Phở GPT có tính năng tương tự Chat GPT, nhưng có khả năng hiểu và viết văn phong tiếng Việt vượt bậc so với các công nghệ khác.
Từ khi ChatGPT ra đời với nhiều thành công đáng kể, các công nghệ ứng dụng AI ngày càng trở nên phổ biến và nhận được nhiều sự quan tâm. Theo dòng phát triển của công nghệ, mới đây, VinAI – một thành viên của Vingroup đã giới thiệu dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt PhởGPT. Dự án được công bố tại Ngày Trí tuệ nhân tạo 2023 (AI Day 2023) với chủ đề “AI – tái thiết thực tại”.
“PhởGPT song hành cùng trào lưu mô hình ngôn ngữ lớn với mã nguồn mở của thế giới. So sánh phiên bản PhởGPT-7B5-Instruct, ChatGPT mã nguồn đóng (GPT-3.5-turbo) cùng các mô hình mã nguồn mở khác cho thấy PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết mục đánh giá”, đại diện nhóm phát triển dự án cho biết.
PhởGPT có thể được xem như phiên bản ChatGPT chuyên dụng cho tiếng Việt với với sự hiểu biết sâu sắc và khả năng sử dụng ngôn ngữ linh hoạt. VinAI đã huấn luyện mô hình PhoGPT từ đầu bằng cách sử dụng thư viện llm-foundry của Mosaicml llm và một kho dữ liệu tiếng Việt đào tạo trước có dung lượng lên đến 41GB. Kho dữ liệu này bao gồm 1GB văn bản Wikipedia và một biến thể 40GB đã loại bỏ các phần trùng lặp từ tập dữ liệu tin tức (phiên bản 21/05/2021). Đội ngũ nghiên cứu tại VinAI đã điều chỉnh PhoGPT bằng cách sử dụng bộ dữ liệu chứa 150,000 cặp câu lệnh và phản hồi tiếng Việt.
Theo lãnh đạo của VinAI, đội ngũ VinAI vẫn đang tiếp tục cải tiến mô hình, tối ưu hóa khả năng của PhởGPT. Trong thời gian tới, VinAI sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và các gói giải pháp hỗ trợ chuyên sâu dành cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như y tế, giáo dục…