Tại Ngày hội trí tuệ nhân tạo - AI Day 2023 đang diễn ra ở TP.HCM, Công ty VinAI lần đầu tiên công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt có tên là PhởGPT.
Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hóa người Việt. PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước.
Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.
Kết quả so sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá.
Đội ngũ phát triển PhởGPT cho biết đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.
Chia sẻ với Tuổi Trẻ Online, đại diện VinAI cho biết ý tưởng phát triển PhởGPT xuất phát từ những hạn chế của các mô hình tiếng Việt trước đó. Các thử nghiệm thực tế đã chứng minh rằng những mô hình này chưa đạt được hiệu suất tối ưu, gây ra những khó khăn trong việc ứng dụng chúng cho các mục đích thực tế và tiềm năng phát triển ứng dụng đa dạng dành cho ngôn ngữ tiếng Việt.
“Chúng tôi thấy rằng sự thiếu sót này không chỉ đặt ra thách thức đối với việc tạo ra các ứng dụng tiếng Việt chất lượng cao mà còn ảnh hưởng đến sự phát triển của cộng đồng ngôn ngữ tự nhiên trong nước. Việc này thúc đẩy chúng tôi đặt ra mục tiêu xây dựng một mô hình mới, mạnh mẽ hơn và có khả năng xử lý ngôn ngữ Việt với độ chính xác và hiệu suất cao”, đại diện VinAI cho biết.
Đánh giá về ứng dụng mới, Thứ trưởng Bộ Kế hoạch và Đầu tư Trần Duy Đông cho rằng đây là ứng dụng AI với mã nguồn mở để sẵn sàng cung cấp cho người dùng Việt Nam, đặt nền móng cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao.
“Từ đó phát triển các ứng dụng thực tế, phù hợp với nhu cầu sử dụng của người Việt và định hướng phát triển công nghệ của Chính phủ”, ông Đông cho biết.
PhởGPT khác gì so với ChatGPT?
PhởGPT là một dự án mã nguồn mở (open-source) thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI. Điều này nghĩa là mã nguồn của PhởGPT là công khai và có sẵn cho cộng đồng người phát triển.
Do đó, bằng cách sử dụng mô hình mã nguồn mở PhởGPT, người dùng có thể phát triển các ứng dụng tùy chỉnh, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phải phụ thuộc vào API từ các phần mềm sở hữu riêng.
Ngày hội trí tuệ nhân tạo AI Day 2023 với chủ đề “AI tái thiết thực tại” vừa được công bố sẽ diễn ra trong hai ngày 5 và 6-12 tại The Global City (TP.HCM).