ChatGPT bị chiếm “ngôi vương” bởi Claude 3 Opus

Đăng ngày: 04/04/2024

Trong bảng xếp hạng “Chatbot Arena”, ChatGPT đã bị vượt qua bởi Claude 3 Opus của Anthropic, công ty khởi nghiệp tại San Francisco. Claude 3 Opus được đánh giá cao về khả năng hiểu ngôn ngữ đa nhiệm lớn và giải quyết vấn đề toán học. Tuy nhiên, Opus vẫn còn hạn chế trong việc cập nhật thông tin về sự kiện diễn ra từ năm trước.

ChatGPT bị chiếm “ngôi vương” bởi Claude 3 Opus

Bảng xếp hạng “Chatbot Arena” của LMSYS (Tổ chức Hệ thống Mô hình Lớn) đã công bố rằng ChatGPT không còn là chatbot thông minh nhất thế giới. Từ khi ra mắt, ChatGPT đã nhanh chóng tạo ra cơn sốt toàn cầu với sự thông minh và đa nhiệm. Mô hình ngôn ngữ của OpenAI và các phiên bản GPT-4 luôn dẫn đầu trong bảng xếp hạng “Chatbot Arena” cho đến thời điểm hiện tại.

Bảng xếp hạng “Chatbot Arena" trong lần cập nhật gần nhất
Bảng xếp hạng “Chatbot Arena” trong lần cập nhật gần nhất

Tuy nhiên, trong cập nhật gần đây nhất của bảng xếp hạng “Chatbot Arena”, Claude 3 Opus đã vượt qua ChatGPT (GPT-4-1106-preview) của OpenAI để trở thành mô hình ngôn ngữ lớn thông minh nhất thế giới. Điểm số đánh giá của Claude 3 Opus và GPT-4-1106-preview không chênh lệch quá nhiều.

Claude 3 Opus được phát triển bởi Anthropic, một công ty khởi nghiệp có trụ sở tại San Francisco, và được sử dụng để phát triển chatbot Claude AI. Theo Anthropic, các chỉ số đánh giá chung cho hệ thống AI của Claude 3 Opus vượt trội so với các mô hình cùng loại, bao gồm MMLU (Đo lường mức độ hiểu ngôn ngữ đa nhiệm lớn), MATH (Giải quyết vấn đề toán học),… Ngoài ra, mô hình ngôn ngữ này còn có khả năng xử lý nhiều định dạng khác nhau, bao gồm hình ảnh, biểu đồ, đồ thị và sơ đồ kỹ thuật.

Các chỉ số của các phiên bản Claude 3 đều vượt trội
Các chỉ số của các phiên bản Claude 3 đều vượt trội

Trên trang TechCrunch, cây viết Kyle Wiggers nhận định về khả năng tác vụ của Claude 3 Opus: “Opus là một trong những chatbot hữu ích nhất mà tôi từng sử dụng, ít nhất là khi Opus đưa ra câu trả lời thì tất cả đều rất dễ hiểu, ngắn gọn và không có từ chuyên ngành.” Tuy nhiên, Opus lại có phần thua kém các chatbot khác về vấn đề trả lời thông tin của các sự kiện được diễn ra từ năm ngoái, những sự kiện mà đáng lẽ phải có trong cơ sở dữ liệu của Opus trước tháng 8 năm 2023. Cụ thể, cây viết Kyle Wiggers đã hỏi Opus về những sự kiện được diễn ra vào tháng 7 năm 2023, kết quả là Opus không thể thông tin được một cách chính xác và rõ ràng.

Claude 3 Opus vẫn còn gặp khó khăn trong một số câu hỏi
Claude 3 Opus vẫn còn gặp khó khăn trong một số câu hỏi
5/5 - (1 bình chọn)

Chia sẻ bài viết:

Facebook
Twitter
LinkedIn
Email

Mỗi ngày, chúng tôi học hỏi một điều mới về Marketing và chia sẻ cho bạn, để ngày mai của bạn trở nên thành công rực rỡ hơn ngày hôm qua.

Picture of MIC Creative

MIC Creative

Xem hồ sơ
Marketing