ChatGPT bị "soán ngôi", không còn là chatbot AI thông minh nhất hiện nay
(Dân trí) - Lâu nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào cơ sở dữ liệu lớn và tốc độ phản hồi người dùng nhanh. Tuy nhiên, mới đây ngôi vị này của ChatGPT đã bị "lật đổ".
Bảng xếp hạng các chatbot AI thông minh nhất hiện nay
Cuối tháng 1/2023, ChatGPT - chatbot (phần mềm chat tự động) tích hợp trí tuệ nhân tạo (AI) - đã vụt sáng lên trở thành một hiện tượng trên toàn cầu, khi chatbot này thể hiện sự thông minh đáng kinh ngạc thông qua những nội dung hội thoại với người dùng.
Người dùng có thể đặt những câu hỏi và giao tiếp với ChatGPT bằng văn bản, công cụ này sẽ đưa ra câu trả lời và thực hiện theo các yêu cầu của người dùng, như viết đoạn văn, viết mã lập trình, soạn email… với ngôn ngữ hết sức tự nhiên, như một con người thực sự. Đáng chú ý, ChatGPT hỗ trợ tốt nhiều ngôn ngữ khác nhau, bao gồm cả tiếng Việt.
Kể từ khi ChatGPT tạo nên một "cơn sốt" trên toàn cầu, nhiều hãng công nghệ lớn cũng đã nhanh chóng bắt tay vào xây dựng những công cụ chatbot tích hợp AI để cạnh tranh với ChatGPT, mở ra một cuộc đua về phát triển AI, có thể kể đến Gemini của Google, Qwen của Alibaba, Copilot của Microsoft hay Llama của Meta…
Dù vậy, ChatGPT vẫn vững vàng "ngôi vương" trong cuộc đua và vẫn được giới công nghệ lẫn người dùng đánh giá là chatbot AI thông minh nhất hiện nay.
Tuy nhiên, mới đây, ChatGPT đã không còn là chatbot AI thông minh nhất thế giới, theo bảng xếp hạng vừa được công bố của LMSYS, một tổ chức chuyên đánh giá và xếp hạng khả năng của các mô hình ngôn ngữ lớn, là nền tảng để phát triển nên các công cụ chatbot AI.
Theo bảng xếp hạng "Chatbot Arena" của LMSYS, mô hình ngôn ngữ lớn Claude 3 Opus, được phát triển bởi Anthropic, công ty khởi nghiệp có trụ sở tại San Francisco, đã vượt qua GPT-4-1106-preview của OpenAI để trở thành mô hình ngôn ngữ lớn thông minh nhất thế giới.
Claude 3 Opus là mô hình ngôn ngữ được sử dụng để phát triển chatbot Claude AI (đã được Dân trí hướng dẫn cách dùng ở đây), trong khi đó GPT-4 đang được sử dụng để làm nền tảng cho chatbot ChatGPT phiên bản chuyên nghiệp của OpenAI.
Đây là lần đầu tiên mô hình ngôn ngữ của OpenAI bị đánh bật khỏi vị trí dẫn đầu, kể từ khi LMSYS ra mắt bảng xếp hạng "Chatbot Arena" cách đây một năm. Bảng xếp hạng này liên tục được cập nhật và thứ hạng các mô hình ngôn ngữ luôn có sự xáo trộn, nhưng GPT của OpenAI chưa bao giờ rời khỏi vị trí đầu tiên, cho đến thời điểm hiện tại.
Mô hình ngôn ngữ GPT-4 với phiên bản thấp hơn (GPT-4-0125-preview) xếp ở vị trí thứ 3 trong bảng xếp hạng của LMSYS, trong khi đó mô hình ngôn ngữ Bard (sử dụng để phát triển chatbot Gemini phiên bản chuyên nghiệp) của Google xếp ở vị trí thứ 4 về mức độ thông minh.
Đáng chú ý, điểm số đánh giá về 3 mô hình ngôn ngữ lớn dẫn đầu trong bảng xếp hạng chênh nhau rất ít, điều này cho thấy mức độ thông minh của các chatbot xây dựng trên 3 mô hình ngôn ngữ này là tương đương nhau.
Trong số 10 mô hình ngôn ngữ lớn xếp đầu về trí thông minh, Anthropic góp mặt với 3 cái tên, bao gồm Claude 3 Opus, Claude 3 Sonnet (vị trí thứ 4, sử dụng cho Claude AI phiên bản miễn phí), và Claude 3 Haiku (phiên bản Claude 3 đầu tiên, xếp ở vị trí thứ 7).
Trong khi đó, OpenAI góp mặt 4 sản phẩm trong top 10 mô hình ngôn ngữ thông minh nhất, với 2 phiên bản thử nghiệm của GPT-4 (phiên bản preview, xếp lần lượt ở vị trí thứ 2 và thứ 3), GPT-4-0314 (xếp ở vị trí thứ 6) và GPT-4-0613 (xếp ở vị trí thứ 8).
8 vị trí dẫn đầu trong top 10 mô hình ngôn ngữ lớn thông minh nhất đều thuộc về các công ty của Mỹ. Mô hình ngôn ngữ Mistral-Large-2402 của hãng công nghệ Pháp Mistral và Qwen1.5-72B-Chat của hãng công nghệ Trung Quốc Alibaba lần lượt góp mặt ở 2 vị trí thứ 9 và 10.
Các chuyên gia dự đoán khi OpenAI ra mắt mô hình ngôn ngữ GPT-5 hoàn toàn mới, với nhiều cải tiến so với GPT-4 hiện nay, ChatGPT sẽ sớm trở lại vị trí dẫn đầu trên cuộc đua chatbot tích hợp AI.
Mô hình ngôn ngữ lớn là gì?
Nói một cách dễ hiểu, mô hình ngôn ngữ lớn (Large Language Model - LLM) là một loại trí tuệ nhân tạo (AI) được đào tạo dựa trên một lượng dữ liệu rất lớn để thực hiện các tác vụ liên quan đến ngôn ngữ, bao gồm trả lời các câu hỏi, tạo nội dung văn bản, tóm tắt văn bản, dịch thuật, soạn email… theo yêu cầu của người dùng. Các mô hình ngôn ngữ lớn ngày nay còn có thể viết mã lập trình bằng nhiều ngôn ngữ khác nhau.
Các mô hình ngôn ngữ lớn được đào tạo dựa trên một lượng dữ liệu lớn được tập hợp từ sách nghiên cứu, công trình khoa học, các trang web, từ điển bách khoa, mạng internet hoặc được các nhà phát triển xây dựng, tổng hợp riêng theo từng chuyên ngành, lĩnh vực…
Các mô hình ngôn ngữ lớn có thể hiểu và giao tiếp với con người bằng văn bản, giọng nói hoặc nhận diện hình ảnh để phản hồi các câu hỏi của người dùng. Cách thức diễn tả nội dung của các LLM rất trau chuốt và tự nhiên, gần gũi với cách diễn đạt của con người.
Các mô hình ngôn ngữ lớn là nền tảng tạo nên những chatbot AI và tiếp tục được phát triển để thực hiện nhiều tác vụ phức tạp và phục vụ nhiều lĩnh vực trong cuộc sống.
Bảng xếp hạng "Chatbot Arena" của LMSYS là gì?
LMSYS (Large Model Systems) Organization là một tổ chức nghiên cứu được thành lập bởi các chuyên gia về AI tại Đại học California Berkeley, Đại học California San Diego và Đại học Carnegie Mellon nhằm nghiên cứu về các hệ thống AI và đánh giá về các mô hình ngôn ngữ lớn.
"Chatbot Arena" là một bảng xếp hạng do LMSYS tạo ra để đánh giá và xếp hạng các mô hình ngôn ngữ lớn phổ biến và được sử dụng rộng rãi nhất hiện nay. Bên cạnh đánh giá từ các chuyên gia, "Chatbot Arena" còn ghi nhận đánh giá từ cộng đồng người dùng khi sử dụng các chatbot trong thực tế.
"Chatbot Arena" sẽ đánh giá và xếp hạng các LLM bằng hình thức "so sánh mù", nghĩa là người dùng sẽ sử dụng ngẫu nhiên các LLM khác nhau mà họ không biết rõ đó là loại chatbot nào, sau đó người dùng sẽ đưa ra những đánh giá về tốc độ phản hồi, mức độ chính xác của các thông tin hay mức độ hài lòng về nội dung do chatbot cung cấp…
Dựa vào những đánh giá này, LMSYS sẽ tổng hợp, chấm điểm và xếp hạng mức độ thông minh của các mô hình ngôn ngữ lớn và các chatbot được xây dựng dựa trên các LLM này.
Theo LMSYS/ArsTechnica/THW