ChatGPT bị "soán ngôi", không còn là chatbot AI thông minh nhất hiện nay

Thứ ba, 02/04/2024 - 06:12

(Dân trí) - Lâu nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào cơ sở dữ liệu lớn và tốc độ phản hồi người dùng nhanh. Tuy nhiên, mới đây ngôi vị này của ChatGPT đã bị "lật đổ".

Bảng xếp hạng các chatbot AI thông minh nhất hiện nay

Cuối tháng 1/2023, ChatGPT - chatbot (phần mềm chat tự động) tích hợp trí tuệ nhân tạo (AI) - đã vụt sáng lên trở thành một hiện tượng trên toàn cầu, khi chatbot này thể hiện sự thông minh đáng kinh ngạc thông qua những nội dung hội thoại với người dùng.

Người dùng có thể đặt những câu hỏi và giao tiếp với ChatGPT bằng văn bản, công cụ này sẽ đưa ra câu trả lời và thực hiện theo các yêu cầu của người dùng, như viết đoạn văn, viết mã lập trình, soạn email… với ngôn ngữ hết sức tự nhiên, như một con người thực sự. Đáng chú ý, ChatGPT hỗ trợ tốt nhiều ngôn ngữ khác nhau, bao gồm cả tiếng Việt.

Kể từ khi ChatGPT tạo nên một "cơn sốt" trên toàn cầu, nhiều hãng công nghệ lớn cũng đã nhanh chóng bắt tay vào xây dựng những công cụ chatbot tích hợp AI để cạnh tranh với ChatGPT, mở ra một cuộc đua về phát triển AI, có thể kể đến Gemini của Google, Qwen của Alibaba, Copilot của Microsoft hay Llama của Meta…

Dù vậy, ChatGPT vẫn vững vàng "ngôi vương" trong cuộc đua và vẫn được giới công nghệ lẫn người dùng đánh giá là chatbot AI thông minh nhất hiện nay.

Tuy nhiên, mới đây, ChatGPT đã không còn là chatbot AI thông minh nhất thế giới, theo bảng xếp hạng vừa được công bố của LMSYS, một tổ chức chuyên đánh giá và xếp hạng khả năng của các mô hình ngôn ngữ lớn, là nền tảng để phát triển nên các công cụ chatbot AI.

Theo bảng xếp hạng "Chatbot Arena" của LMSYS, mô hình ngôn ngữ lớn Claude 3 Opus, được phát triển bởi Anthropic, công ty khởi nghiệp có trụ sở tại San Francisco, đã vượt qua GPT-4-1106-preview của OpenAI để trở thành mô hình ngôn ngữ lớn thông minh nhất thế giới.

Claude 3 Opus là mô hình ngôn ngữ được sử dụng để phát triển chatbot Claude AI (đã được Dân trí hướng dẫn cách dùng ở đây), trong khi đó GPT-4 đang được sử dụng để làm nền tảng cho chatbot ChatGPT phiên bản chuyên nghiệp của OpenAI.

Đây là lần đầu tiên mô hình ngôn ngữ của OpenAI bị đánh bật khỏi vị trí dẫn đầu, kể từ khi LMSYS ra mắt bảng xếp hạng "Chatbot Arena" cách đây một năm. Bảng xếp hạng này liên tục được cập nhật và thứ hạng các mô hình ngôn ngữ luôn có sự xáo trộn, nhưng GPT của OpenAI chưa bao giờ rời khỏi vị trí đầu tiên, cho đến thời điểm hiện tại.

Mô hình ngôn ngữ GPT-4 với phiên bản thấp hơn (GPT-4-0125-preview) xếp ở vị trí thứ 3 trong bảng xếp hạng của LMSYS, trong khi đó mô hình ngôn ngữ Bard (sử dụng để phát triển chatbot Gemini phiên bản chuyên nghiệp) của Google xếp ở vị trí thứ 4 về mức độ thông minh.

Đáng chú ý, điểm số đánh giá về 3 mô hình ngôn ngữ lớn dẫn đầu trong bảng xếp hạng chênh nhau rất ít, điều này cho thấy mức độ thông minh của các chatbot xây dựng trên 3 mô hình ngôn ngữ này là tương đương nhau.

Trong số 10 mô hình ngôn ngữ lớn xếp đầu về trí thông minh, Anthropic góp mặt với 3 cái tên, bao gồm Claude 3 Opus, Claude 3 Sonnet (vị trí thứ 4, sử dụng cho Claude AI phiên bản miễn phí), và Claude 3 Haiku (phiên bản Claude 3 đầu tiên, xếp ở vị trí thứ 7).

Trong khi đó, OpenAI góp mặt 4 sản phẩm trong top 10 mô hình ngôn ngữ thông minh nhất, với 2 phiên bản thử nghiệm của GPT-4 (phiên bản preview, xếp lần lượt ở vị trí thứ 2 và thứ 3), GPT-4-0314 (xếp ở vị trí thứ 6) và GPT-4-0613 (xếp ở vị trí thứ 8).

8 vị trí dẫn đầu trong top 10 mô hình ngôn ngữ lớn thông minh nhất đều thuộc về các công ty của Mỹ. Mô hình ngôn ngữ Mistral-Large-2402 của hãng công nghệ Pháp Mistral và Qwen1.5-72B-Chat của hãng công nghệ Trung Quốc Alibaba lần lượt góp mặt ở 2 vị trí thứ 9 và 10.

Các chuyên gia dự đoán khi OpenAI ra mắt mô hình ngôn ngữ GPT-5 hoàn toàn mới, với nhiều cải tiến so với GPT-4 hiện nay, ChatGPT sẽ sớm trở lại vị trí dẫn đầu trên cuộc đua chatbot tích hợp AI.

Mô hình ngôn ngữ lớn là gì?

Nói một cách dễ hiểu, mô hình ngôn ngữ lớn (Large Language Model - LLM) là một loại trí tuệ nhân tạo (AI) được đào tạo dựa trên một lượng dữ liệu rất lớn để thực hiện các tác vụ liên quan đến ngôn ngữ, bao gồm trả lời các câu hỏi, tạo nội dung văn bản, tóm tắt văn bản, dịch thuật, soạn email… theo yêu cầu của người dùng. Các mô hình ngôn ngữ lớn ngày nay còn có thể viết mã lập trình bằng nhiều ngôn ngữ khác nhau.

Các mô hình ngôn ngữ lớn được đào tạo dựa trên một lượng dữ liệu lớn được tập hợp từ sách nghiên cứu, công trình khoa học, các trang web, từ điển bách khoa, mạng internet hoặc được các nhà phát triển xây dựng, tổng hợp riêng theo từng chuyên ngành, lĩnh vực…

Các mô hình ngôn ngữ lớn có thể hiểu và giao tiếp với con người bằng văn bản, giọng nói hoặc nhận diện hình ảnh để phản hồi các câu hỏi của người dùng. Cách thức diễn tả nội dung của các LLM rất trau chuốt và tự nhiên, gần gũi với cách diễn đạt của con người.

Các mô hình ngôn ngữ lớn là nền tảng tạo nên những chatbot AI và tiếp tục được phát triển để thực hiện nhiều tác vụ phức tạp và phục vụ nhiều lĩnh vực trong cuộc sống.

Bảng xếp hạng "Chatbot Arena" của LMSYS là gì?

LMSYS (Large Model Systems) Organization là một tổ chức nghiên cứu được thành lập bởi các chuyên gia về AI tại Đại học California Berkeley, Đại học California San Diego và Đại học Carnegie Mellon nhằm nghiên cứu về các hệ thống AI và đánh giá về các mô hình ngôn ngữ lớn.

"Chatbot Arena" là một bảng xếp hạng do LMSYS tạo ra để đánh giá và xếp hạng các mô hình ngôn ngữ lớn phổ biến và được sử dụng rộng rãi nhất hiện nay. Bên cạnh đánh giá từ các chuyên gia, "Chatbot Arena" còn ghi nhận đánh giá từ cộng đồng người dùng khi sử dụng các chatbot trong thực tế.

"Chatbot Arena" sẽ đánh giá và xếp hạng các LLM bằng hình thức "so sánh mù", nghĩa là người dùng sẽ sử dụng ngẫu nhiên các LLM khác nhau mà họ không biết rõ đó là loại chatbot nào, sau đó người dùng sẽ đưa ra những đánh giá về tốc độ phản hồi, mức độ chính xác của các thông tin hay mức độ hài lòng về nội dung do chatbot cung cấp…

Dựa vào những đánh giá này, LMSYS sẽ tổng hợp, chấm điểm và xếp hạng mức độ thông minh của các mô hình ngôn ngữ lớn và các chatbot được xây dựng dựa trên các LLM này.

Theo LMSYS/ArsTechnica/THW

ChatGPT bị "soán ngôi", không còn là chatbot AI thông minh nhất hiện nay

(Dân trí) - Lâu nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào cơ sở dữ liệu lớn và tốc độ phản hồi người dùng nhanh. Tuy nhiên, mới đây ngôi vị này của ChatGPT đã bị "lật đổ".

Bảng xếp hạng các chatbot AI thông minh nhất hiện nay

Mô hình ngôn ngữ lớn là gì?

Bảng xếp hạng "Chatbot Arena" của LMSYS là gì?

Tra cứu lịch sử khám bệnh và đơn thuốc đã được kê thông qua ứng dụng VNeID

iPhone 18 sẽ không ra mắt trong năm nay

Galaxy S26 Ultra lộ giá bán rẻ hơn Galaxy S25 Ultra?

Chiếc điện thoại ở hiện trường mở lối giải sáng kiến an toàn giao thông

iPhone 16 là smartphone bán chạy nhất thế giới

Deepfake đưa tội phạm mạng chiếm ngôi đầu danh sách nguy hiểm

Camera trên iPhone 18 Pro Max sẽ có nâng cấp đáng giá

Công nghệ khiến xe máy không thể di chuyển nếu tài xế dùng điện thoại

Cuộc đua giành “ngôi vương” trên thị trường chatbot AI ngày càng gay cấn

Sập bẫy làm giàu nhanh cận Tết, tội phạm mạng dùng AI để "chăn thả"

Lương cơ sở được dự kiến tăng năm 2026, những khoản nào điều chỉnh theo?

Chiến sự Ukraine 31/1: Nga bất ngờ tấn công sườn bắc, đe dọa Konstantinovka

Khách sạn cao nhất thế giới, có 1.000 phòng, khách ngủ "chạm mây"

Những tổ chức nào phụ trách bầu cử đại biểu Quốc hội và HĐND các cấp?

Công ty của bầu Đức báo lãi kỷ lục, chấm dứt 10 năm nợ nần thua lỗ

“Thay đổi hành vi ngay từ thế hệ trẻ là chìa khóa cho một tương lai xanh”

Giải mã cú sập 500 USD của vàng: Ai đang thực sự giật dây giá kim loại quý?

Hà Nội tuyên bố muốn làm sân bay thứ hai

Thủ tướng đề nghị tập đoàn dệt may Trung Quốc tăng đầu tư vào Việt Nam

HLV Carrick đối mặt tổn thất lực lượng khi Man Utd đang thăng hoa

Công nghệ khiến xe máy không thể di chuyển nếu tài xế dùng điện thoại

Ba trụ cột đưa Việt Nam thoát bẫy thu nhập trung bình

Galaxy S26 Ultra lộ giá bán rẻ hơn Galaxy S25 Ultra?

Giá iPhone 16 Pro Max tăng cao sau khi bị “khai tử”

Galaxy S26 Ultra liên tục lộ diện gần ngày ra mắt