1. Dòng sự kiện:
  2. Sổ tay VNeID
  3. Đánh giá sản phẩm

DeepSeek ra mắt công cụ AI có khả năng giành HCV kỳ thi toán quốc tế

T.Thủy

(Dân trí) - Công ty trí tuệ nhân tạo DeepSeek của Trung Quốc khiến giới công nghệ ngỡ ngàng khi cho ra mắt mô hình AI chuyên giải toán với khả năng đạt được huy chương vàng các kỳ thi toán quốc tế.

Để giải được những bài toán phức tạp với ngôn ngữ tự nhiên, lời giải và lập luận chặt chẽ, rõ ràng… là điều không hề dễ dàng, ngay cả với những học sinh, sinh viên giỏi về môn toán. Tuy nhiên, DeepSeek đã tạo ra một mô hình AI  DeepSeekMath-V2 có khả năng thực hiện điều đó.

DeepSeek ra mắt công cụ AI có khả năng giành HCV kỳ thi toán quốc tế - 1

DeepSeek gây ấn tượng khi tạo ra mô hình AI có khả năng giải các bài toán cấp độ kỳ thi quốc tế (Ảnh minh họa: AI).

Trong các bài đánh giá, DeepSeekMath-V2 đã đạt được điểm số ở mức giành huy chương vàng khi giải các bài toán tại Kỳ thi Olympic Toán học Quốc tế (IMO) năm 2025 và Kỳ thi Olympic Toán học Trung Quốc (CMO) năm 2024.

Khi tham gia bài kiểm tra IMO-ProofBench để đánh giá khả năng diễn giải và suy luận toán học của các mô hình AI, DeepSeekMath-V2 của DeepSeek đã đạt được điểm số vượt trội so với các mô hình AI khác như DeepMind của Google, Grok của xAI hay GPT-5 của OpenAI…

Đáng chú ý, mô hình AI của DeepSeek còn đạt số điểm 118/120 khi giải đề của cuộc thi toán Putnam năm 2024, trong khi người đứng cao nhất tại kỳ thi này chỉ đạt số điểm 90. Kỳ thi Putnam được đánh giá là cuộc thi toán khó và danh giá nhất thế giới dành cho sinh viên đại học, được tổ chức vào tháng 12 hàng năm.

Nhiều bài toán tại các kỳ thi quốc tế đôi khi không yêu cầu một câu trả lời là con số chính xác, thay vào đó điểm số được chấm dựa trên cách lập luận để đưa ra lời giải. Dù vậy, DeepSeekMath-V2 vẫn cho thấy khả năng lập luận chặt chẽ bằng ngôn ngữ tự nhiên giống như con người, giúp mô hình AI này được chấm số điểm cao.

DeepSeek cho biết để mô hình AI của mình có thể đưa ra câu trả lời chuẩn xác và cách lập luận chặt chẽ, hãng đã xây dựng hai mô hình ngôn ngữ lớn và đặt ở vai trò đối đầu nhau. Một mô hình đóng vai trò “người chứng minh” để tạo ra các lập luận và chứng minh toán học, mô hình còn lại đóng vai trò “người đánh giá” để kiểm tra các lập luận được đưa ra.

Cách thức hoạt động này giúp triệt tiêu những giả thuyết và lập luận yếu, tập trung vào việc tối ưu lời giải để tìm ra đáp án chính xác và lập luận một cách chặt chẽ.

DeepSeekMath-V2 được phát triển dưới dạng mã nguồn mở, cho phép cộng đồng có thể điều chỉnh mã nguồn và sử dụng cho nhiều mục đích khác nhau.

DeepSeek cho biết những đột phá đạt được với DeepSeekMath-V2 sẽ đặt nền tảng để xây dựng các hệ thống AI toán học mạnh mẽ và đáng tin cậy hơn.

DeepSeek là hãng công nghệ Trung Quốc, đã gây được tiếng vang trên toàn cầu khi cho ra mắt mô hình AI R1 vào cuối tháng 1 vừa qua, cho tốc độ phản hồi nhanh và chính xác.

Điểm nổi bật của R1 là DeepSeek chỉ tiêu tốn khoảng 6,5 triệu USD để phát triển và đào tạo mô hình AI này, thay vì phải chi ra hàng tỷ USD như các hãng công nghệ Mỹ để đào tạo và vận hành các mô hình AI của riêng mình.

Bên cạnh đó, R1 được DeepSeek phát triển và vận hành dựa trên các chip AI thế hệ cũ, do các công ty Trung Quốc chịu lệnh cấm vận từ chính phủ Mỹ không thể đặt mua các chip AI cao cấp. Dù vậy, R1 vẫn cho thấy khả năng xử lý và tốc độ phản hồi các yêu cầu của người dùng một cách ấn tượng.

Sự xuất hiện của DeepSeek đã khiến Mỹ mất thế độc tôn trên cuộc đua phát triển các mô hình AI, đồng thời mở ra một cuộc đua mới. Thay vì chỉ tập trung vào trí thông minh và khả năng xử lý, các hãng công nghệ bắt đầu quan tâm hơn đến bài toán hiệu quả kinh tế trong quá trình phát triển các mô hình AI.