Google đáp trả DeepSeek bằng mô hình AI "siêu nhẹ" Gemma 3

Thứ năm, 13/03/2025 - 11:07

(Dân trí) - Google vừa ra mắt mô hình AI mới mang tên gọi Gemma 3, mà theo hãng sẽ có khả năng hoạt động siêu hiệu quả dù chỉ cần dùng duy nhất một bộ xử lý đồ họa.

Gemma 3 - Mô hình AI siêu hiệu quả và tiết kiệm của Google

Hơn một năm sau khi phát hành 2 phiên bản của mô hình trí tuệ nhân tạo (AI) Gemma, Google vừa tiếp tục phát hành bản nâng cấp của mô hình AI này với phiên bản Gemma 3.

Theo bài đăng trên trang blog chính thức của Google, Gemma 3 được xây dựng dựa trên mã nguồn mở và được thiết kế siêu nhẹ, cho phép các nhà phát triển có thể tạo ra các ứng dụng AI có thể chạy trên bất kỳ thiết bị nào, từ smartphone đến máy trạm.

Google cho biết Gemma 3 là mô hình AI được tối ưu để hoạt động hiệu quả nhất về mặt hiệu suất, khi chỉ cần một bộ vi xử lý đồ họa (GPU) đã có thể chạy mô hình AI này, thay vì cần đến một hệ thống máy chủ đồ sộ. Gemma 3 cũng được tối ưu hóa để chạy trên các GPU của Nvidia và phần cứng AI chuyên dụng.

Google đáp trả DeepSeek bằng mô hình AI siêu nhẹ Gemma 3 - 1 — Biểu đồ so sánh điểm số xử lý giữa Gemma 3 với các mô hình AI khác. Số chấm phía dưới chính là số lượng chip xử lý AI cần sử dụng để đạt được số điểm tối đa (Ảnh: Google).

Google tự tin tuyên bố hiệu suất hoạt động của Gemma 3 vượt trội so với các mô hình AI khác như Llama của Facebook, GPT của OpenAI và đặc biệt là R1 của DeepSeek, mô hình AI đến từ Trung Quốc, nổi tiếng với khả năng hoạt động hiệu quả trên những loại chip AI thế hệ cũ và không đòi hỏi cấu hình quá mạnh.

Sử dụng điểm số đánh giá trên Chatbot Arena, một trang web chuyên so sánh khả năng xử lý và trí thông minh của các hệ thống AI tạo sinh, Google cho biết Gemma 3 đạt được số điểm tương đương 98% so với điểm số mô hình R1 của DeepSeek.

Điều này đồng nghĩa với việc R1 của DeepSeek vẫn vượt trội hơn Gemma 3 về khả năng xử lý và tốc độ phản hồi. Tuy nhiên, Google khẳng định rằng DeepSeek phải sử dụng đến 32 chip xử lý đồ họa H100 của Nvidia để đạt được điểm số tối đa, trong khi Gemma 3 chỉ sử dụng duy nhất một GPU H100.

Mô hình AI Gemma 3 cho phép xử lý văn bản, hình ảnh, video… để đưa ra các phản hồi theo yêu cầu, bao gồm cả việc tạo nội dung hình ảnh và video theo mô tả của người dùng.

Đáng chú ý, Google tích hợp vào Gemma 3 bộ công cụ phân loại hình ảnh an toàn ShieldGemma 2, tạo thành một bộ lọc hình ảnh đầu vào và đầu ra nhằm ngăn chặn người dùng sử dụng Gemma 3 để tạo ra các nội dung hình ảnh, video khiêu dâm, nguy hiểm hoặc bạo lực.

Cuộc chạy đua khả năng tối ưu AI về hiệu quả và kinh phí

Google cho rằng sự cân bằng giữa sức mạnh tính toán và hiệu quả hoạt động là điểm nhấn đáng chú ý nhất của Gemma 3. Không quá khó để nhận ra rằng mục tiêu Google phát triển Gemma 3 chính là nhằm đánh bại DeepSeek và khả năng xử lý dựa trên cấu hình phần cứng và tiết kiệm chi phí.

Trước đó, khi mô hình R1 của DeepSeek "gây sốt" trên toàn cầu vào cuối tháng 1 vừa qua, DeepSeek đã khiến thế giới phải bất ngờ khi tuyên bố công ty chỉ mất 5,6 triệu USD để xây dựng và vận hành R1, trong khi các hãng công nghệ của Mỹ phải chi ra hàng trăm, thậm chí hàng tỷ đô la để phát triển và vận hành mô hình AI của riêng mình.

Bên cạnh đó, R1 được DeepSeek phát triển và vận hành dựa trên các chip AI thế hệ cũ, do các công ty Trung Quốc chịu lệnh cấm vận từ chính phủ Mỹ không thể đặt mua các chip AI cao cấp. Dù vậy, R1 vẫn cho thấy khả năng xử lý và tốc độ phản hồi các yêu cầu của người dùng một cách ấn tượng.

Kể từ thời điểm R1 của DeepSeek ra mắt, một cuộc đua mới trên thị trường AI đã bắt đầu. Thay vì chỉ tập trung vào trí thông minh và khả năng xử lý, các hãng công nghệ bắt đầu quan tâm hơn đến bài toán kinh tế trong các phát triển AI.

Với sự xuất hiện của Gemma 3, Google cho thấy rằng các hãng công nghệ Mỹ cũng hoàn toàn có thể tạo ra những mô hình AI siêu nhẹ và hiệu quả, tương tự như điều DeepSeek đã làm được với R1, giúp cuộc đua phát triển AI giữa 2 cường quốc Mỹ và Trung Quốc trở nên gay cấn hơn.