DeepSeek hâm nóng “cuộc đua” AI giữa Trung Quốc và Mỹ
(Dân trí) - DeepSeek vừa cho ra mắt mô hình ngôn ngữ lớn phiên bản mới nhất, không lâu sau khi OpenAI trình làng mô hình ngôn ngữ GPT-5.5.
Đầu năm 2025, DeepSeek - Công ty khởi nghiệp trong lĩnh vực trí tuệ nhân tạo, có trụ sở tại thành phố Hàng Châu (Trung Quốc) - đã trở thành cái tên được giới công nghệ toàn cầu nhắc đến, khi cho ra mắt mô hình ngôn ngữ lớn R1, có tốc độ phản hồi yêu cầu của người dùng nhanh và chính xác.
Điểm nổi bật của R1 là DeepSeek chỉ tiêu tốn khoảng 6,5 triệu USD để phát triển và đào tạo mô hình AI này, thay vì phải chi ra hàng tỷ USD như các hãng công nghệ Mỹ để đào tạo và vận hành các mô hình AI của riêng mình.

Sự xuất hiện của DeepSeek V4 hứa hẹn sẽ khiến cuộc đua phát triển AI giữa Trung Quốc và Mỹ trở nên sôi động hơn (Ảnh minh họa: AI).
Sau những bản nâng cấp không thực sự ấn tượng, DeepSeek một lần nữa thu hút sự chú ý của giới công nghệ khi vừa cho ra mắt bản nâng cấp mô hình ngôn ngữ lớn DeepSeek V4.
Đây được xem là lời đáp trả của mô hình trí tuệ nhân tạo GPT-5.5 của OpenAI và Claude Opus 4.7 của Anthropic mới ra mắt cách đây không lâu.
Cũng giống các phiên bản AI trước đây, DeepSeek V4 vẫn được phát hành dưới dạng mã nguồn mở, trong khi các công cụ AI do công ty Mỹ phát triển như ChatGPT của OpenAI, Gemini của Google, Claude của Anthropic hay Grok của xAI… đều có mã nguồn đóng và được bảo vệ nghiêm ngặt.
Việc DeepSeek được phát triển dưới dạng mã nguồn mở cho phép các công ty khác có thể sử dụng công cụ AI này trong các sản phẩm của mình, đồng thời DeepSeek cũng có thể được phát triển nhờ vào sự đóng góp của cộng đồng.
DeepSeek V4 được ra mắt với 2 phiên bản, bao gồm DeepSeek-V4-Flash có tổng cộng 284 tỷ tham số và DeepSeek-V4-Pro với 1,6 nghìn tỷ tham số. Trong đó, phiên bản V4-Pro được DeepSeek tự tin là mô hình ngôn ngữ lớn thông minh nhất của hãng.
DeepSeek cho biết mô hình AI mới của công ty sẽ được nâng cao khả năng tạo mã lập trình để hỗ trợ các nhà phát triển ứng dụng, đồng thời có thể tích hợp nhiều tác nhân AI để có thể tự động thực hiện các nhiệm vụ trên máy tính theo yêu cầu, thay vì chỉ đơn thuần là một công cụ chatbot AI để trả lời câu hỏi người dùng như trước đây.
Ưu điểm lớn nhất của DeepSeek V4 là được tối ưu chi phí huấn luyện và vận hành. DeepSeek cho biết phiên bản V4-Pro chỉ tiêu tốn khoảng 1,74 USD cho một triệu token đầu vào (dữ liệu đầu vào) và 3,48 USD cho một triệu token đầu ra (dữ liệu do AI tạo ra để phản hồi người dùng).
Trong khi đó, GPT-5.5 của OpenAI tiêu tốn 5 USD cho một triệu token đầu vào và 30 USD cho một triệu token đầu ra; Claude Opus 4.7 tốn lần lượt 5 USD và 25 USD cho token đầu vào và token đầu ra.
Riêng phiên bản Gemini 3.1 Pro của Google đã được tối ưu chi phí nên chỉ tiêu tốn 2 USD cho một triệu token đầu vào và 12 USD cho một triệu token đầu ra.
Điều này cho thấy DeepSeek-V4-Pro chỉ tiêu tốn khoảng 1/6 chi phí so với các mô hình AI mới nhất của các công ty Mỹ.
Theo Intelligence Index, dịch vụ chấm điểm các mô hình trí tuệ nhân tạo, với những cuộc trò chuyện có độ dài lớn, GPT-5.5 sẽ tốn chi phí cao gấp 32 lần so với DeepSeek-V4. Tương tự, khi cùng thực hiện các tác vụ giống nhau từ phía người dùng, DeepSeek V4 chỉ mất chi phí khoảng 113 USD, trong khi mô hình Claude Opus 4.7 của Anthropic mất chi phí lên đến 4.811 USD.
Đây được xem là ưu thế cực lớn của DeepSeek so với các đối thủ của Mỹ, cho phép DeepSeek cung cấp những gói dịch vụ với mức phí cạnh tranh để thu hút nhiều người dùng hơn.
Tuy nhiên, theo một số công cụ chấm điểm xử lý mô hình AI phổ biến như Arena AI hay Intelligent Analytics, khả năng xử lý và phản hồi của DeepSeek V4 vẫn có phần kém hiệu quả hơn so với GPT-5.5 hay Claude Opus 4.7, dù chênh lệch là không quá lớn.
Sự xuất hiện của DeepSeek V4 hứa hẹn sẽ khiến cuộc đua phát triển AI giữa Trung Quốc và Mỹ trở nên sôi động hơn trong thời gian tới, khi mỗi bên đều cho thấy những ưu điểm riêng.





