Từ DeepSeek nghĩ về hướng đi cho khoa học công nghệ Việt Nam
Mô hình trí tuệ nhân tạo (AI) của DeepSeek - một công ty công nghệ của Trung Quốc, đã gây rung động thế giới ngay khi được công bố vào cuối năm 2024.
Đến nay nhìn lại sự kiện này, có thể nói về tổng thể nó phản ánh sự cạnh tranh gay gắt trong lĩnh vực AI toàn cầu. Trước hết, việc DeepSeek ra mắt mô hình AI R1 với chi phí huấn luyện thấp (được cho là vào khoảng 5,6 triệu USD) đã gây áp lực lớn lên các công ty AI hàng đầu của Mỹ, đặc biệt là Google và OpenAI.
Thứ hai, đây có thể được xem là một diễn biến khẳng định sự phát triển mạnh mẽ của ngành công nghệ Trung Quốc. Việc DeepSeek ra mắt các mô hình AI không chỉ thu hút chú ý từ giới công nghệ quốc tế, mà còn gửi thông điệp mạnh mẽ về khả năng tự chủ và sáng tạo của Trung Quốc, đặc biệt trong bối cảnh nước này đang bị áp đặt chính sách cấm vận chip AI tiên tiến nhất từ Mỹ.

Mô hình trí tuệ nhân tạo (AI) của DeepSeek - một công ty công nghệ của Trung Quốc, đã gây rung động thế giới ngay khi được công bố vào cuối năm 2024 (Ảnh minh họa: MV)
Thứ ba, việc Trung Quốc thúc đẩy các công ty như DeepSeek ra mắt mô hình AI (hàng loạt công ty khác của Trung Quốc cũng đã công bố mô hình AI trong thời gian qua), có thể là một phần trong chiến lược dài hạn của Trung Quốc nhằm chiếm lĩnh thị trường AI và gia tăng ảnh hưởng trong các lĩnh vực quan trọng khác.
Để đánh giá chất lượng hoạt động của các hệ thống tính toán, người ta sử dụng một số phép thử theo những tiêu chuẩn nhất định gọi là benchmark (thước đo hiệu suất). DeepSeek đã tự công bố các kết quả benchmark của chính mình cho thấy hiệu suất của mô hình DeepSeek V3 vượt trội so với Llama 3.1 và Qwen 2.5 (hai mô hình do Meta và Baidu phát triển), đồng thời tương đương với GPT-4o và Claude 3.5 Sonnet (hai mô hình do OpenAI và Anthropic phát triển). Tuy nhiên, thông tin chi tiết về phương pháp thực hiện và chỉ số cụ thể các benchmark này chưa được công bố rộng rãi.
Để đánh giá chính xác về thông tin mà DeepSeek cung cấp, cần có thêm đánh giá độc lập và minh bạch từ các tổ chức hoặc cá nhân bên ngoài.
Amodei, giám đốc điều hành của Anthropic, đã bày tỏ nghi ngờ về việc DeepSeek chỉ tiêu hết 5,6 triệu USD cho việc huấn luyện mô hình AI của họ, vì con số này quá thấp so với chi phí huấn luyện các mô hình AI lớn ở các công ty công nghệ phương Tây, đặc biệt là so với OpenAI hoặc Google. Ông cho rằng việc huấn luyện một mô hình AI lớn, đặc biệt là một mô hình giống như R1 của DeepSeek, đòi hỏi một lượng tài nguyên tính toán khổng lồ, bao gồm hàng ngàn GPU (bộ xử lý), và chi phí cho việc này có thể rất cao.
Nếu DeepSeek huấn luyện được mô hình AI với chi phí thấp như nêu trên, có thể là do sự khác biệt trong cách tiếp cận công nghệ hoặc những chi phí ẩn chưa tiết lộ.
Nhớ lại, trước đây khi chúng tôi phát triển hệ thống dịch tự động tiếng Việt sang nhiều thứ tiếng khác nhau, một kỹ thuật đã được chúng tôi sử dụng là chưng cất dữ liệu (distillation). Kỹ thuật này cho phép sử dụng dữ liệu của các mô hình đã có từ trước, ví dụ như truy vấn các mô hình đó để lấy dữ liệu. Nhờ vậy chi phí huấn luyện dữ liệu được giảm thiểu. Thời gian qua có nhiều chuyên gia nghi vấn DeepSeek đã sử dụng kỹ thuật chưng cất dữ liệu?
Dù sao, thành công của DeepSeek cần được đánh giá cao và tiếp thu đúng đắn như một bài học về phát triển khoa học công nghệ.
Qua sự kiện DeepSeek, một số ý kiến cho rằng châu Á có thể phát triển khoa học công nghệ hoàn toàn độc lập, tách rời với việc học hỏi tri thức từ Mỹ và phương Tây. Theo tôi, chúng ta cần phải nhận thức rõ ràng mặc dù DeepSeek là một thành công vang dội, nhưng so với các trung tâm hàng đầu về AI trên thế giới, DeepSeek vẫn ở vị thế đi sau. Thành công của DeepSeek cũng là việc tiếp thu tinh hoa của thế giới chứ không phải đóng cửa tự nghiên cứu. DeepSeek đã sử dụng mã nguồn mở là tài sản trí tuệ chung của thế giới. Trong hoàn cảnh của những người đi sau về khoa học công nghệ, như Việt Nam chúng ta, việc tiếp thu tối đa tri thức của thế giới là yếu tố quyết định.
Điều quan trọng trong thành công của DeepSeek là tầm suy nghĩ và tinh thần dám nghĩ dám làm để tìm những giải pháp mới trong hoàn cảnh khó khăn. DeepSeek đã tiếp cận bài toán rất thực tiễn: làm thế nào để vừa giảm chi phí và thời gian huấn luyện, vừa giữ được chất lượng của mô hình AI, trong bối cảnh Trung Quốc gặp khó khăn khi tiếp cận những con chip AI hiện đại nhất.
Tinh thần dám nghĩ dám làm đó cho phép DeepSeek tạo ra được thành công tầm cỡ thế giới trong thời gian ngắn, mà không sợ bị chê là "nổ" hay "viển vông". Sự hỗ trợ của chính phủ Trung Quốc cũng có tính chất quyết định. Tôi nghĩ rằng hỗ trợ quan trọng nhất không phải là tài chính mà là tầm nhìn. Tầm nhìn của Trung Quốc về khoa học công nghệ được thể hiện trong lộ trình phát triển khoa học công nghệ nước này tới năm 2050. Với tầm nhìn tham vọng và mạch lạc của nhà nước, các doanh nghiệp, các nhà khoa học Trung Quốc có được chỗ dựa và sự tự tin trong nghiên cứu, phát triển.
Nhận thức chung từ tầm nhìn đã tạo được một văn hóa đổi mới sáng tạo và một hệ sinh thái hỗ trợ cho nhau. Không phải chỉ DeepSeek, riêng trong lĩnh vực AI, bên cạnh các công ty lớn như Alibaba, Baidu, Huawei, Trung Quốc còn có "6 con hổ trẻ" gồm các công ty như Zhipu AI, Moonshot AI, MiniMax, Baichuan Intelligence, StepFun và 01.AI.
Nhân đây, tôi muốn nói thêm là bên cạnh lĩnh vực trí tuệ nhân tạo, nhiều ngành khác của Trung Quốc đang có bứt phá mạnh mẽ, như: năng lượng, khoa học vật liệu, ứng dụng thám hiểm đáy đại dương, nghiên cứu lõi Trái Đất, đặc biệt là tính toán lượng tử… Có thể nói toàn bộ nền khoa học công nghệ đã tạo ra một hệ sinh thái giúp lĩnh vực AI, các nhà khoa học công nghệ, doanh nghiệp khoa học công nghệ Trung Quốc phát triển.
Trong quá trình phát triển máy dịch tiếng Việt sang các thứ tiếng khác trước đây, chúng tôi đã không có được sự tự tin và hỗ trợ như vậy. Các cải tiến công nghệ của chúng tôi nếu được đánh giá đúng, được động viên và được hỗ trợ, lẽ ra đã có thể phát triển tiếp. Mặc dù cải tiến này không phải là kết quả để công bố tạp chí khoa học hay đem lại doanh thu ngay lập tức, nhưng có thể đem lại các tiến bộ công nghệ nhất định cho đất nước.
Bên cạnh bài học từ câu chuyện DeepSeek, tôi nghĩ rằng việc xây dựng các chương trình dự án lớn, với cơ chế triển khai đặc biệt như dự án Manhattan (dự án chế tạo bom nguyên tử) của Hoa Kỳ, sẽ đem lại một tầm nhìn xa cho khoa học công nghệ Việt Nam. Ở đây tôi không nói chuyện sản xuất bom nguyên tử, mà muốn nói rằng một dự án lớn, có tầm thời đại sẽ giúp chúng ta vượt qua những bài toán chuyên ngành manh mún, khó có tác động xã hội hay khó tạo ra được sản phẩm tầm cỡ.
Chúng ta kỳ vọng rằng, với Nghị quyết 57 của Bộ Chính trị về đột phá phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số, bức tranh toàn cảnh về khoa học công nghệ nước nhà sẽ ngày càng "sắc nét" hơn, tác động mạnh mẽ lên hệ thống giá trị, định hướng mục tiêu, đem lại sự hứng khởi và tự tin cho các nhà khoa học, các công ty công nghệ Việt Nam.
Tác giả: PGS, TS Nguyễn Ái Việt có hơn 20 năm giảng dạy, nghiên cứu khoa học và phát triển công nghệ ở các nước châu Âu và Mỹ. Ông từng giữ chức Phó Chánh Văn phòng Ban chỉ đạo Quốc gia về Công nghệ thông tin, Bộ Thông tin và Truyền thông (nay là Bộ Khoa học và Công nghệ).
Chuyên mục TÂM ĐIỂM mong nhận được ý kiến của bạn đọc về nội dung bài viết. Hãy vào phần Bình luận và chia sẻ suy nghĩ của mình. Xin cảm ơn!