"Ai sẽ giải bài toán của Việt Nam nếu không phải chính người Việt"
(Dân trí) - Ít ai biết rằng, để giành được giải Nhất Nhân tài Đất Việt 2019 với phần mềm tự động chuyển đổi giọng nói tiếng Việt sang văn bản, nhóm tác giả đã phải dốc hết những đồng tiền tiết kiệm cuối cùng. Tất cả chỉ vì một câu hỏi: Ai sẽ giải bài toán của Việt Nam nếu không phải chính người Việt?
Đỗ Quốc Trình, đồng sáng lập kiêm Giám đốc Phát triển kinh doanh Công ty TNHH Trí thông minh Nhân tạo Việt Nam (VAIS), đơn vị giành quán quân Nhân tài Đất Việt 2019 trong lĩnh vực CNTT, đã tâm sự về hành trình đầy cảm xúc ấy.
Xông ra chiến đấu và có thể "chết" sau 6 tháng
- Xin chúc mừng sản phẩm Origin-STT của các anh đã “lên ngôi” Nhân tài Đất Việt năm nay! Vì sao anh và nhóm tác giả của VAIS lại lựa chọn đầu bài khó đến thế bởi tiếng Việt là một trong những ngôn ngữ khó học, khó phát âm nhất trên thế giới?
Công nghệ nhận dạng giọng nói dù đã có từ lâu nhưng những “ông lớn” như Google chưa phát triển những nền tảng dành riêng cho người Việt một cách triệt để. Vì thế việc chuyển đổi giọng nói thành chữ viết tiếng Việt với độ chính xác cao là điều chúng tôi rất trăn trở. Chúng tôi đặt ra câu hỏi “Ai sẽ giải bài toán của Việt Nam nếu không phải chính người Việt?” và lên ý tưởng sử dụng trí tuệ nhân tạo (AI) để xử lý câu chuyện này.
- Trước đó, Origin-STT được nhắc tới khi gỡ băng cho các phiên chất vấn của Quốc hội với độ chính xác cao. Theo anh, dự án có thể ứng dụng ra sao trong cuộc sống?
Origin-STT là công nghệ lõi và gỡ băng trong các phiên họp chỉ là một trong những ứng dụng thiết thực. Ngoài ra, Origin-STT có thể sử dụng cho các nhà báo tác nghiệp hoặc tại các bệnh viện, nơi bác sĩ vừa khám bệnh vừa đọc chẩn đoán, các cảnh báo, lưu ý và phần mềm sẽ tự động xuất ra bệnh án điện tử.
Công nghệ này cũng có thể ứng dụng để hỗ trợ ghi biên bản điều tra hiện trường, trong các phiên tòa, với tổng đài dịch vụ hay phát triển hỗ trợ cho người khuyết tật...
- Phần lớn startup phải rời bỏ thị trường chỉ trong thời gian ngắn ban đầu vì hết tiền và không thể gọi vốn. Với VAIS, các anh đang vượt qua quãng thời gian này ra sao?
VAIS được thành lập tháng 8/2018 với 5 thành viên, phần lớn đều là thế hệ 9X. Trước đó, mọi người đều đang có những công việc với thu nhập tốt, có thể nói là đáng mơ ước. Bản thân tôi trước đó cũng đang làm ở KPMG Việt Nam (một trong những Tập đoàn kiểm toán nằm trong nhóm Big Four). Tuy nhiên, mấy anh em đã xác định tinh thần, cùng xông ra ngoài chiến đấu.
Thời gian đầu, toàn bộ kinh phí hoạt động là tiền tích góp trong vài năm đi làm của 5 thành viên. Chúng tôi tính toán, nếu không có thu nhập, công ty chỉ hoạt động được 6 tháng. Tuy nhiên, tôi và 4 người bạn cùng nghĩ sẽ "chơi hết mình".
May mắn là ngay trong những tháng đầu tiên, chúng tôi đã nhận được một dự án lớn hợp tác với trang thương mại điện tử Adayroi. Trong đó điều làm chúng tôi rất cảm kích là nhận được sự tin tưởng và hỗ trợ tài chính rất quan trọng từ Quỹ Đổi mới sáng tạo Vingroup (VINIF).
VINIF đã tạo cảm hứng, giúp chúng tôi đi nhanh
- Cảm giác có dự án đầu tay như thế nào, nhất là với những ông lớn như Adayroi?
Cả nhóm rất mừng vì dù xác định từ đầu là xông ra chiến đấu nhưng nếu không có tiền, mọi sự phát triển chỉ là trên giấy. Phải có tài chính thì anh em mới lên được kế hoạch cho công việc một cách chính xác.
Với dự án đầu tay, nhóm đã giúp cải thiện khả năng tìm kiếm trên website này. Ví dụ người dùng có thể viết không dấu hoặc có dấu, hay chưa chính xác tên gọi các sản phẩm, công cụ tìm kiếm đều nhận biết với độ chính xác cao.
Ngoài ra, chúng tôi cũng phát triển chatbot (chương trình tương tác tự động với người dùng qua tin nhắn hoặc âm thanh). Một trong những tính năng đó là khi người dùng muốn hủy đơn hàng đã đặt, chatbot sẽ tự động hỏi xin số điện thoại, mã đơn hàng của người dùng và liên kết với hệ thống dữ liệu để xác định khách hàng đã đặt mua gì. Đối chiếu với các điều kiện, chatbot sẽ tự động xác nhận việc hủy đơn với khách hàng.
Điểm khác biệt là hệ thống chatbot này là có thể tự học hỏi thêm để nhận biết các tình huống khác nhau thay vì chỉ "bắt cứng" từ khóa như những chương trình khác.
- Anh đã nhắc tới sự hỗ trợ của Quỹ Đổi mới sáng tạo Vingroup (VINIF). Điều này có ý nghĩa ra sao trong hành trình của VAIS?
Mặc dù rất tự tin vào sự cố gắng của mình nhưng thực sự VAIS là tập hợp của những người trẻ. Tuy nhiên, VINIF đã đặt niềm tin vào chúng tôi. Đó là điều rất ý nghĩa. Chúng tôi đã may mắn có cơ hội tiếp xúc với Giám đốc khoa học của Quỹ là giáo sư Vũ Hà Văn - một nhà khoa học lừng danh thế giới. Được những vị giáo sư như anh Văn đánh giá đây là một nền tảng tốt chính là sự ghi nhận với chúng tôi.
Chính sự tin tưởng và hỗ trợ của VINIF đã tạo ra động lực, cảm hứng, giúp anh em duy trì và đưa startup của mình đi nhanh hơn. Việc đi nhanh là rất quan trọng với các startup vì nếu các ý tưởng không được hiện thực hóa ngay, rất nhiều doanh nghiệp khác có thể sẽ giành trước.
- Bước đi đầu tiên với VINIF đã giúp cả nhóm ra sao trên con đường vươn tới giải Nhất Nhân tài Đất Việt sau đó?
Dự án đã tạo tiền đề cho chúng tôi không chỉ về tài chính mà về kỹ thuật, việc nghiên cứu cũng giúp nhóm nâng cao được chất lượng nhận dạng ngôn ngữ tự nhiên.
Đơn cử, chúng tôi đã nghiên cứu để chương trình của mình hiểu được các ngữ cảnh khác nhau, từ đó "đoán" chữ chính xác hơn trong từng câu văn. Đây là một phần quan trọng của sản phẩm Origin-STT sau đó.
Tới bây giờ, chúng tôi càng thấy rõ, nếu không có người đồng hành như VINIF, những bước đi ban đầu của chúng tôi chắc chắn sẽ nặng nề hơn rất nhiều. Có tới 90% dự án khởi nghiệp phải dừng cuộc chơi trong 2 năm đầu vì rỗng túi và không kêu gọi được sự hỗ trợ. Quỹ đã đến với chúng tôi đúng thời điểm và giúp chúng tôi tự tin hơn khi thấy những nỗ lực của mình được ghi nhận xứng đáng.
- Hướng đi trong tương lai của VAIS là gì sau giải Nhân tài Đất Việt và xa hơn nữa?
Với phần mềm tự động chuyển đổi giọng nói tiếng Việt sang văn bản, điều chúng tôi muốn là cải thiện công nghệ lõi để nhận dạng và chuẩn hóa văn bản tốt hơn. Trong tháng 12, chúng tôi sẽ chính thức ra mắt Origin-STT với độ chính xác cao và có cả ứng dụng trên các thiết bị di động.
Tuy nhiên, nhìn rộng hơn, điều chúng tôi hướng tới là nền tảng mở để các nhà sáng lập tự phát triển thêm các ý tưởng./.
- Xin cảm ơn anh!
Phần mềm tự động chuyển đổi tiếng nói tiếng Việt sang văn bản (Origin-STT) có độ chính xác trung bình lên tới 93,6%. Origin-STT có thể nhận dạng giọng nói ở cả 3 miền Bắc, Trung, Nam với khoảng 7.000 từ tiếng Việt.
Origin sẽ giúp người dùng tiết kiệm phần lớn thời gian, công sức nghe lại âm thanh và gõ lại văn bản (gỡ băng). Trung bình, với một đoạn băng dài 60 phút, phần mềm chỉ cần 6 phút để hoàn thành việc chuyển đổi. Qua đó, Origin-STT có thể hỗ trợ tốt cho các nhà báo tác nghiệp, giúp các bác sỹ làm bệnh án điện tử hay ứng dụng cho ghi biên bả các phiên tòa, tổng đài dịch vụ,...