Viettel AI tiếp tục dẫn đầu tại giải thưởng về Xử lý tiếng nói VLSP 2021
(Dân trí) - Tại Hội thảo Quốc tế lần thứ 8 về Xử lý ngôn ngữ và tiếng nói tiếng Việt (VLSP 2021) do Câu lạc bộ VLSP - chi hội của Hội Tin học Việt Nam tổ chức, Viettel AI đạt giải nhất về Công nghệ nhận dạng giọng nói tiếng Việt.
Năm 2021, Hội thảo VLSP 2021 phát động với 9 cuộc thi đánh giá các công cụ xử lý văn bản và tiếng nói tiếng Việt. Chuỗi cuộc thi này nhằm thu hút các nhóm nghiên cứu trong và ngoài nước chia sẻ kinh nghiệm, thúc đẩy hợp tác giữa các trường đại học, viện nghiên cứu và doanh nghiệp công nghệ. Qua đó, các nhà nghiên cứu và chuyên gia công nghệ nắm bắt được quá trình phát triển và đưa ra các vấn đề cần giải quyết về xử lý ngôn ngữ tại Việt Nam.
Trong phần thi Nhận dạng tiếng nói (Automatic Speech Recognition - ASR), Viettel AI được phát triển bởi Trung tâm Không gian mạng Viettel (VTCC) đã đạt giải nhất với tỉ lệ lỗi chỉ 4,17% trong khi tỷ lệ lỗi trung bình của các đội xếp sau lên đến 14,79%. Kết quả trên là thành quả dựa trên ba yếu tố then chốt đã hội tụ tại VTCC bao gồm dữ liệu, hạ tầng tính toán và đội ngũ nghiên cứu.
Cụ thể VTCC đã xây dựng được bộ dữ liệu huấn luyện mô hình nhận dạng tiếng nói chất lượng cao lên đến hàng nghìn giờ và con số này dự tính sẽ tăng lên hàng chục nghìn giờ vào năm 2022. Bộ dữ liệu này được thiết kế nhằm tối đa hóa sự đa dạng giọng nói của người Việt về độ tuổi, giới tính, vùng miền cũng như môi trường nói. Điều này giúp hệ thống của VTCC có thể hoạt động ổn định, sai số thấp với hầu hết các ứng dụng trong trong thực tế.
Về hạ tầng tính toán, VTCC được Tập đoàn Viettel đầu tư hệ thống NVIDIA DGX A100 có năng lực tính toán lên đến 20 petaFLOPS, tức 5 triệu tỷ phép tính với dấu phẩy động trong một giây. Hệ thống này giúp thời gian huấn luyện, thử nghiệm các mô hình AI được giảm xuống tính bằng đơn vị ngày thậm chí đơn vị giờ thay vì phải chờ đợi hàng tuần, hàng tháng như các hệ thống cũ.
Với đội ngũ nghiên cứu mạnh gồm các chuyên gia và kỹ sư cả trong và ngoài nước, VTCC là đơn vị đi tiên phong nghiên cứu các công nghệ mới nhất trên thế giới như các hệ thống nhận dạng tiếng nói dựa trên kiến trúc đầu-cuối (end-to-end) hay các phương pháp tự huấn luyện (self-training). Ngoài ra nhóm nghiên cứu còn có những sáng tạo, phát triển riêng cho đặc thù tiếng nói tiếng Việt thể hiện thông qua các sáng chế và bài báo Quốc tế.
Đây cũng là lần thứ 2, Trung tâm Không gian mạng Viettel tham gia hội thảo VLSP. Trong lần đầu, Viettel AI đã đạt giải nhất với số điểm đạt 4.5/5 độ tự nhiên tại cuộc thi Tổng hợp tiếng nói và giải nhì trong cuộc thi Nhận dạng tiếng nói.
Qua 2 lần tham dự và đạt được những giải thưởng cao tại hội thảo VLSP, có thể thấy, Viettel hiện nay vẫn đang là đơn vị đi đầu trong lĩnh vực xử lý tiếng nói tại Việt Nam.