Meeting note ứng dụng nhận diện giọng nói tiếng Việt

Trường Thịnh Lan Hương

(Dân trí) - Một trong những ứng dụng nổi bật của trí tuệ nhân tạo là Voice platform. Hiện tại Trung tâm Không gian mạng Viettel đã đưa công nghệ nhận diện giọng nói con người vào từng phòng họp, trở thành thư ký điện tử ghi lại các biên bản họp.

Giải pháp Voice Meeting Note của Viettel là sản phẩm ứng dụng công nghệ trí tuệ nhân tạo vào xử lý ngôn ngữ Tiếng Việt. Cụ thể là: Công nghệ nhận diện giọng nói Tiếng Việt (ASR - Automatic Speech Recognition); Công nghệ Xử lý ngôn ngữ tự nhiên (NLP - Natural Language Processing); Công nghệ tách kênh, nhận diện giọng người nói (VAD - Voice Activity Detection, SR - Speaker Recognition); Công nghệ học sâu (Deep Learning). Voice Meeting Note được đội ngũ kỹ sư của Trung tâm Không gian Mạng Viettel bắt đầu nghiên cứu từ năm 2016, chính thức hoàn thiện và đóng gói sản phẩm, cung cấp ra thị trường từ đầu năm 2019 đến nay đã có khả năng chuyển đổi dữ liệu giọng nói thành văn bản đạt độ chính xác lên đến 96%. Giải pháp được ứng dụng trong phòng họp của hàng loạt đơn vị như: Bộ Quốc phòng, Bộ Công an... và ngay tại các đơn vị trực thuộc Tập đoàn Viettel.

Ghi biên bản cuộc họp vốn được coi là một công việc khá thủ công, tốn thời gian nhưng lại không hề đơn giản. Nếu như trước đây thư ký phải ghi chép toàn diện, chính xác, khách quan nội dung của từng người tham gia họp thì giờ đây, Meeting note đã giải quyết bài toán này bằng chuỗi công nghệ số hóa quy trình, văn bản tài liệu và nghiệp vụ, giúp cho mọi tổ chức, doanh nghiệp tối ưu nguồn lực, nâng cao năng suất và tiết kiệm chi phí. Biên bản họp được ghi chép bởi Meeting note là thực hiện trực tiếp (realtime), tự động, không giới hạn về thời gian, địa điểm. Dựa trên nguồn dữ liệu lớn, số lượng gán nhãn lên đến hàng chục nghìn giờ dữ liệu, Viettel đang cung cấp ra thị trường một sản phẩm TOP đầu về khả năng nhận diện và chuyển đổi giọng nói đa dạng vùng miền, các từ ngữ chuyên môn, chuyên ngành, từ địa phương… thành văn bản (text); bóc tách, nhận diện giọng nói của các đối tượng khác nhau tham gia cuộc họp; tự động ghi biên bản họp cũng như xuất biên bản, điền phiếu việc tự động… Ứng dụng Deep learning cho phép hệ thống tự học và cải tiến độ chính xác trong quá trình đưa vào sử dụng.

Meeting note ứng dụng nhận diện giọng nói tiếng Việt - 1
Màn hình trang chủ thống kê & thanh menu các chức năng của hệ thống Meeting Note

Về mặt ứng dụng, giải pháp này được coi là bám sát thực tế nhu cầu người dùng tại Việt Nam, các kỹ sư phát triển sản phẩm Meeting note của Trung tâm Không gian mạng Viettel ưu tiên xây dựng tool công cụ có khả năng triển khai đơn giản, tương thích với hầu hết các hệ thống quản lý văn bản, quản lý công việc, tự động hóa các quy trình thống kê, báo cáo, giao việc... Khách hàng có thể đăng ký Meeting note dưới 2 hình thức: cloud và on-premise. Một ưu thế của sản phẩm được đặc biệt quan tâm đó là những cam kết đảm bảo các tiêu chuẩn an ninh an toàn dữ liệu tuyệt đối đến từ nhà cung cấp hàng đầu như Viettel.

Meeting note ứng dụng nhận diện giọng nói tiếng Việt - 2
Ví dụ triển khai màn hình Ghi âm cuộc họp trực tuyến

Theo ông Nguyễn Trường Giang - Giám đốc sản phẩm thì: "Viettel Voice Meeting Note đã trải qua nhiều phiên bản nâng cấp. Đến nay, công nghệ nhận diện giọng nói Tiếng Việt cũng như xử lý ngôn ngữ tự nhiên đã đạt tới độ chính xác 96%, tiệm cận với khả năng nghe/hiểu của con người. Hướng phát triển tiếp theo sẽ là tiếp tục hoàn thiện, nâng cao độ chính xác nhận diện tiếng vùng miền, tiếng địa phương, từ ngữ vay mượn; dễ dàng triển khai trong mọi môi trường phòng họp của các đơn vị". Đây là một công bố khá ấn tượng của đại diện nhà cung cấp.

Trong giai đoạn Covid, Meeting note hỗ trợ tốt cho việc đảm bảo giãn cách xã hội, tạo lập các văn phòng không giấy tờ, các phòng họp thông minh, trợ lý cuộc họp…giải quyết bài toán nhân sự cho các công việc lặp đi lặp lại và với khối lượng lớn. Chuyển đối số không phải từ đâu xa, chính là từ những thay đổi như Meeting note mang lại cho các tổ chức và doanh nghiệp.