“Nhờ” trí tuệ nhân tạo chuyển đổi văn bản sang tiếng nói tự nhiên

Là Sản phẩm số Triển vọng được lựa chọn vào vòng Chung khảo Giải thưởng Nhân tài Đất Việt 2018 - Giải pháp ứng dụng công nghệ trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên - Vbee xuất phát từ nhu cầu ban đầu về một giải pháp công nghệ hỗ trợ người khiếm thị Việt Nam tiếp cận thông tin tốt hơn…

Vbee được nghiên cứu và phát triển xuất phát từ nhu cầu về một giải pháp công nghệ hỗ trợ người khiếm thị Việt Nam tiếp cận thông tin tốt hơn. Nhóm tác giả Vbee đã nghiên cứu, hoàn thiện giải pháp và cho ra mắt giải pháp công nghệ và dịch vụ TTS (Text to Speech) vào tháng 01/2018. Công nghệ này không chỉ mang lại lợi ích lớn cho cộng đồng người khuyết tật mà còn mang lại nhiều giá trị thực tiễn, ứng dụng sâu rộng trong hệ thống tổng đài chăm sóc khách hàng, tổng đài nhắc nợ, hay các hệ thống phát thanh trong các lĩnh vực công cộng như giao thông, y tế…

Ứng dụng hiệu quả nhờ nền tảng AI tiên tiến

Công nghệ TTS của Vbee được phát triển trên nền tảng AI tiên tiến, độc đáo, đón đầu xu hướng của cuộc cách mạng công nghệ 4.0. Công nghệ Text to Speech làm việc trên nền tảng công nghệ trí tuệ nhân tạo AI là công nghệ sở hữu khả năng học tập như bộ não con người. Không những thế, AI còn khắc phục những nhược điểm của bộ não con người.

Vbee mang lại một giải pháp mới và tối ưu trong việc áp dụng trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt thành giọng nói tự nhiên, giúp cho cộng đồng có thể tiếp cận được tri thức nhân loại một cách nhanh nhất, dễ nhất, rẻ nhất. Text to Speech trên AI dễ dàng tích hợp với bất kỳ hệ thống nào để xây dựng tổng đài chăm sóc khách hàng tự động, ứng dụng đọc tin tức, tương tác hội thoại với robots, và nhiều ứng dụng khác.

Giải pháp TTS của Vbee giải quyết được các vấn đề đặc thù của ngôn ngữ tiếng Việt, tính toán tối ưu được dữ liệu, thiết kế giọng đọc và cấu trúc ngôn ngữ để bao phủ được toàn bộ câu, cụm từ, từ, âm tiết, âm vị, ngữ âm và các ngữ cảnh khác nhau, thành phần câu trong văn bản. Điều này phải bắt đầu từ việc phân tích ngôn ngữ sau đó mới đến cấu trúc hệ thống và tối ưu dữ liệu.

images

Đồng thời, giải pháp của Vbee cũng xử lý được các khác biệt về ngôn ngữ theo từng vùng miền. Ví dụ ở miền Bắc, phân biệt rất rõ các dấu ngang, huyền, hỏi, ngã, sắc, nặng nhưng miền Nam không phân biệt được hỏi và ngã. Hay ở miền Nam và miền Trung, phát âm có phân biệt rất rõ về gi, tr, ch, r…. nhưng miền Bắc lại không phân biệt rõ ràng. Trong khi đó, văn bản đầu vào là giống nhau. Điều này cần phải có cách xử lý cụ thể từ cầu trúc tiếng nói tự nhiên, phân tích văn bản rồi đưa ra âm vị, ngữ cảnh, ngữ điệu… trước khi đưa vào để tổng hợp tiếng nói.

Có thể ứng dụng trong nhiều lĩnh vực khác nhau

Sử dụng giải pháp Vbee TTS cho phép cộng đồng xây dựng nội dung số bằng tiếng nói một cách tự động, nhanh và tiết kiệm. Bên cạnh ý nghĩa nhân văn của giải pháp TTS của Vbee trong việc giúp cộng đồng người khuyết tật tiếp cận được với thông tin như người bình thường. Công nghệ TTS của Vbee được ứng dụng vào các sản phẩm và dịch vụ, cung cấp cho cộng đồng người khiếm thị và người bị câm giải pháp về tiếp cận và sản xuất thông tin. Đây là ứng dụng vụ đầu tiên áp tại thị trường Việt Nam được công bố và áp dụng thành công trí tuệ nhân tạo học máy vào ngôn ngữ tự nhiên tiếng Việt, cho kết quả giọng nói tự nhiên như con người, có xảm xúc, có “tâm hồn”.

VBee có thể được ứng dụng trong nhiều lĩnh vực khác nhau trong đời sống xã hội, như phát triển các kho sách nói, ứng dụng báo nói, các dịch vụ bằng tiếng nói trên điện thoại thông minh cũng như các thiết bị nhà thông minh, dịch vụ ngân hàng thông minh, tổng đài thông minh, hệ thống chăm sóc khách hàng, trong y tế, giáo dục… Giải pháp có thể trở thành công cụ tạo sách nói tự động, cho phép chuyển tự động sách văn bản thành sách nói. Công cụ cho phép bóc tách, chuẩn hoá, và từ đó tổng hợp văn bản sách thành tiếng nói;

Giải pháp cũng có thể là công cụ thuyết minh phim tự động, cho phép chuyển đổi các phụ đề thành giọng thuyết minh khớp với các khung hình trong phim một cách hoàn toàn tự động và nhanh chóng, tiết kiệm được rất nhiều thời gian và tiền bạc, đặc biệt với số lượng lớn phim cần thuyết minh. Công cụ cho phép cấu hình tiếng nói đầu ra như chất lượng tốc độ, loại giọng. Công cụ cũng cho phép định nghĩa các đoạn hội thoại với các giọng khác nhau (nam, nữ, trẻ em…) để thuyết minh gần hơn với các giọng của nhân vật trong phim.

Hiện công nghệ TTS của Vbee đã được triển khai thành công vào các dự án của nhiều đối tác tin cậy trong nước như: Công ty cổ phần Lumi Việt Nam (38 Đỗ Đức Dục, Quận Nam Từ Liêm, Hà Nội) sử dụng giải pháp của VBee để cung cấp nội dung số cho các thiết bị nhà thông minh (loa thông minh), đồng thời sử dụng công nghệ trong sản phẩm để tương tác với thiết bị nhà thông minh bằng giọng nói. Đây là sản phẩm về điều khiển thiết bị nhà thông minh đầu tiên ra mắt thành công tại thị trường Việt Nam sử dụng tiếng Việt… Rất nhiều doanh nghiệp đã nhận thấy những tính năng ưu việt của Vbee TTS, đã bước đầu dùng thử giải pháp và có những đánh giá tích cực, có thể kể đến: VNG, KinderTech, NTTNetworks, SouthStreet, IrisMedia, Cloudfone, Gcalls, Tel4VN…

 Theo kế hoạch, với lĩnh vực CNTT, dự kiến ngày 18/11, các tác giả, nhóm tác giả vượt qua vòng sơ khảo nội dung CNTT sẽ tập trung tại Hà Nội và thuyết trình, bảo vệ sản phẩm trực tiếp trước Hội đồng Chung khảo. Lễ trao giải “Giải thưởng Nhân Tài Đất Việt 2018” sẽ diễn ra trang trọng tại Cung Văn hóa Hữu Nghị Hà Nội, 91 Trần Hưng Đạo, Hà Nội vào tối 20/11 và được truyền hình trực tiếp trên kênh VTV2, Đài Truyền hình Việt Nam.
Được Hội Khuyến học Việt Nam khởi xướng từ năm 2005 và được đồng tổ chức bởi Báo Dân trí cùng Tập đoàn Bưu chính Viễn thông Việt Nam (VNPT), đến nay, Giải thưởng Nhân tài Đất Việt đã bước sang năm thứ 14, trở thành Giải thưởng uy tín mang tầm vóc quốc gia. Trong 13 năm qua, đã có hàng nghìn sản phẩm dự thi và hàng chục sản phẩm được tôn vinh mỗi năm thực sự đã phát huy giá trị, ứng dụng trong mọi lĩnh vực đời sống. Giải thưởng Nhân tài Đất Việt thực sự là sân chơi để những nhân tài của đất nước có cơ hội chứng minh sức mạnh của trí tuệ và sự sáng tạo phục vụ cộng đồng.

Trong tương lai, nhóm tác giả sản phẩm sẽ nghiên cứu và phát triển giải pháp đang tiếp tục hoàn thiện lõi tổng hợp tiếng nói của Vbee theo các hướng hoàn thiện phần chuẩn hoá cách đọc cho các trường hợp nhập nhằng, sử dụng các giải pháp học máy, học sâu trên nền tảng trí tuệ nhân tạo; đa dạng hoá hơn nữa các giọng cho các lứa tuổi, vùng miền trên toàn quốc; Tiếp tục cải tiến chất lượng giọng đọc sao cho tự nhiên hơn, gần gũi hơn với tiếng nói tự nhiên của con người, sử dụng các kỹ thuật, phương pháp mới nhất trong lĩnh vực nghiên cứu trên nền tảng trí tuệ nhân tạo…

Hiền Mai – VnMedia