Khám phá công nghệ giọng nói AI được Dân trí tiên phong phát triển thành báo nói

(Dân trí) - Báo điện tử Dân trí vừa tiên phong tích hợp thêm phiên bản báo nói, cho phép các độc giả có thể nghe nội dung của các bài viết thay vì phải đọc chữ như trước đây. Phiên bản báo nói của Dân trí ứng dụng công nghệ trí tuệ nhân tạo hiện đại do Trung tâm Không gian Mạng Viettel (VTCC) xây dựng và phát triển.

Khi truy cập vào trang web của báo điện tử Dân trí trên máy hoặc thiết bị di động, các độc giả sẽ thấy xuất hiện phía dưới tiêu đề là tùy chọn “Báo nói Dân trí”, mà người dùng có thể nhấn vào đây để có thể nghe  nội dung của bài báo, thay vì phải tự đọc.

Điều này giúp người dùng có thể trải nghiệm nội dung bài báo tốt hơn mà không cần phải mất thời gian tập trung vào màn hình, vừa có thể theo dõi bài báo, vừa có thể thư giãn cho đôi mắt.

Để phù hợp với sở thích và vùng miền mình đang sinh sống, độc giả có thể tùy chọn giọng đọc là nam hoặc nữ, giọng nói miền Nam hoặc miền Bắc, giúp nghe rõ và chính xác hơn về nội dung của bài báo.

Khám phá công nghệ giọng nói AI được Dân trí tiên phong phát triển thành báo nói - 1

Tùy chọn giọng đọc của phiên bản báo nói Dân trí giúp phù hợp với nhu cầu của độc giả

Áp dụng công nghệ hiện đại nhất trong lĩnh vực trí tuệ nhân tạo

Phiên bản báo nói của Dân trí là thành quả kết hợp giữa báo điện tử Dân trí và Trung tâm Không gian Mạng Viettel (VTCC).  Bằng việc nghiên cứu áp dụng công cụ chuyển đổi văn bản thành giọng nói tiếng Việt tự nhiên (VTCC.AI) do VTCC xây dựng và phát triển, báo Dân trí đã thực hiện thành công việc đưa báo nói lên web.

Về công nghệ, các kỹ sư nhóm xử lý tiếng nói của VTCC đã sử dụng công nghệ hiện đại nhất trong lĩnh vực trí tuệ nhân tạo như mạng nơron học sâu để sản sinh ra tiếng nói Tiếng Việt với ngữ điệu tự nhiên, đa dạng và dễ dàng tích hợp trên các hệ thống.

VTCC.AI sử dụng công nghệ học sâu (deep learning) tiên tiến thay vì áp dụng các kỹ thuật truyền thống như HMM (Hidden Markov Model) hay ghép nối các từ... giúp cho giọng đọc tự nhiên, liền mạch, ngắt nghỉ, kết hợp với biểu cảm chính xác.

Sản phẩm này đạt được giải nhất trong cuộc thi xử lý ngôn ngữ tiếng Việt (VLSP 2018) với số điểm vượt trội so với các đối thủ cả về độ tự nhiên lẫn mức độ rõ ràng và được các chuyên gia đánh giá cao. 

Khám phá công nghệ giọng nói AI được Dân trí tiên phong phát triển thành báo nói - 2

Công cụ báo nói Dân trí giúp độc giả có thể theo dõi nội dung bài báo vừa có thể thư giãn mà không cần phải tập trung vào màn hình

Giọng đọc Bắc, Nam

Với việc sử dụng các công nghệ tiên tiến thế giới về xử lý ngôn ngữ tự nhiên, xử lý tiếng nói, học sâu, hệ thống tổng hợp giọng nói cho báo Dân trí sinh ra 3 giọng đọc cho người dùng lựa chọn theo giọng Nam/Bắc, Nam/Nữ  nên với một triệu bài viết sẽ sinh ra số bài báo đọc tương ứng là 3 triệu, đòi hỏi rất nhiều tài nguyên của cả Dantri.com.vn và VTCC.

Để đáp ứng nhu cầu của độc giả, VTCC và hệ thống báo nói Dân trí hiện đang sử dụng số lượng lớn các máy chủ mạnh với công nghệ tính toán song song cho phép đáp ứng nhanh chóng mọi yêu cầu của bạn đọc, đội ngũ kỹ thuật đã tăng cường hệ thống hạ tầng server, băng thông, tối ưu thuật toán nén dữ liệu để đảm bảo bạn đọc nghe được nhanh nhất, ngay cả trong các trường hợp truy cập tăng đột biến.

Chất lượng giọng nói tiếng Việt của VTCC.AI vượt trội so với với sản phẩm tương tự, chẳng hạn như công cụ chuyển đổi văn bản thành giọng nói tiếng Việt của Google, cả về âm điệu, cách ngắt câu, thể hiện biểu cảm...

Khi sử dụng công cụ báo nói Dân trí, độc giả rất khó để có thể nhận ra rằng những giọng đọc ở trên trang web đều là giọng đọc nhân tạo, bởi giọng điệu hết sức tự nhiên.

Video trải nghiệm giọng nói tự nhiên của VTCC.AI và so sánh với giọng nói của Google

Dantri.com.vn là báo nói đầu tiên tích hợp với VTCC nên ban đầu còn gặp nhiều khó khăn, ví dụ cụm các thuật ngữ chuyên ngành, cụm từ viết tắt... Đội ngũ kỹ thuật đã phải thử nghiệm trên hàng triệu mẫu giọng để chọn ra giọng đọc phù hợp nhất và dự kiến sẽ còn tiếp tục cải thiện các tính năng của phiên bản báo nói, giúp mang đến độc giả Dân trí trải nghiệm tốt nhất.

T.Thủy

Đang được quan tâm
Sản phẩm: Giải pháp ứng dụng công nghệ trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên Vbee (Vietnamese text to speech)

Sản phẩm: Giải pháp ứng dụng công nghệ trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên Vbee (Vietnamese text to speech)

VBEE TTS (công nghệ tổng hợp tiếng nói) là dịch vụ đầu tiên áp tại thị trường Việt Nam được công bố và áp dụng thành công trí tuệ nhân tạo học máy vào ngôn ngữ tự nhiên tiếng Việt, cho kết quả giọng nói tự nhiên như con người, có xảm xúc, có “tâm hồn”.
Chebi Chat – Trợ lý ảo thông minh hỗ trợ cộng đồng học Ngoại ngữ

Chebi Chat – Trợ lý ảo thông minh hỗ trợ cộng đồng học Ngoại ngữ

Đáp ứng nhu cầu học ngoại ngữ trong thời đại hội nhập phát triển, ứng dụng trợ lý ảo học ngoại ngữ Chebi Chat là giải pháp được phát triển giúp tạo nên một người bạn ảo để mọi người có thể rèn luyện kỹ năng ngoại ngữ của mình. Sản phẩm nằm trong TOP 17 sản phẩm công nghệ xuất sắc nhất của Nhân tài Đất Việt năm 2017.
“Nhờ” trí tuệ nhân tạo chuyển đổi văn bản sang tiếng nói tự nhiên

“Nhờ” trí tuệ nhân tạo chuyển đổi văn bản sang tiếng nói tự nhiên

Là Sản phẩm số Triển vọng được lựa chọn vào vòng Chung khảo Giải thưởng Nhân tài Đất Việt 2018 - Giải pháp ứng dụng công nghệ trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên - Vbee xuất phát từ nhu cầu ban đầu về một giải pháp công nghệ hỗ trợ người khiếm thị Việt Nam tiếp cận thông tin tốt hơn…
Mạng truyền tải và xử lý hình ảnh thông minh Trixabyte: Đa lợi ích, chi phí thấp!

Mạng truyền tải và xử lý hình ảnh thông minh Trixabyte: Đa lợi ích, chi phí thấp!

Sản phẩm vừa được lựa chọn vào vòng Chung khảo Giải thưởng Nhân tài Đất Việt 2018 lĩnh vực CNTT - mạng truyền tải và xử lý hình ảnh thông minh Trixabyte được xem là một thành tựu, hướng tới đối tượng khách hàng những người cần một công nghệ phân phối và xử lý hình ảnh thông minh và những nhà thiết kế, phát triển sản phẩm lấy cảm hứng tiếp tục nghiên cứu.