Khám phá công nghệ giọng nói AI được Dân trí tiên phong phát triển thành báo nói
(Dân trí) - Báo điện tử Dân trí vừa tiên phong tích hợp thêm phiên bản báo nói, cho phép các độc giả có thể nghe nội dung của các bài viết thay vì phải đọc chữ như trước đây. Phiên bản báo nói của Dân trí ứng dụng công nghệ trí tuệ nhân tạo hiện đại do Trung tâm Không gian Mạng Viettel (VTCC) xây dựng và phát triển.
Khi truy cập vào trang web của báo điện tử Dân trí trên máy hoặc thiết bị di động, các độc giả sẽ thấy xuất hiện phía dưới tiêu đề là tùy chọn “Báo nói Dân trí”, mà người dùng có thể nhấn vào đây để có thể nghe nội dung của bài báo, thay vì phải tự đọc.
Điều này giúp người dùng có thể trải nghiệm nội dung bài báo tốt hơn mà không cần phải mất thời gian tập trung vào màn hình, vừa có thể theo dõi bài báo, vừa có thể thư giãn cho đôi mắt.
Để phù hợp với sở thích và vùng miền mình đang sinh sống, độc giả có thể tùy chọn giọng đọc là nam hoặc nữ, giọng nói miền Nam hoặc miền Bắc, giúp nghe rõ và chính xác hơn về nội dung của bài báo.
Áp dụng công nghệ hiện đại nhất trong lĩnh vực trí tuệ nhân tạo
Phiên bản báo nói của Dân trí là thành quả kết hợp giữa báo điện tử Dân trí và Trung tâm Không gian Mạng Viettel (VTCC). Bằng việc nghiên cứu áp dụng công cụ chuyển đổi văn bản thành giọng nói tiếng Việt tự nhiên (VTCC.AI) do VTCC xây dựng và phát triển, báo Dân trí đã thực hiện thành công việc đưa báo nói lên web.
Về công nghệ, các kỹ sư nhóm xử lý tiếng nói của VTCC đã sử dụng công nghệ hiện đại nhất trong lĩnh vực trí tuệ nhân tạo như mạng nơron học sâu để sản sinh ra tiếng nói Tiếng Việt với ngữ điệu tự nhiên, đa dạng và dễ dàng tích hợp trên các hệ thống.
VTCC.AI sử dụng công nghệ học sâu (deep learning) tiên tiến thay vì áp dụng các kỹ thuật truyền thống như HMM (Hidden Markov Model) hay ghép nối các từ... giúp cho giọng đọc tự nhiên, liền mạch, ngắt nghỉ, kết hợp với biểu cảm chính xác.
Sản phẩm này đạt được giải nhất trong cuộc thi xử lý ngôn ngữ tiếng Việt (VLSP 2018) với số điểm vượt trội so với các đối thủ cả về độ tự nhiên lẫn mức độ rõ ràng và được các chuyên gia đánh giá cao.
Công cụ báo nói Dân trí giúp độc giả có thể theo dõi nội dung bài báo vừa có thể thư giãn mà không cần phải tập trung vào màn hình
Giọng đọc Bắc, Nam
Với việc sử dụng các công nghệ tiên tiến thế giới về xử lý ngôn ngữ tự nhiên, xử lý tiếng nói, học sâu, hệ thống tổng hợp giọng nói cho báo Dân trí sinh ra 3 giọng đọc cho người dùng lựa chọn theo giọng Nam/Bắc, Nam/Nữ nên với một triệu bài viết sẽ sinh ra số bài báo đọc tương ứng là 3 triệu, đòi hỏi rất nhiều tài nguyên của cả Dantri.com.vn và VTCC.
Để đáp ứng nhu cầu của độc giả, VTCC và hệ thống báo nói Dân trí hiện đang sử dụng số lượng lớn các máy chủ mạnh với công nghệ tính toán song song cho phép đáp ứng nhanh chóng mọi yêu cầu của bạn đọc, đội ngũ kỹ thuật đã tăng cường hệ thống hạ tầng server, băng thông, tối ưu thuật toán nén dữ liệu để đảm bảo bạn đọc nghe được nhanh nhất, ngay cả trong các trường hợp truy cập tăng đột biến.
Chất lượng giọng nói tiếng Việt của VTCC.AI vượt trội so với với sản phẩm tương tự, chẳng hạn như công cụ chuyển đổi văn bản thành giọng nói tiếng Việt của Google, cả về âm điệu, cách ngắt câu, thể hiện biểu cảm...
Khi sử dụng công cụ báo nói Dân trí, độc giả rất khó để có thể nhận ra rằng những giọng đọc ở trên trang web đều là giọng đọc nhân tạo, bởi giọng điệu hết sức tự nhiên.
Dantri.com.vn là báo nói đầu tiên tích hợp với VTCC nên ban đầu còn gặp nhiều khó khăn, ví dụ cụm các thuật ngữ chuyên ngành, cụm từ viết tắt... Đội ngũ kỹ thuật đã phải thử nghiệm trên hàng triệu mẫu giọng để chọn ra giọng đọc phù hợp nhất và dự kiến sẽ còn tiếp tục cải thiện các tính năng của phiên bản báo nói, giúp mang đến độc giả Dân trí trải nghiệm tốt nhất.
T.Thủy