Sản phẩm vào Chung khảo Nhân tài đất Việt 2016:

“iHearTech” - Sản phẩm đọc sách báo cho người khiếm thị

(Dân trí) - Để hỗ trợ người khiếm thị tiếp cận thông tin, không ít các hãng công nghệ lớn đã cho ra đời ứng dụng nhận dạng và tổng hợp tiếng nói. Tuy nhiên, trở ngại là các ứng dụng này chỉ hỗ trợ tiếng Anh. Chíp iHearTech được sáng tạo để hỗ trợ nhận dạng tiếng Việt.

Sản phẩm chip nổi trội

Chip “iHearTech” – sáng tạo vì người khiếm thị Việt Nam

PGS-TS Hoàng Trang, Phó Trưởng khoa Điện – Điện tử Trường ĐH Bách khoa – trưởng nhóm nghiên cứu sản phẩm chip “iHearTech” chia sẻ: “So với các loại chip tương tự đang có mặt trên thị trường thế giới thì chíp iHearTech có nhiều chỉ số vượt trội cả về số lượng từ nhận dạng lẫn thời gian xử lý, xác suất nhận dạng chính xác, tần số hoạt động của chip…”

Theo TS Trang, sản phẩm này được xây dựng dựa trên nền tảng 3 yếu tố: công nghệ, ứng dụng và thương mại như một vòng lặp để hỗ trợ lẫn nhau. Công nghệ phải cải tiến sao cho phù hợp với ứng dụng và đáp ứng được tính thương mại, tùy vào nhu cầu của người sử dụng.

Công dụng chính của thiết bị là tiếp nhận lệnh bằng giọng nói và điều khiển theo lệnh. Khi người khiếm thị ra lệnh cho thiết bị truy cập vào một tờ báo điện tử nào đó, thiết bị sẽ có bộ phận lọc bỏ các dữ liệu không cần thiết khác, chỉ giữ lại phần chữ, sau đó chuyển định dạng chữ sang định dạng âm thanh, và phát ra cho người nghe.

Ngoài đọc báo online, thiết bị có bộ nhớ để lưu các tài liệu sách nói để khi không có Internet, người khiếm thị có thể nghe offline ở bất kỳ đâu, bất kỳ lúc nào họ muốn.

iHearTech - điều khiển thiết bị nhà thông minh

Bên cạnh đó, thiết bị cũng được ứng dụng vào điều khiển thiết bị trong nhà thông minh bằng tiếng nói (smarthome). Thiết bị có tính năng nổi trội hơn nhiều giải pháp hiện nay ở chỗ cho phép tích hợp những cảm biến của nhiều hãng khác nhau.

Qua thẩm định thực tế, chip iHearTech hỗ trợ bộ từ phụ thuộc người nói tối đa đến 768 từ, hỗ trợ bộ từ độc lập người nói tối đa 256 từ (giọng của bất kỳ ai nói máy đều nhận dạng). Với số lượng từ đó, khi người nói phối từ với nhau sẽ ra nhiều câu có nghĩa.

Để máy dễ dàng tiếp nhận, nhóm nghiên cứu đã xây dựng bộ xử lý văn phạm, trong đó gom gọn các câu lệnh bằng những “key word”, giúp thời gian nhận dạng và xử lý câu lệnh nhanh hơn. Đó cũng là công nghệ quan trọng được chính nhóm nghiên cứu tự phát triển.

TS Hoàng Trang cũng chia sẻ rằng trong suốt hai năm nghiên cứu, từng có thời điểm tất cả các thành viên của nhóm nghiên cứu mất ăn, mất ngủ vì thiết bị không thể nhận dạng chính xác giọng nói. Làm xong mang đi thử, không đạt lại phải mày mò tìm nguyên nhân. Mỗi lần thất bại, không chỉ kinh phí nghiên cứu hao hụt dần mà tiến độ thời gian thực hiện cũng gây thêm áp lực cho nhóm.

“Thiết bị càng nhỏ gọn, đòi hỏi công đoạn thiết kế và gia công phải kỹ. Con chip sản xuất theo công nghệ 130nm, với những sợi đồng li ti, bất kỳ sai sót nào cũng khiến cho thiết bị không hoạt động như ý muốn. Nhóm đã từng nghĩ tới trường hợp xấu nhất – đó là thất bại nhưng may mắn là sau đó, những giải pháp công nghệ đưa ra đã khắc phục được”, PGS-TS Hoàng Trang bộc bạch.

Mong muốn tạo thiết bị để người khiếm thị hòa nhập

Đến nay, thiết bị cầm tay nhận dạng tiếng nói của nhóm iHearTech đã được thử nghiệm tại 2 công ty và cũng đã có 2 lời đề nghị chuyển giao công nghệ, ứng dụng sản phẩm. Tuy nhiên, nhóm nghiên cứu mong ước có những đơn vị chung tay sản xuất ra các thiết bị hỗ trợ miễn phí cho người khiếm thị Việt Nam.

Chip “iHearTech” sẽ tiếp tục phát triển vì người khiếm thị

Lí giải cho hướng nghiên cứu này, TS Hoàng Trang cho biết phương châm của cả nhóm là “trái tim vi mạch, đôi tai kĩ thuật, suy nghĩ toàn cầu, phục vụ địa phương, phát triển bền vững”.

Bởi theo thống kê của các tổ chức xã hội công bố mà nhóm nghiên cứu đã ghi nhận lại được rằng, Việt Nam hiện có hơn 1 triệu người mù trong tổng số hơn 3 triệu người khiếm thị tại Việt Nam, và có đến 82% người khiếm thị phản hồi: “đọc” là một phần rất quan trọng của cuộc sống họ; nhưng cũng chỉ có 1% người khiếm thị có khả năng đọc được bằng chữ nổi.

Trong khi đó, trên thế giới chỉ khoảng 2% các tài liệu được chuyển sang các định dạng cho người khiếm thị. Tỷ lệ đó ở Việt Nam còn thấp hơn nhiều.

Trong nghiên cứu của mình, nhóm iHearTech đã tiến hành khảo sát hàng trăm người khiếm thị trên địa bàn TPHCM, và kết quả rằng đọc sách là khát khao cháy bỏng của người khiếm thị, trong đó nhiều nhất là sách giáo khoa phổ thông, sách học ngoại ngữ, sách văn học, sách các ngành nghề thủ công… Các nội dung này có rất ít ở dạng chữ nổi cho người mù.

Để hỗ trợ người khiếm thị tiếp cận với thông tin, không ít các hãng công nghệ lớn đã ra đời ứng dụng nhận dạng và tổng hợp tiếng nói. Tuy nhiên, trở ngại là các ứng dụng này chỉ hỗ trợ tiếng Anh.

Trong nước, một số tổ chức nghiên cứu đã bắt đầu chú ý nhiều hơn đến phát triển loại công nghệ nhận dạng tiếng Việt nhưng mới chỉ đề cập ở mức độ ban đầu. Khó khăn lớn nhất trong nhận dạng tiếng Việt là âm sắc, ngữ điệu, cấu trúc ngữ pháp rất phức tạp, không thể áp dụng các công nghệ nhận dạng tiếng nói có sẵn trên thế giới.

Nhóm nghiên cứu của PGS.TS Hoàng Trang hi vọng sự ra đời của chip iHearTech được coi là bước đột phá về công nghệ nhận dạng giọng nói tiếng Việt, tạo thêm cơ hội để người khiếm thị Việt Nam hòa nhập cộng đồng nhiều hơn, tiếp cận với nguồn thông tin vô tận trên Internet.

Mới lần đầu tham dự nhưng sản phẩm “Chip nhận dạng tiếng nói tiếng Việt và thiết bị hỗ trợ người khiếm thị bằng tiếng nói” của Nhóm nghiên cứu iHearTech – Trường ĐH Bách Khoa (ĐH Quốc gia TPHCM) đã lọt vào vòng chung kết Giải thưởng Nhân tài Đất Việt năm 2016 ở lĩnh vực sản phẩm CNTT triển vọng.

Lê Phương

Clip: Gia Hưng