Nhân tài Đất Việt 2009:

Tìm kiếm dữ liệu bằng hình ảnh

(Dân trí) - Bên cạnh việc tìm kiếm bằng từ khoá như thông thường, với phần mềm “Tìm kiếm hình ảnh tương đồng trong cơ sở dữ liệu hình ảnh”, người sử dụng có thể thay thế những từ khoá ấy bằng hình ảnh, tìm được những hình liên quan đến hình ảnh người dùng cung cấp.

Đó là tính năng chính của sản phẩm do tác giả Hoàng Nguyên Vũ thuộc trường Đại học Paris Dauphine, một trong 10 sản phẩm có tiềm năng ứng dụng được BGK chọn vào vòng thi chung khảo của Giải thưởng Nhân tài Đất Việt 2009.

Từ nước Pháp xa xôi, Nguyên Vũ đã có cuộc trò chuyện qua điện thoại với chúng tôi. Vũ tâm sự: “Sau khi nhận được thư chúc mừng của Ban tổ chức, mình đã không ngừng tíu ta tíu tít với bạn gái trên suốt chặng đường đến trường.”

Nhớ lại khoảng thời gian cách đây 2 năm, khi bước vào học Thạc sỹ 2, Vũ thấy mình đã lựa chọn đúng đắn khi chọn học hệ nghiên cứu thay vì học hệ chuyên nghiệp như dự định ban đầu.
 
Tìm kiếm dữ liệu bằng hình ảnh - 1
Với phần mềm này, người sử dụng có thể tìm kiếm được những hình ảnh gần giống với hình ảnh mình cung cấp.

Phần mềm “Tìm kiếm hình ảnh tương đồng trong cơ sở dữ liệu hình ảnh” của Vũ tham gia Giải thưởng Nhân tài Đất Việt năm nay liên quan đến những gì Vũ nghĩ ra trong quá trình học và thực tập tại này.

Ý tưởng sáng tạo ra sản phẩm này xuất phát từ một nhu cầu cá nhân của Vũ. Trong một lần lên mạng để tìm một cái mẫu bàn làm việc cho phù hợp với chỗ ở, thấy một mẫu bàn khá ưng ý, Vũ đã lưu lại hình ảnh của nó. Tuy nhiên, khi muốn quay lại tìm một chiếc bàn tương tự như vậy với giá rẻ hơn, Vũ không thể nhớ nổi tên trang Web mà mình đã xem lúc trước. Trong đầu Vũ bật ra một câu hỏi: “Tại sao Google không cho phép người ta tìm kiếm bằng hình ảnh.”

Câu hỏi này đã theo Vũ khá nhiều năm và đến khi học Thạc sĩ 2, Vũ mới có điều kiện theo đuổi nó khi chọn cho mình chuyên ngành về cơ sở dữ liệu và xử lý hình ảnh. Qua nghiên cứu, Vũ đã sáng tạo ra phương pháp Delta-TSR và ứng dụng nó để tạo nên phần mềm tiện ích này.

Phần mềm tìm kiếm bằng hình ảnh có hai chức năng chính: xây dựng sẵn cơ sở dữ liệu cho một tập hợp các hình ảnh và tìm kiếm hình ảnh tương đồng (gần giống) với hình ảnh do người dung cung cấp từ các cơ sở dữ liệu được xây dựng. Việc xây dựng cơ sở dữ liệu là rất lâu, có thể mất hàng giờ. Đây được gọi là quá trình “offline” chuẩn bị để phục vụ việc tìm kiếm (gọi là online). Các thao tác tìm kiếm online cũng khá đơn giản, tiện lợi như cách tìm kiếm bằng từ khoá mà mọi người vẫn sử dụng.
 
Tìm kiếm dữ liệu bằng hình ảnh - 2
Sản phẩm đã được thử nghiệm trên 6.000 hình ảnh của một số công trình kiến trúc ở Paris.

Sản phẩm được phát triển dựa trên lý thuyết khoa học do Vũ nghiên cứu trong quá trình học tập tại Pháp. Do đó sản phẩm tham dự lần này nhìn chung là chỉ một phiên bản thể hiện các nghiên cứu trong phòng thí nghiệm. Song, tiềm năng ứng dụng thực tế của sản phẩm này rất rộng rãi, có thể mang lại lợi ích cho nhiều ngành nghề khác nhau.

Tiềm năng ứng dụng lớn nhất của sản phẩm là trong lĩnh vực kiến trúc, giúp tìm kiếm các hình ảnh tương đồng về một công trình kiến trúc hay giúp các nhà kiến trúc hình thành nên ý niệm hình ảnh tổng quan cho công trình của mình. Ứng dụng này đã được thử nghiệm trên 6.000 hình ảnh về các công trình của Paris và cũng đã cho kết quả khả quan.

Trong lĩnh vực an ninh, sản phẩm có thể có thể nhận dạng khuôn mặt hoặc vân tay từ cơ sở dữ liệu có sẵn. Ứng dụng sẽ giúp lọc bớt các hình ảnh sai, hoặc không giống, tiết kiệm một khoảng thời gian tìm kiếm chính xác rất lớn.

Bên cạnh đó, sản phẩm còn có thể giúp đăng ký bản quyền cho các họa sĩ, giúp tìm kiếm và ngăn chặn các vi phạm bản quyền khi sao chép sử dụng lại một phần hoặc toàn phần tác phẩm; tìm kiếm các đồ vật mất cắp đang được rao bán trên Internet, phát hiện vị trí các xe mất cắp dựa vào biển số thông qua các camera giám sát công cộng.

Một ứng dụng khác mà tác giả nghĩ đến là trong quân sự và tự động hóa. Nguyên Vũ hy vọng, sau khi hoàn thiện sản phẩm, những ứng dụng này sẽ có thể giúp giảm thiểu các tổn thất tài sản đặc biệt quan trọng bằng cách đưa ra cảnh báo hoặc không cho phép nổ súng nếu tầm phá hoại quanh mục tiêu ảnh hưởng đến một công trình đã được lưu trữ.

T.N