Tìm kiếm “thế giới ngầm” của Internet

(Dân trí) - Nói đến tìm kiếm, phần lớn người dùng Internet nghĩ ngay đến Google, hoặc Yahoo, MSN.. Nhưng trên thực tế, những cỗ máy tìm kiếm đó chỉ cho bạn thấy một phần của toàn bộ những gì có trên Internet.

Các website sau đây có thể giúp bạn thâm nhập vào “thế giới ngầm” vốn thường không được các site lớn  đưa vào danh mục website.

Dogpile  -  tổng hợp của 4 site tìm kiếm lớn nhất Internet (Google, MSN, Yahoo, Ask). Nếu bạn vô tình lạc vào một website nào đó và không bookmark, nhưng không thể quay lại trang đó khi tìm bằng Dogpile, chắc chắn site đó nằm ở “vùng tối” của thế giới ảo.

Địa chỉ: http://www.dogpile.com/

Clusty  -  site tìm kiếm này trả về danh sách kết quả tìm kiếm khá rối rắm, ngược lại với các “ông lớn” thường cố gắng khiến danh sách đó càng đơn giản càng tốt. Tuy nhiên, Clusty có lợi thế nhất định do site không tự động lọc bỏ các kết quả bị máy tính cho là “dư thừa”. Nếu có đủ thời gian và kiên nhẫn, khả năng lọc ra được những website “giấu mặt” là khá lớn.

Địa chỉ: http://clusty.com/

USA Library of Congress - site chuyên về tìm các tài liệu học thuật – cũng thường được site tìm kiếm chính thống bỏ qua do mang tính chuyên môn cao.

Địa chỉ: http://www.loc.gov/about

Nelson Search   - website chuyên về tìm kiếm tin tức. Tất cả các sự kiện, tin tức được đưa tin trên web đều có thể tìm ra ở đây – một phiên bản “thô” chưa được lọc tin rác của Google News.

Địa chỉ: http://www.nelsonsearch.org/

Inute  - công việc lên danh sách và tìm kiếm của Google được thực hiện hoàn toàn tự động nhờ các phần mềm gọi là bot. Người sử dụng dịch vụ thường xuyên cảm thấy chán ngán do bot không có khả năng lọc hàng núi “rác” vô nghĩa khỏi danh mục kết quả. Intute là bộ máy tìm kiếm duy nhất sử dụng danh sách website hoàn toàn do sức người lập nên, nhằm đảm bảo rằng các website vô nghĩa không bao giờ lọt vào danh sách kết quả tìm kiếm.

Địa chỉ: http://www.intute.ac.uk

AltaVista  - AltaVista là cỗ máy tìm kiếm nổi tiếng nhất trước khi Google soán ngôi thống trị như ngày nay. Mặc dù “chìm nghỉm” dưới bóng các ông lớn, bộ máy tìm kiếm này vẫn hoạt động tốt và trả về kết quả tương tự với Clusty khi sử dụng.

Địa chỉ: http://www.altavista.com

Wayback Machine - một cỗ máy thời gian thực sự của thế giới web. Máy chủ của bộ máy tìm kiếm này lưu giữ toàn bộ các site đã có mặt trên Internet từ trước đến nay, và bạn có thể tìm tháy các site hiện giờ hoàn toàn không còn tồn tại bằng Wayback Machine. Vấn đề duy nhất khi sử dụng là bạn phải đưa ra được đường dẫn chính xác của website cần tìm!

Địa chỉ: http://www.archive.org/index.php

Bloglines (http://www.bloglines.com/)  – Bộ máy tìm kiếm chuyên về blog. Các blog cá nhân có số người truy cập khá ít, và do đó thường bị các ông lớn nhét xuống dưới cùng danh sách kết quả tìm kiếm đôi khi lên đến vài chục ngàn kết quả. Một danh sách chỉ toàn blog hẳn sẽ dễ dàng hơn nhiều…

Địa chỉ: http://www.bloglines.com

Chú ý rằng phần lớn cái gọi là “thế giới ngầm của web” thường là các site có chất lượng quá thấp đến mức bị bot bỏ qua, các trang chủ cá nhân hoặc hồ sơ lưu của các forum. Thế giới này cũng bao gồm các thông tin bị số đông bỏ qua như thông tin học thuật – cần có chuyên môn nhất định để hiểu và sử dụng, và còn nhiều loại khác

Hoàng Hải
(tổng hợp)