DeepDyve Inc. hôm 11/11 đã chính thức ra mắt một công cụ tìm kiếm miễn phí có khả năng lùng sục và lôi ra ánh sáng những tài nguyên thông tin từ “đáy sâu đại dương web” (Deep Web).

“Deep Web” – hay còn có một tên gọi khác là “Dark Web” (vùng nửa tối của thế giới web) – là thuật ngữ dùng để chỉ những vùng tài nguyên trên thế giới web mà những công cụ tìm kiếm truyền thống đến tận bây giờ vẫn chưa khai phá. Đó thường là những cơ sở dữ liệu, bài viết trên các tạp chí nghiên cứu học giả chuyên ngành, thông tin mạng phi cấu trúc …
Sử dụng công cụ tìm kiếm của DeepDyve người dùng sẽ có thể dễ dàng tìm thấy những tài nguyên thông tin về khoa học đời sống, dữ liệu bản quyền hay những nguồn dữ liệu của Wikipedia. Công cụ tìm kiếm này hiện đã lập chỉ mục được khoảng 500 triệu trang web khác nhau.
Hãng phát triển cho biết tới đây sẽ tiến hành lập chỉ mục thêm các nguồn tài nguyên thông tin khoa học công nghệ, công nghệ sạch hay năng lượng. Mục tiêu của hãng là đến cuối năm nay đưa tổng số trang web được lập chỉ mục đạt tới con số 1 tỉ.
Sở dĩ công cụ tìm kiếm truyền thống không “sờ” đến những nguồn tài nguyên thông tin này là bởi chúng phải đối mặt với khá nhiều khó khăn khi phải thực hiện tìm kiếm thông tin từ những cơ sở dữ liệu thông tin khoa học, tạp chí nghiên cứu chuyên ngành, dữ liệu phi cấu trúc … như thế này.
Với DeepDyve từ khóa tìm kiếm không chỉ giới hạn ở một hoặc một vài từ mà còn có thể là cả nguyên văn một bài viết nào đó.
Để giải quyết được vấn đề đó DeepDyve đã phải hợp tác với các nhà xuất bản cũng như những đối tác cung cấp những nguồn thông tin như thế. Nhờ đó mà công cụ tìm kiếm của hãng này mới có thể thành công tiến vào khai phá vùng tài nguyên thông tin còn bỏ ngỏ này.
Google hồi đầu tháng này cũng tuyên bố tới đây hãng cũng sẽ tập trung đến Dark Web nhiều hơn. Bước đi đầu tiên là bổ sung thêm khả năng tìm kiếm các văn bản định dạng PDF cho công cụ tìm kiếm của hãng này. Ngoài ra hồi tháng 4 Google cũng tuyên bố sẽ phát triển một giải pháp riêng giúp bổ sung thêm khả năng tìm kiếm nội dung trực tiếp từ các HTML Form.
DeepDyve tuyên bố mục tiêu của hãng này không phải là để cạnh tranh với Google mà chỉ muốn tạo ra một công cụ giúp những người dùng muốn thực hiện tìm kiếm thông tin phục vụ công tác nghiên cứu từ trong thế giới Dark Web.