Dự thi TTVN: Hệ thống thu thập và bóc tách thông tin
Giúp mọi đối tượng tiếp cận nhiều thông tin (tiếng Việt hoặc tiếng Anh) theo ý muốn với thời gian vào mạng tối thiểu là mục đích chính của 2 cựu sinh viên trường ĐH Bách khoa Hà Nội - Nguyễn Phú Bình và Nguyễn Thành Long - khi viết phần mềm này.
Với cấu hình máy tính tối thiểu 8 MB RAM, Internet Explorer 5.0, Windows 98 SE và modem, người dùng có thể tải sản phẩm đã lọt vào vòng chung khảo cuộc thi Trí tuệ Việt Nam 2002 miễn phí tại
http://www.it4vn.net hoặc
http://phubinh.allviet.com.
Sau khi cài đặt, máy tính sẽ xuất hiện 2 chương trình: Channel Generator và VNBot. Channel Generator dựa vào website đầu vào để tạo một kênh tin dùng cho quá trình thu thập và tách thông tin sau này. Người dùng chỉ cần click chuột vào đoạn tin cần lấy trong trang web đầu vào, rồi nhập thông tin về địa chỉ URL, font chữ, cách sắp xếp kết quả... là chương trình sẽ sinh ra kênh tin tương ứng.
Nếu ngại tạo kênh, người dùng có thể dùng luôn gần 1.000 kênh tin tạo sẵn trong VNBot để đọc báo điện tử, tìm kiếm dữ liệu và đọc tin trên các diễn đàn. Chương trình này cho phép người dùng dễ dàng thực hiện các thao tác chọn kênh tin, lấy tin, tìm kiếm, xuất kết quả ra file, tải nội dung trang tin về, quản lý kênh tin, thống kê và thiết lập cấu hình.
Nhóm tác giả Hệ thống thu thập & bóc tách thông tin cho biết họ có ý định thương mại hoá sản phẩm với hướng phát triển trong tương lai là tạo lập máy chủ phân phối thông tin đến mọi đối tượng có nhu cầu. Theo Bình và Long, việc đọc lướt tiêu đề tin tức từ các bài báo được chia thành từng chủ đề rồi mới xem chi tiết và lưu lại sẽ tiết kiệm thời gian và tiền bạc hơn rất nhiều so với việc phải dùng trình duyệt đi tới từng trang web.
Minh Long