Система Тематического Поиска компании СофтИнформ представляет собой комплекс программного обеспечения, позволяющего производить узконаправленный поиск информации в интернет по заранее определенному списку ресурсов. Тематический поиск включает в себя все возможности Personal Internet, дополняя их функциями мониторинга ведущих поисковиков (Google, Yandex, Yahoo, Msn) и добавления в базу новых ресурсов по заданным ключевым словам, а также наличием поиска похожих по содержанию документов для реализации функции построения отчета «похожих» материалов за определенный период.
Google (или любой другой поисковик) индексирует гигантское количество ресурсов и, соответственно, делает это медленно. Так, к примеру, какое-либо сообщение на форуме или комментарий в блоге будет проиндексирован (и, соответственно, появится в списке результатов поиска) в худшем случае через несколько недель. В случае же использования Personal Internet индексация проходит ежедневно (или по заданному пользователем интервалу) и по ограниченному списку ресурсов, что позволяет своевременно получать новые данные. Кстати, одним из применений данной системы может быть оперативное отслеживание информации о конкурентах. А отделам маркетинга пригодится такая система «оперативного реагирования» на любые изменения в форумах, блогах и новостных сайтах.
Добавление ресурсов в базу
Администратор в явном виде вносит перечень сайтов, который система будет индексировать
Администратор задает ключевые слова связанные с данной темой. Далее система вводит данные ключевые слова в виде запроса для поисковиков (google, yandex и т.д.) и обрабатывает полученный результат. Домены, на страницах которых были найдены заданные ключевые слова автоматически (или в ручном режиме с «модерацией» вносятся в нужную «тему».
Поиск похожих по содержанию документов
Часто при просмотре информации необходимо получить дополнительные данные на эту же тему. Например, просмотрев статью о новом мобильном телефоне на одном ресурсе, нужно ознакомиться с информацией о данной модели на других сайтах. Для обеспечения получения пользователем всей похожей по содержанию и смыслу информации из индекса нужной тематики используется уникальная технология поиска похожих документов. Именно за счет использования этой технологии и возможно получение в течение нескольких секунд всех «похожих» материалов со всех ресурсов в «теме».
Резюме
Поиск по определенной тематике позволит выводить в результирующем списке только информацию по заданной тематике, с автоматической разбивкой ее на подрубрики. Индексация для конкретной задачи только ресурсов со схожей тематикой, мониторинг их в реальном времени специально разработанным «спайдером» и уникальный поиск похожих позволят пользователям получать свежую отрубрицированную информацию по той тематике, которая их интересует.