Компания «СофтИнформ» предлагает издательствам и Интернет СМИ решение для определения заимствований из чужих материалов на базе собственной разработки для поиска плагиата в текстах «Плагиат-Информ».
Редактор, получив новый текст, проверяет его в системе «Плагиат-Информ». Система параллельно проверяет его по двум базам материалов. По локальной базе материалов, в которой могут храниться сданные материалы и, например, оцифрованные статьи из печатных изданий и по базе материалов, собранных из Интернета. Проверив, она выдаёт редактору результат, в котором указано, содержит ли материал плагиат, и каков процент его содержания.
Чтобы держать базу данных в по материалам, собранным из Интернета, в актуальном состоянии, SearchInform Internet Server откачивает с заданной периодичностью из Интернета указанные пользователем домены (страницы) и складывает их в хранилище. Парсер веб-страниц извлекает из этих страниц исключительно информативный текст, не обращая внимания на менюшки, текстовые рекламные блоки и прочий «информационный мусор». Это делает результаты поиска соответствующими реальному положению вещей.