Многие поисковые системы основаны на хорошо известных методах и
алгоритмах, разработанных еще до появления Интернет. Общая задача
информационного поиска в Интернет состоит в том, чтобы найти документы,
соответствующие информационной потребности пользователя. Еще десять лет
назад проблем с поиском необходимой информации у пользователя Интернет
не возникало. Однако, с течением времени ситуация изменилась и теперь
мы даже не всегда понимаем, какой необходимо сделать запрос для поиска
нужной информации. Следовательно, необходимо изменить постановку задачи
поиска и разработать новые методы обработки полученных данных с целью
сужения области поиска.
Одним из методов, позволяющих пользователю найти нужную информацию в
Интернете, является кластеризация полученных документов. Системы,
обеспечивающие кластеризацию документов на английском языке, были
реализованы западными специалистами несколько лет назад. Подобный
алгоритм работает и для поиска документов на русском языке.
Преимущество интеллектуальной поисковой системы Nigma.ru состоит в том,
что ее алгоритм ищет документы с учетом русской орфографии, объединяет
результаты, полученные с разных поисковых систем, использует запросы
пользователей для улучшения качества кластеризации и счетчики для
сортировки результатов поиска, а также корректирует возможные ошибки.