ENG/RUS   Главная :: RiSearch :: RiSearch Pro :: RiSearch PHP :: RiLax :: RuMor :: Forum

Введение :: Документация :: Купить :: License :: Системные требования

На главную

RiSearch Pro v.3.2 Manual

© С. Тарасов

Сортировка результатов

      Найденные документы могут быть отсортированны по релевантности, дате последней модификации документа, размеру или могуть быть представлены в порядке их размещения в индексе. Имейте в виду, что большинство вебсерверов не возвращают дату последней модификации для динамических документов и скрипт будет использовать дату индексации.

Релевантность

      Релевантность - это абстрактная мера соответствия документа запросу пользователя. RiSearch считает релевантность на основе числа слов из запроса в данном документе. Каждое слово увеличивает рейтинг документа на одну единицу. Если слово в документе находится в определенных местах (заголовок, ссылка, жирный текст или курсив) рейтинг документа может быть увеличен в соответствии с весами, указанными в конфигурационном файле. Затем рейтинг документа нормализуется с учетом наиболее часто встречающегося в данном документе слова (чтобы более длинный документ не получил больший рейтинг).

      Рассчитанный таким образом рейтинг затем может быть перерассчитан с учетом числа документов, в которых встречается данное слово. В результате более часто встречающиеся слова меньше влияют на общий рейтинг документа для многословных запросов.

      Рейтинг документа также может быть рассчитан с учетом расстояния между словами. Данная опция включается в конфигурационном файле. Сохранения позиций каждого слова требует дополнительного места и размер индекса вырастет в два-три раза. Учет расстояния также замедляет поиск.

Настройка

  1.  allow_sort_by_rating => 1,  - включение возможности сортировки результатов поиска по релевантности. Дополнительно, скрипт может сортировать документы по дате последнего изменения и размеру файла (allow_sort_by_date, allow_sort_by_size).

  2.  weight_title => 5,  - увеличение веса слова в зависимости от его расположения на странице. При сортировке по релевантности скрипт учитывает, сколько раз каждое слово встречается в данном документе. Каждое вхождение увеличивает рейтинг долумента на единицу. Используя параметры weight_title, weight_heading, weight_bold и т.д, Вы можете указать скрипту на сколько увеличивать рейтинг, если оно встречается в теге TITLE, заголовке документа, выделено жирным шрифтом, является ссылкой на другой документ, присутствует в метатегах.

  3.  word_freq => 1,  - включение нормализации рейтинга документа в соответствии с частотой данного слова (редкие слова будут иметь больший рейтинг). Данная опция может быть включена и отключена без переиндексации сайта.

  4.  word_dist => 1,  - включение учета расстояния между словами при расчете релевантности.

  5.  weight_dist => 10,  - данный параметр задает как сильно рейтинг документа будет зависеть от наличия близко стоящих слов. Данный параметр может быть изменен без переиндексации сайта.

      Используйте дополнтельный параметр "&o=R" в строке запроса чтобы получить результаты в обратном порядке.



http://risearch.org С.Тарасов, © 2000-2003