На главную
RiSearch v.1.0 Manual
© С. Тарасов
Сортировка результатов
Найденные документы могут быть отсортированны по релевантности,
дате последней модификации документа, размеру или могуть
быть представлены в порядке их размещения в индексе.
Имейте в виду, что большинство вебсерверов не возвращают
дату последней модификации для динамических документов
и скрипт будет использовать дату индексации.
Релевантность
Релевантность - это абстрактная мера соответствия документа
запросу пользователя. RiSearch считает релевантность на основе
числа слов из запроса в данном документе. Каждое слово
увеличивает рейтинг документа на одну единицу. Если слово
в документе находится в определенных местах (заголовок,
ссылка, жирный текст или курсив) рейтинг документа может быть
увеличен в соответствии с весами, указанными в конфигурационном
файле. Затем рейтинг документа нормализуется с учетом наиболее часто встречающегося
в данном документе слова (чтобы более длинный документ не получил
больший рейтинг).
Рассчитанный таким образом рейтинг затем может быть
перерассчитан с учетом числа документов, в которых
встречается данное слово. В результате более часто встречающиеся
слова меньше влияют на общий рейтинг документа для многословных
запросов.
Настройка
allow_sort_by_rating => 1,
- включение возможности сортировки результатов поиска по релевантности. Дополнительно,
скрипт может сортировать документы по дате последнего изменения и размеру файла
(allow_sort_by_date, allow_sort_by_size).
weight_title => 5,
- увеличение веса слова в зависимости от его расположения на странице. При сортировке по релевантности
скрипт учитывает, сколько раз каждое слово встречается в данном документе. Каждое вхождение
увеличивает рейтинг долумента на единицу. Используя параметры weight_title, weight_heading, weight_bold
и т.д, Вы можете указать скрипту на сколько увеличивать рейтинг, если оно встречается
в теге TITLE, заголовке документа, выделено жирным шрифтом, является ссылкой на другой
документ, присутствует в метатегах.
word_freq => 1,
- включение нормализации рейтинга документа в соответствии с частотой
данного слова (редкие слова будут иметь больший рейтинг). Данная опция
может быть включена и отключена без переиндексации сайта.
|