RiSearch
Введение
Поисковый скрипт, написанный на Перле и не требующий внешней базы данных.
Скрипт использует эффективный механизм индексации, позволяющий легко
работать с сотнями мегабайт текстовой информации. В новой версии появилась
возможность сортировки результатов поиска по релевантности, размеру файла и дате последнего редактирования,
подсветка ключевых слов в результатах поиска.
Особенности
RiSearch Pro не использует какие-либо библиотеки или базы данных, кроме самого Перла.
Следовательно, его можно использовать на любом сервере, где у Вас
есть доступ к CGI (включая некоторые бесплатные хостинги).
Скрипт способен работать с разными языками.
Простой и удобный язык запросов.
RiSearch Pro использует платформонезависимые бинарные файлы, которые могут
быть использованы на разных компьютерах. То есть, Вы можете проводить
индексацию локальной копии сайта у себя дома под Windows9x, а затем
использовать созданные скриптом файлы на сервере.
Возможна индексация на локальном диске и через HTTP.
Конфигурируемый список стоп-слов.
Настраиваемый внешний вид результатов поиска.
Сортировка результатов поиска по релевантности, размеру файла, дате последнего редактирования.
Подсветка ключевых слов в результатах поиска.
Подсветка найденных слов в оригинальном документе - аналог функции "Показать найденные слова"
в Яндексе.
Фронтэнд на ПХП.
Скачать демо-версию
Вы можете использовать этот скрипт в течение 30 дней для тестирования.
risearch_1.0.01
History
- Ver. 1.0.01 - 19.01.2005
- Спайдер может использовать файл ROBOTS.TXT.
- Ver. 1.0.01 - 25.05.2004
- Код полностью переписан. Новая версия базируется на движке RiSearch Pro.
- Ver. 0.99.08 - 19.03.2004
- Исправлено несколько некритичных ошибок.
- Ver. 0.99.08 - 30.04.2002
- Исправлена ошибка игнорирования ссылок в теге <MAP> в spider.pl.
- Ver. 0.99.08 - 03.11.2001
- Возможен поиск в одном или нескольких подразделах сайта.
- Исправлена ошибка при индексировании слов с несколькими дефисами (например 323-321-234).
- Доступен новый метод индексирования.
- Ver. 0.99.07 - 21.10.2001
- Исправлена ошибка в spider.pl.
- Ver. 0.99.06 - 21.09.2001
- Исправлена ошибка в spider.pl.
- Ver. 0.99.05 - 25.07.2001
- Исправлено несколько ошибок.
- Ver. 0.99.05 - 11.06.2001
- Исправлены две незначительные ошибки.
- Добавлена возможность автоматического преобразования URL в нижний регистр.
- Ver. 0.99.05 - 08.06.2001
- Добавлен простой робот-паук.
- Ver. 0.99.04 - 06.06.2001
- Исправлена ошибка в поддержке интернациональных символов.
- Ver. 0.99.04 - 08.05.2001
- Добавлены шаблоны для изменения дизайна страниц с результатом поиска.
- В значительной степени переписан индексирующий скрипт. Он теперь работает
процентов на 30 быстрее.
- Множество незначительных изменений.
- Ver. 0.99.03 - 06.04.2001
- Исправлено несколько некритичных ошибок.
- Ver. 0.99.03 - 05.01.2001
- Исправлена ошибка для многострочного тега TITLE.
- Добавлена функция ведения лога запросов.
- Ver. 0.99.02 - 30.10.2000
- Добавлен список "стопслов".
- В результатах поиска можно показывать либо содержимое тэга "META description", либо содержимое страницы.
- Индексер больше не вызывает ошибку при запуске его через броузер как CGI скрипт.
- Исправлено несколько некритичных ошибок.
- Ver. 0.99.01 - 04.09.2000
- Все конфигурационные параметры вынесены в отдельный файл config.pl.
- Добавлена индексация тагов META и IMG ALT.
- Числа и слова с дефисом теперь индексируются корректно.
- Возможность указания минимальной длины слова при индексации.
- Возможность указания числа результатов на странице в выводе скрипта.
- Добавлена поддержка специальных символов (таких как È или &x255;).
- Добавлен список файлов, которые не нужно индексировать.
|