Привет Solr, Sphinx — пока, пока!
Недавно для одно из своих проектов понадобился полноценный поиск. В первую очередь я обратился к Sphinx но вскоре был вынужден от него отказаться в пользу поискового движка Solr от Apache Software Foundation
Основные преимущества (для меня)
- Solr поставляется с более либеральной лицензией. (чтобы изменить функционал или использовать Sphinx как часть коммерческого приложения нужно покупать коммерческую лицензию)
- Solr не нуждается в предоставлении уникального идентификатора для документа. Для Sphinx нужен числовое уникальное значение.
- В Solr тоже есть посдветка искомых слов.
- В Solr также есть поддержка русской морфологии, подсветка искомого запроса в результатах поиска.
- Для Solr не проблема удалить единичный или набор документов которые просто подходят определенному критерию поиска. Например можно все результаты поиска по определенному слову. В случае со Sphinx для этого нужно проводить переиндексацию. Также в единичном порядке можно добавить документы в индекс.
- В Solr встроена поддержка проверки орфографии и утилита позволяющая не использовать дубликаты документов в поиске.
- Solr может индексировать документы такие как Microsoft Word, PDF и другие
- Solr работает везде где есть Java
- Для Solr есть отличное PHP extension под PHP http://www.php.net/manual/en/book.solr.php Позволяющее проводить поиск, добавлять, удалять документы
Думаю преимуществ достаточно чтобы выбрать Solr как поисковый движок для Вашего сайта.
Кратко о установке и использовании. На примере Freebsd.
Обновляем порты (portsnap fetch, portsnap extract, portsnap update) или любым другим удобным для Вас способом
cd /usr/ports/textproc/apache-solr
make install clean
В директории порта, появится папка work в которой будет готовый к работе дистрибутив. Переместим его в более удобное для работы место.
Далее.
cd apache-solr-1.4.1/example
java -jar start.jar
Все, Solr запускается.
2 comments to “Привет Solr, Sphinx — пока, пока!”
Февраль 3rd, 2011 at 20:27
Зато Solr жрёт ресурсы и работает не так быстро.
Март 30th, 2011 at 16:12
Главный минус Solr это Apache