Tpoxa's blog. Yii, PHP, jQuery etc | Freelancer Developer Blog

TAG | solr

Недавно для одно из своих проектов понадобился полноценный поиск. В первую очередь я обратился к Sphinx но вскоре был вынужден от него отказаться в пользу поискового движка Solr от Apache Software Foundation

Основные преимущества (для меня)

  • Solr поставляется с более либеральной лицензией. (чтобы изменить функционал или использовать Sphinx как часть коммерческого приложения нужно покупать коммерческую лицензию)
  • Solr не нуждается в предоставлении уникального идентификатора для документа. Для Sphinx нужен числовое уникальное значение.
  • В Solr тоже есть посдветка искомых слов.
  • В Solr также есть поддержка русской морфологии, подсветка искомого запроса в результатах поиска.
  • Для Solr не проблема удалить единичный или набор документов которые просто подходят определенному критерию поиска. Например можно все результаты поиска по определенному слову. В случае со Sphinx для этого нужно проводить переиндексацию. Также в единичном порядке можно добавить документы в индекс.
  • В Solr встроена поддержка проверки орфографии и утилита позволяющая не использовать дубликаты документов в поиске.
  • Solr может индексировать документы такие как Microsoft Word, PDF и другие
  • Solr работает везде где есть Java
  • Для Solr есть отличное PHP extension под PHP http://www.php.net/manual/en/book.solr.php Позволяющее проводить поиск, добавлять, удалять документы

Думаю преимуществ достаточно чтобы выбрать Solr как поисковый движок для Вашего сайта.

Кратко о установке и использовании. На примере Freebsd.

Обновляем порты  (portsnap fetch, portsnap extract, portsnap update) или любым другим удобным для Вас способом

cd /usr/ports/textproc/apache-solr
make install clean

В директории порта,  появится папка work в которой будет  готовый к работе дистрибутив. Переместим его в более удобное для работы место.

Далее.

cd apache-solr-1.4.1/example

java -jar start.jar

Все, Solr запускается.

· ·

Theme Design by devolux.nh2.me