一、solr简介

Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。

Solr是一个全文检索服务器,只需要进行配置就可以实现全文检索服务。

Solr它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索(就是统计)、命中醒目显示并且支持多种输出格式(包括XML/XSLT 和JSON等格式)。它易于安装和配置,而且附带了一个基于HTTP 的管理界面。可以使用 Solr 的表现优异的基本搜索功能,也可以对它进行扩展从而满足企业的需要。Solr的特性包括:

  • 高级的全文搜索功能
  • 专为高通量的网络流量进行的优化
  • 基于开放接口(XML和HTTP)的标准
  • 综合的HTML管理界面
  • 可伸缩性-能够有效地复制到另外一个Solr搜索服务器
  • 使用XML配置达到灵活性和适配性
  • 可扩展的插件体系

 Lucene 是什么

Lucene是一个基于Java的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta(雅加达) 家族中的一个开源项目。也是目前最为流行的基于Java开源全文检索工具包。目前已经有很多应用程序的搜索功能是基于 Lucene ,比如Eclipse 帮助系统的搜索功能。Lucene能够为文本类型的数据建立索引,所以你只要把你要索引的数据格式转化的文本格式,Lucene 就能对你的文档进行索引和搜索。

二、solr的单机版安装

环境:centos6.5  64位 JDK1.7   tomcat1.7

 solr4.10.3

1、创建solor4目录,并将tomcat安装在该目录下

[root@localhost tools]# mkdir /usr/local/solr4



[root@localhost solr4]# pwd
/usr/local/solr4
[root@localhost solr4]# ll
总用量 4
drwxr-xr-x. 9 root root 4096 3月   4 01:17 tomcat7



jdk与tomcat的安装参考:

2、安装solr    solr-4.10.3.tgz.tgz

解压:[root@localhost tools]# tar -zxvf solr-4.10.3.tgz.tgz

目录介绍:



[root@localhost solr-4.10.3]# ll
总用量 996
drwxr-xr-x.  2 root root   4096 3月   4 01:23 bin
-rw-r--r--.  1 root root 406208 12月 10 2014 CHANGES.txt
drwxr-xr-x. 13 root root   4096 12月 10 2014 contrib
drwxr-xr-x.  4 root root   4096 3月   4 01:23 dist
drwxr-xr-x. 17 root root   4096 3月   4 01:23 docs
drwxr-xr-x. 15 root root   4096 3月   4 01:23 example
drwxr-xr-x.  2 root root  28672 3月   4 01:23 licenses
-rw-r--r--.  1 root root  12646 12月  1 2014 LICENSE.txt
-rw-r--r--.  1 root root 501873 12月  8 2014 LUCENE_CHANGES.txt
-rw-r--r--.  1 root root  24655 12月  1 2014 NOTICE.txt
-rw-r--r--.  1 root root   5344 12月  1 2014 README.txt
-rw-r--r--.  1 root root    850 12月  1 2014 SYSTEM_REQUIREMENTS.txt



(1)bin:是脚本的启动目录

(2)contrib:第三方包存放的目录

(3)dev-tools:跟开发工具相关的包

(4)dist:编译打包后存放目录,即构建后的输出产物存放的目录

(5)docs:solr文档的存放目录

(6)example:示范例子的存放目录,这里展示了DIH,即数据导入处理的例子

(7)licenses:权限相关的

(8)lucene:solr基于Lucene开发,本身是lucene代码的目录,但是构建后都为空,相关东西已经到jar包中

(9)server:即solr搜索引擎框架,基于jetty web服务器开发的。包含jetty服务器的配置。(这个目录就类似于一个包含了tomcat服务器,里面有一个基于solr的web工程)

3、将solr(/opt/tools/solr-4.10.3/dist/solr-4.10.3.war)应用部署到tomcat下,并改名为solr.war(访问简单)



/opt/tools/solr-4.10.3/dist
[root@localhost dist]# cp solr-4.10.3.war /usr/local/solr4/tomcat7/webapps/solr.war



4、启动tomcat

[root@localhost bin]# ./startup.sh 

5、关闭tomcat,删除webapps中的 solr.war    [root@localhost webapps]# rm -rf solr.war

6、复制/opt/tools/solr-4.10.3/example/lib/ext 下的日志相关jar包到solr工程中

[root@localhost ext]# cp * /usr/local/solr4/tomcat7/webapps/solr/WEB-INF/lib/

7、创建solrhome。用于存放solr服务器所有配置文件的目录



[root@localhost example]# pwd
/opt/tools/solr-4.10.3/example
[root@localhost example]# cp -r solr /usr/local/solr4/solrhome



8、指定solrhome的位置 修改solr工程的 web.xml文件



<env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value>/usr/local/solr4/solrhome</env-entry-value> <env-entry-type>java.lang.String</env-entry-type> </env-entry>



9、修改tomcat的编码方式



<Connector port="8080" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443"
               URIEncoding="UTF-8"/>



 

10、启动tomcat ,开放8080端口



[root@localhost bin]#  /sbin/iptables -I INPUT -p tcp --dport 8080 -j ACCEPT   
[root@localhost bin]#   /etc/init.d/iptables save 
iptables:将防火墙规则保存到 /etc/sysconfig/iptables:     [确定]
[root@localhost bin]# service iptables restart
iptables:将链设置为政策 ACCEPT:filter                    [确定]
iptables:清除防火墙规则:                                 [确定]
iptables:正在卸载模块:                                   [确定]
iptables:应用防火墙规则:                                 [确定]



11、访问solr应用

http://192.168.6.179:8080/solr