忍者ブログ

ビーキョウのIT

このブログは99%ののほほんと1%のお菓子でできています。

カテゴリー「Solr」の記事一覧
  • « PREV
  •  | HOME | 
  • NEXT »

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


Solr 4.0 + Tomcat 7 インストール(構築)

こんちゃ(´・ω・)ノ

Solr4.0とTomcat7の組み合わせでの
構築手順を記載するよ!
※そのうちSolr4.0+Jetty(同梱)の手順も書いておこうと思う。

<%SOLR_INST_HOME%>:Solrのインストーラホームディレクトリ
<%SOLR_HOME%>:Solrのホームディレクトリ
<%TOMCAT_HOME%>:TOMCATのホームディレクトリ



【環境】
・Apache Tomcat 7.0.32
・Apache Solr 4.0
・JDK 1.6.0_24



【事前準備】
・Tomcat7を構築済みであること。
Tomcat7のインストール方法はこちらを参照。
http://itdata.blog.shinobi.jp/Entry/84/
私は最初すでに入っていたtomcat7.0.12でやったが
「SetCharacterEncodingFilter」関連の設定で上手くいかず、
tomcat7.0.32でやったら上手くいった。
そのため以下に記載する手順は「SetCharacterEncodingFilter」が
入ってるtomcatでの手順となっています。

・Javaの設定が完了していること。
JDKのインストール
環境変数のPATHおよびJAVA_HOMEの設定

・Solr4.0のダウンロード
http://www.apache.org/dyn/closer.cgi/lucene/solr/4.0.0
「apache-solr-4.0.0.zip」をダウンロードする。



【インストール】
1.解凍
「apache-solr-4.0.0.zip」を解凍する。
解凍してできたディレクトリを<%SOLR_INST_HOME%>とする。

※Solrのディレクトリ構成はこちらを参照
http://itdata.blog.shinobi.jp/Entry/85/


2.solrホームディレクトリの配備
「<%SOLR_INST_HOME%>/example/solr」ディレクトリを
「<%TOMCAT_HOME%>」配下に配置する。
配置したディレクトリを<%SOLR_HOME%>とする。
※<%SOLR_HOME%>自体は他の場所で問題はない。

また、「<%SOLR_INST_HOME%>/contrib」と
「<%TOMCAT_HOME%>/dist」ディレクトリを
<%SOLR_HOME%>の配下に配置する。

3. WARファイルの配備
「<%SOLR_INST_HOME%>/example/webapps/solr.war」を
「<%TOMCAT_HOME%>/webapps」に配置して解凍する。
※上手く解凍できない場合は、solr.warだけを置いて、TOMCATを起動すれば、
自動でデプロイ(解凍)してくれる。

4. tomcat7のsolr用設定
・server.xmlの編集
「<%TOMCAT_HOME%>/conf/server.xml」を編集
「useBodyEncodingForURI」を追加する。
----------------------------------------------------------------------------
<Connector port="8090" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" useBodyEncodingForURI="true"/>
----------------------------------------------------------------------------

・solrのweb.xmlの編集
「<%TOMCAT_HOME%>/webapps/solr/WEB-INF/web.xml」を編集
SolrRequestFilterの手前に追加
----------------------------------------------------------------------------
<filter>
<filter-name>SetCharacterEncoding</filter-name>
<filter-class>org.apache.catalina.filters.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>

<filter-mapping>
<filter-name>SetCharacterEncoding</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
----------------------------------------------------------------------------

・solr.xmlの追加
「<%TOMCAT_HOME%>/conf/Catalina/localhost」にsolr.xmlを作成する。
※ディレクトリが存在しない場合は作成する。
----------------------------------------------------------------------------
<?xml version="1.0" encoding="utf-8"?>
<Context docBase="<%TOMCAT_HOME%>/webapps/solr" debug="0" crossContext="true">
<Environment name="solr/home" type="java.lang.String" value="<%SOLR_HOME%>" override="true"/>
</Context>
----------------------------------------------------------------------------

5. solrの設定
・solrconfig.xmlの編集
「<%SOLR_HOME%>/collection1/conf/solrconfig.xml」を編集する。
インデックス用のデータディレクトリと各種ライブラリへのパスを設定する。

----------------------------------------------------------------------------
(省略)
<lib dir="<%SOLR_HOME%>/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="<%SOLR_HOME%>/dist/" regex="apache-solr-cell-\d.*\.jar" />

<lib dir="<%SOLR_HOME%>/contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="<%SOLR_HOME%>/dist/" regex="apache-solr-clustering-\d.*\.jar" />

<lib dir="<%SOLR_HOME%>/contrib/langid/lib/" regex=".*\.jar" />
<lib dir="<%SOLR_HOME%>/dist/" regex="apache-solr-langid-\d.*\.jar" />

<lib dir="<%SOLR_HOME%>/contrib/velocity/lib" regex=".*\.jar" />
<lib dir="<%SOLR_HOME%>/dist/" regex="apache-solr-velocity-\d.*\.jar" />
(省略)
<dataDir>${solr.data.dir:<%SOLR_HOME%>/collection1/data}</dataDir>
(省略)
<updateLog>
<str name="dir">${solr.data.dir:<%SOLR_HOME%>/collection1/data}</str>
</updateLog>
----------------------------------------------------------------------------

6.TOMCAT起動
「<%TOMCAT_HOME%>/bin/startup.bat」を実行する。
※linuxの場合はstartup.sh




【操作】
1.管理画面ログイン
以下のURLで管理画面を起動する。
http://localhost:8080/solr/
※IE8だとJavaScriptエラーで表示されませんでした。
※GoogleChrome、FireFoxだと表示されました。


2.Analyse
左メニューから[colection1]-[Analysis]を選択。
Field Value(INDEX)に「庭には二羽ニワトリがいる」と入力
Analyse Fieldname/FieldTypeを「text_ja」に選択
[Analyse Values]ボタンを押下する。
※この時文字化けされずに表示されればOK


3.Query
①現状確認
左メニューから[colection1]-[Query]を選択。
qの部分に「solr」を入力。
indentにチェックを入れる。
[Execute Query]ボタンを押下する。

クエリー: http://localhost:8080/solr/collection1/select?q=solr&wt=xml


文書が登録されている場合のレスポンスはこちら


※GoogleChromeでXML構造を参照するには右クリックから「要素を検証」で一応確認できる。最初からXML構造を表示するにはプラグイン(XML Tree)を入れる。


②文書登録
標準でついているサンプルの
<%SOLR_INST_HOME%>/example/exampledocs/post.jarを使用し、
文書をSolrに登録する。
コマンド:「java -jar post.jar solr.xml」

※1 デフォルトでは「http://localhost:8983/solr/update」にリクエストが送信されるため、
「-Durl」オプションでURLを指定して実行する。
(例)
コマンド:「java -jar -Durl=http://localhost:8080/solr/update post.jar solr.xml」

※2 文書登録検索削除のサンプル作ってみた!( ゚Д゚ )
solrClient.zip
検索、登録、削除ができるよ!
パスワード:「bkyo20121121」



■まとめ
意外と手間取った。
というのもやはり手順を確立し、書きながらだと結構時間かかるね!
今後Solrではjavaのサンプルをいくつか書いて上げていこうと思うので、
そちらもよろしくです。

拍手[8回]

PR

Solr 4.0 ディレクトリ構成と用語



■用語
用語 説明
Apache Lucene 全文検索エンジン
Carrot2 検索結果クラスタリングエンジン、検索結果を分類して表示することが可能
Apache tika javaからHTML、PDF、MSドキュメント等のファイルからデータ解析・抽出が可能
pdfbox javaからPDFを操作するライブラリ
poi javaからMSドキュメントを操作するライブラリ
UIMA 構造化されていないドキュメントを解析して、情報や関連性を抽出する技術
(Unstructured Information Management Architecture)
Apche UIMA Apacheが提供するUIMA
Apache Velocity Javaのテンプレートエンジン。(JSPの変わりにつかえたりする)
Apache ZooKeeper 分散システムに対して、設定情報の集中管理や名前付け等を行う。
Jetty JavaのWebAPサーバ。小型で組み込みなどに適している。
Apache Tomcat JavaのWebAPサーバ。
JBoss JavaのWebAPサーバ。EJB実行可能。Redhat社による有償サポート化も可能。
Apache ManifoldCF web、ファイルサーバ、データベース等から情報を収集(クロール)し、検索サーバ等へデータを渡す。Solrと連携可能。
Fess SolrとS2Robot を組み込んだ日本製の全文検索アプリケーション
S2Robot Seasar2を利用したWeb、ファイルシステム等かあ情報を収集(クロール)するフレームワーム。
Kuromoji javaの日本語形態素解析エンジン。Solr3.6から標準で入っている。

 

拍手[2回]


 | HOME | 

カレンダー

12 2025/01 02
S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

最新コメント

[11/13 NEX-C3]
[01/24 R]
[07/30 ビーキョウ]
[07/25 unknown]
[06/24 ブログランキング]

最新トラックバック

バーコード

広告

カウンター

ブログ内検索

プロフィール


HN:ビーキョウ
職業:SI屋(PG、SE)
<自己紹介>
ちゃお(´・ω・)ノ
ビーキョウです。
どんどんスキルアップして、 その中で学んだことを忘れないようにメモ代わり的な 感じで記事を書いていこうという考えです。

なので、適当な部分が多々あるとは思いますが、 なにとぞよろしくお願いします
(´ ▽`)

バナーエリア

Copyright ©  -- ビーキョウのIT --  All Rights Reserved
Designed by CriCri / Photo by Geralt / Powered by [PR]
/ 忍者ブログ