忍者ブログ

ビーキョウのIT

このブログは99%ののほほんと1%のお菓子でできています。

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


Solr 4.0 ディレクトリ構成と用語



■用語
用語 説明
Apache Lucene 全文検索エンジン
Carrot2 検索結果クラスタリングエンジン、検索結果を分類して表示することが可能
Apache tika javaからHTML、PDF、MSドキュメント等のファイルからデータ解析・抽出が可能
pdfbox javaからPDFを操作するライブラリ
poi javaからMSドキュメントを操作するライブラリ
UIMA 構造化されていないドキュメントを解析して、情報や関連性を抽出する技術
(Unstructured Information Management Architecture)
Apche UIMA Apacheが提供するUIMA
Apache Velocity Javaのテンプレートエンジン。(JSPの変わりにつかえたりする)
Apache ZooKeeper 分散システムに対して、設定情報の集中管理や名前付け等を行う。
Jetty JavaのWebAPサーバ。小型で組み込みなどに適している。
Apache Tomcat JavaのWebAPサーバ。
JBoss JavaのWebAPサーバ。EJB実行可能。Redhat社による有償サポート化も可能。
Apache ManifoldCF web、ファイルサーバ、データベース等から情報を収集(クロール)し、検索サーバ等へデータを渡す。Solrと連携可能。
Fess SolrとS2Robot を組み込んだ日本製の全文検索アプリケーション
S2Robot Seasar2を利用したWeb、ファイルシステム等かあ情報を収集(クロール)するフレームワーム。
Kuromoji javaの日本語形態素解析エンジン。Solr3.6から標準で入っている。

 

拍手[2回]

PR

COMMENT

Name
Title
Mail
URL
Color
Emoji Vodafone絵文字 i-mode絵文字 Ezweb絵文字
Comment
Pass   コメント編集用パスワード
 管理人のみ閲覧

カレンダー

03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

最新コメント

[11/13 NEX-C3]
[01/24 R]
[07/30 ビーキョウ]
[07/25 unknown]
[06/24 ブログランキング]

最新トラックバック

バーコード

広告

カウンター

ブログ内検索

プロフィール


HN:ビーキョウ
職業:SI屋(PG、SE)
<自己紹介>
ちゃお(´・ω・)ノ
ビーキョウです。
どんどんスキルアップして、 その中で学んだことを忘れないようにメモ代わり的な 感じで記事を書いていこうという考えです。

なので、適当な部分が多々あるとは思いますが、 なにとぞよろしくお願いします
(´ ▽`)

バナーエリア

Copyright ©  -- ビーキョウのIT --  All Rights Reserved
Designed by CriCri / Photo by Geralt / Powered by [PR]
/ 忍者ブログ