ビーキョウのIT

このブログは99%ののほほんと1%のお菓子でできています。

[PR]

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

Solr 4.0　ディレクトリ構成と用語

■用語

用語	説明
Apache Lucene	全文検索エンジン
Carrot2	検索結果クラスタリングエンジン、検索結果を分類して表示することが可能
Apache tika	javaからHTML、PDF、MSドキュメント等のファイルからデータ解析・抽出が可能
pdfbox	javaからPDFを操作するライブラリ
poi	javaからMSドキュメントを操作するライブラリ
UIMA	構造化されていないドキュメントを解析して、情報や関連性を抽出する技術（Unstructured Information Management Architecture）
Apche UIMA	Apacheが提供するUIMA
Apache Velocity	Javaのテンプレートエンジン。(JSPの変わりにつかえたりする）
Apache ZooKeeper	分散システムに対して、設定情報の集中管理や名前付け等を行う。
Jetty	JavaのWebAPサーバ。小型で組み込みなどに適している。
Apache Tomcat	JavaのWebAPサーバ。
JBoss	JavaのWebAPサーバ。EJB実行可能。Redhat社による有償サポート化も可能。
Apache ManifoldCF	web、ファイルサーバ、データベース等から情報を収集（クロール）し、検索サーバ等へデータを渡す。Solrと連携可能。
Fess	SolrとS2Robot を組み込んだ日本製の全文検索アプリケーション
S2Robot	Seasar2を利用したWeb、ファイルシステム等かあ情報を収集（クロール）するフレームワーム。
Kuromoji	javaの日本語形態素解析エンジン。Solr3.6から標準で入っている。

[2回]

COMMENT

Name
Title
Mail
URL
Color
Emoji
Comment
Pass	コメント編集用パスワード
	管理人のみ閲覧

<<Solr 4.0 + Tomcat 7 インストール(構築) | HOME | Tomcat 7 インストール>>

カレンダー

2025/12

S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

アーカイブ

RSS

RSS 0.91

RSS 1.0

RSS 2.0

バーコード

カウンター

[PR] 沖縄ツアー

ブログ内検索

プロフィール

ＨＮ：ビーキョウ
職業：SI屋（PG、SE）
＜自己紹介＞
ちゃお(´･ω･)ﾉ
ビーキョウです。
どんどんスキルアップして、その中で学んだことを忘れないようにメモ代わり的な感じで記事を書いていこうという考えです。

なので、適当な部分が多々あるとは思いますが、なにとぞよろしくお願いします
(´ ▽｀）

リンク

ビーキョウの日々

GIGAZINE

take A note

バナーエリア

にほんブログ村

オススメ本

Amazon.co.jp ウィジェット

/ 忍者ブログ

ビーキョウのIT

[PR]