翻訳と辞書
Words near each other
・ Lubuntu
・ LUC
・ LUCA
・ Luca Badoer
・ Luca Cordero di Montezemolo
・ Lucas Arts
・ Lucas pendulum
・ Lucca
・ Luce
・ Luce Twinkle Wink
・ Lucene
・ lucent
・ LuceTwinkleWink
・ Lucian Bee's
・ Lucian Bee's RESURRECTION SUPERNOVA
・ Luciano Burti
・ lucid
・ lucid interval
・ Lucien Ballard
・ LUCIFER


Dictionary Lists
翻訳と辞書 辞書検索 [ 開発暫定版 ]
スポンサード リンク

Lucene ( リダイレクト:Apache Lucene ) : ウィキペディア日本語版
Apache Lucene[るしーん]
Apache Lucene(アパッチ ルシーン)は、Javaで記述された全文検索ソフトウェアである。あらかじめ蓄積した大量のデータから、指定したキーワードを探し出す機能を持つ。Javaのクラスライブラリとして提供される。
== 概要 ==
1000万ドキュメントくらいの規模まで1台のマシンで対応できる。それ以上を複数のマシンで分散検索できるようにするHadoopというサブプロジェクトがある。
検索エンジン(ライブラリ)だけの提供であり、ウェブアプリとしての機能はSolr、クローラーの機能はNutchというサブプロジェクトで開発されている。またApache外でも、リアルタイム検索システムのElasticsearchのベースシステムなどに採用されている〔what is elasticsearch? - elastic search〕。
日本語のデータをインデックスするためには、CJKAnalyzerかJapaneseAnalyzerを使う。CJKAnalyzerはbi-gram方式である。JapaneseAnalyzerを使うには形態素解析エンジンを組み込む必要があり、2014年現在ではオープンソースのSen(MeCabのJava実装)ベースの「lucene-gosen」、同じくオープンソースのKuromojiベースの2種類の実装がある。また、ベイシステクノロジー社 から販売されているJLAでも日本語のデータを形態素解析してインデックスできる。
2007年1月にApacheのトップレベルプロジェクトになり、現在はPMC (Project Management Committee) での開発スタイルをとっている。

抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)
ウィキペディアで「Apache Lucene」の詳細全文を読む




スポンサード リンク
翻訳と辞書 : 翻訳のためのインターネットリソース

Copyright(C) kotoba.ne.jp 1997-2016. All Rights Reserved.