|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ 文 : [ぶん] 【名詞】 1. sentence ・ 文書 : [ぶんしょ, もんじょ] 【名詞】 1. document 2. writing 3. letter 4. paperwork 5. note 6. records 7. archives ・ 書 : [しょ] 【名詞】 1. penmanship 2. handwriting 3. calligraphy (esp. Chinese) ・ 検索 : [けんさく] 1. (n,vs) (1) looking up (e.g., a word in a dictionary) 2. retrieval (e.g., data) 3. searching for 4. (2) reference 5. referring to ・ 索 : [さく] 【名詞】 1. rope 2. cord
文書検索(ぶんしょけんさく、)は、自由な書式の文書群に対するユーザーの何らかのクエリについて照合を行うこと。文書はどんな形式でもよいが、主に自然言語で書かれたもので、ニュース記事、不動産情報、マニュアルなど様々なものが考えられる。ユーザーのクエリは、必要な情報に関する複数の文から成る完全な説明や、いくつかの単語まで様々である。 文書検索はテキスト検索(Text Retrieval)の一部または同義とされることもある。テキスト検索は情報検索の一部であり、主に自然言語の形で格納された情報を扱う。1980年代に全文検索が生まれ、索引作成者の仕事の重要性が低下した。テキストデータベースは、パーソナルコンピュータとCD-ROMによって分散化していった。テキスト検索はインターネット検索エンジンの基盤であるため、今日も重要な研究分野となっている。 == 概要 == 文書検索システムは、所定の方法で文書とユーザーのクエリの照合をすることで情報を探す。これは、エキスパートシステムが論理的知識ベースでの推論に基づいて質問に答えるのと対照的である。文書検索システムは、文書データベース、全文索引を構築するための分類アルゴリズム、データベースへのアクセス・インタフェースから構成される。 文書検索システムは主に以下の2つのタスクを行う。 # ユーザーのクエリに対応した文書を探し出す。 # ページランクなどのアルゴリズムを使い、照合結果を評価して、妥当性の順位に従って結果をソートする。 インターネット検索エンジンは文書検索の典型的応用である。今日使われている文書検索システムは、単純な二値判断システムから、統計学的技法や自然言語処理技法を使ったシステムまで、様々なものがある。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「文書検索」の詳細全文を読む スポンサード リンク
|