翻訳と辞書 |
固有表現抽出[こゆうひょうげんちゅうしゅつ] 固有表現抽出(こゆうひょうげんちゅうしゅつ、、)とは、計算機を用いた自然言語処理技術の一つであり、固有名詞(人名、地名など)や日付、時間表現などを抽出する技術である。情報抽出の一分野であるとされる。 == 目的 == 新聞記事など現実世界に存在するテキストには大量の固有表現 () が含まれている。形態素解析などを行なう際、それらの固有表現は辞書に登録されていない場合、未知語として扱われ、解析の誤りを起こす。そのため、様々な固有表現を辞書に登録する必要があるが、前述の通り、現実のテキストには大量の固有表現が存在し、人手でそれらを登録することは困難である。 この問題を解決するため、計算機によって大量のテキストから固有表現を自動的に抽出する技術が生まれた。
抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「固有表現抽出」の詳細全文を読む
スポンサード リンク
翻訳と辞書 : 翻訳のためのインターネットリソース |
Copyright(C) kotoba.ne.jp 1997-2016. All Rights Reserved.
|
|