|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ 日 : [にち, ひ] 1. (n-adv,n-t) sun 2. sunshine 3. day ・ 訳 : [わけ, やく] 【名詞】 1. (uk) conclusion from reasoning, judgement or calculation based on something read or heard 2. reason 3. cause 4. meaning 5. circumstances 6. situation
機械翻訳(きかいほんやく)とは、ある自然言語を別の自然言語へ機械的に変換する技術をいう。機械翻訳の概念自体はコンピュータの存在以前より存在するため、機械翻訳と翻訳ソフトは同義ではないが、現在ではほとんど翻訳ソフトとして実装される。例として、英語の文章を入力するとそれを翻訳した日本語の文章を出力する英和翻訳ソフトウエアなどがある。自動翻訳ともいう。近年は統計、人工知能、コンピュータ処理能力、データベース、記憶容量の進歩により急速に成長している分野である。 == 歴史 == 機械翻訳という発想が生まれた起原のひとつは、暗号学からである。ウォーレン・ウィーバー(シャノンによる、情報理論の記念碑的業績である論文『通信の数学的理論』の書籍版〔日本語には、初出版と書籍版は同題に訳されるのだが、原題では '' A Mathematical Theory of Communication'' と '' The Mathematical Theory of Communication'' という僅かだが深遠な違いがある。〕の共著者)が1947年3月にノーバート・ウィーナー(サイバネティックスが著名)に送った手紙によると、ロシア語で書かれた文章について、「暗号化された英語の文章」と見なせば暗号解読の要領で機械的に翻訳できるのではないかと提案している。しかし、同年4月のウィーナーの返信によれば、(自然)言語は曖昧な表現が多いために、暗号のように機械的な手段は適用できないのではと懐疑的であった。 以上のように米国(およびソ連)の場合は冷戦を背景とした需要があった。欧州の場合は、多国間交渉や条約などで多国語間の翻訳という課題を抱えていたという動機があり、2言語間ではなく多言語間という難しい問題に挑む一方、ある程度近い言語間の翻訳ではあった。日本の場合は、とにかく英日と日英の翻訳が望まれた。 上位の学術分野としては自然言語処理あるいは計算言語学であるが、いずれもコンピュータの発達により言語を扱えるようになったことで発展した分野であり、また言語の統計的性質を研究する所など、暗号学に起源の一部を辿れる点も似ている。機械翻訳はこれらの分野で主要な応用の位置にある。 大学や研究機関による成果の最も早いものは、1954年にジョージタウン大学などの研究グループにより発表された。これを皮切りに、形態素解析や係り受け解析などの機械翻訳に必要な技術の研究が始まった。日本では1950年代に九州大学の栗原俊彦らが研究を開始し、1950年代末に実験機「KT-1」を〔http://museum.ipsj.or.jp/heritage/KT-1.html〕、またそれとは独立に電総研の研究チームが実験機「やまと」を〔http://museum.ipsj.or.jp/computer/dawn/0027.html〕作っている。その後も研究が続いたが、当時のコンピュータの性能による限界が厳しく、米国では1964年に発表された「ALPACレポート」で機械翻訳の様々な問題点が指摘され実用レベルには程遠いとされたことにより、米国では(同時期に似たような経過を辿った他の人工知能分野と同様に)研究にしばらく予算がつかず約10年にわたって研究が停滞した。しかしそんな中でも研究する研究者はおり、研究は緩やかに進んだ。1980年代になると、ルールベースの機械翻訳システムが一定の成果を上げるようになった。 一方、IBMは1990年代に異なる言語間の単語対応を統計的に獲得する「IBMモデル」という手法を提案した。これが統計機械翻訳の始まりである。初期の統計ベースの翻訳は単語の並べ替えに基づくものであったが、2000年代に句構造を利用した翻訳手法が発表され、語族が異なる言語間でも翻訳の精度が飛躍的に向上することとなった。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「機械翻訳」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Machine translation 」があります。 スポンサード リンク
|