|
話者認識(わしゃにんしき、)は、人間の声から個人を認識(識別や認証)するコンピュータによる処理。音声から特徴を抽出し、モデル化し、それを使って個人の声の認識を行う。 誰の声であるかを識別する「話者認識」は、何を話しているかを認識する「音声認識」とは異なる。英語では話者認識を Voice recognition とも呼ぶが、これを音声認識の意味で間違って使っている場合がある。 話者認識は約40年前、アナログのフィルタの出力を平均化したもので一致するかどうかを調べるという形式で始まった。話者認識は、人によって異なる声の音響的特徴を利用する。そういった音響パターンは、解剖学的特徴(咽喉や口の大きさや形状)と生まれ育ってきた環境(話すスピードやスタイル)に起因する。このように後天的に学習したパターンも声に影響するため、話者認識は「行動的特徴」を用いた生体認証に分類される。 == 照合/認証と識別 == 話者認識の応用は2種類に分類される。1つは、ある人物が本人の主張している通りの個人であるかを照合/認証するものである。これを話者照合(Speaker verification)または話者認証(Speaker authentication)と呼ぶ。もう1つは、誰だかわからない声を誰のものか識別するものである。これを話者識別(Speaker identification)と呼ぶ。話者照合では、話者の声を1つのテンプレートと照合すればよいが、話者識別では記憶しているあらゆるテンプレートと照合する必要がある。 例えば、ATMが話者認識を生体認証として使っている場合、それは話者照合/話者認証である。また、何らかの音声記録から犯罪者の声がないかを探す場合、犯罪者の声のデータベースとの照合によって話者識別を行うことになる。 話者照合は、セキュリティを確保したアクセスを必要とする場合に利用される。システムは利用者の知識を前提として運用され、利用者が協力することで成り立つ。話者識別システムは、逆に利用者に知られないように行われることが多い。例えば、ユーザーを正しいメールボックスに誘導する、議論に参加している話者を識別する、音声認識システムに話者が入れ替わっていることを知らせる、ユーザーがシステムに既に登録済みかどうかを調べるといった利用が考えられる。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「話者認識」の詳細全文を読む スポンサード リンク
|