|
音声圧縮あるいはオーディオ圧縮(英語: )とは、音声ファイルのサイズを削減する目的で設計されたデータ圧縮の一種である。音声圧縮アルゴリズムは、「オーディオコーデック」として実装される。汎用データ圧縮アルゴリズムは音声データには適さず、オリジナルの87%以下に圧縮できることがほとんどなく、リアルタイムの再生にも適さない。そのため、音声向けの可逆圧縮アルゴリズムや非可逆圧縮アルゴリズムが生み出された。非可逆圧縮アルゴリズムは圧縮率が非常に高く、一般の音響機器によく使われている。 可逆でも非可逆でも、情報の冗長性を削減するために、符号化手法、パターン認識、線形予測などの手法を駆使して、圧縮を行う。音声品質は若干落ちるが、多くのユーザーはその違いに気づかず、必要なデータ量は大幅に削減される。例えば、1枚のコンパクトディスクで、高品質な音楽データなら1時間しか記録できないが、可逆圧縮すれば2時間ぶんを記録でき、MP3のような非可逆圧縮なら7時間ぶんの音楽を記録できる〔可逆圧縮は元の音声の性質によって圧縮後のサイズ・圧縮率が大きく異なり、非可逆圧縮はビットレートの設定によって異なるため、あくまで目安である〕。 == 可逆音声圧縮 == 年々記録媒体のコストが低下し、またインターネットの通信速度も向上しているため、音声ファイルを永久的に保管するための形式として、Monkey's Audio、FLAC、Shorten などの可逆圧縮フォーマットがよく使われるようになってきている。特にレコーディングエンジニアやオーディオマニアが可逆圧縮フォーマットをよく使う。圧縮率は汎用の可逆データ圧縮と同程度(オリジナルの50%から60%)である。次世代DVD向けに Dolby TrueHD のような可逆圧縮フォーマットも登場している。 音声の全てのデータを保持しつつ、大幅な圧縮率を達成することは困難である。そもそも、実世界で録音された音声は非常に複雑で、圧縮技法のひとつであるパターンの繰り返しの検出が困難である。画像の場合もコンピュータグラフィックスよりも実世界の写真の方が圧縮しにくいのと同じである。ただし音声の場合、コンピュータが生成した音も非常に複雑な波形を含み、多くの圧縮アルゴリズムでは圧縮が難しい。これは、音声波形がそのままでは単純化するのが難しく、人間の耳で行われているように周波数領域に(必要なら可逆に)変換してやる必要があるためである。 また、音声の標本化された値は非常に素早く変化するため、汎用のデータ圧縮アルゴリズムでは音声をうまく扱えず、同じバイト列が何度も繰り返されることもほとんどない。1 フィルタによる畳み込みは、スペクトルを若干ホワイトノイズ化(平坦化)する傾向があり、そのため可逆圧縮のエンコーダで利用される。その場合、デコーダが逆の操作を行って元の信号を復元する。FLAC、Shorten、TTA といったコーデックは、信号の周波数スペクトルを推定するのに線形予測法を用いる。エンコーダでは、その予測の逆を行って周波数スペクトルのピークを小さくすることでホワイトノイズ化し、デコーダは線形予測法をそのまま使って元の信号を再構築する。 可逆オーディオコーデックは音質には問題がないため、有用性は以下の観点で判断される。 * 圧縮・伸張の速度 * 圧縮率 * 対応するビット深度・サンプリングレート・チャンネル数 * ソフトウェア・ハードウェアでの採用状況 * 誤り訂正能力 データ上の劣化は存在しないが、デコーダの性能などによって音質の劣化が発生し得る。オーディオマニアの間ではスーパーオーディオCDの圧縮を好まない傾向があり、ユニバーサルミュージックの「SACD~SHM仕様~」など非圧縮にこだわったソフトがリリースされている。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「音声圧縮」の詳細全文を読む スポンサード リンク
|