| 音声ファイルのフォーマットについて |
さて、音声ファイルの概念については説明しましたが、音声ファイルにもいくつかのフォーマットがあるのをご存知でしょうか。
まず代表的なものをあげると、
- WAV形式
- Microsoft社とIBM社が規格制定した,Windows標準のフォーマットです。
- 拡張子は一般的に.wavです。
- Windows標準ですので、Windows Media Playerで再生できます。
- AU形式
- UNIXでもっとも普及している音声フォーマットの1つです。
- 拡張子は一般的に .auです。
フォーマットについて、更に詳細に説明します
- 音声ボードの説明書やミドルウェアの説明書に、それが扱える音声フォーマットが記載されてます。
- ダイアロジックボードの説明書には
- 24Kb/s ADPCM @ 6kHz sampling
- 32Kb/s ADPCM @ 8kHz sampling
- 48Kb/s μ-law PCM @ 6kHz sampling
- 64Kb/s μ-law PCM @ 8kHz sampling
- あるミドルウェアの製品仕様には
- PCM 8KHz 8ビットモノラル
- PCM 8KHz 16ビットモノラル
- とあります。なにやら記号めいたものが並び、何を言っているのか分かりませんね。実は私も知らなくて調べました。睡魔と戦いながら...せっかくですのでご説明します。
- その前に、ダイアロジックボードとミドルウェアとで、表現の仕方が違っているのでダイアロジックをミドルウェアにあわせまて表現を統一します。
- ダイアロジックの最初の行を例にすると
- 24Kb/s ADPCM @ 6kHz sampling
- これには量子化ビット数がありません。
- 量子化ビット数は、データ量÷サンプリングレート=量子化ビット数
- データ量とは、左の24KB/sのことです。
- サンプリングレートは、6kHzのことです。
- 先の式にあてはめると、24÷6=4、量子化ビット数は4ビットになります。
- これをミドルウェアの表現に変換すると、 ADPCM 6kHz 4ビット モノラルとなります。
最後のモノラルに関しては、
- 最後のモノラルに関しては、音声ボードではステレオは扱わないのでモノラルとなります。
- イアロジックの表現をミドルウェアの表現を変えると、
- ダイアロジック
- ADPCM 6kHz 4ビット モノラル
- ADPCM 8kHz 4ビット モノラル
- μ-law PCM 6kHz 8ビット モノラル
- μ-law PCM 8kHz 8ビット モノラル
- ミドルウェア
- PCM 8KHz 8ビット モノラル
- PCM 8KHz 16ビット モノラル
- となります。これで表現の統一が取れました。早速説明します。
まず、並びの説明をすると、
- 変換方式 サンプリング周波数 量子化ビット モノラル
- 並びは分かりましたが、それぞれの意味が分かりませんね。ここからが、私が調べた結果を公開する場なのです。
- 変換方式
- 音声をデジタルデータに変換する方式のこと。
- 音を一定時間ごとに数値化(サンプリング)して記録します。
- PCM(Pulse Code Modulation)
- デジタルデータで記録された音声に何の加工も加えないため、原理上、音質は最もすぐれています。
- ADPCM(Adaptive Differential Pulse Code Modulation)
- 「適応的差分PCM」の略。
- 音声をデジタルデータに変換する方式の一つ。
- 音を一定時間ごとに数値化するところまではPCM方式と同じだが、音が連続的に変化することを利用して、直前に数値化したデータとの差を記録することによってデータ量を減らすことができる。単純なPCM方式では16ビット必要なデータを、品質を落とさずに12ビット程度まで圧縮することができる。
- μ-law(ミューロー、ユーロー)
- ITU-Tで規格化されている音声符号化における圧縮方式の1つ。
- このμ-law方式では、14bitのリニアPCMデータを8bitに圧縮する。
- リニアとは無圧縮のこと。
- サンプリング周波数(sampling frequency)
- アナログ信号からデジタル信号への変換(AD変換)を1秒間に何回行うかを表す数値。
- 単位は「Hz」(ヘルツ)。
- 音声ファイルについて用いられることが多い。
- ある音を正確に記録し、再現するには、その音の周波数の倍程度の周波数でサンプリングする必要になるといわれている。
- CDで採用されているサンプリング周波数は44.1kHzであるが、高周波音の再現が困難であるため、DVD-AudioやSACDなどの次世代規格では軒並みサンプリング周波数の向上が行われている。
- 量子化ビット
- アナログをデジタルにすることを量子化といい、その際に使用するビット数のこと。
- デジタルデータの品質は、1秒間に何回数値化するか(サンプリング周波数)と、データを何ビットの数値で表現するか(量子化ビット数)で決まる。
- 音楽CD(CD-DA)はPCM方式を利用しており、サンプリング周波数44.1kHz(1秒間に44100回の数値化)、量子化16ビット(0〜65535の65536段階で音声データを表現)である。
- モノラル
- 音を単一系統で録音、または再生する方式。
- データ表現について説明しましたが、ここで、音声ファイルを作成する具体的な方法についても説明します。私は、パソコンにマイクをつなぎ、Windowsのサウンドレコーダで録音をしました。サウンドレコーダのプロパティを開くと、音声ファイルの形式が分かります。作成や確認がWindowsのサウンドレコーダで可能なこと&ほとんどの音声ボードで再生可能なことから下の形式で保存すれば間違いないと思います。
- PCM 8KHz 8ビット モノラル
- PCM 8KHz 16ビット モノラル
- いろいろ書きましたが、標準がなによりお手軽です。以上、私も音響に関しての専門家ではないので、ここまでの知識にとどめています。CTIで利用する分には十分な知識ではないでしょうか。
最後に、
- サンプリング周波数について調べていると、ふと周波数とは何かと思い調べてみました。
- 周波数
- 音は振動によって発生し、空気などの媒体によって次々と伝達して耳に届きます。
- 1秒間に何回振動するかを「周波数」と呼び、Hz(ヘルツ)という単位で表す。
- 1秒間に1回、往復振動するのが1ヘルツです。
- 100回なら、100ヘルツ。1.000回なら1キロヘルツ(kHz)。
- 往復振動、という言葉ではイメージしにくいので例を挙げてみましょう。
- 『バネ(スプリング)の先に重りを吊るし、上下に動かしながら、一定の速さで横に動かしてみる様子』を想像してみてください。バネは伸びたり縮んだりしていますね。吊るした重りは、上下に動いています。横に動かしている、重りの動く跡(軌跡)は波のように見えます。この上下の揺れ”最高点から最低点まで落ち、また最高点まで戻ってくる”が一往復です。この「往復を何回繰り返すか」によって周波数が決まるのです。多ければ高い音、少なければ低い音になるのです。
|
| TOPへ |
|
| Home | CTI | Download | What's New | Profile | Address |
株式会社オープンコム
〒102-0072 東京都千代田区飯田橋4-8-13 山商ビル9階
TEL: 03-3263-7885 FAX: 03-3263-7889
お問合せは webinfo@opencom.co.jp まで。 |
最新更新日:
|
|
| (c) Copyright 2003 OC, Inc. All right reserved |
|
 |
「Linuxの新しい活用方法を発見」
このレポートの内容は以下になります。このレポートを無料で差し上げます。資料請求はこちら
■ はじめに
■ なぜLinux+Bayonneか
■ 弊社が提供するCTI構築
サービス
■ コスト削減が実現できるか
■ どういった使い方ができる
のか
■ 苦労しました
■ 弊社が提供するもの
■ 課題
■ お問い合わせ |
HOMEへ |