オーディオ用語

このオーディオ関連の用語集では、広く使用される一般的な用語および Android 固有の用語について説明します。用語の正規の定義については、センターの Android Platform 用語集をご覧ください。

一般的な用語

慣習的な意味を持つ、一般的なオーディオ関連の用語です。

デジタル オーディオ

デジタル オーディオとは、デジタル形式でエンコードされたオーディオ信号による音声処理を指します。詳しくは、デジタル オーディオをご覧ください。

AC3
ドルビーのオーディオ コーデック。詳しくは、ドルビー デジタルをご覧ください。
音響
デバイス上のトランスデューサ(スピーカー、マイクなど)の物理的な配置が、人の耳に届く音質にどのように影響するかなどといった、音の機械的な特性。
減衰
信号レベルを下げるためにオーディオ信号に対して適用される 1.0 以下の乗法係数。比較対象として、「ゲイン」があります。
オーディオマニア
よい音の追求を趣味とする人々のこと。特に、よりよい音質を実現するためにかかる費用や設置する機器の規模、部屋の設計などを惜しまない愛好家を指します。詳しくは、オーディオマニアをご覧ください。
AVB
イーサネット経由のデジタル オーディオをリアルタイムで転送するための標準規格。詳しくは、Audio Video Bridging をご覧ください。
サンプルあたりのビット数またはビット深度
1 つのサンプルあたりの情報のビット数。
チャンネル
オーディオ情報の単一のストリーム。通常は録音または再生の入出力の単位を指します。
ダウンミックス
ステレオからモノラルへ、または 5.1 チャンネルからステレオへといったように、チャンネルの数を減らす作業のこと。チャンネルのドロップ、チャンネルのミキシング、またはより高度な信号処理によって行います。減衰または制限を設定せずにダウンミックスを行うと、オーバーフローやクリッピングが発生する可能性があります。比較対象として、「アップミックス」があります。
DSD
ダイレクト ストリーム デジタルの略。パルス密度変調に基づく独自のオーディオ エンコーディング。パルス符号変調(PCM)は複数ビットの個別のオーディオ サンプルのシーケンスとして波形をエンコードしますが、DSD は非常に高いサンプルレートで(サンプリングの概念なしで)ビットのシーケンスとして波形をエンコードします。PCM と DSD は、どちらも独立したシーケンスによって複数のチャンネルを表します。従来のデジタル信号処理(DSP)アルゴリズムを DSD に適用することは困難であるため、DSD は処理の内部表現よりもコンテンツ配信に適しています。DSD は、Super Audio CD(SACD)および USB の DSM over PCM(DoP)に使用されます。詳しくは、ダイレクト ストリーム デジタルをご覧ください。
ダッキング
別のストリームがアクティブになった際に、ストリームの音量を一時的に小さくすること。たとえば、音楽を再生している際に通知を受け取った場合などには、通知音の再生中に音楽がダッキングされます。比較対象として「ミュート」があります。
FIFO
First In, First Out(先入れ先出し)の略。データの First In, First Out(先入れ先出し)によるキューイングを実装するハードウェア モジュールまたはソフトウェアのデータ構造。オーディオ関連の場合、キューに格納されるデータは通常オーディオ フレームです。FIFO は、リングバッファで実装されます。
フレーム
ある時点での 1 つのチャンネルに対する 1 つのサンプルのセット。
バッファあたりのフレーム数
あるモジュールから次のモジュールに一度に渡されるフレームの数。オーディオ HAL インターフェースでは、バッファごとのフレームという概念が用いられます。
ゲイン
信号レベルを上げるためにオーディオ信号に対して適用される 1.0 以上の乗法係数。比較対象として、「減衰」があります。
HD オーディオ
高音質オーディオ。ハイ レゾリューション オーディオと同義ですが、インテル ハイデフィニション オーディオとは異なります。
ヘッドフォン
耳に装着する、マイクのないスピーカー。比較対象として、「ヘッドセット」があります。
ヘッドセット
マイク付きヘッドフォン比較対象として、「ヘッドフォン」があります。
Hz
サンプルレートまたはフレームレートの単位。
ハイ レゾリューション オーディオ
CD(44.1 kHz のステレオ 16 ビット PCM)よりも大きなビット深度とサンプルレートを持つ、非可逆データ圧縮なしのオーディオ形式。HD オーディオと同等です。 詳しくは、ハイ レゾリューション オーディオをご覧ください。
インターリーブ
チャンネル間でデータを代替するマルチチャンネル デジタル オーディオの表現。たとえば、インターリーブ形式で表現されたステレオ デジタル オーディオは、左チャンネル、右チャンネル、左チャンネル、右チャンネルなどになります。
遅延
信号がシステムを通過する際の時間の遅延。
ロスレス
エンコードおよびデコード全体でビット精度を維持するロスレスデータ圧縮アルゴリズムのことを指し、エンコードされたデータのデコード結果は元のデータと同等となります。ロスレス オーディオ コンテンツの配信形式の例としては、CDWAV 内の PCM、FLAC があります。オーサリング プロセスにより、ビット深度またはサンプルレートがマスターのビット深度またはサンプルレートから減少する可能性があります。なお、マスターの解像度とビット精度を維持する配信フォーマットの使用は、ハイ レゾリューション オーディオの主要な要件です。
損失
エンコーディング時とデコーディング時に、メディアの最も重要な特徴を維持しようとする非可逆圧縮アルゴリズム。エンコードされたデータのデコード結果は、元のデータと知覚的に類似していながらも同一にはなりません。非可逆音声圧縮アルゴリズムの例としては、MP3 や AAC があります。アナログ値は連続信号であり、デジタル値は離散信号であるため、ADC と DAC は振幅に関して損失が多い変換方法です。関連項目として、「透明性」もご覧ください。
モノラル
単一のチャンネル。
マルチチャンネル
「サラウンド音声」をご覧ください。厳密に言えば、ステレオも 2 つ以上のチャンネルであるため、マルチチャンネルと見なすことができます。ただし、混乱を招くためこのようには呼びません。
ミュート
通常の音量調節を使わず、一時的に音量をゼロにします。
オーバーラン
一定の時間内に、提供されたデータが受け入れられなかったために聞こえるグリッチ。詳しくは、バッファ アンダーランをご覧ください。比較対象として、「アンダーラン」があります。
パンニング
ステレオまたはマルチチャンネル フィールド内の目的の位置に信号を送ります。
PCM
パルス符号変調。デジタル オーディオにおいて、最も一般的かつ低水準のエンコード。オーディオ信号は、サンプルレートと呼ばれる一定の間隔でサンプリングされ、ビット深度に応じて特定の範囲内の離散値に量子化されます。たとえば、16 ビット PCM の場合、サンプル値は -32768 から +32767 までの整数です。
ランプ
音量やエフェクトの強さなど、特定のオーディオ パラメータのレベルを徐々に上げたり下げたりします。音量のランプは、一般的に音楽の一時停止および再開時に適用され、耳に聞こえる極端なトランジションを回避します。
サンプル
ある時点での単一チャンネルのオーディオ値を表す数値。
サンプルレートまたはフレームレート
1 秒あたりのフレーム数。フレームレートと呼ぶほうがより正確ですが、一般にはフレームレートをサンプルレートと呼びます。
ソニフィケーション
タッチ サウンドやキーボード サウンドなど、フィードバックまたはなんらかの情報を表すためにサウンドを使用すること。
SPL
音圧レベル、音圧の相対的な測定単位。
ステレオ
2 つのチャンネル。
ステレオ ワイドニング
より深く豊かなサウンドのステレオ信号を作成するためにステレオ信号に適用するオーディオ効果。エフェクトは、アップミックスの一種であるモノラル信号にも適用できます。
サラウンド音声
リスナーが、ステレオ サウンドの左右だけでなく前後などからも音の位置を認識できるようにするための技術。
透過性
非可逆データ圧縮の理想的な結果。非可逆のデータ変換を行っても、リスナーが知覚的に元のデータと変換後の音を区別できない場合、これは透過的であると言えます。詳しくは、透過性をご覧ください。
アンダーラン
一定の時間内に必要なデータを提供できなかったために聞こえるグリッチ。詳しくは、バッファ アンダーランをご覧ください。比較対象として、「オーバーラン」があります。
アップミキシング
モノラルからステレオへ、またはステレオからサラウンド サウンドへといったように、チャンネルの数を増やす作業。複製、パンニング、またはより高度な信号処理によって行います。比較対象として、「ダウンミックス」があります。
USAC
低ビットレートのアプリケーション用のオーディオ コーデック。詳しくは、統合音声とオーディオ コーディングをご覧ください。
バーチャライザー
より多くのスピーカーをシミュレートしたり、音源の位置を錯覚させたりするなど、オーディオ チャンネルを空間化するためのオーディオ効果。
音量
音量、あるいはオーディオ信号の主観的な強さ。

デバイス間相互接続

デバイス間相互接続技術により、デバイス間で音声および動画コンポーネントを接続します。これは、外部コネクタで簡単に確認できます。HAL の実装者およびエンドユーザーは、この用語を知っておく必要があります。

Bluetooth
短距離無線技術の一種です。オーディオ関連の Bluetooth プロファイルBluetooth プロトコルについて詳しくは、音楽用の A2DP、電話用の SCO音声/動画リモート コントロール プロファイル(AVRCP)をご覧ください。
DisplayPort
Video Electronics Standards Association(VESA)が定めるデジタル ディスプレイのインターフェース。
ドングル
ドングルとは小さなガジェットのことで、特に別のデバイスに装着するタイプのものを指します。
FireWire
IEEE 1394 をご覧ください。
HDMI
高精細度マルチメディア インターフェース。音声データと動画データを転送するためのインターフェースです。モバイル デバイスの場合、micro-HDMI(タイプ D)または MHL コネクタが使用されます。
IEEE 1394
IEEE 1394 はオーディオなどのリアルタイムの低遅延アプリケーションに使用されるシリアルバスです。FireWire とも呼ばれます。
Intel HDA
Intel High Definition Audio(一般的なハイ レゾリューション オーディオまたは高音質オーディオと混同しないようにする必要があります)。前面パネルのコネクタの仕様。詳しくは、Intel High Definition Audio をご覧ください。
インターフェース
特定の表現から別の表現に信号を変換するのがインターフェースです。代表的なインターフェースとして、USB オーディオ インターフェースや MIDI インターフェースがあります。
ラインレベル
ラインレベルとは、変換器間ではなく、オーディオ コンポーネント間を通過するアナログ オーディオ信号の強度のことです。
MHL
モバイル ハイデフィニション リンク。主にマイクロ USB コネクタを介したモバイル音声/動画インターフェース。
フォンコネクタ
デバイスを有線ヘッドフォン、ヘッドセット、またはラインレベル アンプに接続するミニまたはサブミニ コンポーネント。
SlimPort
micro-USB から HDMI へのアダプター。
S/PDIF
Sony/Philips デジタル インターフェース フォーマット。非圧縮 PCM と IEC 61937 の相互接続。詳しくは、S/PDIF をご覧ください。S/PDIF は、AES3 の民間向け派生規格です。
Thunderbolt
高性能な周辺機器への接続を行うための、USB および HDMI と競合するマルチメディア インターフェース。詳しくは、Thunderbolt をご覧ください。
トスリンク
トスリンクは、S/PDIF で使用される光オーディオ ケーブルです。
USB
ユニバーサル シリアル バスの略。詳しくは、USB をご覧ください。

デバイス内相互接続

デバイス内相互接続技術は、特定のデバイスに内蔵のオーディオ コンポーネントを接続するものです。これは、デバイスを分解しない限りエンドユーザーの目には触れません。HAL の実装者はこれらを認識している必要がありますが、エンドユーザーには必要ありません。デバイス内の相互接続について詳しくは、次の記事をご覧ください。

ALSA System on Chip(ASoC)では、これらは総称してデジタル オーディオ インターフェース(DAI)と呼ばれます。

オーディオ信号パス

オーディオ信号パスとは、オーディオ データがアプリケーションからトランスデューサへ、またはその逆にたどる信号パスを指します。

ADC
アナログ-デジタル変換器。アナログ信号(時間と振幅が連続)をデジタル信号(時間と振幅が離散)に変換するモジュール。ADC は、概念的には一定間隔のサンプリングとホールドおよびそれに続く量子化で構成されますが、必ずしもこのように実装する必要はありません。通常、ADC の前にはローパス フィルタが配置され、目的のサンプルレートで表現できない高周波成分を除去します。詳しくは、アナログ-デジタル変換器をご覧ください。
AP
アプリケーション プロセッサ。モバイル デバイス上のメインの汎用コンピュータ。
コーデック
コーダー-デコーダ。ある特定の表現から別の表現へオーディオ信号をエンコードおよび / またはデコードするモジュール(通常、アナログから PCM、または PCM からアナログ)。厳密に言えば、コーデックとはエンコードとデコードを行うモジュールに対する呼称ですが、このうちの片方だけを指すものとして使用されることもあります。詳しくは、オーディオ コーデックをご覧ください。
DAC
デジタル-アナログ変換器。デジタル信号(時間と振幅が離散)をアナログ信号(時間と振幅が連続)に変換するモジュール。通常、デジタル量子化によって発生した高周波成分を除去するローパス フィルタがその後に続きます。詳しくは、デジタル-アナログ変換器をご覧ください。
DSP
デジタル シグナル プロセッサ。通常、アプリケーション プロセッサの後(出力用)またはアプリケーション プロセッサの前(入力用)に配置されます。主な目的として、アプリケーションプロセッサの負荷を軽減し、信号処理機能を低負荷で提供することがあげられます。
PDM
パルス密度変調。アナログ信号をデジタル信号で表現するために使用される変調の形式で、相対密度 1 または 0 により信号レベルを表します。デジタル-アナログ変換器で一般的に使用される変調形式です。詳しくは、パルス密度変調をご覧ください。
PWM
パルス幅変調。アナログ信号をデジタル信号で表現するために使用される変調の形式で、デジタルパルスの相対幅が信号レベルを表します。アナログ-デジタル変換器で一般的に使用される変調形式です。詳しくは、パルス幅変調をご覧ください。
トランスデューサ
現実世界の物理量の変化を電気信号に変換します。オーディオ関連においては物理量とは音圧のことで、トランスデューサはスピーカーやマイクを指します。詳しくは、トランスデューサをご覧ください。

サンプルレート変換

サンプルレート変換とは、あるサンプルレートから別のサンプルレートに変換する処理を指します。

ダウンサンプリング
シンク サンプルレートをソース サンプルレートよりも小さくする再サンプリングのこと。
ナイキスト周波数
特定のサンプルレートの 1/2 で離散化された信号で表すことができる最大周波数成分。たとえば、人間の可聴域の上限は約 20 kHz であるため、その範囲の音を表現するには、デジタル オーディオ信号のサンプルレートを最低でも 40 kHz とする必要があります。一般的に使用されるサンプルレートは 44.1 kHz と 48 kHz で、ナイキスト周波数はそれぞれ 22.05 kHz と 24 kHz となります。詳しくは、ナイキスト周波数および可聴域をご覧ください。
リサンプラー
サンプルレート変換と同義。
リサンプリング
サンプルレートを変換する処理。
サンプルレート コンバーター
リサンプリングを行うモジュール。
シンク
リサンプラーの出力。
ソース
リサンプラーへの入力。
アップサンプリング
シンク サンプルレートをソース サンプルレートよりも大きくする再サンプリングのこと。

電話

AEC
音響エコー キャンセラとは、信号からエコーを減らすための機能です。詳しくは、エコーの抑制とキャンセルをご覧ください。
ANC
アクティブ ノイズ コントロールとは、不要なセカンダリ信号と反対の信号をアクティブに生成することで、プライマリ信号の品質を向上させる機能です。詳しくは、アクティブ ノイズ コントロールをご覧ください。
電話アプリ
電話用のユーザー インターフェースを提供するアプリ。
HCO
ヒアリング キャリーオーバーは TTY モードであり、メッセージは SMS の形式で送信され、音声の形式で受信されます。
サイドトーン
ローカルのマイクからローカルの優先ヘッドセットへの聴覚フィードバック。詳しくは、サイドトーンをご覧ください。
TDD
聴覚障がい者向け通信デバイスは、聴覚障がいまたは言語障がいのある人向けに設計されたテレタイプライター(TTY)です。
TTY
テレタイプライター。多くの場合、TDD と同じ意味で使用されます。
UE
ユーザー機器。ユーザーのスマートフォン デバイス。
UMTS
Universal Mobile Telecommunications System。モバイル ネットワーク システムの 1 つ。
VCO
ボイス キャリーオーバーは TTY モードであり、メッセージは音声の形式で送信され、SMS の形式で受信されます。

Android 固有の用語

Android 固有の用語には、Android 音声フレームワークのみで使用される用語や、Android 関連として使用する場合に特別な意味合いを持つ一般的な用語があります。

ALSA
Advanced Linux Sound Architecture の略。他のシステムにも影響を与えた Linux 用のオーディオ フレームワークです。一般的な定義について詳しくは、ALSA をご覧ください。Android では、ALSA はユーザーモード API を指すものではなく、カーネル オーディオ フレームワークとドライバを意味します。関連項目: tinyalsa
オーディオ機器
HAL が実装されたオーディオ I/O エンドポイント。
AudioEffect
出力(後処理)効果および入力(前処理)効果のための API および実装フレームワーク。この API は、android.media.audiofx.AudioEffect に定義されています。
AudioFlinger
Android サウンド サーバーの実装。AudioFlinger は、mediaserver プロセス内で動作します。一般的な定義については、サウンド サーバーをご覧ください。
音声フォーカス
複数の独立したアプリ間での音声操作を管理する一連の API。詳しくは、音声フォーカスの管理および android.media.AudioManager のフォーカス関連のメソッドと定数をご覧ください。
AudioMixer
複数のトラックを結合し、減衰(音量)や効果を適用する AudioFlinger のモジュール。一般的な定義については、Audio mixing(recorded music)をご覧ください(システム内のソフトウェア モジュールではなく、ハードウェア デバイスまたはソフトウェア アプリケーションとしてミキサーを説明しています)。
オーディオ ポリシー
新しい I/O ストリームの開始、変更後の再ルーティング、ストリームのボリューム管理など、最初にポリシー決定を行う必要のあるすべての操作を行うサービス。
AudioRecord
マイクなどのオーディオ入力デバイスからデータを受信するためのプライマリ ローレベル クライアント API。通常、このデータは PCM 形式です。API は、android.media.AudioRecord で定義されています。
AudioResampler
サンプルレート変換を行う AudioFlinger のモジュール。
オーディオ ソース
オーディオ入力をキャプチャするための適切なユースケースを示す定数の列挙型。詳しくは、オーディオ ソースをご覧ください。API レベル 21 以降では、オーディオ属性を使用することをおすすめします。
AudioTrack
スピーカーなどのオーディオ出力デバイスにデータを送信するためのプライマリ ローレベル クライアント API。通常、このデータは PCM 形式です。API は、android.media.AudioTrack に定義されています。
audio_utils
Android プラットフォームにはほとんど依存しない、PCM 形式変換、WAV ファイル I/O および非ブロッキング FIFO などの機能用のオーディオ ユーティリティ ライブラリ。
クライアント
通常、アプリケーションまたはアプリ クライアントを指します。ただし、AudioFlinger クライアントは、MediaPlayer オブジェクトによってデコードされたメディアを再生するといった場合に、mediaserver システム プロセス内で実行されるスレッドであることがあります。
HAL
HAL は Android の一般的な用語で、オーディオ関連として使われる場合は、(C++ libaudio に置き換わる)C API を備えた AudioFlinger とカーネル デバイス ドライバの間のレイヤーを意味します。
FastCapture
レイテンシを低減するように構成されている場合に、オーディオ データを低遅延の高速トラックに送信して入力デバイスを動作させる、AudioFlinger 内のスレッド。
FastMixer
レイテンシを低減するように構成されている場合に、低遅延の高速トラックからオーディオ データを受信およびミキシングしてプライマリ出力デバイスを動作させる、AudioFlinger 内のスレッド。
Fast Track
遅延は発生しにくいものの、一部のデバイスとルートで機能が限られる AudioTrack または AudioRecord クライアント。
MediaPlayer
AudioTrack よりも高水準のクライアント API。エンコードされたコンテンツ、またはマルチメディアの音声トラックや動画トラックを含むコンテンツを再生します。
media.log
カスタムビルドのみで使用できる AudioFlinger デバッグ機能。必要に応じて時間を遡ってダンプ可能なオーディオ バッファへのオーディオ イベントのロギングに使用されます。
mediaserver
AudioFlinger などのメディア関連サービスを含む Android システム プロセス。
NBAIO
ノンブロッキング オーディオ入出力。AudioFlinger ポートの抽象化のことですが、この用語は、NBAIO API の一部の実装ではブロッキングをサポートしているため、誤解を招く可能性があります。主な NBAIO の実装はパイプの種類に応じて異なります。
通常ミキサー
ほぼ全機能の AudioTrack クライアントを提供する、AudioFlinger 内のスレッド。出力デバイスを直接動作させるか、サブミックスをパイプ経由で FastMixer に送ります。
OpenSL ES
クロノス グループによるオーディオ API 標準。API バージョン 9 以降の Android は、OpenSL ES 1.0.1 のサブセットに基づくネイティブ オーディオ API をサポートしています。
Pro Audio
機能フラグ android.hardware.audio.pro の略。 この要件は、Android CDD の 5.10 Professional Audio で説明されています。機能 android.hardware.audio.pro の「pro」は、意図されているユーザーではなく、予測可能なリアルタイムのパフォーマンス レベルを指します。
リアルタイム

リアルタイム コンピューティング システムは、制限時間内に関連するイベントに応答することを保証します。リアルタイム コンピューティングをサポートするデバイスの実装は必要ですが、上記の android.hardware.audio.pro 機能要件を満たすための前提条件としては十分ではありません。

リアルタイムの性能は、オーディオ分野に加えて、ゲーム、グラフィックス、カメラ、動画、センサー処理、仮想現実(VR)、拡張現実(AR)などの分野でも広く使用されています。

マナーモード
メディアの再生(音楽、動画、ゲーム)、またはアラームに影響を与えずに電話の着信音と通知をミュートするユーザー設定可能な機能です。
SoundPool
AudioTrack よりも高水準のクライアント API。サンプリングされた音声クリップを再生するもので、UI フィードバック、ゲームサウンドなどのトリガーとして利用できます。この API は android.media.SoundPool で定義されます。
Stagefright
メディアをご覧ください。
StateQueue
スレッド間で状態を同期させる AudioFlinger 内のモジュール。NBAIO はデータの受け渡しに使用され、StateQueue は制御情報の受け渡しに使用されます。
ストラテジー
同様の動作を行うストリーム タイプのグループ。オーディオ ポリシー サービスで使用されます。
ストリーム タイプ
オーディオ出力のユースケースを表す列挙型。オーディオ ポリシーの実装では、ストリーム タイプおよび他のパラメータを使用して、音量とルーティングを決定します。ストリーム タイプの一覧については、android.media.AudioManager をご覧ください。
ティーシンク
オーディオのデバッグをご覧ください。
tinyalsa
BSD ライセンスを備えた ALSA カーネルの上の小規模なユーザーモード API。HAL の実装に推奨されます。
ToneGenerator
AudioTrack よりも高水準のクライアント API。デュアルトーン マルチ周波数(DTMF)信号を再生します。詳しくは、DTMF および android.media.ToneGenerator の API の定義をご覧ください。
トラック
音声ストリーム。AudioTrack API または AudioRecord API によって制御されます。
音量減衰カーブ
特定の出力の汎用ボリューム レベルから特定の減衰係数へのデバイス固有のマッピング。
ボリューム レベル
ストリームの任意の相対ボリュームを表す、単位のない整数。android.media.AudioManager のボリューム関連の API は、絶対減衰係数ではなくボリューム レベルで動作します。