Terminologia de áudio

Este glossário de terminologia relacionada a áudio inclui termos genéricos amplamente usados ​​e termos específicos do Android. Consulte o glossário central da plataforma Android para obter as definições canônicas dos termos.

Termos genéricos

Termos genéricos relacionados ao áudio têm significados convencionais.

Áudio digital

Os termos de áudio digital referem-se ao tratamento do som usando sinais de áudio codificados em formato digital. Para obter detalhes, consulte Áudio Digital .

AC3
Um codec de áudio da Dolby. Para obter detalhes, consulte Dolby Digital .
acústica
Estudo das propriedades mecânicas do som, por exemplo, como o posicionamento físico dos transdutores (alto-falantes, microfones, etc.) em um dispositivo afeta a qualidade percebida do áudio.
atenuação
Fator multiplicativo menor ou igual a 1,0, aplicado a um sinal de áudio para diminuir o nível do sinal. Compare para ganhar .
audiófilo
Pessoa preocupada com uma experiência superior de reprodução musical, especialmente disposta a fazer compensações substanciais (despesas, tamanho dos componentes, design da sala, etc.) pela qualidade do som. Para obter detalhes, consulte audiófilo .
AVB
Um padrão para transmissão em tempo real de áudio digital pela Ethernet. Para obter detalhes, consulte Ponte de áudio e vídeo .
bits por amostra ou profundidade de bits
Número de bits de informação por amostra.
canal
Fluxo único de informações de áudio, geralmente correspondendo a um local de gravação ou reprodução.
mixagem
Diminua o número de canais, como de estéreo para mono ou de 5.1 para estéreo. Conseguido eliminando canais, misturando canais ou processamento de sinal mais avançado. A mixagem simples sem atenuação ou limitação tem potencial para estouro e corte. Compare com upmixing .
DSD
Transmissão direta digital. Codificação de áudio proprietária baseada em modulação de densidade de pulso . Enquanto a Pulse Code Modulation (PCM) codifica uma forma de onda como uma sequência de amostras de áudio individuais de vários bits, o DSD codifica uma forma de onda como uma sequência de bits em uma taxa de amostragem muito alta (sem o conceito de amostras). Tanto PCM quanto DSD representam múltiplos canais por sequências independentes. O DSD é mais adequado para distribuição de conteúdo do que como representação interna para processamento, pois pode ser difícil aplicar algoritmos tradicionais de processamento de sinal digital (DSP) ao DSD. DSD é usado em Super Audio CD (SACD) e em DSD over PCM (DoP) para USB. Para obter detalhes, consulte Transmissão direta digital .
pato
Reduza temporariamente o volume de um fluxo quando outro fluxo se tornar ativo. Por exemplo, se a música estiver tocando quando uma notificação chegar, a música diminuirá enquanto a notificação for reproduzida. Compare com mudo .
FIFO
Primeiro a entrar, primeiro a sair. Módulo de hardware ou estrutura de dados de software que implementa o enfileiramento de dados First In, First Out . Num contexto de áudio, os dados armazenados na fila são normalmente quadros de áudio. O FIFO pode ser implementado por um buffer circular .
quadro
Conjunto de amostras, uma por canal, em um determinado momento.
quadros por buffer
Número de quadros transferidos de um módulo para outro de uma só vez. A interface de áudio HAL usa o conceito de quadros por buffer.
ganho
Fator multiplicativo maior ou igual a 1,0, aplicado a um sinal de áudio para aumentar o nível do sinal. Compare com atenuação .
Áudio HD
Áudio de alta definição. Sinônimo de áudio de alta resolução (mas diferente de Intel High Definition Audio).
fones de ouvido
Alto-falantes que cabem nos ouvidos, sem microfone. Compare com fone de ouvido.
fone de ouvido
Fones de ouvido com microfone. Compare com fones de ouvido.
Hz
Unidades para taxa de amostragem ou taxa de quadros.
áudio de alta resolução
Representação com maior profundidade de bits e taxa de amostragem que os CDs (PCM estéreo de 16 bits a 44,1 kHz) e sem compactação de dados com perdas. Equivalente a áudio HD. Para obter detalhes, consulte áudio de alta resolução .
intercalado
Uma representação para áudio digital multicanal que alterna dados entre canais. Por exemplo, o áudio digital estéreo expresso em formato intercalado é esquerdo, direito, esquerdo, direito, etc.
latência
Atraso de tempo quando um sinal passa por um sistema.
sem perdas
Um algoritmo de compactação de dados sem perdas que preserva a precisão dos bits na codificação e decodificação, onde o resultado da decodificação de dados previamente codificados é equivalente aos dados originais. Exemplos de formatos de distribuição de conteúdo de áudio sem perdas incluem CDs , PCM dentro de WAV e FLAC . O processo de criação pode reduzir a profundidade de bits ou a taxa de amostragem dos masters ; formatos de distribuição que preservam a resolução e a precisão de bits dos masters são objeto de áudio de alta resolução.
com perdas
Um algoritmo de compactação de dados com perdas que tenta preservar os recursos mais importantes da mídia durante a codificação e decodificação, onde o resultado da decodificação de dados previamente codificados é perceptualmente semelhante aos dados originais, mas não idêntico. Exemplos de algoritmos de compressão de áudio com perdas incluem MP3 e AAC. Como os valores analógicos são de um domínio contínuo e os valores digitais são discretos, ADC e DAC são conversões com perdas em relação à amplitude. Veja também transparência .
mono
Um canal.
multicanal
Consulte som surround . Em termos estritos, estéreo é mais de um canal e pode ser considerado multicanal; no entanto, tal uso é confuso e, portanto, evitado.
mudo
Force temporariamente o volume para zero, independente dos controles de volume usuais.
superação
Falha audível causada pela falha na aceitação dos dados fornecidos em tempo suficiente. Para obter detalhes, consulte buffer underrun . Compare com subexecução .
panorâmica
Direcione um sinal para uma posição desejada dentro de um campo estéreo ou multicanal.
PCM
Modulação de código de pulso. Codificação de baixo nível mais comum de áudio digital. O sinal de áudio é amostrado em um intervalo regular, denominado taxa de amostragem, e então quantizado em valores discretos dentro de um intervalo específico, dependendo da profundidade de bits. Por exemplo, para PCM de 16 bits, os valores de amostra são números inteiros entre -32768 e +32767.
rampa
Aumente ou diminua gradualmente o nível de um parâmetro de áudio específico, como o volume ou a intensidade de um efeito. Uma rampa de volume é comumente aplicada ao pausar e retomar a música para evitar uma transição audível difícil.
amostra
Número que representa o valor de áudio de um único canal em um determinado momento.
taxa de amostragem ou taxa de quadros
Número de quadros por segundo. Embora a taxa de quadros seja mais precisa, a taxa de amostragem é convencionalmente usada para significar a taxa de quadros.
sonificação
Uso de som para expressar feedback ou informações, como sons de toque e sons de teclado.
SPL
Nível de pressão sonora, uma medida relativa da pressão sonora.
estéreo
Dois canais.
ampliação estéreo
Efeito aplicado a um sinal estéreo para criar outro sinal estéreo que soe mais completo e rico. O efeito também pode ser aplicado a um sinal mono, onde é um tipo de upmix.
o som ao Redor
Técnicas para aumentar a capacidade do ouvinte de perceber a posição do som além do estéreo esquerdo e direito.
transparência
Resultado ideal de compactação de dados com perdas. A conversão de dados com perdas é transparente se for perceptivamente indistinguível do original por um sujeito humano. Para obter detalhes, consulte Transparência .
underrun
Falha audível causada pela falha no fornecimento dos dados necessários em tempo suficiente. Para obter detalhes, consulte buffer underrun . Compare com superação .
mixagem
Aumente o número de canais, como de mono para estéreo ou de estéreo para som surround. Realizado por duplicação, panorâmica ou processamento de sinal mais avançado. Compare com downmixing .
USAC
Um codec de áudio para aplicações de baixa taxa de bits. Para obter detalhes, consulte Codificação Unificada de Fala e Áudio .
virtualizador
Efeito que tenta espacializar canais de áudio, como tentar simular mais alto-falantes ou dar a ilusão de que as fontes sonoras têm posição.
volume
Loudness, a força subjetiva de um sinal de áudio.

Interconexão entre dispositivos

As tecnologias de interconexão entre dispositivos conectam componentes de áudio e vídeo entre dispositivos e são facilmente visíveis nos conectores externos. O implementador HAL e o usuário final devem estar cientes destes termos.

Bluetooth
Tecnologia sem fio de curto alcance. Para obter detalhes sobre os perfis Bluetooth relacionados ao áudio e os protocolos Bluetooth , consulte A2DP para música, SCO para telefonia e Perfil de controle remoto de áudio/vídeo (AVRCP) .
Porta de exibição
Interface de exibição digital da Video Electronics Standards Association (VESA).
conector de wifi
Um dongle é um pequeno gadget, especialmente aquele que fica pendurado em outro dispositivo.
FireWire
Consulte IEEE 1394.
HDMI
Interface multimídia de alta definição. Interface para transferência de dados de áudio e vídeo. Para dispositivos móveis, é usado um conector micro-HDMI (tipo D) ou MHL.
IEEE 1394
IEEE 1394 , também chamado de FireWire, é um barramento serial usado para aplicações de baixa latência em tempo real, como áudio.
Intel HDA
Áudio de alta definição Intel (não confunda com áudio genérico de alta definição ou áudio de alta resolução ). Especificação para um conector do painel frontal. Para obter detalhes, consulte Áudio de alta definição Intel .
interface
Uma interface converte um sinal de uma representação para outra. As interfaces comuns incluem uma interface de áudio USB e uma interface MIDI.
nível de linha
O nível de linha é a intensidade de um sinal de áudio analógico que passa entre os componentes de áudio, não entre os transdutores.
MHL
Link móvel de alta definição. Interface móvel de áudio/vídeo, geralmente através de conector micro-USB.
conector de telefone
Componente mini ou submini que conecta um dispositivo a fones de ouvido com fio, headset ou amplificador de nível de linha.
SlimPort
Adaptador de micro-USB para HDMI.
S/PDIF
Formato de interface digital Sony/Philips. Interconecte para PCM não compactado e IEC 61937. Para obter detalhes, consulte S/PDIF . S/PDIF é a variante de consumo do AES3 .
Raio
Interface multimídia que compete com USB e HDMI para conexão com periféricos de última geração. Para obter detalhes, consulte Thunderbolt .
TOSLINK
TOSLINK é um cabo de áudio óptico usado com S/PDIF .
USB
Barramento serial universal. Para obter detalhes, consulte USB .

Interconexão intradispositivo

As tecnologias de interconexão intradispositivo conectam componentes de áudio internos em um determinado dispositivo e não são visíveis sem a desmontagem do dispositivo. O implementador HAL pode precisar estar ciente disso, mas não o usuário final. Para obter detalhes sobre interconexões intradispositivos, consulte os seguintes artigos:

No ALSA System on Chip (ASoC) , eles são chamados coletivamente de Digital Audio Interfaces (DAI).

Caminho do sinal de áudio

Os termos do caminho do sinal de áudio referem-se ao caminho do sinal que os dados de áudio seguem de um aplicativo para o transdutor ou vice-versa.

ADC
Conversor analógico para digital. Módulo que converte um sinal analógico (contínuo no tempo e amplitude) em um sinal digital (discreto no tempo e amplitude). Conceitualmente, um ADC consiste em um sample-and-hold periódico seguido por um quantizador, embora não precise ser implementado dessa forma. Um ADC geralmente é precedido por um filtro passa-baixa para remover quaisquer componentes de alta frequência que não sejam representáveis ​​usando a taxa de amostragem desejada. Para obter detalhes, consulte Conversor analógico para digital .
PA
Processador de aplicativos. Computador principal de uso geral em um dispositivo móvel.
codec
Codificador-decodificador. Módulo que codifica e/ou decodifica um sinal de áudio de uma representação para outra (normalmente analógico para PCM ou PCM para analógico). Em termos estritos, codec é reservado para módulos que codificam e decodificam, mas podem ser usados ​​livremente para se referir a apenas um deles. Para obter detalhes, consulte Codec de áudio .
DAC
Conversor digital para analógico. Módulo que converte um sinal digital (discreto no tempo e amplitude) em um sinal analógico (contínuo no tempo e amplitude). Freqüentemente seguido por um filtro passa-baixa para remover componentes de alta frequência introduzidos pela quantização digital. Para obter detalhes, consulte Conversor digital para analógico .
DSP
Processador de sinal digital. Componente opcional normalmente localizado após o processador do aplicativo (para saída) ou antes do processador do aplicativo (para entrada). O objetivo principal é descarregar o processador do aplicativo e fornecer recursos de processamento de sinal com menor custo de energia.
PDM
Modulação por densidade de pulso. Forma de modulação utilizada para representar um sinal analógico por um sinal digital, onde a densidade relativa de 1s versus 0s indica o nível do sinal. Comumente usado por conversores digital para analógico. Para obter detalhes, consulte Modulação de densidade de pulso .
PWM
Modulação por largura de pulso. Forma de modulação utilizada para representar um sinal analógico por um sinal digital, onde a largura relativa de um pulso digital indica o nível do sinal. Comumente usado por conversores analógico-digitais. Para obter detalhes, consulte Modulação por largura de pulso .
transdutor
Converte variações em quantidades físicas do mundo real em sinais elétricos. No áudio, a grandeza física é a pressão sonora e os transdutores são o alto-falante e o microfone. Para obter detalhes, consulte Transdutor .

Conversão de taxa de amostragem

Os termos de conversão da taxa de amostragem estão relacionados ao processo de conversão de uma taxa de amostragem para outra.

reduzir a resolução
Reamostrar, onde taxa de amostragem do coletor <taxa de amostragem da origem.
Frequência de Nyquist
Componente de frequência máxima que pode ser representada por um sinal discretizado a 1/2 de uma determinada taxa de amostragem. Por exemplo, a faixa auditiva humana se estende até aproximadamente 20 kHz, portanto, um sinal de áudio digital deve ter uma taxa de amostragem de pelo menos 40 kHz para representar essa faixa. Na prática, taxas de amostragem de 44,1 kHz e 48 kHz são comumente usadas, com frequências Nyquist de 22,05 kHz e 24 kHz, respectivamente. Para obter detalhes, consulte Frequência de Nyquist e Faixa auditiva .
reamostrador
Sinônimo de conversor de taxa de amostragem.
reamostragem
Processo de conversão da taxa de amostragem.
conversor de taxa de amostragem
Módulo que reamostra.
afundar
Saída de um reamostrador.
fonte
Entrada para um reamostrador.
aumentar a resolução
Reamostrar, onde taxa de amostragem do coletor > taxa de amostragem da fonte.

Telefonia

AEC
O cancelamento de eco acústico é um meio de reduzir o eco de um sinal. Para obter detalhes, consulte Supressão e cancelamento de eco .
ANC
O Controle Ativo de Ruído é um meio de melhorar a qualidade de um sinal primário, adicionando ativamente o inverso de um sinal secundário indesejado. Para obter detalhes, consulte Controle ativo de ruído .
discador
O aplicativo que fornece a interface do usuário para telefonia.
HCO
Audição Carry-Over é um modo TTY no qual uma mensagem é enviada como texto e recebida como fala.
tom lateral
Feedback audível do microfone local para o fone de ouvido local. Para obter detalhes, consulte Tom lateral .
TDD
Dispositivo de telecomunicações para surdos é um tipo específico de teletipo (TTY) para pessoas com deficiência auditiva ou de fala.
TTY
Teletipo . Freqüentemente usado de forma intercambiável com TDD.
UE
Equipamento do usuário. O dispositivo telefônico do consumidor.
UMTS
Sistema Universal de Telecomunicações Móveis . Um tipo de sistema celular móvel.
VCO
Voice Carry-Over é um modo TTY no qual uma mensagem é enviada como áudio e recebida como texto.

Termos específicos do Android

Os termos específicos do Android incluem termos usados ​​apenas na estrutura de áudio do Android e termos genéricos que têm um significado especial no Android.

ALSA
Arquitetura de som Linux avançada. Um framework de áudio para Linux que também influenciou outros sistemas. Para uma definição genérica, consulte ALSA . No Android, ALSA refere-se à estrutura e drivers de áudio do kernel e não à API do modo de usuário. Veja também tinyalsa .
dispositivo de áudio
Endpoint de E/S de áudio apoiado por uma implementação HAL.
Efeito de áudio
API e estrutura de implementação para efeitos de saída (pós-processamento) e efeitos de entrada (pré-processamento). A API é definida em android.media.audiofx.AudioEffect .
AudioFlinger
Implementação de servidor de som Android. AudioFlinger é executado dentro do processo mediaserver. Para obter uma definição genérica, consulte Servidor de som .
foco de áudio
Conjunto de APIs para gerenciar interações de áudio em vários aplicativos independentes. Para obter detalhes, consulte Gerenciando o foco de áudio e os métodos e constantes relacionados ao foco de android.media.AudioManager .
Misturador de áudio
Módulo no AudioFlinger responsável por combinar múltiplas trilhas e aplicar atenuação (volume) e efeitos. Para uma definição genérica, consulte Mixagem de áudio (música gravada) (discute um mixer como um dispositivo de hardware ou aplicativo de software, em vez de um módulo de software dentro de um sistema).
política de áudio
Serviço responsável por todas as ações que exigem que uma decisão política seja tomada primeiro, como a abertura de um novo fluxo de E/S, o reencaminhamento após uma alteração e a gestão do volume do fluxo.
Gravação de audio
API cliente primária de baixo nível para receber dados de um dispositivo de entrada de áudio, como um microfone. Os dados geralmente estão no formato PCM. A API é definida em android.media.AudioRecord .
Amostrador de áudio
Módulo no AudioFlinger responsável pela conversão da taxa de amostragem .
fonte de áudio
Uma enumeração de constantes que indica o caso de uso desejado para capturar a entrada de áudio. Para obter detalhes, consulte fonte de áudio . A partir do nível 21 da API e superiores, os atributos de áudio são preferidos.
Faixa de áudio
API de cliente principal de baixo nível para enviar dados para um dispositivo de saída de áudio, como um alto-falante. Os dados geralmente estão no formato PCM. A API é definida em android.media.AudioTrack .
audio_utils
Biblioteca de utilitários de áudio para recursos como conversão de formato PCM, E/S de arquivo WAV e FIFO sem bloqueio , que é amplamente independente da plataforma Android.
cliente
Geralmente um aplicativo ou cliente de aplicativo. No entanto, um cliente AudioFlinger pode ser um thread em execução no processo do sistema mediaserver, como ao reproduzir mídia decodificada por um objeto MediaPlayer.
HAL
Camada de abstração de hardware. HAL é um termo genérico em Android; em áudio, é uma camada entre o AudioFlinger e o driver de dispositivo do kernel com uma API C (que substitui o libaudio C++).
Captura rápida
Thread dentro do AudioFlinger que envia dados de áudio para faixas rápidas de latência mais baixa e aciona o dispositivo de entrada quando configurado para latência reduzida.
FastMixer
Thread dentro do AudioFlinger que recebe e mixa dados de áudio de trilhas rápidas de menor latência e aciona o dispositivo de saída primário quando configurado para latência reduzida.
faixa rápida
Cliente AudioTrack ou AudioRecord com menor latência, mas menos recursos em alguns dispositivos e rotas.
Reprodutor de mídia
API de cliente de nível superior ao AudioTrack. Reproduz conteúdo codificado ou conteúdo que inclui faixas multimídia de áudio e vídeo.
mídia.log
Recurso de depuração AudioFlinger disponível apenas em compilações personalizadas. Usado para registrar eventos de áudio em um buffer circular onde eles podem ser despejados retroativamente quando necessário.
servidor de mídia
Processo do sistema Android que contém serviços relacionados à mídia, incluindo AudioFlinger.
NBAIO
Entrada/saída de áudio sem bloqueio. Abstração para portas AudioFlinger. O termo pode ser enganoso, pois algumas implementações da API NBAIO suportam bloqueio. As principais implementações do NBAIO são para diferentes tipos de tubos.
misturador normal
Thread dentro do AudioFlinger que atende a maioria dos clientes AudioTrack com recursos completos. Aciona diretamente um dispositivo de saída ou alimenta sua submixagem no FastMixer por meio de um tubo.
OpenSL ES
Padrão API de áudio do The Khronos Group . As versões do Android desde o nível 9 da API suportam uma API de áudio nativa baseada em um subconjunto do OpenSL ES 1.0.1 .
áudio profissional
Abreviatura do sinalizador de recurso android.hardware.audio.pro . Os requisitos estão documentados na seção 5.10 Áudio Profissional do Android CDD. O "pro" no recurso android.hardware.audio.pro refere-se ao nível de desempenho previsível em tempo real, não ao usuário pretendido.
tempo real (substantivo), tempo real (adjetivo)

Os sistemas de computação em tempo real garantem uma resposta a eventos relevantes dentro de um limite de tempo exigido. O suporte à implementação de dispositivos para computação em tempo real é um pré-requisito necessário, mas não suficiente, para atender aos requisitos do recurso android.hardware.audio.pro descrito acima.

O desempenho em tempo real também traz benefícios em outras áreas além do áudio, como jogos, gráficos, câmera, vídeo, processamento de sensores, Realidade Virtual (VR) e Realidade Aumentada (AR).

modo silencioso
Recurso configurável pelo usuário para silenciar a campainha e as notificações do telefone sem afetar a reprodução de mídia (música, vídeos, jogos) ou alarmes.
Piscina de som
API de cliente de nível superior ao AudioTrack. Reproduz clipes de áudio amostrados. Útil para acionar feedback da IU, sons de jogos, etc. A API é definida em android.media.SoundPool .
Medo do palco
Consulte Mídia .
StateQueue
Módulo dentro do AudioFlinger responsável por sincronizar o estado entre threads. Enquanto NBAIO é usado para passar dados, StateQueue é usado para passar informações de controle.
estratégia
Grupo de tipos de fluxo com comportamento semelhante. Usado pelo serviço de política de áudio.
tipo de fluxo
Enumeração que expressa um caso de uso para saída de áudio. A implementação da política de áudio utiliza o tipo de fluxo, juntamente com outros parâmetros, para determinar decisões de volume e roteamento. Para obter uma lista de tipos de stream, consulte android.media.AudioManager .
pia de camiseta
Consulte Depuração de áudio .
tinyalsa
API de modo de usuário pequena acima do kernel ALSA com licença BSD. Recomendado para implementações HAL.
Gerador de tons
API de cliente de nível superior ao AudioTrack. Reproduz sinais multifrequenciais (DTMF) de tom duplo. Para obter detalhes, consulte Sinalização multifrequência de tom duplo e a definição da API em android.media.ToneGenerator .
acompanhar
Fluxo de áudio. Controlado pela API AudioTrack ou AudioRecord.
curva de atenuação de volume
Mapeamento específico do dispositivo de um índice de volume genérico para um fator de atenuação específico para uma determinada saída.
índice de volume
Inteiro sem unidade que expressa o volume relativo desejado de um fluxo. As APIs relacionadas ao volume do android.media.AudioManager operam em índices de volume em vez de fatores de atenuação absolutos.