USB 数字音频

本文综述了 Android 对 USB 数字音频和相关 USB 协议的支持。

目标读者

本文的目标读者是 Android 设备原始设备制造商 (OEM)、SoC 供应商、USB 音频外设供应商、高级音频应用开发者以及希望详细了解 Android 上的 USB 数字音频内件的其他人士。

Nexus 设备的最终用户则应该查看 Nexus 帮助中心内的使用 USB 主机模式录制和播放音频一文。虽然这篇文章并非面向最终用户,但某些发烧友级消费者可能会发现感兴趣的部分。

USB 概览

维基百科 USB 一文对通用串行总线 (USB) 进行了非正式描述,而 USB Implementers Forum, Inc 发布的标准给出了正式定义。为了方便起见,我们在本文中总结了重要的 USB 概念,但上述标准仍是权威参考。

基本概念和术语

USB 是一种总线,具有单个数据传输操作启动器,称为“主机”。主机通过总线与外设进行通信。

注意:术语“设备”和“配件”是“外设”的常见同义词。在本文中,我们避免使用这些术语,因为它们可能与 Android 设备或称为配件模式的 Android 特定概念相混淆。

主机的一个重要作用是“枚举”:检测哪些外设连接到总线并通过“描述符”查询其属性的过程。

外设可能是一个物理对象,但实际上实现了多个逻辑“功能”。functions例如,摄像头外设可以兼备相机功能和麦克风音频功能。

每个外设功能都有一个“接口”,用于定义与该功能通信所用的协议。

主机通过连接到端点、数据源或外设功能之一提供的接收器的管道与外设进行通信。

有两种管道:“消息”和“信息流”。消息管道用于双向控制和状态。信息流管道用于单向数据传输。

主机发起所有数据传输,因此术语“输入”和“输出”是相对于主机而言的。输入操作将数据从外设传输到主机,而输出操作则将数据从主机传输到外设。

有三种主要的数据传输模式:“中断”、“批量”和“等时”。我们将在音频上下文中进一步讨论等时模式。

外设可能具有连接到外部世界(超出外设自身范围)的“终端”。这样,外设可以在 USB 协议和“实际”信号之间进行转换。终端是功能的逻辑对象。

Android USB 模式

开发模式

自 Android 首次发布以来,“开发模式”就一直存在。在运行桌面操作系统(如 Linux、Mac OS X 或 Windows)的主机 PC 中,Android 设备显示为 USB 外设。唯一可见的外设功能是 Android fastbootAndroid 调试桥 (adb)。fastboot 和 adb 协议所在层高于 USB 批量数据传输模式所在层。

主机模式

“主机模式”在 Android 3.1(API 级别 12)中引入。

由于 Android 设备必须充当主机,并且大多数 Android 设备都包含一个不直接允许主机操作的 Micro USB 连接器,因此通常需要如下 On-The-Go (OTG) 适配器:

OTG

图 1. On-The-Go (OTG) 适配器

Android 设备可能无法提供充足的电力来运行特定的外设,具体取决于外设需要的电力以及 Android 设备能够提供的电力。即使能够提供充足的电力,Android 设备的电池电量也可能会大幅下降。对于这些情况,请使用供电hub,如下图所示:

供电集线器

图 2. 供电集线器

配件模式

配件模式在 Android 3.1(API 级别 12)中被引入,并将其向后移植到 Android 2.3.4。在这种模式下,Android 设备作为 USB 外设运行,并受另一个设备(例如,充当主机的基座)控制。开发模式与配件模式之间的区别在于,在配件模式下,除了 adb 之外,主机还可以看到其他 USB 功能。Android 设备从开发模式开始运行,然后通过重新协商过程转换到配件模式。

配件模式在 Android 4.1 中增加了功能,特别是下述音频功能。

USB 音频

USB 类

每个外设功能都有一个关联的设备类文档,用于指定该功能的标准协议。这使得类兼容主机和外设功能可以互操作,而无需详细了解彼此的运行原理。如果主机和外围设备由不同的实体提供,则类兼容性至关重要。

术语“免驱动”是“类兼容”的常见同义词,表示可以使用此类外设的标准功能,而无需安装特定于操作系统的驱动程序您可以认为,如果某个外设宣称“无需驱动程序”便可用于主要桌面操作系统,那么该外设属于类兼容外设,但可能有例外情况。

USB 音频类

在本文中,我们只关注实现音频功能的外设,因而仅介绍音频设备类。USB 音频类规范存在以下两个版本:类 1 (UAC1) 和类 2 (UAC2)。

与其他类比较

USB 包括许多其他设备类,其中一些类可能会与音频类相混淆。大容量存储类 (MSC) 用于面向扇区的媒体访问,而媒体传输协议 (MTP) 则用于对媒体进行完全文件访问。MSC 和 MTP 可以用于传输音频文件,但只有 USB 音频类适用于实时流式传输。

音频终端

音频外围设备的终端通常是模拟的。在外设输入终端提供的模拟信号通过模拟转数字转换器 (ADC) 转换为数字,并通过 USB 协议进行传输,以供主机消耗。ADC 是主机的数据源。同样,主机通过 USB 协议将数字音频信号发送到外设,然后数字转模拟转换器 (DAC) 对信号进行转换并呈现给模拟输出终端。DAC 是主机的接收器。

频道

具有音频功能的外围设备可以包括源终端、接收终端或两者。每个方向可能有一个通道(单声道)、两个通道(立体声)或更多。具有两个以上通道的外设称为多声道。通常将立体声流解释为由左和右声道组成,并且延伸为将多通道流解释为具有对应于每个声道的空间位置。然而,没有为每个通道分配任何特定的标准空间含义也是非常合适的(相较于 HDMI 而言,对于 USB 音频尤为如此)。在这种情况下,由应用和用户决定每个通道的使用方式。例如,四通道 USB 输入流可以将前三个通道连接到房间内的各种麦克风,最后一个通道从 AM 收音机接收输入。

等时传输模式

USB 音频采用等时传输模式实现其实时特性,但代价是无法实现错误恢复。在等时模式下,带宽得到保证,并使用循环冗余校验 (CRC) 检测数据传输错误。但是在发生错误的情况下,不会进行包确认或重新传输。

在每个起始帧 (SOF) 周期内发生等时传输。SOF 周期为全速 1 毫秒,高速 125 微秒。每个全速帧可承载高达 1023 字节的有效载荷,高速帧可承载 1024 字节。综合这两种情况,我们计算出最大传输速率为每秒 1023000 或 8192000 字节。这为组合音频采样率、通道数和位深设置了理论上限。实际上限更低。

在等时模式下,有三种子模式:

  • 自动调节
  • 异步
  • 同步

在自动调节子模式下,外设接收器或信号源根据主机的潜在变化采样率进行调节。

在异步(也称为隐式反馈)子模式下,接收器或信号源确定采样率,然后主机相应地做出调整。异步子模式的主要理论优势是信号源或接收器 USB 时钟在物理和电气上更接近于驱动 DAC 或 ADC 的时钟(实际上可能与驱动 DAC 或 ADC 的时钟相同或从其衍生而来)。这种接近意味着异步子模式应该不太容易受到时钟抖动的影响。此外,DAC 或 ADC 使用的时钟可能具有比主机时钟更高的精度和更低的偏移。

在同步子模式下,每个 SOF 周期传输固定数量的字节。音频采样率实际上派生自 USB 时钟。同步子模式不常用于音频,因为主机和外设均受到 USB 时钟的控制。

下表对等时子模式进行了总结:

子模式 每包
字节数
采样率
决定因素
是否用于音频
自动调节 不定额 主机
异步 不定额 外围设备
同步 固定 USB 时钟

在实践中,子模式当然重要,但也应考虑其他因素。

Android 对 USB 音频类的支持

开发模式

开发模式不支持 USB 音频。

主机模式

Android 5.0(API 级别 21)及以上版本支持 USB 音频类 1 (UAC1) 功能的一部分:

  • Android 设备必须作为主机
  • 音频格式必须是 PCM(接口类型 I)
  • 位深必须是 16 位、24 位或 32 位,其中 24 位有用音频数据在 32 位字的最高有效位内左对齐
  • 采样率必须是 48 kHz、44.1 kHz、32 kHz、24 kHz、22.05 kHz、16 kHz、12 kHz、11.025 kHz 或 8 kHz
  • 通道数必须为 1(单声道)或 2(立体声)

查看 Android 框架源代码时,可能会发现除支持这些功能所需最低代码之外的附加代码。但此代码尚未经过验证,因此尚未声明更高级的功能。

配件模式

Android 4.1(API 级别 16)新增了对主机音频播放的有限支持。在配件模式下,Android 会自动将其音频输出路由到 USB。也就是说,Android 设备充当主机(例如基座)的数据源。

配件模式音频具有以下特点:

  • Android 设备必须由能够首先将 Android 设备从开发模式切换到配件模式的信息丰富的主机控制,然后主机必须从适当的端点传输音频数据。因此,Android 设备不会对主机显示为“免驱动”。
  • 方向必须为输入(相对于主机而言)
  • 音频格式必须为 16 位 PCM
  • 采样率必须为 44.1 kHz
  • 通道数必须为 2(立体声)

配件模式音频尚未广泛采用,目前不推荐用于新设计。

USB 数字音频的应用

顾名思义,USB 数字音频信号由数字数据流表示,而非常见的 TRS 迷你耳机接口使用的模拟信号。最终任何数字信号都必须先转换为模拟信号,然后才能被听到。选择在哪里进行转换时需要做出取舍。

两种 DAC 设计

在下面的示例图中,我们比较了两种设计。首先,我们设计了一个配有应用处理器 (AP)、板载 DAC、放大器和连接到耳机的模拟 TRS 连接器的移动设备。我们还考虑设计一个将 USB 连接到外部 USB DAC 和放大器并且配备耳机的移动设备。

DAC 比较

图 3. 两个 DAC 的比较

哪个设计更好?答案取决于您的需求。每个设计各有优缺点。

注意:这是一个人为的比较,因为真正的 Android 设备可能同时具有这两种选项。

第一种设计 A 更简单、更便宜、消耗更少的功率,并且将是更可靠的设计(假设其他组件同等可靠)。然而,通常需要权衡音频质量和其他要求。例如,如果这是一个大众市场设备,则可能需要适应普通消费者的需求,而不是针对发烧友。

在第二种设计中,外部音频外设 C 可以专为实现更高的音频质量和更大的功率输出而设计,不会影响基本大众市场 Android 设备 B 的成本。是的,这是一个更昂贵的设计,而且成本只有真正有需求的人会去承担。

移动设备因具有高密度电路板而声名狼藉,因为带来了更多串扰机会,可能会降低相邻的模拟信号质量。数字通信不易受噪音影响,因此将 DAC 从 Android 设备 A 移到外部电路板 C,可使最终的模拟阶段在物理和电气上与密集且嘈杂的电路板相隔离,从而产生更高的保真音频。

另一方面,第二种设计更为复杂,复杂性越高,失败的几率就越高。还有来自 USB 控制器的额外延迟。

主机模式应用

典型的 USB 主机模式音频应用包括:

  • 听音乐
  • 电话
  • 即时通讯和语音聊天
  • 正在录制

对于所有这些应用,Android 会检测到兼容的 USB 数字音频外设,并根据音频政策规则自动路由音频播放和捕获。立体声内容在外设的前两个通道上播放。

没有特定于 USB 数字音频的 API。对于高级用途,自动路由可能会干扰 USB 感知应用。对于这样的应用,请通过设置/开发者选项的“媒体”部分中的相应控件停用自动路由。

在主机模式下进行调试

在 USB 主机模式下,无法通过 USB 进行 adb 调试。如需了解备选方案,请参阅 Android 调试桥无线用法部分。

实现 USB 音频

面向音频外设供应商的建议

为了与 Android 设备进行互操作,音频外设供应商应该:

  • 采用兼容音频类的设计;目前 Android 目标是类 1,但是计划兼容类 2 是明智之举
  • 避免怪异行为
  • 测试与参考和热门 Android 设备的互操作性
  • 清楚地记录支持的功能、音频类兼容性、电源要求等,以便消费者做出明智的决定

面向 Android 设备原始设备制造商 (OEM) 和 SoC 供应商的建议

为了支持 USB 数字音频,设备 OEM 和 SoC 供应商应该:

  • 设计支持 USB 主机模式的硬件
  • 通过 android.hardware.usb.host.xml 功能标记在框架级别启用通用 USB 主机支持
  • 启用所有需要的内核功能:USB 主机模式、USB 音频、等时传输模式;请参阅 Android 内核配置
  • 及时了解最新的内核版本和补丁程序;尽管类兼容是一个至高的目标,但是仍然存在具有怪异行为的音频外设,不过最新的内核提供了解决这些怪异行为的方法
  • 启用 USB 音频政策,如下所述
  • 将 audio.usb.default 添加到 device.mk 中的 PRODUCT_PACKAGES
  • 测试与常见 USB 音频外设的互操作性

启用 USB 音频政策

要启用 USB 音频,请在音频政策配置文件中添加一个条目。通常位于以下位置:

device/oem/codename/audio_policy.conf

路径名中的“oem”应替换为制造 Android 设备的 OEM 的名称,“codename”应替换为设备代号。

示例条目如下所示:

audio_hw_modules {
  ...
  usb {
    outputs {
      usb_accessory {
        sampling_rates 44100
        channel_masks AUDIO_CHANNEL_OUT_STEREO
        formats AUDIO_FORMAT_PCM_16_BIT
        devices AUDIO_DEVICE_OUT_USB_ACCESSORY
      }
      usb_device {
        sampling_rates dynamic
        channel_masks dynamic
        formats dynamic
        devices AUDIO_DEVICE_OUT_USB_DEVICE
      }
    }
    inputs {
      usb_device {
        sampling_rates dynamic
        channel_masks AUDIO_CHANNEL_IN_STEREO
        formats AUDIO_FORMAT_PCM_16_BIT
        devices AUDIO_DEVICE_IN_USB_DEVICE
      }
    }
  }
  ...
}

源代码

用于 USB 音频的音频硬件抽象层 (HAL) 实现位于以下位置:

hardware/libhardware/modules/usbaudio/

USB 音频 HAL 在很大程度上取决于 tinyalsa(如音频术语中所述)。虽然 USB 音频依赖于等时传输,但这是通过 ALSA 实现抽象出来的。所以,USB 音频 HAL 和 tinyalsa 不需要关注 USB 协议的这部分。

测试 USB 音频

如需了解适用于 USB 音频的 CTS 测试,请参阅 USB 音频 CTS 验证程序测试