Qué es Bluetooth LE Audio y por qué cambiará el audio inalámbrico

Última actualización: diciembre 12, 2025
Autor: Isaac
  • Bluetooth LE Audio introduce el códec LC3 y transporte isócrono para mejorar calidad, reducir consumo y latencia frente al Bluetooth clásico.
  • Permite unidifusión avanzada, difusión tipo Auracast y audio de múltiples flujos, con conexiones simultáneas a varios auriculares o altavoces.
  • Windows 11 implementa LE Audio mediante el marco ACX y VSAP, definiendo formatos mínimos, perfiles BAP/TMAP y soporte para streaming bidireccional multicanal.
  • Aunque su adopción es gradual y exige nuevo hardware, LE Audio está llamado a convertirse en el estándar dominante del audio Bluetooth.

Bluetooth LE Audio auriculares

La llegada de Bluetooth LE Audio supone uno de los cambios más importantes en la historia del Bluetooth desde que usamos esta tecnología para conectar auriculares inalámbricos, altavoces o incluso el coche. No es solo una versión más del estándar: es una nueva forma de gestionar el audio inalámbrico, pensada para mejorar la calidad, reducir el consumo de batería y abrir la puerta a usos que hasta ahora eran imposibles.

En este artículo vamos a ver con calma qué es exactamente Bluetooth LE Audio, qué aporta frente al Bluetooth clásico, cómo funciona por dentro (incluyendo conceptos como LC3, CIS, BIS o Auracast) y qué implicaciones tiene tanto para usuarios normales como para desarrolladores, sistemas operativos y fabricantes de chips. Si te interesa el audio inalámbrico y quieres entender por qué todo el mundo habla de LE Audio, ponte cómodo.

Qué es Bluetooth LE Audio y en qué se diferencia del Bluetooth clásico

Bluetooth LE Audio es un nuevo estándar de audio basado en Bluetooth Low Energy (BLE) 5.2 y posteriores, definido por el grupo Bluetooth SIG. A diferencia del audio Bluetooth “clásico”, que se apoya en perfiles como A2DP o HFP, LE Audio aprovecha la pila de baja energía y una arquitectura isócrona específica para el audio.

Este estándar nace con tres objetivos muy claros: mejorar la calidad del sonido, reducir el consumo de energía y multiplicar las posibilidades de conexión. En lugar de seguir añadiendo parches al Bluetooth tradicional, SIG ha creado un ecosistema nuevo de perfiles y servicios pensado desde cero para el audio moderno: desde unos simples auriculares hasta sistemas de difusión pública en aeropuertos o estadios.

Una de las claves de LE Audio es que no sustituye de golpe al Bluetooth clásico, sino que convive con él. Muchos dispositivos serán compatibles simultáneamente con ambos mundos: podrán usar A2DP/HFP de toda la vida o aprovechar LE Audio cuando haya soporte en el teléfono, el sistema operativo y los propios auriculares.

Para entender bien cómo cambia el panorama, hay que tener en cuenta que LE Audio se apoya en una nueva forma de transporte llamada transmisión isócrona, que permite reservar ancho de banda y tiempos de entrega constantes para el audio. A partir de ahí se construyen dos grandes tipos de flujos: CIS (unidifusión) y BIS (difusión).

Esquema Bluetooth LE Audio

El códec LC3: corazón del nuevo Bluetooth LE Audio

Si el transporte isócrono es el “camino” por el que viaja el audio, el códec LC3 es el motor que comprime y descomprime la señal sonora. LC3 (Low Complexity Communication Codec) es el códec obligatorio en LE Audio, del mismo modo que SBC lo es en el audio Bluetooth clásico.

LC3 se ha diseñado para lograr una relación de compresión mucho más eficiente que SBC, manteniendo o incluso mejorando la calidad percibida. Por ejemplo, para audio estéreo de 48 kHz y 16 bits, LC3 puede ofrecer una calidad de alta fidelidad con unos 96 kbps, mientras que un flujo SBC típico se mueve en torno a 328 kbps para el mismo material. Menos bitrate implica menos datos a enviar y, en consecuencia, menor consumo y latencias más bajas.

Otra ventaja clave es que a igual tasa de bits, LC3 suena claramente mejor que SBC, sobre todo en rangos medios y graves. Esto ayuda a cerrar la brecha entre auriculares con cable e inalámbricos, ofreciendo más detalle y menos artefactos incluso en conexiones no ideales.

LC3 es muy flexible: admite duraciones de fotograma de 7,5 ms y 10 ms, profundidades de 16, 24 y 32 bits y una amplia variedad de frecuencias de muestreo (8, 16, 24, 32, 44,1 y 48 kHz). Además, el estándar no limita el número de canales, por lo que se pueden crear configuraciones mono, estéreo o multicanal según el escenario.

En la práctica, esto significa que los sistemas operativos, como Windows 11, pueden elegir diferentes combinaciones de frecuencia, bits y bitrate en función del uso: música, videojuegos, voz, difusión pública, etc., siempre dentro de lo que anuncie cada dispositivo mediante PACS (Published Audio Capabilities Service).

Unidifusión, difusión y audio de múltiples flujos

Una de las grandes revoluciones de LE Audio es que ya no estamos limitados a enviar audio de un emisor a un único receptor. El estándar define varios tipos de flujos y perfiles que permiten escenarios mucho más ricos.

Por un lado, tenemos la unidifusión, basada en CIS (Connected Isochronous Streams) gestionados dentro de grupos CIG (Connected Isochronous Groups). Esta modalidad se usa para lo que hoy entendemos como “emparejar” unos auriculares con el móvil o el PC: un flujo punto a punto, pero ahora con más control fino sobre la calidad de servicio (QoS), la latencia y el número de canales.

Por otro, LE Audio introduce la difusión, que se apoya en BIS (Broadcast Isochronous Streams) y grupos BIG (Broadcast Isochronous Groups). Aquí el audio se transmite de manera unidireccional a un número potencialmente ilimitado de receptores. Es el concepto que Bluetooth SIG comercializa bajo el nombre de Auracast.

  Testeo de Memoria RAM en Windows 10 | ¡Sigue Estas Instrucciones!

Además, aparece el concepto de audio de múltiples flujos (Multi-Stream Audio). Esta funcionalidad permite que una misma fuente (por ejemplo, un smartphone) mantenga varias transmisiones de audio independientes y sincronizadas hacia uno o varios receptores. Es clave para mejorar la experiencia con auriculares true wireless: cada auricular puede recibir su flujo propio, perfectamente sincronizado, sin que un lado tenga que “reenviar” el sonido al otro.

Gracias a los múltiples flujos, también se facilita el cambio fluido entre varios dispositivos fuente (por ejemplo, móvil y portátil a la vez) y se abren posibilidades como que un mismo teléfono envíe audio simultáneamente a dos pares de auriculares diferentes o a varios altavoces repartidos por la casa, manteniendo la sincronía sin retardos molestos.

Perfiles y servicios clave: BAP, TMAP, ASCS, PACS y compañía

LE Audio no es solo transporte y códec; se apoya en un conjunto de perfiles y servicios bien definidos que orquestan cómo se anuncia, configura y controla el audio entre dispositivos.

El Basic Audio Profile (BAP) define cómo se distribuye y consume el audio a través de comunicaciones LE. Es el marco que indica qué combinaciones de flujos, códecs y QoS se deben soportar para superar las certificaciones de interoperabilidad.

El Telephony and Media Audio Profile (TMAP) especifica configuraciones interoperables que combinan BAP con otros servicios para cubrir casos de uso como llamadas de voz, multimedia y escenarios mixtos (por ejemplo, juego con chat de voz).

El Audio Stream Control Service (ASCS) define una forma estándar de configurar y establecer las secuencias de audio unicast. A través de este servicio se realizan operaciones como “configurar códec”, “habilitar flujo”, “preparar para detener” o “liberar recursos”, siempre de acuerdo con lo que la otra parte declara que admite.

El Published Audio Capabilities Service (PACS) es el que usa un dispositivo para publicar sus capacidades de códec y formatos compatibles. Un sistema operativo como Windows 11 consulta este servicio para saber, por ejemplo, si unos auriculares soportan estéreo a 48 kHz a 96 kbps o solo mono a 16 kHz.

Además, LE Audio se integra con perfiles de control de volumen y micrófono ya definidos por SIG, de forma que los cambios de volumen y silenciado puedan gestionarse directamente en el dispositivo remoto, y no únicamente en el mezclador del sistema.

Cómo implementa Windows 11 el audio Bluetooth LE

En el caso de Windows 11, Microsoft ha definido una arquitectura específica llamada VSAP (Vendor Specific Audio Path) para permitir que los fabricantes de hardware integren LE Audio aprovechando el marco ACX (Audio Class Extensions). El objetivo es separar claramente la parte de perfil Bluetooth del sistema operativo y la parte de streaming que aporta cada proveedor (IHV).

El marco ACX de Windows se encarga de la gestión de los endpoints de audio multinivel. Desde el punto de vista del sistema, un “dispositivo de audio LE” puede ser un único aparato remoto o un conjunto de dispositivos coordinados que conforman un único punto de conexión (por ejemplo, un par de audífonos).

El conjunto de controladores de audio específicos del proveedor es responsable de enviar y recibir los datos de audio LE hacia y desde el controlador Bluetooth a través de una interfaz definida por el fabricante. Ahí puede residir el códec LC3 (software en el DSP de audio o en el propio controlador) o delegarse en el controlador Bluetooth si este trae LC3 en hardware.

El perfil de audio Bluetooth LE de Windows incluye la implementación de BAP, volumen y control de micrófono. Se ocupa de crear un ACXCIRCUIT de control por cada dispositivo remoto LE Audio y de gestionar el estado de los canales y grupos isócronos (CIG/BIG, CIS/BIS), además de informar de los formatos de audio negociados.

Por debajo, la pila central Bluetooth de Windows facilita APIs para que este perfil consulte las capacidades de códec soportadas por el controlador local (vía HCI_Read_Local_Supported_Codecs v2 y HCI_Read_Local_Supported_Codec_Capabilities) y gestione las operaciones típicas: crear y eliminar CIG/BIG, establecer o retirar rutas ISO, configurar parámetros de QoS, etc.

Variantes de arquitectura de streaming en Windows

La especificación de Microsoft contempla varias variantes de arquitectura de streaming LE Audio para adaptarse a diferentes diseños de hardware:

En la arquitectura de banda lateral sin descarga de audio, los datos de audio se envían a través de una interfaz específica entre el controlador de audio y el de Bluetooth, separada de la ruta HCI normal. El códec LC3 puede residir en el controlador Bluetooth o en la pila de controladores de audio; en el primer caso el controlador recibe audio PCM, en el segundo, frames LC3 ya comprimidos.

En la arquitectura de banda lateral con descarga de audio, entra en juego un DSP de audio dedicado que asume parte o todo el procesamiento de códec y mezcla. Esto permite reducir aún más el consumo, al descargar tareas pesadas de la CPU principal y permitir estados de baja potencia más agresivos.

Finalmente, existe una arquitectura en banda específica del proveedor en la que los datos ISO se envían a través de la propia HCI, pero gestionando el flujo mediante un “componente de combinación ISO” del IHV, que coordina el envío de comandos HCI y el control de flujo de los datos.

  ¿Por qué es mejor Android?

En todos los casos, Windows proporciona los componentes de perfil y la pila central Bluetooth, mientras que el IHV aporta sus controladores ACX para streaming, el posible DSP de audio y cualquier configuración específica de códec o ruta de datos.

Formatos, modos de procesamiento y calidades obligatorias

Para garantizar interoperabilidad y buena experiencia, Windows 11 define una serie de formatos de audio mínimos que deben soportar las soluciones LE Audio, organizados por modos de procesamiento de señal y casos de uso.

El modo predeterminado (AUDIO_SIGNALPROCESSINGMODE_DEFAULT) se utiliza para escenarios de reproducción unidireccional: música, efectos del sistema, audio de videojuegos sin chat, etc. En este modo se espera que los dispositivos soporten combinaciones estéreo y mono con frecuencias como 48, 32, 24 y 16 kHz, 16 bits, duraciones de frame de 7,5 o 10 ms y bitrates típicos entre 48 y 96 kbps por flujo.

El modo comunicaciones (AUDIO_SIGNALPROCESSINGMODE_COMMUNICATIONS) está orientado a llamadas de voz y chats bidireccionales. Aquí predominan formatos mono con frecuencias de 32, 24 y 16 kHz, siempre con duraciones de frame de 7,5 o 10 ms y bitrates entre 32 y 64 kbps, priorizando latencia baja sobre máxima fidelidad.

Windows requiere que los códecs proporcionados por el IHV soporten ambas duraciones de fotograma (7,5 y 10 ms), para que puedan coexistir distintos dispositivos LE en el mismo sistema sin conflictos de calidad o latencia.

Además, se establecen topologías de flujo concretas (llamadas “configuraciones básicas de perfil de audio”, o BAP Configuration 1, 2, 3, 4, 6, 8, 9, 12, 13, etc.) que describen cómo se combinan canales, CIS/BIS y roles (render/capture) en cada caso de uso: reproducción mono, estéreo, conjunto coordinado de dispositivos, llamadas con micrófono en uno o varios miembros, captura multicanal, difusión mono/estéreo, etc.

Bidirectional Multichannel Streaming y “estéreo de banda ancha” en llamadas

Uno de los puntos débiles del Bluetooth clásico es que, al activar el micrófono, muchos sistemas caen a audio mono y reducen drásticamente la calidad. Esto fastidia la experiencia en videollamadas, reuniones online o juegos con chat, donde el usuario espera algo más cercano al audio cableado.

LE Audio y la implementación de Windows abordan este problema con el concepto de Bidirectional Multichannel Streaming: la capacidad de transmitir varios canales de salida y entrada a la vez, de forma sincronizada, manteniendo calidad y latencia razonables. Un caso típico es “representación estéreo con captura mono” (2+1 canales), que permite escuchar en estéreo mientras usamos el micrófono.

Para que el sistema pueda negociar correctamente estos escenarios, Microsoft define una estructura específica de capacidades Bidirectional_Multichannel_Streaming, que incluye campos como RenderChannelCount, CaptureChannelCount y máscaras de frecuencias de muestreo para cada combinación posible. Estas capacidades pueden anunciarse tanto desde el controlador Bluetooth (mediante identificadores de códec específicos de Microsoft en HCI) como desde el controlador de streaming ACX.

El driver de audio del IHV también puede exponer estas capacidades a través de la propiedad de dispositivo DEVPKEY_BluetoothLEAudioBidirectionalMultichannelStreamingCapabilities, asociada a la interfaz GUID_BLUETOOTH_LEAUDIO_SUPPORT_INTERFACE. De esta forma, Windows conoce qué pares de formatos estéreo/mono soporta realmente la solución hardware (por ejemplo, 48 kHz estéreo + 32 kHz mono, 24 kHz estéreo + 24 kHz mono, etc.).

El resultado práctico para el usuario es que las llamadas de voz y videollamadas pueden mantener audio estéreo mientras el micrófono está activo, habilitando funciones como audio espacial en aplicaciones de colaboración o una experiencia de juego online más rica.

Creación de puntos de conexión, flujos y gestión de estados

Detrás de todo esto, el flujo de trabajo en Windows cuando emparejamos un dispositivo LE Audio es bastante preciso. Al emparejar un auricular compatible, el perfil de audio Bluetooth LE lee primero las capacidades publicadas por PACS y las compatibles con el controlador local (vía HCI). Con esa información crea un ACXCIRCUIT de perfil con los formatos admitidos.

A continuación, el marco ACX solicita al controlador de streaming ACX del IHV que genere su propio ACXCIRCUIT para el procesamiento de audio. Este controlador crea los objetos necesarios (pines, bolsas de propiedades, puentes de stream) y, si aloja el códec LC3 o uno propietario, rellena propiedades como BluetoothLEAudio_CodecCapabilities, Bluetooth_DatapathID o Bluetooth_DatapathConfiguration.

Cuando ambos circuitos están listos, ACX los conecta y ajusta los formatos de datos compartidos. El controlador de streaming puede iterar sobre los formatos expuestos por el circuito de perfil para quedarse solo con aquellos que realmente soporta su hardware o DSP, y opcionalmente crear un motor de audio interno para descarga (offload) de mezclado, volumen, etc.

Cuando una aplicación abre un flujo de audio (por ejemplo, una app de videollamadas), ACX llama al callback EvtCircuitCreateStream primero en el circuito de streaming del IHV y luego en el de perfil. Durante este proceso se configuran rutas de datos ISO, se negocia el códec con ASCS, se crean CIG/CIS o BIG/BIS según sea unidifusión o difusión y se devuelven al driver los handles de conexión resultantes mediante propiedades como BluetoothLEAudio_StreamConnectionHandles.

Las transiciones de estado del stream (preparar hardware, iniciar, pausar, liberar) se orquestan en un orden específico entre perfil y streaming, dependiendo de si se trata de captura o render, y de si el cambio de estado va hacia más actividad (run) o hacia menos (pause/stop). Esto garantiza que ni el controlador Bluetooth ni el de audio queden fuera de sincronía al abrir o cerrar flujos.

  ¿Por qué no puedo acceder a APKPure?

Cuando se pierde la conexión LE-ACL con el dispositivo remoto o este indica que ya no está disponible para streaming, el perfil actualiza el estado del endpoint y el servicio de audio de Windows invalida los streams activos, desencadenando las secuencias de pausa y liberación correspondientes.

Volumen, mute y convivencia con el audio Bluetooth clásico

En el diseño de Windows para LE Audio, el volumen y el silenciado se delegan preferentemente en el dispositivo remoto cuando este soporta los servicios de control de volumen y micrófono definidos por SIG. Para ello, el motor de audio del controlador de streaming ACX marca sus elementos de volumen, mute y medidor de pico como “secundarios”, de modo que solo actúen como respaldo si el endpoint no ofrece esos controles.

Si el dispositivo remoto no admite control de volumen ni micrófono, o si se trata de un endpoint de difusión (broadcast), entonces los controles de volumen y mute del motor de audio de Windows toman el relevo para manejar las peticiones del sistema (subir/bajar volumen, silenciar, etc.).

En cuanto a la coexistencia de Bluetooth LE Audio y audio clásico, Windows se asegura de que nunca estén activos a la vez para el mismo dispositivo. Si el endpoint está usando LE Audio, se deshabilitan los caminos de banda lateral habituales para A2DP y HFP; si está usando audio clásico, no se crea el circuito de perfil para LE Audio. Esto evita conflictos y problemas de sincronización entre dos pilas de audio diferentes.

Ventajas prácticas para el usuario: calidad, batería y nuevas experiencias

Todo este entramado técnico se traduce en una serie de beneficios muy claros a nivel de usuario. El primero es una mejor calidad de sonido con menos consumo. Gracias a LC3, es posible mantener una fidelidad muy alta con bitrates bastante más bajos, lo que se traduce en más horas de autonomía en auriculares y altavoces, o en diseños más pequeños sin sacrificar duración de batería.

El segundo gran beneficio es la latencia reducida y la mejor sincronización. El uso de flujos isócronos, junto con las configuraciones de QoS de BAP (alta fiabilidad o baja latencia según el caso), hace que el audio para juegos, vídeo o llamadas sea más fluido, con menos retraso y menos cortes incluso en entornos con mucha interferencia.

El tercero es la capacidad de conectar varios dispositivos al mismo tiempo. Gracias a Multi-Stream y a los BIS de difusión, podemos imaginar escenarios como ver una película en el salón con dos pares de auriculares conectados al mismo televisor, repartir el sonido por varios altavoces en distintas habitaciones sin desfases o permitir que en un bar deportivo cada persona escuche el audio de la pantalla que le interesa en sus propios cascos.

LE Audio también está pensado para mejorar la accesibilidad y la escucha asistida. Auracast permite que un emisor en una sala de conferencias, teatro, aeropuerto o museo transmita uno o varios canales de audio (idiomas, comentarios guiados, ayudas auditivas) que cualquiera pueda recibir con sus propios auriculares compatibles, sin necesidad de dispositivos específicos como los sistemas de bucle de inducción tradicionales.

Por último, a medida que más móviles, portátiles, televisores y auriculares incorporen LE Audio y LC3, la interoperabilidad entre marcas mejorará porque gran parte de estas capacidades están estandarizadas y certificadas por SIG, reduciendo la “lotería” actual de códecs propietarios y compatibilidades parciales.

Limitaciones actuales y retos de adopción

Como toda tecnología relativamente nueva, LE Audio todavía se enfrenta a ciertas limitaciones y retos de implantación. El primero es la compatibilidad: hay muchos fabricantes de chips, sistemas operativos y dispositivos finales, y no todos implementan todas las funciones desde el primer momento, lo que puede dar lugar a experiencias desiguales.

La propia complejidad de códecs como LC3 o LC3 Plus exige una potencia de procesamiento suficiente en los SoC y DSP de audio. Algunos chips pueden anunciar compatibilidad con el protocolo pero tener dificultades a la hora de manejar múltiples flujos, altas tasas de muestreo o configuraciones de baja latencia de forma estable.

También hay un tema de masa crítica de dispositivos. Aunque los buques insignia de smartphones, portátiles y auriculares ya han empezado a incluir soporte LE Audio, la sustitución completa del parque de dispositivos llevará años. Mientras tanto, convivirán equipos solo clásicos, solo LE, mixtos y soluciones híbridas que soporten ambos mundos.

Para mitigar este escenario, algunos fabricantes han lanzado módulos y soluciones que soportan simultáneamente audio clásico y LE Audio, permitiendo desarrollar productos que introduzcan funciones LE sin renunciar a la compatibilidad inmediata con el ecosistema actual basado en A2DP/HFP.

Aun así, la tendencia es clara: distintos análisis de mercado, como los de ABI Research, apuntan a que antes de que acabe la década la mayoría de smartphones y dispositivos de audio nuevos serán compatibles con LE Audio, con envíos anuales de cientos de millones de unidades.

Bluetooth LE Audio combina un códec moderno y eficiente como LC3, una arquitectura isócrona avanzada y un conjunto completo de perfiles y servicios pensados para un mundo cada vez más inalámbrico y conectado. Aunque su despliegue completo llevará tiempo y habrá diferencias entre plataformas y fabricantes, todo indica que será la base del audio Bluetooth del futuro, tanto en el salón de casa como en oficinas, gimnasios, aeropuertos o grandes eventos.

Artículo relacionado:
¿Cómo funcionan los audífonos inalámbricos de Bluetooth?