Codage audio avancé - Advanced Audio Coding

Codage audio avancé
Extension de nom de fichier Conteneur MPEG/3GPP

Conteneur de pomme

Flux ADTS

Type de média Internet
audio/aac
audio/aacp
audio/3gpp
audio/3gpp2
audio/mp4
audio/mp4a-latm
audio/mpeg4-generic
Développé par Bell , Fraunhofer , Dolby , Sony , Nokia , LG Electronics , NEC , NTT Docomo , Panasonic
Première version 1997 ; il y a 24 ans ( 1997 )
Type de format Format de compression audio, compression avec perte
Contenu par MPEG-4 Part 14 , 3GP et 3G2 , format de fichier multimédia de base ISO et format d' échange de données audio (ADIF)
Standard ISO/CEI 13818-7 ,
ISO/CEI 14496-3

Advanced Audio Coding ( AAC ) est une norme de codage audio pour la compression audio numérique avec perte . Conçu pour être le successeur du format MP3 , AAC a généralement atteint une qualité sonore supérieure à celle des encodeurs MP3 du 20e siècle au même débit binaire .

AAC a été normalisé par l' ISO et la CEI dans le cadre des spécifications MPEG-2 et MPEG-4 . Une partie de AAC, HE-AAC ("AAC+"), fait partie de MPEG-4 Audio et est adopté dans les normes de radio numérique DAB+ et Digital Radio Mondiale , et les normes de télévision mobile DVB-H et ATSC-M/H .

AAC prend en charge l'inclusion de 48 canaux audio pleine bande passante (jusqu'à 96 kHz) dans un flux plus 16 canaux d' effets basse fréquence ( LFE , limité à 120 Hz), jusqu'à 16 canaux de "couplage" ou de dialogue et jusqu'à 16 flux de données . La qualité de la stéréo est satisfaisante à des exigences modestes à 96 kbit/s en mode stéréo conjoint ; cependant, la transparence hi-fi exige des débits de données d'au moins 128 kbit/s ( VBR ). Des tests d'audio MPEG-4 ont montré que l'AAC répond aux exigences dites "transparentes" pour l' UIT à 128 kbit/s pour la stéréo, et 320 kbit/s pour l' audio 5.1 . AAC utilise uniquement un algorithme de transformation en cosinus discrète modifiée (MDCT), ce qui lui confère une efficacité de compression supérieure à celle du MP3, qui utilise un algorithme de codage hybride qui est en partie MDCT et en partie FFT .

AAC est le format audio par défaut ou standard pour iPhone , iPod , iPad , Nintendo DSi , Nintendo 3DS , Apple Music , iTunes , DivX Plus Web Player , PlayStation 4 et divers téléphones Nokia Series 40 . Il est pris en charge sur PlayStation Vita , Wii , Sony Walkman MP3 , Android et BlackBerry . AAC est également pris en charge par les fabricants de systèmes audio embarqués pour voiture. C'est aussi l'un des formats audio utilisés sur Spotify .

Histoire

Fond

La transformée en cosinus discrète (DCT), un type de codage par transformée pour la compression avec perte , a été proposée par Nasir Ahmed en 1972, et développée par Ahmed avec T. Natarajan et KR Rao en 1973, publiant leurs résultats en 1974. Cela a conduit au développement de la transformée en cosinus discrète modifiée (MDCT), proposée par JP Princen, AW Johnson et AB Bradley en 1987, à la suite de travaux antérieurs de Princen et Bradley en 1986. La norme de codage audio MP3 introduite en 1994 utilisait un algorithme de codage hybride qui fait partie de la MDCT et une partie FFT . AAC utilise un algorithme purement MDCT, ce qui lui confère une efficacité de compression supérieure à celle du MP3.

AAC a été développé avec la coopération et les contributions de sociétés telles que Bell Labs , Fraunhofer IIS , Dolby Laboratories , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , ETRI , JVC Kenwood , Philips , Microsoft et NTT . Il a été officiellement déclaré norme internationale par le Moving Picture Experts Group en avril 1997. Il est spécifié à la fois comme partie 7 de la norme MPEG-2 et sous - partie 4 dans la partie 3 de la norme MPEG-4 .

Standardisation

En 1997, AAC a été introduit pour la première fois sous le nom de MPEG-2 Part 7 , officiellement connu sous le nom d' ISO / IEC 13818-7:1997 . Cette partie de MPEG-2 était une nouvelle partie, puisque MPEG-2 incluait déjà MPEG-2 Part 3 , officiellement connu sous le nom d' ISO/IEC 13818-3 : MPEG-2 BC (Backwards Compatible). Par conséquent, MPEG-2 Part 7 est également connu sous le nom de MPEG-2 NBC (Non-Backward Compatible), car il n'est pas compatible avec les formats audio MPEG-1 ( MP1 , MP2 et MP3 ).

MPEG-2 Partie 7 a défini trois profils : profil de faible complexité (AAC-LC / LC-AAC), profil principal (AAC Main) et profil de taux d'échantillonnage évolutif (AAC-SSR). Le profil AAC-LC se compose d'un format de base très similaire au format de codage PAC (Perceptual Audio Coding) d'AT&T, avec l'ajout de la mise en forme temporelle du bruit (TNS), la fenêtre Kaiser (décrite ci-dessous), un quantificateur non uniforme et un remaniement du format bitstream pour gérer jusqu'à 16 canaux stéréo, 16 canaux mono, 16 canaux d'effet basse fréquence (LFE) et 16 canaux de commentaires dans un seul flux binaire. Le profil principal ajoute un ensemble de prédicteurs récursifs qui sont calculés à chaque prise de la banque de filtres. Le SSR utilise un banc de filtres PQMF à 4 bandes, suivi de quatre bancs de filtres plus courts, afin de permettre des taux d'échantillonnage évolutifs.

En 1999, MPEG-2 Part 7 a été mis à jour et inclus dans la famille de normes MPEG-4 et est devenu connu sous le nom de MPEG-4 Part 3 , MPEG-4 Audio ou ISO/IEC 14496-3:1999 . Cette mise à jour comprenait plusieurs améliorations. L'une de ces améliorations a été l'ajout de types d'objets audio qui sont utilisés pour permettre l'interopérabilité avec une large gamme d'autres formats audio tels que TwinVQ , CELP , HVXC , Text-To-Speech Interface et MPEG-4 Structured Audio . Un autre ajout notable dans cette version de la norme AAC est la substitution de bruit perceptuel (PNS). À cet égard, les profils AAC (profils AAC-LC, AAC Main et AAC-SSR) sont combinés à une substitution de bruit perceptuel et sont définis dans la norme audio MPEG-4 en tant que types d'objets audio. Les types d'objets audio MPEG-4 sont combinés en quatre profils audio MPEG-4 : Principal (qui inclut la plupart des types d'objets audio MPEG-4), Évolutif (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, Wavetable Synthesis, TTSI) , la parole (CELP, HVXC, TTSI) et la synthèse à faible débit (Wavetable Synthesis, TTSI).

Le logiciel de référence pour MPEG-4 Part 3 est spécifié dans MPEG-4 Part 5 et les flux binaires de conformité sont spécifiés dans MPEG-4 Part 4. MPEG-4 Audio reste rétrocompatible avec MPEG-2 Part 7.

Le MPEG-4 Audio Version 2 (ISO/IEC 14496-3:1999/Amd 1:2000) a défini de nouveaux types d'objets audio : le type d'objet AAC à faible retard ( AAC-LD ), le type d'objet BSAC (bit-sliced ​​Arithmetic Coding). , codage audio paramétrique utilisant des versions harmoniques et ligne individuelle plus le bruit et l'erreur (ER) des types d'objets. Il a également défini quatre nouveaux profils audio : un profil audio de haute qualité, un profil audio à faible délai, un profil audio naturel et un profil d'interconnexion audio mobile.

Le profil HE-AAC (AAC LC avec SBR ) et le profil AAC (AAC LC) ont d'abord été normalisés dans la norme ISO/IEC 14496-3:2001/Amd 1:2003. Le profil HE-AAC v2 (AAC LC avec SBR et stéréo paramétrique) a été spécifié pour la première fois dans la norme ISO/IEC 14496-3:2005/Amd 2:2006. Le type d'objet audio stéréo paramétrique utilisé dans HE-AAC v2 a été défini pour la première fois dans ISO/IEC 14496-3:2001/Amd 2:2004.

La version actuelle de la norme AAC est définie dans ISO/IEC 14496-3:2009.

AAC+ v2 est également normalisé par l' ETSI ( European Telecommunications Standards Institute ) en tant que TS 102005.

La norme MPEG-4 Part 3 contient également d'autres méthodes de compression du son. Il s'agit notamment des formats de compression sans perte, de l'audio synthétique et des formats de compression à faible débit généralement utilisés pour la parole.

Améliorations de l'AAC par rapport au MP3

Advanced Audio Coding est conçu pour être le successeur du MPEG-1 Audio Layer 3 , connu sous le nom de format MP3, qui a été spécifié par ISO / IEC dans 11172-3 ( MPEG-1 Audio) et 13818-3 ( MPEG-2 Audio) .

Des tests à l'aveugle à la fin des années 1990 ont montré que l'AAC présentait une qualité sonore et une transparence supérieures à celles du MP3 pour les fichiers codés au même débit binaire.

Les améliorations comprennent :

  • plus de fréquences d'échantillonnage (de 8 à 96 kHz ) que MP3 (16 à 48 kHz);
  • jusqu'à 48 canaux (MP3 prend en charge jusqu'à deux canaux en mode MPEG-1 et jusqu'à 5.1 canaux en mode MPEG-2);
  • débits binaires arbitraires et longueur de trame variable. Débit binaire constant standardisé avec réservoir de bits ;
  • une plus grande efficacité et une banque de filtres plus simple . AAC utilise une pure MDCT (transformée en cosinus discrète modifiée), plutôt que le codage hybride de MP3 (qui était en partie MDCT et en partie FFT );
  • une efficacité de codage plus élevée pour les signaux stationnaires (AAC utilise une taille de bloc de 1024 ou 960 échantillons, permettant un codage plus efficace que les 576 blocs d'échantillons de MP3) ;
  • une précision de codage plus élevée pour les signaux transitoires (AAC utilise une taille de bloc de 128 ou 120 échantillons, permettant un codage plus précis que les 192 blocs d'échantillons de MP3) ;
  • possibilité d'utiliser la fonction de fenêtre dérivée de Kaiser-Bessel pour éliminer les fuites spectrales au détriment de l'élargissement du lobe principal ;
  • une bien meilleure gestion des fréquences audio supérieures à 16 kHz ;
  • stéréo commune plus flexible (différentes méthodes peuvent être utilisées dans différentes gammes de fréquences);
  • des modules supplémentaires (outils) ajoutés pour augmenter l'efficacité de la compression : TNS , prédiction en arrière, substitution de bruit perceptuel (PNS), etc. Ces modules peuvent être combinés pour constituer différents profils d'encodage.

Dans l'ensemble, le format AAC offre aux développeurs plus de flexibilité pour concevoir des codecs que MP3 et corrige de nombreux choix de conception effectués dans la spécification audio MPEG-1 d'origine. Cette flexibilité accrue conduit souvent à des stratégies de codage plus concurrentes et, par conséquent, à une compression plus efficace. Cela est particulièrement vrai à des débits binaires très faibles où le codage stéréo supérieur, le MDCT pur et de meilleures tailles de fenêtre de transformation laissent le MP3 incapable de rivaliser.

Alors que le format MP3 a une prise en charge matérielle et logicielle quasi universelle, principalement parce que MP3 était le format de choix au cours des premières années cruciales de partage /distribution de fichiers musicaux à grande échelle sur Internet, AAC est un concurrent sérieux en raison d'un soutien indéfectible de l'industrie. .

Fonctionnalité

AAC est un algorithme de codage audio à large bande qui exploite deux stratégies de codage principales pour réduire considérablement la quantité de données nécessaires pour représenter un son numérique de haute qualité :

  • Les composants de signal qui ne sont pas pertinents sur le plan de la perception sont rejetés.
  • Les redondances dans le signal audio codé sont éliminées.

Le processus d'encodage réel comprend les étapes suivantes :

  • Le signal est converti du domaine temporel au domaine fréquentiel à l'aide d' une transformée en cosinus discrète modifiée vers l'avant (MDCT) . Cela se fait en utilisant des bancs de filtres qui prennent un nombre approprié d'échantillons temporels et les convertissent en échantillons de fréquence.
  • Le signal du domaine fréquentiel est quantifié sur la base d'un modèle psychoacoustique et codé.
  • Des codes de correction d'erreur internes sont ajoutés.
  • Le signal est stocké ou transmis.
  • Afin d'éviter des échantillons corrompus, une implémentation moderne de l' algorithme Luhn mod N est appliquée à chaque trame.

La norme audio MPEG-4 ne définit pas un seul ou petit ensemble de schémas de compression très efficaces, mais plutôt une boîte à outils complexe pour effectuer une large gamme d'opérations allant du codage vocal à faible débit au codage audio de haute qualité et à la synthèse musicale.

  • La famille d'algorithmes de codage audio MPEG-4 s'étend du codage de la parole à faible débit (jusqu'à 2 kbit/s) au codage audio de haute qualité (à 64 kbit/s par canal et plus).
  • AAC offre des fréquences d'échantillonnage entre 8 kHz et 96 kHz et un nombre quelconque de canaux entre 1 et 48.
  • Contrairement à la banque de filtres hybrides de MP3, AAC utilise la transformée en cosinus discrète modifiée ( MDCT ) avec les longueurs de fenêtre augmentées de 1024 ou 960 points.

Les encodeurs AAC peuvent basculer dynamiquement entre un seul bloc MDCT de longueur 1024 points ou 8 blocs de 128 points (ou entre 960 points et 120 points, respectivement).

  • En cas de changement de signal ou de transitoire, 8 fenêtres plus courtes de 128/120 points chacune sont choisies pour leur meilleure résolution temporelle.
  • Par défaut, la fenêtre plus longue de 1024 points/960 points est par ailleurs utilisée car la résolution de fréquence accrue permet un modèle psychoacoustique plus sophistiqué, ce qui se traduit par une efficacité de codage améliorée.

Encodage modulaire

AAC adopte une approche modulaire de l'encodage. En fonction de la complexité du flux binaire à coder, des performances souhaitées et du résultat acceptable, les implémenteurs peuvent créer des profils pour définir lesquels d'un ensemble spécifique d'outils ils souhaitent utiliser pour une application particulière.

La norme MPEG-2 Part 7 (Advanced Audio Coding) a été publiée pour la première fois en 1997 et propose trois profils par défaut :

  • Faible complexité (LC) - le plus simple et le plus largement utilisé et pris en charge
  • Profil principal (principal) - comme le profil LC, avec l'ajout d'une prédiction en arrière
  • Taux d'échantillonnage évolutif (SSR) alias taux d'échantillonnage évolutif (SRS)

La norme MPEG-4 Part 3 (MPEG-4 Audio) a défini divers nouveaux outils de compression (alias Audio Object Types ) et leur utilisation dans de tout nouveaux profils. AAC n'est pas utilisé dans certains des profils audio MPEG-4. Les profils MPEG-2 Part 7 AAC LC, AAC Main et AAC SSR sont combinés avec Perceptual Noise Substitution et définis dans la norme MPEG-4 Audio en tant que Types d'objets audio (sous le nom AAC LC, AAC Main et AAC SSR). Ceux-ci sont combinés avec d'autres types d'objets dans les profils audio MPEG-4. Voici une liste de quelques profils audio définis dans la norme MPEG-4 :

  • Profil audio principal - défini en 1999, utilise la plupart des types d'objets audio MPEG-4 (AAC Main, AAC-LC, AAC-SSR, AAC-LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, synthèse principale)
  • Profil audio évolutif - défini en 1999, utilise AAC-LC, AAC-LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI
  • Speech Audio Profile - défini en 1999, utilise CELP, HVXC, TTSI
  • Profil audio synthétique - défini en 1999, TTSI, synthèse principale
  • Profil audio de haute qualité - défini en 2000, utilise AAC-LC, AAC-LTP, AAC Scalable, CELP, ER-AAC-LC, ER-AAC-LTP, ER-AAC Scalable, ER-CELP
  • Profil audio à faible retard - défini en 2000, utilise CELP, HVXC, TTSI, ER-AAC-LD, ER-CELP, ER-HVXC
  • Low Delay AAC v2 - défini en 2012, utilise AAC-LD, AAC-ELD et AAC-ELDv2
  • Profil d'interconnexion audio mobile - défini en 2000, utilise ER-AAC-LC, ER-AAC-Scalable, ER-TwinVQ, ER-BSAC, ER-AAC-LD
  • Profil AAC - défini en 2003, utilise AAC-LC
  • Profil AAC haute efficacité - défini en 2003, utilise AAC-LC, SBR
  • Profil AAC v2 haute efficacité - défini en 2006, utilise AAC-LC, SBR, PS
  • Extended High Efficiency AAC xHE-AAC - défini en 2012, utilise USAC

L'une des nombreuses améliorations apportées à MPEG-4 Audio est un type d'objet appelé prédiction à long terme (LTP), qui est une amélioration du profil principal utilisant un prédicteur avancé avec une complexité de calcul inférieure.

Boîte à outils de protection contre les erreurs AAC

L'application d'une protection contre les erreurs permet de corriger les erreurs jusqu'à un certain point. Les codes de correction d'erreur sont généralement appliqués de manière égale à l'ensemble de la charge utile. Cependant, étant donné que différentes parties d'une charge utile AAC présentent une sensibilité différente aux erreurs de transmission, ce ne serait pas une approche très efficace.

La charge utile AAC peut être subdivisée en parties avec différentes sensibilités aux erreurs.

  • Des codes de correction d'erreur indépendants peuvent être appliqués à n'importe laquelle de ces parties à l'aide de l'outil de protection contre les erreurs (EP) défini dans la norme audio MPEG-4.
  • Cette boîte à outils fournit la capacité de correction d'erreurs aux parties les plus sensibles de la charge utile afin de réduire la surcharge supplémentaire.
  • La boîte à outils est rétrocompatible avec les décodeurs AAC plus simples et préexistants. Une grande partie des fonctions de correction d'erreurs de la boîte à outils sont basées sur la diffusion plus uniforme des informations sur le signal audio dans le flux de données.

AAC résilient aux erreurs (ER)

Les techniques de résilience aux erreurs (ER) peuvent être utilisées pour rendre le schéma de codage lui-même plus robuste contre les erreurs.

Pour AAC, trois méthodes sur mesure ont été développées et définies dans MPEG-4 Audio

  • Huffman Codeword Reordering (HCR) pour éviter la propagation d'erreurs dans les données spectrales
  • Livres de codes virtuels (VCB11) pour détecter les erreurs graves dans les données spectrales
  • Code de longueur variable réversible (RVLC) pour réduire la propagation des erreurs dans les données de facteur d'échelle

AAC faible délai

Les normes de codage audio MPEG-4 Low Delay ( AAC-LD ), Enhanced Low Delay (AAC-ELD) et Enhanced Low Delay v2 (AAC-ELDv2) telles que définies dans ISO/IEC 14496-3:2009 et ISO/IEC 14496 -3:2009/Amd 3 sont conçus pour combiner les avantages du codage audio perceptuel avec le faible délai nécessaire à la communication bidirectionnelle. Ils sont étroitement dérivés du format MPEG-2 Advanced Audio Coding (AAC). AAC-ELD est recommandé par la GSMA comme codec vocal à très large bande dans le service IMS Profile for High Definition Video Conference (HDVC).

Licences et brevets

Aucune licence ou paiement n'est requis pour qu'un utilisateur diffuse ou distribue du contenu au format AAC. Cette seule raison pourrait avoir fait de l'AAC un format plus attrayant pour distribuer du contenu que son prédécesseur MP3, en particulier pour le contenu en streaming (comme la radio Internet) selon le cas d'utilisation.

Cependant, une licence de brevet est requise pour tous les fabricants ou développeurs de codecs AAC . Pour cette raison, les implémentations de logiciels libres et open source telles que FFmpeg et FAAC peuvent être distribuées sous forme de source uniquement, afin d'éviter la contrefaçon de brevet. (Voir ci-dessous sous Produits prenant en charge AAC, Logiciel.)

Les détenteurs de brevets AAC incluent Bell Labs , Dolby , Fraunhofer , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , ETRI , JVC Kenwood , Philips , Microsoft et NTT .

Extensions et améliorations

Certaines extensions ont été ajoutées à la première norme AAC (définie dans MPEG-2 Part 7 en 1997) :

  • Perceptual Noise Substitution (PNS) , ajouté dans MPEG-4 en 1999. Il permet le codage du bruit sous forme de données pseudo-aléatoires .
  • Prédicteur à long terme (LTP) , ajouté dans MPEG-4 en 1999. Il s'agit d'un prédicteur direct avec une complexité de calcul inférieure.
  • Résilience aux erreurs (ER) , ajoutée dans MPEG-4 Audio version 2 en 2000, utilisée pour le transport sur des canaux sujets aux erreurs
  • AAC-LD (Low Delay), défini en 2000, utilisé pour les applications de conversation en temps réel
  • High Efficiency AAC (HE-AAC) , alias aacPlus v1 ou AAC+, la combinaison de SBR (Spectral Band Replication) et AAC LC. Utilisé pour les faibles débits. Défini en 2003.
  • HE-AAC v2 , alias aacPlus v2 ou eAAC+, la combinaison de Parametric Stereo (PS) et HE-AAC ; utilisé pour des débits encore plus bas. Défini en 2004 et 2006.
  • MPEG-4 Scalable To Lossless (SLS) , défini en 2006, peut compléter un flux AAC pour fournir une option de décodage sans perte, comme dans le produit "HD-AAC" de Fraunhofer IIS

Formats de conteneur

En plus des formats de conteneur MP4 , 3GP et autres basés sur le format de fichier multimédia de base ISO pour le stockage de fichiers, les données audio AAC ont d'abord été empaquetées dans un fichier pour la norme MPEG-2 utilisant le format d'échange de données audio (ADIF), consistant en un seul en-tête suivi des blocs de données audio AAC bruts. Cependant, si les données doivent être diffusées dans un flux de transport MPEG-2, un format d'auto-synchronisation appelé flux de transport de données audio (ADTS) est utilisé, consistant en une série de trames, chaque trame ayant un en-tête suivi de l'AAC données audio. Ce format de fichier et de diffusion en continu est défini dans MPEG-2 Part 7 , mais ne sont considérés qu'à titre informatif par MPEG-4, de sorte qu'un décodeur MPEG-4 n'a pas besoin de prendre en charge l'un ou l'autre format. Ces conteneurs, ainsi qu'un flux AAC brut, peuvent porter l'extension de fichier .aac. MPEG-4 Part 3 définit également son propre format d'auto-synchronisation appelé Low Overhead Audio Stream (LOAS) qui encapsule non seulement AAC, mais tout schéma de compression audio MPEG-4 tel que TwinVQ et ALS . Ce format est celui qui a été défini pour être utilisé dans les flux de transport DVB lorsque les encodeurs utilisent des extensions SBR ou AAC stéréo paramétriques . Cependant, il est limité à un seul flux AAC non multiplexé. Ce format est également appelé multiplex de transport audio à faible surcharge (LATM), qui n'est qu'une version à flux multiples entrelacés d'un LOAS.

Produits prenant en charge la CAA

Normes TVHD

ISDB-T japonais

En décembre 2003, le Japon a commencé à diffuser la norme DTV ISDB-T terrestre qui implémente la vidéo MPEG-2 et l'audio MPEG-2 AAC. En avril 2006, le Japon a commencé à diffuser le sous-programme mobile ISDB-T, appelé 1seg, qui était la première mise en œuvre de la vidéo H.264/AVC avec audio HE-AAC dans le service de diffusion HDTV terrestre sur la planète.

International ISDB-Tb

En décembre 2007, le Brésil a commencé à diffuser la norme DTV terrestre appelée International ISDB-Tb qui implémente le codage vidéo H.264/AVC avec audio AAC-LC sur le programme principal (simple ou multi) et vidéo H.264/AVC avec audio HE-AACv2 dans le sous-programme mobile 1seg.

DVB

L' ETSI , l'organisme de réglementation des normes pour la suite DVB , prend en charge le codage audio AAC, HE-AAC et HE-AAC v2 dans les applications DVB depuis au moins 2004. Les émissions DVB qui utilisent la compression H.264 pour la vidéo utilisent normalement HE-AAC pour l'audio.

Matériel

iTunes et iPod

En avril 2003, Apple a attiré l'attention du grand public sur AAC en annonçant que ses produits iTunes et iPod prendraient en charge les chansons au format MPEG-4 AAC (via une mise à jour du firmware pour les iPod plus anciens). Les clients pouvaient télécharger de la musique sous une forme restreinte de gestion des droits numériques (DRM) à source fermée (voir FairPlay ) via l' iTunes Store ou créer des fichiers sans DRM à partir de leurs propres CD à l'aide d'iTunes. Au cours des dernières années, Apple a commencé à proposer des vidéos musicales et des films, qui utilisent également AAC pour l'encodage audio.

Le 29 mai 2007, Apple a commencé à vendre des chansons et des clips vidéo sans DRM des maisons de disques participantes. Ces fichiers adhèrent pour la plupart à la norme AAC et sont lisibles sur de nombreux produits non Apple, mais ils incluent des informations iTunes personnalisées telles que des illustrations d'album et un reçu d'achat, afin d'identifier le client au cas où le fichier serait divulgué sur peer-to -réseaux de pairs . Il est toutefois possible de supprimer ces balises personnalisées pour restaurer l'interopérabilité avec des lecteurs strictement conformes à la spécification AAC. Depuis le 6 janvier 2009, presque toute la musique sur l'iTunes Store des États-Unis est devenue sans DRM, le reste devenant sans DRM à la fin de mars 2009.

iTunes prend en charge une option d'encodage "Variable Bit Rate" (VBR) qui encode les pistes AAC dans un schéma "Average Bit Rate" (ABR). Depuis septembre 2009, Apple a ajouté la prise en charge de HE-AAC (qui fait entièrement partie de la norme MP4) uniquement pour les flux radio, pas pour la lecture de fichiers, et iTunes ne prend toujours pas en charge le véritable encodage VBR. L'API QuickTime sous-jacente offre cependant un véritable profil d'encodage VBR.

Autres lecteurs portables

Téléphones portables

Depuis plusieurs années, de nombreux téléphones mobiles de fabricants tels que Nokia , Motorola , Samsung , Sony Ericsson , BenQ-Siemens et Philips prennent en charge la lecture AAC. Le premier de ces téléphones était le Nokia 5510 sorti en 2002, qui lit également les MP3. Cependant, ce téléphone a été un échec commercial et de tels téléphones avec lecteurs de musique intégrés n'ont pas gagné en popularité jusqu'en 2005, lorsque la tendance à prendre en charge AAC ainsi que MP3 s'est poursuivie. La plupart des nouveaux smartphones et téléphones à thème musical prennent en charge la lecture de ces formats.

  • Les téléphones Sony Ericsson prennent en charge divers formats AAC dans un conteneur MP4. AAC-LC est pris en charge dans tous les téléphones commençant par K700 , les téléphones commençant par W550 prennent en charge HE-AAC. Les derniers appareils tels que le P990 , le K610 , le W890i et les versions ultérieures prennent en charge HE-AAC v2.
  • Nokia XpressMusic et d'autres téléphones multimédias Nokia de nouvelle génération comme les séries N et E prennent également en charge le format AAC dans les profils LC, HE, M4A et HEv2. Ceux-ci prennent également en charge la lecture audio AAC codée LTP.
  • Les téléphones BlackBerry exécutant lesystème d'exploitation BlackBerry 10 prennent en charge la lecture AAC de manière native. Certains terminaux BlackBerry OS de la génération précédenteprennent également en charge AAC.
  • mauvais système d'exploitation
  • L ' iPhone d' Apple prend en charge les fichiers AAC protégés par AAC et FairPlay , autrefois utilisés comme format d' encodage par défaut dans l' iTunes Store jusqu'à la suppression des restrictions DRM en mars 2009 .
  • Android 2.3 et versions ultérieures prennent en charge AAC-LC, HE-AAC et HE-AAC v2 dans les conteneurs MP4 ou M4A ainsi que plusieurs autres formats audio. Android 3.1 et versions ultérieures prennent en charge les fichiers ADTS bruts. Android 4.1 peut encoder AAC.
  • WebOS by HP/Palm prend en charge les conteneurs AAC, AAC+, eAAC+ et .m4a dans son lecteur de musique natif ainsi que plusieurs lecteurs tiers. Cependant, il ne prend pas en charge les fichiers FairPlay DRM d'Apple téléchargés à partir d'iTunes.
  • Leruntime Silverlight de Windows Phone prend en charge le décodage AAC-LC, HE-AAC et HE-AAC v2.

Autres appareils

  • Apple de l' iPad : Prisecharge AAC et FairPlay fichiers protégés AAC utilisés comme le format d'encodage par défaut dans l'iTunes Store
  • PDA Palm OS : de nombreux PDA et smartphones basés sur Palm OS peuvent lire AAC et HE-AAC avec le logiciel tiers Pocket Tunes . La version 4.0, publiée en décembre 2006, a ajouté la prise en charge des fichiers natifs AAC et HE-AAC. Le codec AAC pour TCPMP , un lecteur vidéo populaire, a été retiré après la version 0.66 en raison de problèmes de brevets, mais peut toujours être téléchargé à partir de sites autres que corecodec.org. CorePlayer, la suite commerciale de TCPMP, inclut le support AAC. Les autres programmes Palm OS prenant en charge AAC incluent Kinoma Player et AeroPlayer.
  • Windows Mobile : Prend en charge AAC soit par le Windows Media Player natif, soit par desproduits tiers (TCPMP, CorePlayer)
  • Epson : prend en charge la lecture AAC dans lesvisionneuses de stockage multimédia/photo P-2000 et P-4000
  • Sony Reader : lit les fichiers M4A contenant AAC et affiche les métadonnées créées par iTunes. D'autres produits Sony, y compris les baladeurs réseau des séries A et E, prennent en charge l'AAC avec les mises à jour du micrologiciel (publiées en mai 2006) tandis que la série S le prend en charge immédiatement.
  • Sonos Digital Media Player : prend en charge la lecture des fichiers AAC
  • Barnes & Noble Nook Color : prend en charge la lecture de fichiers encodés AAC
  • Roku SoundBridge : un lecteur audio réseau, prend en charge la lecture de fichiers encodés AAC
  • Squeezebox : lecteur audio réseau (fabriqué par Slim Devices , unesociété Logitech ) qui prend en charge la lecture de fichiers AAC
  • PlayStation 3 : prend en charge l'encodage et le décodage des fichiers AAC
  • Xbox 360 : prend en charge la diffusion en continu de l'AAC via le logiciel Zune et des iPods pris en charge connectés via le port USB
  • Wii : prend en charge les fichiers AAC jusqu'à la version 1.1 de Photo Channel depuis le 11 décembre 2007. Tous les profils et débits AAC sont pris en charge tant qu'ils sont dans l'extension de fichier .m4a. Cette mise à jour a supprimé la compatibilité MP3, mais les utilisateurs qui l'ont installé peuvent librement revenir à l'ancienne version s'ils le souhaitent.
  • Livescribe Pulse et Echo Smartpens : enregistrez et stockez l'audio au format AAC. Les fichiers audio peuvent être lus à l'aide du haut-parleur intégré du stylet, des écouteurs connectés ou sur un ordinateur à l'aide du logiciel Livescribe Desktop. Les fichiers AAC sont stockés dans le dossier "Mes documents" de l'utilisateur du système d'exploitation Windows et peuvent être distribués et lus sans matériel ou logiciel spécialisé de Livescribe.
  • Google Chromecast : prend en charge la lecture audio LC-AAC et HE-AAC

Logiciel

Presque tous les lecteurs multimédias informatiques actuels incluent des décodeurs intégrés pour AAC, ou peuvent utiliser une bibliothèque pour le décoder. Sous Microsoft Windows , DirectShow peut être utilisé de cette manière avec les filtres correspondants pour activer la lecture AAC dans n'importe quel lecteur basé sur DirectShow . Mac OS X prend en charge AAC via les bibliothèques QuickTime .

Adobe Flash Player , depuis la version 9 mise à jour 3, peut également lire les flux AAC. Étant donné que Flash Player est également un plug-in de navigateur, il peut également lire des fichiers AAC via un navigateur.

Le micrologiciel open source Rockbox (disponible pour plusieurs lecteurs portables) offre également une prise en charge de l'AAC à des degrés divers, selon le modèle de lecteur et le profil AAC.

La prise en charge optionnelle de l'iPod (lecture de fichiers AAC non protégés) pour la Xbox 360 est disponible en téléchargement gratuit sur Xbox Live .

Ce qui suit est une liste non exhaustive d'autres applications de lecteur logiciel :

Certains de ces lecteurs (par exemple, foobar2000, Winamp et VLC) prennent également en charge le décodage d'ADTS (Audio Data Transport Stream) à l'aide du protocole SHOUTcast . Les plug-ins pour Winamp et foobar2000 permettent la création de tels flux.

Nero Digital Audio

En mai 2006, Nero AG a publié un outil d'encodage AAC gratuit, Nero Digital Audio (la partie codec AAC est devenue Nero AAC Codec ), capable d'encoder les flux LC-AAC, HE-AAC et HE-AAC v2. L'outil est uniquement un outil d' interface de ligne de commande . Un utilitaire séparé est également inclus pour décoder en PCM WAV .

Divers outils, dont le lecteur audio foobar2000 et MediaCoder, peuvent fournir une interface graphique pour cet encodeur.

FAAC et FAAD2

FAAC et FAAD2 signifient respectivement Freeware Advanced Audio Coder et Decoder 2. FAAC prend en charge les types d'objets audio LC, Main et LTP. FAAD2 prend en charge les types d'objets audio LC, Main, LTP, SBR et PS. Bien que FAAD2 soit un logiciel libre , FAAC n'est pas un logiciel libre.

Fraunhofer FDK AAC

Un encodeur/décodeur open source créé par Fraunhofer et inclus dans Android a été porté sur d'autres plates-formes. C'est l'encodeur AAC recommandé de FFmpeg.

FFmpeg et Libav

L'encodeur AAC natif créé dans le libavcodec de FFmpeg et fork avec Libav , était considéré comme expérimental et médiocre. Un travail important a été fait pour la version 3.0 de FFmpeg (février 2016) afin de rendre sa version utilisable et compétitive avec le reste des encodeurs AAC. Libav n'a pas fusionné ce travail et continue d'utiliser l'ancienne version de l'encodeur AAC. Ces encodeurs sont open source sous licence LGPL et peuvent être construits pour n'importe quelle plate-forme sur laquelle les frameworks FFmpeg ou Libav peuvent être construits.

FFmpeg et Libav peuvent utiliser la bibliothèque Fraunhofer FDK AAC via libfdk-aac, et bien que l'encodeur natif FFmpeg soit devenu stable et suffisamment bon pour une utilisation courante, FDK est toujours considéré comme l'encodeur de la plus haute qualité disponible pour une utilisation avec FFmpeg. Libav recommande également d'utiliser FDK AAC s'il est disponible.

Voir également

Les références

Liens externes