MPEG-1/2 Audio Layer 3 / MP3
Le MPEG-1/2 Audio Layer 3, plus connu sous son abréviation de MP3, est la spécification sonore du standard MPEG-1, du Moving Picture Experts Group.

Catégories :
Codec audio - Algorithme de compression avec perte - MPEG - Format fermé pour cause de brevet - Format de fichier audio
Page(s) en rapport avec ce sujet :
- We also have a page dedicated to MPEG Audio Layer 3 aka MP3. Our MPEG Software Simulation Group (MSSG) page gives you access to the source code of several... (source : mpeg)
- Discussion du forum «Multimédia» : mpeg 1 ou 2 audio layer 3 recherche - 2 réponses... convertir un fichier audio MPEG-4 (protégé) en un mp3 ou autre... Rechercher " mpeg 1 2 audio layer 3 recherche" dans le forum :... (source : sur-la-toile)
- Decoder can be used to play MPEG-1 and MPEG-2 streams.... MPEG Layer - 3 Codec · AC3 Filter · AC-3 Decompressor... LAME MP3 Encoder... MPEG-4 AAC Audio and MPEG-4 Video (such as DivX 3, 4 and 5 and XviD).... (source : free-codecs)
Le MPEG-1/2 Audio Layer 3, plus connu sous son abréviation de MP3, est la spécification sonore du standard MPEG-1, du Moving Picture Experts Group (MPEG). C'est un algorithme de compression audio (voir aussi codec) capable de diminuer drastiquement la quantité de données indispensable pour restituer de l'audio, mais qui, pour l'auditeur, est comparable à une reproduction du son original non compressé, c'est-à-dire avec perte de qualité sonore significative mais acceptable pour l'oreille humaine.
L'extension de nom de fichier est . mp3 et le type MIME est audio/mpeg[1]. Ce type de fichier est nommé «fichier MP3».
Un fichier MP3 n'est soumis à aucune mesure technique de protection (cf. gestion numérique des droits) .


Histoire
Le codage MPEG-1/2 Layer 2 est né avec le projet Digital Audio Broadcasting (radio numérique DAB) qui fut lancé par le Deutsche Luft und Raumfahrt . Ce projet a été financé par l'Union européenne, et faisait partie du programme de recherche EUREKA, plus connu sous le nom de EU-147.
Le projet EU-147 exista de 1987 à 1994. En 1991, deux formats étaient disponibles :
- MUSICAM (Masking pattern adapted Universal Subband Coding And Multiplexing), basé sur un pur codage psycho-acoustique et un banc de filtres adaptés aux sons de type percussifs ;
- ASPEC (Adaptive Spectral Perceptual Entropy Coding), qui introduisait la technologie de codage entropique.
Le format Musicam conçu par le CCETT, Philips et l'IRT fut choisi par l'ISO MPEG Audio dirigé par Hans-Georg Mussman à cause de sa structuration modulaire en plusieurs couches de codage [Layers], sa simplicité de mise en œuvre côté décodeur et sa grande tolérance aux erreurs de transmission.
À la demande de Hans-Georg Mussman, un groupe de travail comprenant Leon Van de Kerkhof (Philips), Yves-Francois Dehery (TDF-CCETT), Karlheinz Brandenburg (Fraunhofer-Gesellschaft) reprit des idées de Musicam et d'ASPEC, ajouta de nouveaux outils technologiques et créa le format MP3 (Layer III ou couche III), conçu pour être de même qualité à 128 kbit/s que le MP2 à 192 kbit/s.
La norme ISO MPEG Audio avec ses trois couches de codage Layer I, Layer II (Musicam), Layer III (. MP3) fut achevée officiellement en 1992 et forma la première partie du MPEG-1, le premier travail du groupe MPEG, groupe à l'origine de la norme internationale ISO/CEI 11172-3[2], publiée en 1993. Le travail sur l'audio MPEG se termina en 1994 et forma la seconde partie (MPEG-2) de la norme internationale ISO/CEI 13818-3, publiée pour la première fois en 1995.
Les équipes de normalisation procédèrent à de nombreux tests subjectifs en double aveugle sur de nombreux matériaux sonores pour déterminer le niveau de compression approprié pour les diverses couches de l'algorithme. On a surtout utilisé Tom's Diner, la chanson de Suzanne Vega comme séquence de test pour l'algorithme de compression du MP3. Cette chanson a été choisie à cause de sa finesse et de sa simplicité, qui favorise la détection des imperfections du codec.
Utilisation
Sur les CD vierges il est indiqué «80 minutes» pour 737 Mo (702 Mio) soit 1, 24 Mbit/s. Le format populaire de compression audio permet une réduction de 3, 88 (320 kbit/s) à 155 (8 kbit/s). Un fichier audio occupe fréquemment ainsi 3, 88 à 19, 4 (64 kbit/s) fois moins d'espace une fois compressé au format MP3. La réduction de taille favorise le téléchargement et le stockage de données musicales sur un support numérique, tel qu'un disque dur ou une mémoire flash.
Il a aussi été beaucoup mis en œuvre en diffusion numérique dans les récepteurs T-DMB Radio dont la spécification a été adoptée par l'ETSI en 2005 et qui est beaucoup répandue en Corée du Sud. En effet le MP3 appartient à la même famille de norme MPEG Audio que le MP2 MUSICAM utilisé en radiodiffusion numérique (TNT pour la télévision numérique de terre et T-DMB Radio). Un simple transcodage binaire du format "MP2 audio diffusé" en format "MP3 enregistré" peut ainsi être réalisé dans les terminaux T-DMB, autorisant par conséquent la mise sur le marché de baladeurs/récepteurs audionumériques qui cumulent les fonctions de décodage audio MP2 (MUSICAM) et MP3.
Technique de codage
Le taux de compression peut être augmenté en choisissant un débit binaire (en anglais bitrate) plus faible. On considère généralement qu'il faut au moins 128 ou 192 kilobits par seconde (kbit/s) pour bénéficier d'une qualité audio acceptable pour un morceau de musique. À 8 kbit/s, le son devient fortement altéré (bruits parasites non attendus, spectre «sourd», …).
- Ce format de données utilise un dispositif de compression partiellement destructif. Il ne retransmet pas totalement le spectre des fréquences audio. Par contre il tente d'annuler en premier lieu les sons les moins perçus de manière à ce que les dégradations se fassent le moins remarquer envisageable. Ce n'est pas une compression à proprement parler, mais plutôt une suppression d'informations.
- Compresser un fichier musical provenant d'un CD audio au format MP3 diminué la qualité. Il suffit de faire plusieurs essais à différents taux de compression pour constater une baisse progressive de la qualité. (Plus la compression est forte, plus le son est dégradé. ) Une compression correspondant à 64 kbit/s donne un son «enroué» ainsi qu'à 32 kbit/s, un son médiocre de qualité «grandes ondes».
- Les termes commerciaux de «qualité CD» ou «qualité numérique» ne veulent rien dire. Déjà parce que le MP3 diminué la qualité (de façon plus ou moins perceptible) par principe même. Par la suite, parce que «numérique» n'est pas un critère de qualité (en numérique comme en analogique il existe différentes techniques de qualités particulièrement différentes).
- La compression au format MP3 exploite un modèle psycho-acoustique de l'effet dit de «masque» : si deux fréquences d'intensités différentes sont présentes en même temps, l'une peut être moins perçue que l'autre selon que ces deux fréquences sont proches ou non. La modélisation de notre audition selon ce principe est au départ empirique, mais assez efficace. Elle exploite en outre les caractéristiques psycho-acoustiques de masquage temporel du filtre en sous-bande hérité du MUSICAM étant donné que les sons percussifs (piano, triangle, batterie, .. ) n'engendrent aucun artefact perceptible de type pré-écho.
- Cependant, si le taux de compression est trop important, on peut être amené à faire ressortir certaines harmoniques de façon non attendue. Cela donne alors l'impression de bruits parasites et désagréables au milieu du son.
- On peut perfectionner la qualité à débit moyen égal en utilisant un débit binaire variable (VBR ou Variable Bit Rate par opposition à un débit constant Constant bit rate, CBR). Dans ce cas, les instants peu complexes (contenant peu de fréquences), comme les silences par exemple, seront codés avec un débit d'information plus faible. Par exemple 64 kbit/s au lieu de 128, réduisant ainsi la taille totale du fichier tout en gardant une très bonne qualité lors des passages riches en harmoniques. Le perfectionnement apportée est variable selon le morceau codé. Le codage en VBR peut néanmoins poser des problèmes de compatibilité avec certains lecteurs. l'utilisation dépend de la personne qui gère l'objet.
Taux de compression
L'efficacité de la compression des codeurs avec perte est généralement définie par le débit binaire, puisque le taux de compression dépend de la taille de l'échantillon et de la fréquence d'échantillonnage du signal d'origine. Cependant, les paramètres du disque compact sont fréquemment utilisés comme référence (44, 1 kHz, 2×16 bits). Et aussi quelquefois, ceux du DAT SP (48 kHz, 2×16 bits). Le taux de compression pour cette référence est plus élevé, ce qui montre la complexité de la définition du terme «taux de compression» pour les codeurs avec perte.
Fraunhofer-Gesellschaft publie sur son site Web officiel les taux de compression et les débits de données pour le MPEG-1 Layer I, II et III :
- Layer I : 384 kbit/s, compression de 3, 23
- Layer II : 160 à 256 kbit/s, compression de 7, 75 à 4, 84
- Layer III : 112 à 128 kbit/s, compression 11, 1 à 9, 7
Ces valeurs ne disent pas grand-chose sur la qualité du résultat obtenu, puisque la qualité ne dépend pas uniquement du format de codage du fichier, mais également de la qualité de l'algorithme psycho-acoustique utilisé par le codeur. Typiquement, les codeurs layer I utilisent un algorithme particulièrement simple, d'où un résultat nécessitant un débit supérieur pour un codage transparent.
En considérant de bons codeurs, on obtient :
- Layer I codé à 384 kbit/s, même avec ses algorithmes psycho-acoustiques simples, est meilleur que Layer 2 de 192 à 256 kbit/s
- Layer II codé à 160 à 192 kbit/s est équivalent au Compact Disc
- Layer III codé de 112 à 128 kbit/s est équivalent au Layer II de 192 à 256 kbit/s.
Les débits présentés ne sont par conséquent pas équivalents en termes de qualité, et les qualités ne sont pas nécessairement optimales. Qui plus est , la qualité du codeur est un facteur particulièrement important. Ainsi, avec les premiers codeurs, il était le plus souvent admis que 128 kbit/s avec le Layer III n'avait pas un son excellent, mais tout juste raisonnable. La génération de codeurs actuels permet d'obtenir un son particulièrement correct à 128 kbit/s avec le Layer III.
Si on est soucieux de la qualité et pas uniquement du débit, on utilisera plutôt les valeurs suivantes :
- Layer I : excellent à 384 kbit/s
- Layer II : excellent de 256 à 384 kbit/s, particulièrement bon de 224 à 256 kbit/s, bon de 160 à 224 kbit/s
- Layer III : excellent de 224 à 320 kbit/s, particulièrement bon de 192 à 224 kbit/s, bon de 128 à 192 kbit/s
La stéréophonie a un débit précisément deux fois supérieure à la monophonie si la qualité est semblable pour ces deux modes d'écoute. Le mode stéréo joint diffère de la stéréo simple car il ne code pas scindément les deux canaux gauche et droit si les informations sonores sont semblables, donnant la possibilité un gain de qualité comparé à la stéréo classique avec une même valeur de compression. Le procédé de la stéréophonie est un codage dit différentiel de même type que celui utilisé pour la radiodiffusion en FM stéréo.
Taux de compression et qualité du codage mp3Pro
Balises
Outre le fait de stocker la musique de façon particulièrement compacte tout en conservant une qualité acceptable, le MP3 apporte une fonctionnalité rarement présente sur les formats audio qui l'ont précédé : les métadonnées, «metadata» en anglais (données sur les données). En clair, le fichier MP3 ne contient pas uniquement la musique mais peut aussi apporter des informations sur celles-ci (telles que l'interprète, le titre, le nom de l'album, la pochette, les paroles ou du karaoké). Ces informations sont stockées sous forme de'balises' (tag en anglais) dont il existe plusieurs versions.
Le format MP3 d'origine ne permettait pas de stocker des balises, tout au plus, il permettait de préciser certains paramètres binaires comme le fait que le morceau soit protégé ou non par copyright ou le fait qu'il s'agisse d'un original ou d'une copie.
Les balises MP3 sont enregistrées au format ID3 (version 1 ou 2). Les caractères alphanumériques sont codés en code A. S. C. I. I. soit American Standard Code for Information Interchange 255 (8 bits, ou un octet). Il autorise par conséquent les majuscules, mais également minuscules et lettres accentuées.
Licence
Bien que le MP3 soit fréquemment perçu par l'utilisateur final comme une technologie gratuite (parce qu'il peut en effet coder ou décoder sa musique de manière particulièrement légale pour peu que l'enregistrement original lui appartienne ou qu'il soit une copie à usage privé), cette technologie fait l'objet de brevets et d'une licence commerciale.
L'algorithme «MPEG-1 Layer 3» décrit dans les standards fran ISO/CEI IS 11172-3 et ISO/CEI IS 13818-3 est soumis à des redevances (droits commerciaux), en France à Philips (entreprise néerlandaise), TDF (entreprise française), France Télécom (entreprise française), IRT (entreprise allemande), Fraunhofer IIS (entreprise allemande) et Thomson pour toute utilisation ou implantation physique (surtout sur les baladeurs MP3).
Il convient de noter qu'aucune royalty n'est prélevée par ces ayants-droits sur un fichier au format MP3 au contraire de une pratique courante dans le monde de la propriété intellectuelle.
Logiciels servant à créer des MP3
Sous Windows
Quand on dispose d'un CD audio et d'un lecteur CD sur un ordinateur sous Windows, il suffit d'insérer le CD et de le lire avec le Lecteur Windows Media intégré au système d'exploitation et de cliquer sur l'onglet «Extraire» pour transformer les fichiers audio du CD. Néanmoins, le Lecteur Windows Media est réglé par défaut pour extraire les fichiers en WMA, il faut alors modifier les options de codage dans Outils/Options, onglet Extraire la musique, et passer outre le message d'avertissement sur les défauts du codage MP3.
Le codeur MP3 du Lecteur Windows Media est présent depuis la version pour Windows XP, avant il fallait installer un codeur externe.
Il existe des logiciels plus spécialisés offrant plus d'options et une meilleure qualité (grâce au compresseur LAME) tels que CDex, EAC et d'autres.
Sous Mac OS
Quand on dispose d'un CD audio et d'un lecteur CD sur un ordinateur sous Mac OS X ou Mac OS 9, il suffit d'insérer le CD et de le lire avec le lecteur QuickTime intégré au système. Le contenu du CD est visible et les fichiers peuvent particulièrement aisément être extraits par un glisser-déposer avec la souris. Le fichier obtenu est au format AIFF et peut être lu avec QuickTime et codé avec n'importe quel codeur MP3. Le logiciel iTunes offre des possibilités de conversion d'un format à un autre, mais ne prend pas en charge les formats ouverts les plus connus.
Pour un encodage LAME on pourra par exemple utiliser XLD [3] ou, en interaction avec iTunes, l'application iTunes-LAME[4].
Sous Linux
- Grip : sert à ripper un CD audio en MP3 (conçu pour l'environnement graphique GNOME, d'où le «G»)
- k3b : sert à ripper un CD audio en mp3 (conçu pour l'environnement graphique KDE, d'où le «K»)
- LAME : compresser mp3 en mode texte à partir de fichiers audio. Peut autant être utilisé simplement qu'avec ses options (tags ID3 envisageables).
- XCFA : capable de coder en variable bit rate
Logiciels adaptés à la lecture du MP3
- Sous Windows : VLC, Windows Media Player, iTunes, RealPlayer, Audacity, Winamp, Foobar2000, KMPlayer, Zinf, musikCube, BSplayer, Konvertor, XnView, Songbird etc.
- Sous Mac OS : iTunes, VLC, Audacity, Audion 3, QuickTime, RealPlayer, Amadeus <span class="romain" title="Nombre 2 écrit en chiffres romains" style="text-transform :uppercase">II</span>, SoundEdit, Sound Studio, Peak, etc.
- Sous Linux : Xmms, Audacity, Amarok, JuK, Listen, Rhythmbox, VLC, Exaile, Rythmbox zinf, Mplayer, etc.
- Sous Palm OS : Pocket Tunes
Matériels adaptés à sa lecture
- Les ordinateurs : via des logiciels (voir plus haut).
- Les baladeurs numériques : ils permettent d'écouter partout des fichiers MP3 stockés en mémoire.
- Les lecteurs de CD MP3 : portables ou non, ils permettent d'écouter des fichiers MP3 stockés sur des CD.
- Les disques durs multimédia : la majorité disposent de cette fonctionnalité, les autres, non d'en être capable, ne le supportent pas pour ne pas payer la licence.
- Des lecteurs de DVD ou DVD / DivX : portables ou non, ils peuvent fréquemment de lire des fichiers MP3 sur des CD ou DVD, .
- Des récepteurs de radio analogique récents et numérique DAB : ils peuvent quelquefois lire (et même de plus en plus fréquemment enregistrer) des fichiers MP3 sur des cartes mémoires flash et/ou périphériques de stockage usb.
- Des consoles de jeux récentes : comme la PSP, PS3 ou la Xbox 360.
- Des téléphones portables récents : la majorité, seuls ceux se voulant particulièrement «simples» ne le font pas à l'heure actuelle.
- Des appareils de technologies des musiques augmentées récentes : Comme les chaînes HiFi et tous ses dérivés via une platines CD ou DVD et/ou des cartes mémoires flash et/ou périphériques USB et/ou un réseau.
Autres solutions
La popularité du format MP3 a rapidement conquis de nombreux utilisateurs à partir de la seconde moitié des années 1990 tant par sa facilité d'utilisation que par le fait que pour la première fois, elle permettait de transmettre de l'information multimédia par Internet.
Néanmoins, les limites de cette technologie autant quantitativement (taux de compression par conséquent taille des fichiers et temps de téléchargement) que qualitativement (perte de qualité comparé à l'enregistrement non compressé, gestion des droits numériques) et/ou des considérations juridiques ont motivé plusieurs initiatives proposant d'autres formats, dont son successeur direct AAC, et Vorbis (. ogg[5]) qui est un format ouvert, dégagé de tout brevet, offrant un meilleur taux de compression que le MP3.
Voir aussi
Liens externes
- (en) MP3'Tech, présentation technique de MP3, par Gabriel Bouvigne, développeur de LAME.
- (en) mp3licensing. com mp3, mp3PRO and mp3surround Patent and Licensing Information, par Thomson
- (fr) Le format Ogg Vorbis est-il meilleur que le format mp3 ? Comparatif des formats MP3 et Ogg Vorbis
Notes et références
- ↑ Voir RFC 3003 The audio/mpeg Media Type : [1]
- ↑ (en) Information technology — Generic coding of moving pictures and associated audio information - Part 3 : Audio [2]
- ↑ (en) X Lossless Decoder : Lossless audio decoder for Mac OS X
- ↑ (en) iTunes-LAME encoder
- ↑ (quand il est intégré au conteneur Ogg)
- ↑ Voir RFC 3003 The audio/mpeg Media Type : [1]
- ↑ (en) Information technology — Generic coding of moving pictures and associated audio information - Part 3 : Audio [2]
- ↑ (en) X Lossless Decoder : Lossless audio decoder for Mac OS X
- ↑ (en) iTunes-LAME encoder
- ↑ (quand il est intégré au conteneur Ogg)
Recherche sur Amazon (livres) : |
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.