Format de fichiers audio / Format audio

Un format de fichier audio est un format de données utilisé en informatique pour stocker des sons, de la musique ou des voix sous forme numérique.



Catégories :

Format de fichier audio - Enregistrement sonore - DJing

Page(s) en rapport avec ce sujet :

  • Vous pouvez convertir divers format de fichier. Vos fichiers sont ... manière de convertir des fichiers audio, vidéo, présentation, document, tableur, etc.... (source : media-convert)
  • Conversion de fichiers au format rm · Conversion en ligne fichier excel format csv · Conversion fichier flv en wma · Convertir fichier audio format cda en ... (source : commentcamarche)
  • 1.4 Principaux formats de fichiers. 1.4.1 Documents textuels; 1.4.2 Images; 1.4.3 Audio ; 1.4.4 Vidéo; 1.4.5 Compression, archivage et encodage... (source : bibl.ulaval)

Un format de fichier audio est un format de données utilisé en informatique pour stocker des sons, de la musique ou des voix sous forme numérique. De nombreux standards existent; certains s'appliquent à la production, au stockage ainsi qu'à la diffusion, d'autres (ceux qui utilisent des algorithmes de compression de données ou de débit), sont destinés, habituellement, seulement à la diffusion. Aujourd'hui, le format le plus utilisé est de loin le mp3, suivi du wma, et de l'aac.

Caractéristiques des formats audio

Chaque format audio présente des caractéristiques découlant de l'algorithme de compression/décompression, ou codec (ou «codage-décodage» - COde-DECode en anglais), qu'il utilise. Après la numérisation du son, le format utilisé est inscrit dans l'extension du fichier de données qui en stocke la transcription. Chaque format se définit aussi par sa propension à inclure et gérer des Métadonnées.

Dans un format donné, les fichiers sont déclinés en plusieurs échelles de quantification (8, 16 ou 24 bits) avec différentes fréquences d'échantillonnage (p. ex. 22.05, 44.1, 48, 88.2 ; 96, 176.4, 192, kilohertz).

Types de formats

Il est important de faire le distinguo entre un format de fichier et un codec. Un codec effectue le codage et le décodage des données brutes audio alors que les données elles-mêmes sont stockées dans un fichier avec un format spécifique fichier audio. La majorité des formats de fichier audio peuvent être créés avec un de deux ou plusieurs codecs.

Il y a 3 catégories principales de formats :

On classera à part les fichiers conçus pour un usage plus spécialisés.

Les formats audio sans compression

Il existe un format audio non compressé, PCM, qui est le plus souvent stocké sous forme de . WAV sur Windows ou sous. Aiff sur Mac OS. WAV et AIFF sont des formats de fichiers flexibles conçus pour stocker plus ou moins n'importe quelle combinaison de taux d'échantillonnage ou de bitrates (bit rate). Ce sont les formats de fichier appropriés pour le stockage et la réalisation d'enregistrements originaux.

RAW

RAW (Real Audio Wrapper) est un format audio utilisé pour représenter les données de son en modulation d'impulsion codée sans en-tête ni métadonnées.

WAV

Le format WAV (ou WAVE), (WAVEform audio format) est une extension de fichiers audio, c'est un conteneur capable de recevoir des formats variés. Il est basé sur le format de fichier RIFF, lequel est identique au format IFF.

Mono ou stéréo, il a été mis au point par Microsoft et IBM.

Le suffixe des fichiers créés est . wav


BWF

Le BWF (Broadcast Wave Format) est un format audio standard créé par l'European Broadcasting Union comme successeur du WAV. Le BWF sert à stocker des métadonnées dans le fichier. Voir European Broadcasting Union : Spécification du Broadcast Wave Format (EBU Technical document 3285, juillet 1997). Il s'agit du format d'enregistrement courant utilisé dans de nombreuses stations de travail audio professionnel de la télévision et du cinéma. Les Fichiers BWF incluent une référence standardisée Timestamp qui permet et favorise la synchronisation avec un élément d'image différente. Stand-alone, basé sur des fichiers, multi-enregistreurs de Sound Devices [1], Zaxcom [2], HHB USA [3], (en) en :Fostex, et Aaton [4] tous utilisent BWF comme leur format préféré.

AIFF

L'AIFF est un format de stockage de sons sur les ordinateurs de Apple. C'est l'équivalent du format WAV dans le monde Macintosh.

Les résolutions 8, 16, 20, 24 et 32 bits (à virgule flottante) sont acceptées.

Le suffixe des fichiers créés est . aif

Une variante l'AIFF-C sert à compresser la taille jusqu'à 6x.

CAF

Le CAF (Core audio format) a été développé par Apple pour s'affranchir des limitations de conteneur audio plus ancien comme le AIFF ou le WAV.

Il est compatible avec le dispositif Mac OS X d'Apple depuis la version 10.3. Et est lisible par Quicktime 7.

CDA

Article détaillé : Compact Disc Audio track.

Le CDA (Compact Disc Audio), est un format Microsoft spécifique à Windows, des pistes des CD audio, telles qu'elles apparaissent quand elles sont insérées dans le lecteur CD-ROM. Les CD audio du commerce répondent à la norme professionnelle "Red Book". La technique d'échantillonnage du son utilisée pour les disques compacts est la modulation d'impulsion codée (en anglais PCM, pour Pulse Coded Modulation).

Le suffixe des fichiers créés est . cda

Les formats audio compressés sans perte

La compression sans perte (losless) veut dire qu'on utilise un algorithme tel qu'on peut toujours retrouver les données d'origine. Dans l'absolu, il existe toujours un fichier d'origine tel que l'algorithme ne ferait pas gagner d'espace disque.

Typiquement, la compression sans perte sert à diviser la taille des fichiers par deux ou trois. Elle est assez peu utilisée, car ce gain est particulièrement faible en comparaison de ceux permis par la compression avec perte (ce qui est un gros handicap pour les échanges de fichiers), et assez gourmande en temps de calcul. Aucun standard n'a par conséquent suffisamment convaincu pour devenir universellement lisible.

ATRAC

L'ATRAC (Adaptive Transform Acoustic Coding) est une technique de compression audio avec et sans pertes développée par Sony en 1992. Ce format a subi plusieurs évolutions : ATRAC3, ATRAC3plus (familièrement écrit ATRAC3+) et ATRAC Advanced Lossless se sont succédé respectivement en 1999, 2002 et 2006.

FLAC

Le format flac (Free Lossless Audio Codec), est un format libre de compression audio sans perte. Maintenu par la fondation Xiph. org, il est apprécié pour conserver la qualité des fichiers sonores originaux en alternative aux formats de compression avec perte type mp3.

Les formats audio compressés avec perte

La compression audio avec perte (lossy) se base sur des algorithmes spécialisés pour déterminer quelles transformations simplifient la représentation du son tout en étant perçue presque de la même manière par l'oreille humaine. Elle diminue la taille du fichier en éliminant les nuances perçues comme les moins utiles. L'élimination est définitive, créer un fichier dans un format de haute qualité à partir d'un fichier compressé avec perte ne sert strictement à rien.

Le format le plus connu est le MPEG-1/2 Audio Layer 3, dont le suffixe est . mp3. Ce format propose une qualité sonore particulièrement correcte pour un débit de 128 kbits/s. C'est ce format qui a été massivement utilisé pour transférer les musiques via internet dès la fin des années 1990. Rapidement, des baladeurs avec une mémoire réenregistrable et capables de lire directement ce format sont apparus.

Dans la décennie 2000, de nouveaux formats ont été proposés. Vu les progrès des algorithmes, ils dominent beaucoup le MP3 en terme de qualité à débit égal, et peuvent atteindre des qualités supérieures. Qui plus est , certains sont moins contraignants que le MP3 quant aux droits d'utilisation (le Ogg est un format libre). Mais le MP3 reste le plus utilisé, car l'arrivée en continu de nouveaux formats, apportant un avantage assez faible comparé aux qui ont précédé, ne permet pas de mettre en place un standard meilleur que le MP3 et lisible par l'ensemble des baladeurs. Surtout, le fait que les iPod d'Apple ne lisent que le MP3 et l'AAC freine assez fortement les initiatives dans ce domaine.

Pour un même format de compression, il n'y a pas de manière unique de coder, car chaque algorithme cherche la meilleure manière de représenter le son d'origine suivant le langage de compression. Surtout, les codecs de MP3 ont réalisés des progrès particulièrement importants depuis le début de l'utilisation de ce format.

Elle permet typiquement un gain d'un facteur 10 de taille du fichier. Cela a rendu envisageable non seulement le stockage d'un temps d'écoute formidable sur les supports informatiques, mais également leur échange par internet, fréquemment illégalement.

MP3

Star incontestée des formats audio de diffusion, MP3 (MPEG-1 Layer III), est l'abréviation de MPEG-1/2 Audio Layer 3. Cet algorithme de compression prend naissance en 1987. L'ISO en fera un standard dans les années 92-93. La couche (Layer) III est la couche la plus complexe. Elle est dédiée à des applications nécessitant des débits faibles (128 kbits/s) d'où une adhésion particulièrement rapide du monde Internet à ce format de compression. Les taux de compression (ratio) sont d'ordinaire de 1 pour 10 (1 :10) (1 :4 à 1 :12). Particulièrement rapide à l'encodage. Des royalties importantes sont à payer pour exploiter la licence MP3. Utiliser l'encodeur MP3 LAME dernière version, encodé à 130 Kib/s (V5) permet d'obtenir une qualité identique au AAC (Advanced Audio Coding) encodé à 48 kbit/s. [5]

Le suffixe des fichiers créés est . mp3

Type de compression : constant ou variable (VBR)

mp3PRO

Le format mp3PRO, fruit de la collaboration entre Thomson Multimédia et l'Institut Fraunhofer, combine l'algorithme MP3 et un dispositif perfectionnant la qualité des fichiers comprimés nommé (en) SBR pour Spectral Bandwidth Replication.

Ce format a été publié à la fin de 2001 ; un fichier MP3pro 64 Kbit/s a une qualité équivalente à un MP3 à 128 Kbit/s.

Le suffixe des fichiers créés est . mp3

Ogg Vorbis

Le format Ogg Vorbis est un format libre, fruit de la fondation Xiph. org. Vorbis se différencie des MP3, WMA et autre AAC par son algorithme. Il segmente les sources audio en paquets successifs, l'algorithme de compression agissant tout d'abord sur chaque paquet indépendamment des autres. Cela lui permet d'avoir particulièrement peu de faiblesses sur certaines fréquences et de conserver la même qualité quel que soit le type de musique.

Le suffixe des fichiers créés est . ogg ou quelquefois . oga.

Par abus de langage, on appelle'fichier Ogg'des fichiers musicaux compressés par l'algorithme Vorbis. Ceci peut être spécifiquement dérangeant à l'ère des baladeurs numériques supportant audio et vidéo. En réalité, Ogg est un conteneur qui peut contenir des pistes sonores (Vorbis), audio sans perte (FLAC), audio parlées (Speex) et vidéo (Theora). Un'fichier Ogg'peut par conséquent contenir l'un ou l'autre (ou une combinaison) de pistes. Pour être plus clair, nous devrions parler de fichier Ogg Vorbis quand nous mentionnons un fichier . ogg qui ne contient qu'une piste sonore au format Vorbis.

VQF ou TwinVQ

Le format TwinVQ (Transform-domain Weighted Interleave Vector Quantization), a été développé par NTT Cyber Space Laboratories et soutenu par Yamaha. Dans le même esprit que le MP3, il comprime toujours plus et avec une meilleure qualité. On regrettera une durée d'encodage légèrement trop longue, près de 10 fois plus lente que le MP3. Qui plus est , arrivé énormément plus tard, et distribué sous une licence particulièrement restrictive, il a eu peu d'adeptes et est plus ou moins abandonné.

Le suffixe des fichiers créés est . vqf, . vql ou . vqe

WMA

Le format WMA (Windows Media Audio), créé par Microsoft à partir des recommandations MPEG-4 en 1999, est utilisé par le logiciel Windows Media Player. Ce format est lié à une gestion pointue des droits d'auteurs (Gestion numérique des droits, en anglais Digital Right Management ou DRM) qui sert à définir par exemple une durée de vie limitée pour les fichiers ou d'interdire les possibilités de gravure.

Il existe plusieurs versions du codec (wma7.1, wma9, wma pro).

Le suffixe des fichiers créés est . wma

AU

Le format AU est assez bien répandu grâce à Unix et Linux. La fréquence d'échantillonnage est comprise entre 1 kHz et 200 kHz. Mais les applications de rendu audio ne lisent essentiellement que trois fréquences d'échantillonnage : 8012.821 (codec entré), 22050 et 44100 hertz.

Le suffixe des fichiers créés est . au

Les résolutions 8, 16, 20, 24 et 32 bits (flottant) sont acceptées.

ASF

ASF Advanced Streaming Format, est un format conteneur de Microsoft servant au streaming audio et vidéo.

AA

(en) AA Audible, est un format utilisé par Apple pour les audio-books.

AAC ou MPEG-2 AAC

L'AAC (Advanced Audio Coding), est une extension du MPEG-2 et a été perfectionné en MPEG-4, MPEG-4 Version 2 et MPEG-4 Version 3. Il a été reconnu fin avril 1997.

Le suffixe des fichiers créés est . aac, . mp4, . m4a

Apple et l'AAC

Apple a choisi l'ACC comme codec privilégié, on le retrouve dans son iPod et son logiciel iTunes. Pour la vente musicale en ligne iTunes Music Store, la norme AAC ne proposant pas de dispositif de gestion des droits numériques (DRMs), Apple a développé son propre dispositif, nommé FairPlay. Il est lisible sur Mac OS et Windows, seulement avec le logiciel iTunes.

Le fait que l'AAC soit l'unique format de compression à pertes plus performant que le MP3 qui soit supporté par les iPod a fortement contribué à sa popularité. Insuffisamment cependant pour qu'il s'impose comme successeur du MP3, d'autres formats cités faisant beaucoup jeu égal en performances.

Formats multipistes

Les formats multipistes sont une innovation récente. Ils consistent à encapsuler dans un fichier différentes pistes sonores, qui peuvent alors être combinées par l'utilisateur dans les proportions qui lui conviennent. L'idée est de proposer, pour un morceau de musique, la piste correspondant à chaque instrument (et la voix) de manière scindée. L'utilisateur peut alors créer sa propre version.

Le U-MYX avait été utilisé pour inclure des parties bonus dans les albums.

Ces formats ont l'inconvénient de nécessiter un ordinateur pour être utilisés. Cependant la naissance de smartphones jouant le rôle de baladeurs et capables d'exécuter des applications indépendantes autorise ces formats de devenir transportables, y compris pour la lecture avec mixage[6].

iKlax

Le format iKlax est un format numérique d'écoute active développé par la société iKlax Media et le LaBRI. Ce format de fichier de type conteneur permet d'organiser la musique en différents groupes et de leur appliquer des contraintes.

Le format a bénéficié d'une parution scientifique lors de l'ICMC 2008 (Internation Computer Music Conference) à Belfast.

U-MYX

Le U-MYX est un format multipiste lisible avec une application dédiée, éditée par la même entreprise qui a développé le format. Ce format a été utilisé pour apporter des morceaux en version multipiste à titre de bonus dans les albums, l'application étant apportée en même temps que les morceaux, le tout sur une session de CD visible seulement si on lisait le disque sur un ordinateur.

Malgré ces exemples d'utilisation, le futur de U-MYX est incertain, car l'entreprise qui le produit est assez floue sur ses projets futurs.

MXP4

Le MXP4 est un format multipiste dans lequel les pistes encapsulées sont au format Ogg[7]. Produit par une entreprise française, le format a bénéficié d'une forte médiatisation dans la presse française, présenté comme un «successeur du MP3». Une expression qui peut sembler exagérée, les formats multipistes jouant tout simplement un rôle différent[8].

Utilisation des formats

Un format est dit :

Les formats audiovisuels

Ces formats contiennent, à la fois des fichiers image et des fichiers audio, mais aussi du Timecode ou un pseudo-timecode (flag).

Par exemple :Quicktime est multi-plateformes et utilise de nombreux standards de l'industrie gratuits, certains autres, particulièrement orientés, sont payants. Polyvalents et de structure de données polymorphes, certains d'entre eux sont aussi utilisés pour le streaming[9].

Calcul de la taille d'un fichier audio

Pour un format à débit constant :

taille (Ko) = temps (s) x débit (Kbit/s) / 8

Exemple : pour un fichier MP3 encodé à 192 Kbit/s d'une durée de 3 minutes

taille = 3 x 60 x 192 / 8 = 4 320 Ko


Pour un format à débit variable :

taille moyenne (Ko) = temps (s) x débit moyen (Kbit/s) / 8

taille maximale (Ko) = temps (s) x débit maximum (Kbit/s) / 8


Les Métadonnées augmentent la taille des fichiers audio, leurs tailles est négligeable, cependant elles peuvent avoir pour conséquence de ralentir la lecture du fichier en temps réel.

Au-delà de la qualité CD

Le CD a prouvé ses limites, tant au niveau de sa fréquence d'échantillonnage que dans sa définition de 16 bits. Aidé par les nouveaux supports informatiques, le son peut être numérisé en 24 bits, ou alors 32 bits. Ceci permet de perfectionner le rapport signal bruit et autorise la prise de son a des niveaux plus bas.

La fréquence quant à elle est passée à 88.2, 96, 176.4, ou 192 kHz. Mais il s'agit plutôt d'un argument marketing des constructeurs, car cette avancée ne permet pas d'avoir un son plus dynamique et plus détaillé dans les transitoires. En effet l'oreille humaine ne perçoit pas les sons au-delà de 20 Khz.

Cependant la précision supplémentaire ainsi obtenue autorise des calculs plus fins lors de traitements numériques dans les logiciels audio. Ceci permet un progrès subtile de la qualité lors de l'application d'effets tels que la réverberation.

Le DVD-Audio est un exemple de qualité supérieure, mais ce type de média ne semble pas attirer le grand public. Sony propose son SACD (SuperAudio CD), qui a l'avantage d'exister en version hybride : il est lisible à la fois selon la norme CD Audio classique, sur l'ensemble des lecteurs, et en SACD sur un lecteur dédié.

Avant la numérisation

Un filtre passe-bas analogique "anti-alias" (c. a. d. anti-repliement de spectre) est appliqué au signal analogique. Son rôle est de supprimer l'ensemble des fréquences supérieures à la moitié de la fréquence d'échantillonnage. Sans ce filtre, toute fréquence (indésirable) de valeur Fs/2 + a est restituée à la fréquence Fs/2 - a ce qui donne un spectre erroné. C'est comme un phénomène stroboscopique, tel que les roues de voitures vues au cinéma : une fois elles tournent dans le "bon sens", puis dans le "mauvais sens". Exemple : avec le format CD audio, Fs = 44, 1 kHz et Fs/2, la fréquence maximale reproductible, vaut 22, 05 kHz. Exemple de filtre typique choisi pour cette fonction à cause de son excellente réponse en fréquence : le filtre de Butterworth à -18 dB/octave.

Les supports

  • Disque compact
  • Digital Audio Tape
  • Minidisc
  • Digital Compact Cassette
  • Super Audio CD
  • Disque numérique polyvalent (DVD)
  • HD DVD
  • Blu-ray Disc
  • Carte CF
  • Disque dur

Les Formats propriétaires

Certains de ces formats sont devenu obsolètes, comme le SDII de Digidesign

Notes et références

Voir aussi

Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Format_de_fichiers_audio.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu