Traitement de la parole

Le traitement de la parole est une discipline scientique localisé au croisement du traitement du signal numérique et du traitement du langage.



Catégories :

Traitement de la parole

Page(s) en rapport avec ce sujet :

  • Le traitement de la parole est actuellement une composante principale des sciences de l'ingénieur. Localisée au croisement du traitement du signal numérique... Enfin, le rôle des codeurs est de permettre la transmission ou le stockage de ... (source : tcts.fpms.ac)
  • Le traitement de la parole est actuellement une composante principale des ... Traitement du signal et de l'information... Traitement du signal : échantillonnage, traitement de la parole, CDMA, transmission analogique et numérique.... (source : yopdf)
  • Le traitement de la parole est actuellement une composante principale des sciences de l'ingénieur. Localisée au croisement du traitement du signal numérique et du traitement...... Fig. 2.15 Transmission de parole basée sur le codage LPC... (source : eisti)

Le traitement de la parole est une discipline scientique localisé au croisement du traitement du signal numérique et du traitement du langage. Il existe quatre grandes familles de modules vocaux :

Traitement analogique

Dès l'origine du téléphone, le signal utile obtenu par le microphone est d'une puissance de 1 mW (0, 775 V sur une impédance de 600 Ω (Ohms) dit niveau 0 dB). Sachant qu'il a fallu exploiter ces données principales pendant des décennies sans pouvoir bénéficier d'éléments actifs (augmentcation), les normes de transmissions analogiques se sont basées sur cette réalité.

Ce faible signal utile exigeait une qualité optimum des câbles pour que les bruits induits entre circuits soient les plus faibles envisageables (plan de brassage des paires entre segment de câble, à chaque point de raccordement pour compenser les déséquilibres de capacité mesurés après fabrication des segments).

Des ingénieurs tels que l'américain Michæl Pupin (1900) ou le danois Emil Krarup (1902) ont perfectionné la portée du signal en compensant la forte capacité du câble par l'ajout de self (uniformément répartie dans la méthode Krarup (krarupisation) telle une corde à piano ou par des bobines de self l'ensemble des 1830 m dans la méthode du pas Pupin (pupinisation) ) Si par cette méthode on augmente la portée du signal, on perd sur la bande passante transmise (filtre passe-bas limité à 4000 Hz)

La bande passante normalisée pour la téléphonie est de 300 Hz à 3400 Hz. Cette bande passante est suffisante pour l'intelligibilité de la conversation (le % de netteté est vérifié par mesures sur des émissions aléatoires de logatomes (proche des phonèmes) )

Affaiblissement linéique

la liaison téléphonique subit les contraintes des paramètres physiques dit paramètres primaires (résistance R, inductance L, perditance G, capacité C).

l'affaiblissement linéique est le terme (α alpha) de l'exposant de transfert rapporté à l'unité de longueur. C'est une loi logarithmique comparable à la sensibilité de l'oreille humaine (correction par des filtres psophométriques)

Le recollement entre les deux échelles dépend de l'efficacité du micro et de l'écouteur, de la distance entre l'oreille et ceux-ci (donc de la forme du combiné), et de l'affaiblissement de la ligne. Pour une transmission entièrement passive (sans augmentcation), dans le meilleur des cas, le 0 dB de la seconde échelle s'aligne avec à peu près 80 dB de la première.

Premières augmentcations

Pour les premières augmentcations (AF audio fréquence), il a fallu résoudre les problèmes d'adaptation d'impédance (équilibreurs sur le transformateur différentiel) afin d'éviter l'amorçage du circuit (l'effet Larsen).

Premières liaisons multiplexées analogiques

Pour les premiers multiplexage (HF haute fréquence), il a fallu limiter les niveaux de bruit sur les blancs de conversation avec compresseur-extenseur (bruit repoussé à moins de -50 dB).

Traitement numérique

Le théorème de Shannon avait déterminé dès 1948 qu'il suffisait d'échantillonner le signal de base à 2 fois la fréquence maximale de ce signal pour conserver l'information contenue dans le signal à transmettre.

Il a fallu attendre toujours une vingtaine d'années pour disposer des composants électroniques assez véloces pour exploiter les premières liaisons numériques de Modulation par Impulsion Codées (MIC).

Sachant que la bande passante de la téléphonie est normalisée à 300-3 400 Hz (interprétée à 0-4 000 Hz en multiplexage), il suffit d'échantillonner à 8 000 Hz pour transmettre les caractéristiques du signal. Soit prélever un échantillon l'ensemble des 125 micro-secondes (1 s/8 000 Hz)

Les CODEC normalisés (codeurs-décodeurs) travaillent sur 32 IT (intervalles de temps) par conséquent accordent 3, 9 micro-secondes à chaque voie utile (30 voies téléphoniques et 2 IT techniques de signalisation) L'échantillon prélevé est codé sur une échelle numérique de 8 bits. Cette échelle est logarithmique pour minimiser les bruits de quantification, le codage étant plus fin sur les faibles niveaux. Les deux codages les plus utilisés sont le µ-Law (essentiellement aux États-Unis) et l'a-Law (Europe). Plage de -127 à +128 (256 valeurs soit un octet)

La transmission numérique est par conséquent standardisée sur des MIC de base à 2, 048 Mbit/s (256 x 8 000) et accordent 64 kbit/s à chaque voie (8 000 octets).

Ces transmissions numériques ont l'avantage d'être affranchies des bruits de transmission. Mais bien d'autres problèmes ont dû être résolus (codage HDB3 : viols de bipolarité et bourrage pour conserver le rythme de 2 Mbit/s, même en l'absence de signaux sur les voies d'entrée).


Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Traitement_de_la_parole.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu