Conception et réalisation d'un codeur/décodeur de la parole à bande étroite (300 - 3400 Hz), à 16 kbits/s et à faible retard (Djeddou, Mustapha, Auteur ;
Mhania Guerti, Directeur de thèse . -
[S.l.] : [s.n.], 1997 . - 109 f. : ill. ; 30 cm.
Mémoire de Magister : Electronique : Alger, Ecole Nationale Polytechnique : 1997
Bibliogr. f. 102 - 109
Langues : Français (
fre)
Mots-clés : |
Codeur/décodeur Parole Bande étroite à faible retard |
Index. décimale : |
M003597 |
Résumé : |
Un codeur de parole "LD-CELP" de débit 16 Kb/s et possédant un retard de codage inférieur à 2 ms a été réalisé. Cette réalisation a nécessité la prise en compte d'une taille réduite du vecteur d'analyse (5 échantillons) à traiter ainsi qu'une adaptation régressive du prédicteur LPC et du gain d'excitation. Le prédicteur pitch dans le CELP conventionnel est supprimé à cause de sa sensibilité aux erreurs du canal.
Pour compenser la perte de performance (surtout pour un signal de parole prononcé par un locuteur féminin), l'ordre de prédiction LPC est augmenté de 10 à 50. Cette modification permet au codeur d'être moins spécifique pour les signaux de parole. Deux types de dictionnaire sont utilisés pour la QV (Quantification Vectorielle) de l'excitation:
- Stochastique
- Algébrique
Le premier a été conçu par apprentissage (similaire à l'algorithme LBC) optimisé en boucle fermée en utilisant une base de donnée de signaux de parole.
Le deuxième a été conçu par l'utilisation d'un générateur de code ternaire. Une réduction significative de complexité a été obtenue en utilisant les caractéristiques du vecteur d'excitation ternaire. Les mesures objectives et subjectives montrent que la qualité de la parole synthétisée est de haute qualité pour les deux types d'excitations. Le travail a été extrapolé pour avoir un codeur de parole large bande (50 - 7000 Hz) à un faible retard ( |