Titre : | Identification du locuteur en mode indépendant du texte | Type de document : | texte imprimé | Auteurs : | Hamouda, Cherif, Auteur ; Rabah Kaci, Auteur ; Bousseksou, Boualem, Directeur de thèse | Editeur : | [S.l.] : [s.n.] | Année de publication : | 2007 | Importance : | 67 f. | Présentation : | ill. | Format : | 30 cm. | Accompagnement : | 1 CD-ROM. | Note générale : | Mémoire de Projet de Fin d'Etudes: Electronique: Alger, Ecole Nationale Polytechnique: 2007
Annexe [9] f. Bibliogr. [1] f | Langues : | Français (fre) | Mots-clés : | Identification du locuteur
Mel cepstraux (MFCC) -- Paramètres
LSP -- Paramètres
Quantification
Vectorielle (QV) GMM OGMM | Index. décimale : | PN00507 | Résumé : | Ce travail s'inscrit dans le domaine de la reconnaissance automatique du locuteur, domaine riche d'applications potentielles allant de la sécurisation d'accès et les applications d’ordre juridique à l'indexation de documents audio.
Afin de laisser le champ à un large éventail d'applications, nous nous intéressons à la reconnaissance du locuteur en mode indépendant du texte.
Nous nous intéressons plus particulièrement à la modélisation et à la représentation des locuteurs.
Il s'agit d’extraire, à partir des signaux de parole, des informations relatives à l’identité, et d'estimer avec ces dernières un modèle du locuteur suffisamment robuste pour permettre son identification.
Nous avons commencé par rappeler le principe de la reconnaissance automatique du locuteur et nous avons présenté les différentes étapes du système de reconnaissance.
Cette introduction permet de présenter le contexte général de la reconnaissance du locuteur et de comprendre la terminologie de l’identification et de la vérification du locuteur ainsi que les notions générales de la parole.
Dans le deuxième chapitre nous avons présenté les paramètres acoustiques utilisés dans la majorité des systèmes de traitement de la parole.
Ce chapitre donne une aidé générale sur le choix des paramètres acoustiques convenables.
Dans la troisième chapitre nous avons présenté les techniques de modélisation, où plusieurs approches existent: approche vectorielle, connexioniste, statistique et relative.
De cette large gamme d’approches, l’approche statistique demeure la plus utilisée.
Le dernier chapitre est consacré à l’évaluation des différentes modélisations sur notre base de données avec les modélisations VQ, GMM, OGMM, et GMMpitch et cela avec les coefficients MFCC et LPS.
Nous comparerons notre base de données à celle de TIMIT.
Nous examinerons l’influence d’un certain nombre de paramètres (la qualité de données d’apprentissage et de test, le nombre de coefficients acoustiques, le nombre de locuteurs et la quantités de données de test) sur le taux d’identification correcte et sélectionner par la suite l’ensemble des paramètres qui donne les meilleurs performances pour une éventuelle conception d’un système d’identification du locuteur. |
Identification du locuteur en mode indépendant du texte [texte imprimé] / Hamouda, Cherif, Auteur ; Rabah Kaci, Auteur ; Bousseksou, Boualem, Directeur de thèse . - [S.l.] : [s.n.], 2007 . - 67 f. : ill. ; 30 cm. + 1 CD-ROM. Mémoire de Projet de Fin d'Etudes: Electronique: Alger, Ecole Nationale Polytechnique: 2007
Annexe [9] f. Bibliogr. [1] f Langues : Français ( fre) Mots-clés : | Identification du locuteur
Mel cepstraux (MFCC) -- Paramètres
LSP -- Paramètres
Quantification
Vectorielle (QV) GMM OGMM | Index. décimale : | PN00507 | Résumé : | Ce travail s'inscrit dans le domaine de la reconnaissance automatique du locuteur, domaine riche d'applications potentielles allant de la sécurisation d'accès et les applications d’ordre juridique à l'indexation de documents audio.
Afin de laisser le champ à un large éventail d'applications, nous nous intéressons à la reconnaissance du locuteur en mode indépendant du texte.
Nous nous intéressons plus particulièrement à la modélisation et à la représentation des locuteurs.
Il s'agit d’extraire, à partir des signaux de parole, des informations relatives à l’identité, et d'estimer avec ces dernières un modèle du locuteur suffisamment robuste pour permettre son identification.
Nous avons commencé par rappeler le principe de la reconnaissance automatique du locuteur et nous avons présenté les différentes étapes du système de reconnaissance.
Cette introduction permet de présenter le contexte général de la reconnaissance du locuteur et de comprendre la terminologie de l’identification et de la vérification du locuteur ainsi que les notions générales de la parole.
Dans le deuxième chapitre nous avons présenté les paramètres acoustiques utilisés dans la majorité des systèmes de traitement de la parole.
Ce chapitre donne une aidé générale sur le choix des paramètres acoustiques convenables.
Dans la troisième chapitre nous avons présenté les techniques de modélisation, où plusieurs approches existent: approche vectorielle, connexioniste, statistique et relative.
De cette large gamme d’approches, l’approche statistique demeure la plus utilisée.
Le dernier chapitre est consacré à l’évaluation des différentes modélisations sur notre base de données avec les modélisations VQ, GMM, OGMM, et GMMpitch et cela avec les coefficients MFCC et LPS.
Nous comparerons notre base de données à celle de TIMIT.
Nous examinerons l’influence d’un certain nombre de paramètres (la qualité de données d’apprentissage et de test, le nombre de coefficients acoustiques, le nombre de locuteurs et la quantités de données de test) sur le taux d’identification correcte et sélectionner par la suite l’ensemble des paramètres qui donne les meilleurs performances pour une éventuelle conception d’un système d’identification du locuteur. |
|