Catalogue en ligne Bibliothèque Ecole Nationale Polytechnique d'Alger

Les Inscriptions à la Bibliothèque sont ouvertes en ligne via le site: https://biblio.enp.edu.dz

Les Réinscriptions se font à :

• La Bibliothèque Annexe pour les étudiants en 2ème Année CPST

• La Bibliothèque Centrale pour les étudiants en Spécialités

A partir de cette page vous pouvez :

Retourner à l'écran de résultat de la dernière recherche

Consulter l'historique des recherches

Retourner au premier écran avec les recherches...

Détail de l'auteur

Auteur Guerti, Mhania

Documents disponibles écrits par cet auteur

Affiner la recherche

Identification des réponses impulsionnelles acoustiques / Mohamed Mekarzia

Public

ISBD

Titre : Identification des réponses impulsionnelles acoustiques
Type de document : texte imprimé
Auteurs : Mohamed Mekarzia, Auteur ; Guerti, Mhania, Directeur de thèse
Editeur : [S.l.] : [s.n.]
Année de publication : 2010
Importance : 97 f.
Présentation : ill.
Format : 30 cm.
Accompagnement : 1 CD-ROM.
Note générale : Thèse de Doctorat : Electronique : Alger, Ecole Nationale Polytechnique : 2010
Bibliogr. f. 92 - 97
Langues : Français (fre)
Mots-clés : Canal acoustique
Réponses impulsionnelles
Algorithme adaptatif
Algorithme de gradient stochastique
Index. décimale : D000410
Résumé : Dans cette thèse nous présentons une méthode de mesure des réponses impulsionnelles acoustiques plus performante que celles des méthodes traditionnelles.
Cette méthode nous a permis de caractériser directement la qualité acoustique d'une salle de dimensions 20 m de longueur, 8 m de largeur et 3,5 m de hauteur.
Nous avons comparé et testé deux méthodes différentes d’identification de ces réponses impulsionnelles à partir des signaux mesurés, méthode d’intercorrélation et NLMS-DC (Algorithme de Gradient Stochastique Normalisé à pas Décroissant).
D’une part, les réponses impulsionnelles obtenues ont une dynamique de 48 dB pour le cas stationnaire et d’autre part, nous présentons les résultats pratiques obtenus pour des signaux non stationnaires à partir de ces algorithmes adaptatifs.
Les résultats de simulations de l’algorithme NLMS appliqué à un filtre transverse représentant un canal acoustique de couplage non stationnaire ont montré que nous avons de meilleures performances en vitesse de convergence et capacité de poursuite.
Cette thèse comprend quatre chapitres:
• Le premier décrit l’état de l’art sur le traitement de signal en acoustique des salles;
• Le second expose les algorithmes utilisés pour l’identification des réponses impulsionnelles acoustiques;
• Le troisième présente la méthode de mesure du canal acoustique que nous avons utilisée.
Les résultats des mesures obtenues ont également été présentés et commentés;
• Le dernier montre les performances de l'algorithme de gradient stochastique normalisé pour la poursuite d'un canal acoustique non stationnaire pour les trois mouvements (lents, moyens et rapides) de la personne entre le microphone et le haut parleur.
Nous finissons notre travail par des conclusions générales et perspectives.

Identification des réponses impulsionnelles acoustiques [texte imprimé] / Mohamed Mekarzia, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2010 . - 97 f. : ill. ; 30 cm. + 1 CD-ROM.
Thèse de Doctorat : Electronique : Alger, Ecole Nationale Polytechnique : 2010
Bibliogr. f. 92 - 97
Langues : Français (fre)
Mots-clés : Canal acoustique
Réponses impulsionnelles
Algorithme adaptatif
Algorithme de gradient stochastique
Index. décimale : D000410
Résumé : Dans cette thèse nous présentons une méthode de mesure des réponses impulsionnelles acoustiques plus performante que celles des méthodes traditionnelles.
Cette méthode nous a permis de caractériser directement la qualité acoustique d'une salle de dimensions 20 m de longueur, 8 m de largeur et 3,5 m de hauteur.
Nous avons comparé et testé deux méthodes différentes d’identification de ces réponses impulsionnelles à partir des signaux mesurés, méthode d’intercorrélation et NLMS-DC (Algorithme de Gradient Stochastique Normalisé à pas Décroissant).
D’une part, les réponses impulsionnelles obtenues ont une dynamique de 48 dB pour le cas stationnaire et d’autre part, nous présentons les résultats pratiques obtenus pour des signaux non stationnaires à partir de ces algorithmes adaptatifs.
Les résultats de simulations de l’algorithme NLMS appliqué à un filtre transverse représentant un canal acoustique de couplage non stationnaire ont montré que nous avons de meilleures performances en vitesse de convergence et capacité de poursuite.
Cette thèse comprend quatre chapitres:
• Le premier décrit l’état de l’art sur le traitement de signal en acoustique des salles;
• Le second expose les algorithmes utilisés pour l’identification des réponses impulsionnelles acoustiques;
• Le troisième présente la méthode de mesure du canal acoustique que nous avons utilisée.
Les résultats des mesures obtenues ont également été présentés et commentés;
• Le dernier montre les performances de l'algorithme de gradient stochastique normalisé pour la poursuite d'un canal acoustique non stationnaire pour les trois mouvements (lents, moyens et rapides) de la personne entre le microphone et le haut parleur.
Nous finissons notre travail par des conclusions générales et perspectives.

Exemplaires

Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire
D000410B D000410 Papier + ressource électronique Bibliothèque Annexe Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable
D000410A D000410 Papier + ressource électronique Bibliothèque centrale Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable

Documents numériques

MEKARZIA.Mohamed.pdf
URL

Implémentation d'un synthétiseur à formants du type KLATT / Zaidi, Lyazid

Public

ISBD

Titre : Implémentation d'un synthétiseur à formants du type KLATT
Type de document : texte imprimé
Auteurs : Zaidi, Lyazid, Auteur ; Remmache, Laid, Auteur ; Guerti, Mhania, Directeur de thèse
Editeur : [S.l.] : [s.n.]
Année de publication : 1993
Importance : 67 f.
Présentation : ill.
Format : 30 cm.
Note générale : Mémoire de Projet de Fin d’Études : Électronique : Alger, École Nationale Polytechnique : 1993
Annexe f. 68 - 75 . - Bibliogr. f. 76
Langues : Français (fre)
Mots-clés : Fonctionnement -- Appareil phonatoire
Techniques -- Analyse-synthèse
Structures -- Synthétiseur
Étude -- Synthétiseur de KLAT du type hybride
Comparaison -- Signaux naturels
Index. décimale : PN00893
Résumé : L'objectif de ce travail est l'étude d'une simulation d'un synthétiseur à formants et plus précisément un synthétiseur à formants du type KLAT.

Implémentation d'un synthétiseur à formants du type KLATT [texte imprimé] / Zaidi, Lyazid, Auteur ; Remmache, Laid, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 1993 . - 67 f. : ill. ; 30 cm.
Mémoire de Projet de Fin d’Études : Électronique : Alger, École Nationale Polytechnique : 1993
Annexe f. 68 - 75 . - Bibliogr. f. 76
Langues : Français (fre)
Mots-clés : Fonctionnement -- Appareil phonatoire
Techniques -- Analyse-synthèse
Structures -- Synthétiseur
Étude -- Synthétiseur de KLAT du type hybride
Comparaison -- Signaux naturels
Index. décimale : PN00893
Résumé : L'objectif de ce travail est l'étude d'une simulation d'un synthétiseur à formants et plus précisément un synthétiseur à formants du type KLAT.

Exemplaires

Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire
PN00893 PN00893 Papier + ressource électronique Bibliothèque centrale Projet Fin d'Etudes Disponible Electronique Consultation sur place/Téléchargeable

Documents numériques

ZAÏDI.L_REMMACHE.L.pdf
URL

Indexation automatique des documents audio en vue d'une classification par locuteurs / Ouamour Ep. Sayoud, Siham

Public

ISBD

Titre : Indexation automatique des documents audio en vue d'une classification par locuteurs : application à l'archivage des émissions TV et radio
Type de document : texte imprimé
Auteurs : Ouamour Ep. Sayoud, Siham, Auteur ; Guerti, Mhania, Directeur de thèse
Editeur : [S.l.] : [s.n.]
Année de publication : 2009
Importance : 107 f.
Présentation : ill.
Format : 30 cm
Accompagnement : 1 CD-ROM.
Note générale : Thèse de Doctorat: Electronique: Alger, Ecole Nationale Supérieure Polytechnique: 2009
Bibliogr. f. 100 - 107
Langues : Français (fre)
Mots-clés : Indexation audio
Segmentation de la parole
Fusion des classifieurs
Classifieurs statistiques
Réseaux de neurones SVM
Index. décimale : D001109
Résumé : Ce travail de thèse s’intéresse à l’indexation des émissions radio et télé-diffusées en classes de locuteurs, dans le but d’obtenir un archivage hiérarchique des interventions audio en fonction des différents locuteurs.
La tâche d’indexation fait appel à deux disciplines différentes, la première s’intéresse à découper le flux audio en segments homogènes: c’est la segmentation, tandis que la deuxième tâche consiste à identifier les différents segments ou bien les regrouper en classes de locuteurs: c’est l’étiquetage ou le regroupement.
Pour arriver à cette fin, nous avons proposé et implémenté deux systèmes:
• Le premier s’intéresse à l’indexation avec connaissances a priori des locuteurs où les identités des différents locuteurs, sont connues à l’avance par le système;
• Le deuxième traite la tâche d’indexation sans aucune connaissance des modèles des locuteurs.
Pour réaliser le premier système, nous avons développé un nouvel algorithme d’indexation que nous avons appelé ISI (Interlaced Speech Indexing).
Ce dernier est basé sur une indexation entrelacée en utilisant les mesures SOSM (Mesures Statistiques du Second Ordre).
Pour le second système, nous avons développé une nouvelle caractéristique relative du locuteur que nous avons appelée RSC (Relative Speaker Characteristic).
Nous avons implémenté trois classifieurs différents: un classifieur statistique, un réseau de neurones du type MLP (Multi-Layer Perceptron) et un classifieur SVM (Support Vector Machines).
Par la suite, nous avons proposé plusieurs architectures afin de fusionner ces classifieurs.
L’évaluation de nos systèmes a été faite sur une base de données de parole réelle: HUB-4 Broadcast News.
Les résultats obtenus ont montré la bonne performance de l’algorithme ISI, la pertinence de la nouvelle caractéristique RSC, ainsi que l’intérêt de la fusion quant à l’amélioration de la précision de segmentation et d’indexation.
Nous avons organisé notre document en quatre chapitres:
• Dans le chapitre 1, nous définissons certaines généralités sur la reconnaissance du locuteur et ses différentes disciplines, ensuite, nous présentons l’indexation par locuteurs et ses applications.
Nous détaillons après, les deux tâches principales de l’indexation, notamment la segmentation et le regroupement, tout en définissant les différents algorithmes existants dans la littérature, en rapport avec ces deux tâches;
• Le chapitre 2 expose un état de l’art détaillé sur les principales caractéristiques et les différents algorithmes relatifs à la segmentation et au regroupement par locuteurs;
• Au chapitre 3, nous définissons les différents classifieurs implémentés durant notre étude.
Nous expliquons ensuite les différents algorithmes que nous avons développés pour accomplir la tâche d’indexation avec et sans connaissances a priori des locuteurs.
Nous présentons aussi dans ce chapitre les différentes architectures que nous avons développées pour fusionner les différents classifieurs utilisés;
• Le dernier chapitre expose les résultats expérimentaux obtenus durant cette étude, avec des interprétations et des conclusions.
Une conclusion générale clôture ce travail de thèse, et quelques perspectives concernant les deux tâches étudiées (segmentation et regroupement) sont proposées.
Finalement, des références bibliographiques ainsi que des annexes utiles sont mises à la disposition du lecteur pour plus de détails.

Indexation automatique des documents audio en vue d'une classification par locuteurs : application à l'archivage des émissions TV et radio [texte imprimé] / Ouamour Ep. Sayoud, Siham, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2009 . - 107 f. : ill. ; 30 cm + 1 CD-ROM.
Thèse de Doctorat: Electronique: Alger, Ecole Nationale Supérieure Polytechnique: 2009
Bibliogr. f. 100 - 107
Langues : Français (fre)
Mots-clés : Indexation audio
Segmentation de la parole
Fusion des classifieurs
Classifieurs statistiques
Réseaux de neurones SVM
Index. décimale : D001109
Résumé : Ce travail de thèse s’intéresse à l’indexation des émissions radio et télé-diffusées en classes de locuteurs, dans le but d’obtenir un archivage hiérarchique des interventions audio en fonction des différents locuteurs.
La tâche d’indexation fait appel à deux disciplines différentes, la première s’intéresse à découper le flux audio en segments homogènes: c’est la segmentation, tandis que la deuxième tâche consiste à identifier les différents segments ou bien les regrouper en classes de locuteurs: c’est l’étiquetage ou le regroupement.
Pour arriver à cette fin, nous avons proposé et implémenté deux systèmes:
• Le premier s’intéresse à l’indexation avec connaissances a priori des locuteurs où les identités des différents locuteurs, sont connues à l’avance par le système;
• Le deuxième traite la tâche d’indexation sans aucune connaissance des modèles des locuteurs.
Pour réaliser le premier système, nous avons développé un nouvel algorithme d’indexation que nous avons appelé ISI (Interlaced Speech Indexing).
Ce dernier est basé sur une indexation entrelacée en utilisant les mesures SOSM (Mesures Statistiques du Second Ordre).
Pour le second système, nous avons développé une nouvelle caractéristique relative du locuteur que nous avons appelée RSC (Relative Speaker Characteristic).
Nous avons implémenté trois classifieurs différents: un classifieur statistique, un réseau de neurones du type MLP (Multi-Layer Perceptron) et un classifieur SVM (Support Vector Machines).
Par la suite, nous avons proposé plusieurs architectures afin de fusionner ces classifieurs.
L’évaluation de nos systèmes a été faite sur une base de données de parole réelle: HUB-4 Broadcast News.
Les résultats obtenus ont montré la bonne performance de l’algorithme ISI, la pertinence de la nouvelle caractéristique RSC, ainsi que l’intérêt de la fusion quant à l’amélioration de la précision de segmentation et d’indexation.
Nous avons organisé notre document en quatre chapitres:
• Dans le chapitre 1, nous définissons certaines généralités sur la reconnaissance du locuteur et ses différentes disciplines, ensuite, nous présentons l’indexation par locuteurs et ses applications.
Nous détaillons après, les deux tâches principales de l’indexation, notamment la segmentation et le regroupement, tout en définissant les différents algorithmes existants dans la littérature, en rapport avec ces deux tâches;
• Le chapitre 2 expose un état de l’art détaillé sur les principales caractéristiques et les différents algorithmes relatifs à la segmentation et au regroupement par locuteurs;
• Au chapitre 3, nous définissons les différents classifieurs implémentés durant notre étude.
Nous expliquons ensuite les différents algorithmes que nous avons développés pour accomplir la tâche d’indexation avec et sans connaissances a priori des locuteurs.
Nous présentons aussi dans ce chapitre les différentes architectures que nous avons développées pour fusionner les différents classifieurs utilisés;
• Le dernier chapitre expose les résultats expérimentaux obtenus durant cette étude, avec des interprétations et des conclusions.
Une conclusion générale clôture ce travail de thèse, et quelques perspectives concernant les deux tâches étudiées (segmentation et regroupement) sont proposées.
Finalement, des références bibliographiques ainsi que des annexes utiles sont mises à la disposition du lecteur pour plus de détails.

Exemplaires

Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire
D001109A D001109 Papier Bibliothèque centrale Thèse de Doctorat Disponible
D001109B D001109 Papier Bibliothèque centrale Thèse de Doctorat Disponible

Documents numériques

OUAMOUR-SAYOUD.Siham.pdf
URL

Pathologie du langage parlé arabe / Benselama, Zoubir Abdeslem

Public

ISBD

Titre : Pathologie du langage parlé arabe : cas des sigmatismes occlusifs et constrictifs
Type de document : texte imprimé
Auteurs : Benselama, Zoubir Abdeslem, Auteur ; Guerti, Mhania, Directeur de thèse
Editeur : [S.l.] : [s.n.]
Année de publication : 2007
Importance : 150 f.
Présentation : ill.
Format : 30 cm.
Accompagnement : 1 CD-ROM.
Note générale : Thèse d’état : Électronique : Alger, École Nationale Polytechnique : 2007
Bibliogr. f. 151 - 157 . Annexe [3] f
Langues : Français (fre)
Mots-clés : Pathologie du langage Arabe
Sigmatismes HMM/GMM ANN MFCC
Index. décimale : D003107
Résumé : L’étude de la pathologie du langage rentre dans un cadre pluridisciplinaire.
Généralement les différents défauts de prononciation sont corrigés à l'aide d'un orthophoniste qui utilise des méthodes très simplistes, parfois lentes et lassantes pour le patient.
Notre travail rentre dans un cadre d’entraînement à la bonne
prononciation des personnes souffrant de défauts langagiers
en vue d’élaborer un système d’aide à la décision à l'orthophoniste, en utilisant des méthodes graphiques et sonores, permettant de suivre l'évolution du patient présentant un sigmatisme en détectant précisément les phonèmes à corriger.
Pour mettre en œuvre notre travail, nous avons d’abord commencé par élaborer un corpus constitué de mots en Arabe représentant la pathologie que nous voulons traiter.
Dans notre cas il s’agit du sigmatisme occlusif ou constructif.
Par la suite nous avons extrait les meilleures caractéristiques acoustiques qui s’adaptent à notre travail: les Coefficients Cepstraux d'échelle MEL en fréquences (MFCC).
Ensuite nous avons appliqué deux classificateurs basés respectivement sur les HMM/GMM (Hidden Markov Models/ Gaussian Mixture Model) et les ANN (Artificial Neural Networks).
Les résultats obtenus nous ont donné un taux intéressent de reconnaissance de 87% ainsi qu’un taux de déviation du phonème pathologique par rapport au phonème sain le plus proche.
Notre système d'aide peut être aussi installé chez le patient afin de lui permettre de s’auto-corriger.
La première partie de cette thèse est constituée de deux chapitres donnant un état de l’art général sur le domaine de la parole.
Le premier chapitre à pour intention de présenter un état de l’art sur le traitement automatique de la parole ainsi que ses applications en insistant surtout sur la reconnaissance, les notions fondamentales sur la parole et son traitement.
Nous exposons tout d’abord les grands principes du traitement automatique de la langue avant de présenter les appareils phonatoire et auditif de l’être humain.
Nous présentons ensuite deux des taxonomies possibles pour les sons observables dans un signal de parole, l’une étant spécifique au Français tandis que l’autre est spécifique à l’Arabe.
Nous traitons enfin les problèmes de variabilité du signal de parole et énoncerons quelques unes des méthodes de représentation graphique du signal, qu’elles soient ou non dédiées à la parole et qu’elles soient reconnues ou non comme résistantes au bruit.
Le deuxième chapitre nous permet de présenter les trois grandes techniques de la reconnaissance des formes qui sont utilisées en Reconnaissance Automatique de la Parole (RAP): l’alignement temporel, les chaines de Markov et les modèles connexionnistes.
La présentation de ces derniers sera plus approfondie et sera précédée d’une brève présentation des connaissances de la neurobiologie qui ont servi de fondement à l’établissement des techniques neuromimétiques.
La deuxième partie de cette thèse permet de présenter les causes susceptibles de produire des pathologies du langage ainsi que les principales définitions des pathologies de la parole et ceci sera matérialisé dans le chapitre trois.
La troisième partie réalisée en deux chapitres nous permettant de présenter le développement de toute la chaine de reconnaissance avec une proposition du développement de notre travail en vue de la réalisation d’un système d’aide à l’orthophoniste et au patient représentant des mots pathologiques et cela en premier, dans le chapitre 4 représentant le développement du bloc d’extraction des caractéristiques du signal vocal à savoir les techniques classiques ainsi un nouveau procédé s’articulant sur la neuro predictive coding, par la suite le développement des trois grandes techniques de classification des formes qui sont utilisées en Reconnaissance Automatique de la Parole: l’alignement temporel (Dynamic Time Warping, DTW), les Chaînes de Markov et les modèles connexionnistes.
Dans le chapitre 5 nous représentons notre système d’aide qui s’articule sur les chaines de Markov ainsi que les Réseaux de Neurones en dégageant les résultats pour chaque variante.
Nous terminons notre travail par des conclusions et perspectives.

Pathologie du langage parlé arabe : cas des sigmatismes occlusifs et constrictifs [texte imprimé] / Benselama, Zoubir Abdeslem, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2007 . - 150 f. : ill. ; 30 cm. + 1 CD-ROM.
Thèse d’état : Électronique : Alger, École Nationale Polytechnique : 2007
Bibliogr. f. 151 - 157 . Annexe [3] f
Langues : Français (fre)
Mots-clés : Pathologie du langage Arabe
Sigmatismes HMM/GMM ANN MFCC
Index. décimale : D003107
Résumé : L’étude de la pathologie du langage rentre dans un cadre pluridisciplinaire.
Généralement les différents défauts de prononciation sont corrigés à l'aide d'un orthophoniste qui utilise des méthodes très simplistes, parfois lentes et lassantes pour le patient.
Notre travail rentre dans un cadre d’entraînement à la bonne
prononciation des personnes souffrant de défauts langagiers
en vue d’élaborer un système d’aide à la décision à l'orthophoniste, en utilisant des méthodes graphiques et sonores, permettant de suivre l'évolution du patient présentant un sigmatisme en détectant précisément les phonèmes à corriger.
Pour mettre en œuvre notre travail, nous avons d’abord commencé par élaborer un corpus constitué de mots en Arabe représentant la pathologie que nous voulons traiter.
Dans notre cas il s’agit du sigmatisme occlusif ou constructif.
Par la suite nous avons extrait les meilleures caractéristiques acoustiques qui s’adaptent à notre travail: les Coefficients Cepstraux d'échelle MEL en fréquences (MFCC).
Ensuite nous avons appliqué deux classificateurs basés respectivement sur les HMM/GMM (Hidden Markov Models/ Gaussian Mixture Model) et les ANN (Artificial Neural Networks).
Les résultats obtenus nous ont donné un taux intéressent de reconnaissance de 87% ainsi qu’un taux de déviation du phonème pathologique par rapport au phonème sain le plus proche.
Notre système d'aide peut être aussi installé chez le patient afin de lui permettre de s’auto-corriger.
La première partie de cette thèse est constituée de deux chapitres donnant un état de l’art général sur le domaine de la parole.
Le premier chapitre à pour intention de présenter un état de l’art sur le traitement automatique de la parole ainsi que ses applications en insistant surtout sur la reconnaissance, les notions fondamentales sur la parole et son traitement.
Nous exposons tout d’abord les grands principes du traitement automatique de la langue avant de présenter les appareils phonatoire et auditif de l’être humain.
Nous présentons ensuite deux des taxonomies possibles pour les sons observables dans un signal de parole, l’une étant spécifique au Français tandis que l’autre est spécifique à l’Arabe.
Nous traitons enfin les problèmes de variabilité du signal de parole et énoncerons quelques unes des méthodes de représentation graphique du signal, qu’elles soient ou non dédiées à la parole et qu’elles soient reconnues ou non comme résistantes au bruit.
Le deuxième chapitre nous permet de présenter les trois grandes techniques de la reconnaissance des formes qui sont utilisées en Reconnaissance Automatique de la Parole (RAP): l’alignement temporel, les chaines de Markov et les modèles connexionnistes.
La présentation de ces derniers sera plus approfondie et sera précédée d’une brève présentation des connaissances de la neurobiologie qui ont servi de fondement à l’établissement des techniques neuromimétiques.
La deuxième partie de cette thèse permet de présenter les causes susceptibles de produire des pathologies du langage ainsi que les principales définitions des pathologies de la parole et ceci sera matérialisé dans le chapitre trois.
La troisième partie réalisée en deux chapitres nous permettant de présenter le développement de toute la chaine de reconnaissance avec une proposition du développement de notre travail en vue de la réalisation d’un système d’aide à l’orthophoniste et au patient représentant des mots pathologiques et cela en premier, dans le chapitre 4 représentant le développement du bloc d’extraction des caractéristiques du signal vocal à savoir les techniques classiques ainsi un nouveau procédé s’articulant sur la neuro predictive coding, par la suite le développement des trois grandes techniques de classification des formes qui sont utilisées en Reconnaissance Automatique de la Parole: l’alignement temporel (Dynamic Time Warping, DTW), les Chaînes de Markov et les modèles connexionnistes.
Dans le chapitre 5 nous représentons notre système d’aide qui s’articule sur les chaines de Markov ainsi que les Réseaux de Neurones en dégageant les résultats pour chaque variante.
Nous terminons notre travail par des conclusions et perspectives.

Exemplaires

Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire
D003107B D003107 Papier + ressource électronique Bibliothèque Annexe Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable
D003107A D003107 Papier + ressource électronique Bibliothèque centrale Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable

Documents numériques

BENSELAMA.Zoubir Abdeslem.pdf
URL

Perception visuelle de la parole en vue de la lecture labiale / Mohamed Lamine Hamidatou

Public

ISBD

Titre : Perception visuelle de la parole en vue de la lecture labiale
Type de document : texte imprimé
Auteurs : Mohamed Lamine Hamidatou, Auteur ; Guerti, Mhania, Directeur de thèse
Editeur : [S.l.] : [s.n.]
Année de publication : 2014
Importance : 117 f.
Présentation : ill.
Format : 30 cm.
Accompagnement : 1 CD-ROM.
Note générale : Thèse de Doctorat : Électronique : Alger, École Nationale Polytechnique : 2014
Bibliogr. f. 110 - 117
Langues : Français (fre)
Mots-clés : Segmentation
Suivi des points
Contours actifs
Lecture labiale
Séquence vidéo
Recalage des points
Cubiques
Index. décimale : D002414
Résumé : Dans le but de mettre en évidence la perception visuelle de la parole, et afin de contribuer à la lecture labiale, notre travail vise particulièrement l’extraction automatique en temps réel, des contours des lèvres et des paramètres labiaux d’une séquence vidéo, sans contraintes d’éclairage ou de maquillage.
Notre étude comporte deux étapes essentielles: l’initialisation semi-automatique pour l’extraction du contour externe des lèvres de la première image d’une séquence vidéo, et le suivi des mouvements des lèvres en vue de la Lecture Labiale (L.L).
Pour cela, nous avons proposé des algorithmes pour la détermination de certains Points Caractéristiques (PC) des lèvres, ainsi qu’une méthode de pente optimale permettant de tracer les cubiques formant les contours initiaux des lèvres.
Pour le suivi des PC, nous nous sommes basés sur la méthode de la mise en correspondance.
La minimisation des erreurs de suivi se fait à l’aide d’un algorithme de recalage afin de suivre convenablement les contours des lèvres.
Finalement, pour s’assurer de la performance de nos algorithmes, nous avons utilisé aussi une initialisation manuelle des PC.
Les résultats obtenus ont montré la rigueur de nos algorithmes et cela en comparant les graphes obtenus par l’initialisation manuelle avec ceux de l’initialisation semi-automatique.

Perception visuelle de la parole en vue de la lecture labiale [texte imprimé] / Mohamed Lamine Hamidatou, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2014 . - 117 f. : ill. ; 30 cm. + 1 CD-ROM.
Thèse de Doctorat : Électronique : Alger, École Nationale Polytechnique : 2014
Bibliogr. f. 110 - 117
Langues : Français (fre)
Mots-clés : Segmentation
Suivi des points
Contours actifs
Lecture labiale
Séquence vidéo
Recalage des points
Cubiques
Index. décimale : D002414
Résumé : Dans le but de mettre en évidence la perception visuelle de la parole, et afin de contribuer à la lecture labiale, notre travail vise particulièrement l’extraction automatique en temps réel, des contours des lèvres et des paramètres labiaux d’une séquence vidéo, sans contraintes d’éclairage ou de maquillage.
Notre étude comporte deux étapes essentielles: l’initialisation semi-automatique pour l’extraction du contour externe des lèvres de la première image d’une séquence vidéo, et le suivi des mouvements des lèvres en vue de la Lecture Labiale (L.L).
Pour cela, nous avons proposé des algorithmes pour la détermination de certains Points Caractéristiques (PC) des lèvres, ainsi qu’une méthode de pente optimale permettant de tracer les cubiques formant les contours initiaux des lèvres.
Pour le suivi des PC, nous nous sommes basés sur la méthode de la mise en correspondance.
La minimisation des erreurs de suivi se fait à l’aide d’un algorithme de recalage afin de suivre convenablement les contours des lèvres.
Finalement, pour s’assurer de la performance de nos algorithmes, nous avons utilisé aussi une initialisation manuelle des PC.
Les résultats obtenus ont montré la rigueur de nos algorithmes et cela en comparant les graphes obtenus par l’initialisation manuelle avec ceux de l’initialisation semi-automatique.

Exemplaires

Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire
D002414B D002414 Papier + ressource électronique Bibliothèque Annexe Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable
D002414A D002414 Papier + ressource électronique Bibliothèque centrale Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable

Documents numériques

HAMIDATOU.Mohamed Lamine.pdf
URL

Reconnaissance automatique de formes / Diaf, Fatiha

Permalink
Réseaux de pétri / Guerti, Mhania

Permalink
La segmentation en traitement automatique de la parole / Guellour, Boualem

Permalink
Synthèse de la parole à l'aide de l'EVA III / Gouadfel, Bélaïd

Permalink
Synthèse de la parole en arabe standard / Amine Ounnas

Permalink
Synthèse de la parole par méthode TD-PSOLA / Mohamed El Amine Boualam

Permalink
Synthèse de la parole par méthode TDI-PSOLA / Moussaab Bounabi

Permalink
Synthèse de la parole par unités variables en vue d'un guide touristique en Algérie / Mohamed El Amine Boualam

Permalink
Système d’aide orthophonique à la substitution phonémique Infantile basé sur les HMM/GMM / Ahcéne Abed

Permalink
Techniques de synthèse de la parole / Mezaoui, Abdelaziz

Permalink

Détail de l'auteur

Auteur Guerti, Mhania

Documents disponibles écrits par cet auteur

Exemplaires

Documents numériques

Exemplaires

Documents numériques

Exemplaires

Documents numériques

Exemplaires

Documents numériques

Exemplaires

Documents numériques

Bibliothèque Ecole Nationale Polytechnique d'Alger

Accueil

Sélection de la langue

Se connecter

Météo

Adresse

Horaires d'ouverture :

Code-barres	Cote	Support	Localisation	Section	Disponibilité	Spécialité	Etat_Exemplaire
D000410B	D000410	Papier + ressource électronique	Bibliothèque Annexe	Thèse de Doctorat	Disponible	Electronique	Consultation sur place/Téléchargeable
D000410A	D000410	Papier + ressource électronique	Bibliothèque centrale	Thèse de Doctorat	Disponible	Electronique	Consultation sur place/Téléchargeable

Code-barres	Cote	Support	Localisation	Section	Disponibilité	Spécialité	Etat_Exemplaire
D001109A	D001109	Papier	Bibliothèque centrale	Thèse de Doctorat	Disponible
D001109B	D001109	Papier	Bibliothèque centrale	Thèse de Doctorat	Disponible

Code-barres	Cote	Support	Localisation	Section	Disponibilité	Spécialité	Etat_Exemplaire
D003107B	D003107	Papier + ressource électronique	Bibliothèque Annexe	Thèse de Doctorat	Disponible	Electronique	Consultation sur place/Téléchargeable
D003107A	D003107	Papier + ressource électronique	Bibliothèque centrale	Thèse de Doctorat	Disponible	Electronique	Consultation sur place/Téléchargeable

Code-barres	Cote	Support	Localisation	Section	Disponibilité	Spécialité	Etat_Exemplaire
D002414B	D002414	Papier + ressource électronique	Bibliothèque Annexe	Thèse de Doctorat	Disponible	Electronique	Consultation sur place/Téléchargeable
D002414A	D002414	Papier + ressource électronique	Bibliothèque centrale	Thèse de Doctorat	Disponible	Electronique	Consultation sur place/Téléchargeable