Les Inscriptions à la Bibliothèque sont ouvertes en
ligne via le site: https://biblio.enp.edu.dz
Les Réinscriptions se font à :
• La Bibliothèque Annexe pour les étudiants en
2ème Année CPST
• La Bibliothèque Centrale pour les étudiants en Spécialités
A partir de cette page vous pouvez :
Retourner à l'écran de résultat de la dernière recherche | Consulter l'historique des recherches | Retourner au premier écran avec les recherches... |
Détail de l'auteur
Auteur Guerti, Mhania
Documents disponibles écrits par cet auteur
Affiner la recherche
Titre : Identification des réponses impulsionnelles acoustiques Type de document : texte imprimé Auteurs : Mohamed Mekarzia, Auteur ; Guerti, Mhania, Directeur de thèse Editeur : [S.l.] : [s.n.] Année de publication : 2010 Importance : 97 f. Présentation : ill. Format : 30 cm. Accompagnement : 1 CD-ROM. Note générale : Thèse de Doctorat : Electronique : Alger, Ecole Nationale Polytechnique : 2010
Bibliogr. f. 92 - 97Langues : Français (fre) Mots-clés : Canal acoustique
Réponses impulsionnelles
Algorithme adaptatif
Algorithme de gradient stochastiqueIndex. décimale : D000410 Résumé : Dans cette thèse nous présentons une méthode de mesure des réponses impulsionnelles acoustiques plus performante que celles des méthodes traditionnelles.
Cette méthode nous a permis de caractériser directement la qualité acoustique d'une salle de dimensions 20 m de longueur, 8 m de largeur et 3,5 m de hauteur.
Nous avons comparé et testé deux méthodes différentes d’identification de ces réponses impulsionnelles à partir des signaux mesurés, méthode d’intercorrélation et NLMS-DC (Algorithme de Gradient Stochastique Normalisé à pas Décroissant).
D’une part, les réponses impulsionnelles obtenues ont une dynamique de 48 dB pour le cas stationnaire et d’autre part, nous présentons les résultats pratiques obtenus pour des signaux non stationnaires à partir de ces algorithmes adaptatifs.
Les résultats de simulations de l’algorithme NLMS appliqué à un filtre transverse représentant un canal acoustique de couplage non stationnaire ont montré que nous avons de meilleures performances en vitesse de convergence et capacité de poursuite.
Cette thèse comprend quatre chapitres:
• Le premier décrit l’état de l’art sur le traitement de signal en acoustique des salles;
• Le second expose les algorithmes utilisés pour l’identification des réponses impulsionnelles acoustiques;
• Le troisième présente la méthode de mesure du canal acoustique que nous avons utilisée.
Les résultats des mesures obtenues ont également été présentés et commentés;
• Le dernier montre les performances de l'algorithme de gradient stochastique normalisé pour la poursuite d'un canal acoustique non stationnaire pour les trois mouvements (lents, moyens et rapides) de la personne entre le microphone et le haut parleur.
Nous finissons notre travail par des conclusions générales et perspectives.Identification des réponses impulsionnelles acoustiques [texte imprimé] / Mohamed Mekarzia, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2010 . - 97 f. : ill. ; 30 cm. + 1 CD-ROM.
Thèse de Doctorat : Electronique : Alger, Ecole Nationale Polytechnique : 2010
Bibliogr. f. 92 - 97
Langues : Français (fre)
Mots-clés : Canal acoustique
Réponses impulsionnelles
Algorithme adaptatif
Algorithme de gradient stochastiqueIndex. décimale : D000410 Résumé : Dans cette thèse nous présentons une méthode de mesure des réponses impulsionnelles acoustiques plus performante que celles des méthodes traditionnelles.
Cette méthode nous a permis de caractériser directement la qualité acoustique d'une salle de dimensions 20 m de longueur, 8 m de largeur et 3,5 m de hauteur.
Nous avons comparé et testé deux méthodes différentes d’identification de ces réponses impulsionnelles à partir des signaux mesurés, méthode d’intercorrélation et NLMS-DC (Algorithme de Gradient Stochastique Normalisé à pas Décroissant).
D’une part, les réponses impulsionnelles obtenues ont une dynamique de 48 dB pour le cas stationnaire et d’autre part, nous présentons les résultats pratiques obtenus pour des signaux non stationnaires à partir de ces algorithmes adaptatifs.
Les résultats de simulations de l’algorithme NLMS appliqué à un filtre transverse représentant un canal acoustique de couplage non stationnaire ont montré que nous avons de meilleures performances en vitesse de convergence et capacité de poursuite.
Cette thèse comprend quatre chapitres:
• Le premier décrit l’état de l’art sur le traitement de signal en acoustique des salles;
• Le second expose les algorithmes utilisés pour l’identification des réponses impulsionnelles acoustiques;
• Le troisième présente la méthode de mesure du canal acoustique que nous avons utilisée.
Les résultats des mesures obtenues ont également été présentés et commentés;
• Le dernier montre les performances de l'algorithme de gradient stochastique normalisé pour la poursuite d'un canal acoustique non stationnaire pour les trois mouvements (lents, moyens et rapides) de la personne entre le microphone et le haut parleur.
Nous finissons notre travail par des conclusions générales et perspectives.Exemplaires
Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire D000410B D000410 Papier + ressource électronique Bibliothèque Annexe Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable D000410A D000410 Papier + ressource électronique Bibliothèque centrale Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable Documents numériques
MEKARZIA.Mohamed.pdfURL
Titre : Implémentation d'un synthétiseur à formants du type KLATT Type de document : texte imprimé Auteurs : Zaidi, Lyazid, Auteur ; Remmache, Laid, Auteur ; Guerti, Mhania, Directeur de thèse Editeur : [S.l.] : [s.n.] Année de publication : 1993 Importance : 67 f. Présentation : ill. Format : 30 cm. Note générale : Mémoire de Projet de Fin d’Études : Électronique : Alger, École Nationale Polytechnique : 1993
Annexe f. 68 - 75 . - Bibliogr. f. 76Langues : Français (fre) Mots-clés : Fonctionnement -- Appareil phonatoire
Techniques -- Analyse-synthèse
Structures -- Synthétiseur
Étude -- Synthétiseur de KLAT du type hybride
Comparaison -- Signaux naturelsIndex. décimale : PN00893 Résumé : L'objectif de ce travail est l'étude d'une simulation d'un synthétiseur à formants et plus précisément un synthétiseur à formants du type KLAT. Implémentation d'un synthétiseur à formants du type KLATT [texte imprimé] / Zaidi, Lyazid, Auteur ; Remmache, Laid, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 1993 . - 67 f. : ill. ; 30 cm.
Mémoire de Projet de Fin d’Études : Électronique : Alger, École Nationale Polytechnique : 1993
Annexe f. 68 - 75 . - Bibliogr. f. 76
Langues : Français (fre)
Mots-clés : Fonctionnement -- Appareil phonatoire
Techniques -- Analyse-synthèse
Structures -- Synthétiseur
Étude -- Synthétiseur de KLAT du type hybride
Comparaison -- Signaux naturelsIndex. décimale : PN00893 Résumé : L'objectif de ce travail est l'étude d'une simulation d'un synthétiseur à formants et plus précisément un synthétiseur à formants du type KLAT. Exemplaires
Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire PN00893 PN00893 Papier + ressource électronique Bibliothèque centrale Projet Fin d'Etudes Disponible Electronique Consultation sur place/Téléchargeable Documents numériques
ZAÏDI.L_REMMACHE.L.pdfURL Indexation automatique des documents audio en vue d'une classification par locuteurs / Ouamour Ep. Sayoud, Siham
Titre : Indexation automatique des documents audio en vue d'une classification par locuteurs : application à l'archivage des émissions TV et radio Type de document : texte imprimé Auteurs : Ouamour Ep. Sayoud, Siham, Auteur ; Guerti, Mhania, Directeur de thèse Editeur : [S.l.] : [s.n.] Année de publication : 2009 Importance : 107 f. Présentation : ill. Format : 30 cm Accompagnement : 1 CD-ROM. Note générale : Thèse de Doctorat: Electronique: Alger, Ecole Nationale Supérieure Polytechnique: 2009
Bibliogr. f. 100 - 107Langues : Français (fre) Mots-clés : Indexation audio
Segmentation de la parole
Fusion des classifieurs
Classifieurs statistiques
Réseaux de neurones SVMIndex. décimale : D001109 Résumé : Ce travail de thèse s’intéresse à l’indexation des émissions radio et télé-diffusées en classes de locuteurs, dans le but d’obtenir un archivage hiérarchique des interventions audio en fonction des différents locuteurs.
La tâche d’indexation fait appel à deux disciplines différentes, la première s’intéresse à découper le flux audio en segments homogènes: c’est la segmentation, tandis que la deuxième tâche consiste à identifier les différents segments ou bien les regrouper en classes de locuteurs: c’est l’étiquetage ou le regroupement.
Pour arriver à cette fin, nous avons proposé et implémenté deux systèmes:
• Le premier s’intéresse à l’indexation avec connaissances a priori des locuteurs où les identités des différents locuteurs, sont connues à l’avance par le système;
• Le deuxième traite la tâche d’indexation sans aucune connaissance des modèles des locuteurs.
Pour réaliser le premier système, nous avons développé un nouvel algorithme d’indexation que nous avons appelé ISI (Interlaced Speech Indexing).
Ce dernier est basé sur une indexation entrelacée en utilisant les mesures SOSM (Mesures Statistiques du Second Ordre).
Pour le second système, nous avons développé une nouvelle caractéristique relative du locuteur que nous avons appelée RSC (Relative Speaker Characteristic).
Nous avons implémenté trois classifieurs différents: un classifieur statistique, un réseau de neurones du type MLP (Multi-Layer Perceptron) et un classifieur SVM (Support Vector Machines).
Par la suite, nous avons proposé plusieurs architectures afin de fusionner ces classifieurs.
L’évaluation de nos systèmes a été faite sur une base de données de parole réelle: HUB-4 Broadcast News.
Les résultats obtenus ont montré la bonne performance de l’algorithme ISI, la pertinence de la nouvelle caractéristique RSC, ainsi que l’intérêt de la fusion quant à l’amélioration de la précision de segmentation et d’indexation.
Nous avons organisé notre document en quatre chapitres:
• Dans le chapitre 1, nous définissons certaines généralités sur la reconnaissance du locuteur et ses différentes disciplines, ensuite, nous présentons l’indexation par locuteurs et ses applications.
Nous détaillons après, les deux tâches principales de l’indexation, notamment la segmentation et le regroupement, tout en définissant les différents algorithmes existants dans la littérature, en rapport avec ces deux tâches;
• Le chapitre 2 expose un état de l’art détaillé sur les principales caractéristiques et les différents algorithmes relatifs à la segmentation et au regroupement par locuteurs;
• Au chapitre 3, nous définissons les différents classifieurs implémentés durant notre étude.
Nous expliquons ensuite les différents algorithmes que nous avons développés pour accomplir la tâche d’indexation avec et sans connaissances a priori des locuteurs.
Nous présentons aussi dans ce chapitre les différentes architectures que nous avons développées pour fusionner les différents classifieurs utilisés;
• Le dernier chapitre expose les résultats expérimentaux obtenus durant cette étude, avec des interprétations et des conclusions.
Une conclusion générale clôture ce travail de thèse, et quelques perspectives concernant les deux tâches étudiées (segmentation et regroupement) sont proposées.
Finalement, des références bibliographiques ainsi que des annexes utiles sont mises à la disposition du lecteur pour plus de détails.Indexation automatique des documents audio en vue d'une classification par locuteurs : application à l'archivage des émissions TV et radio [texte imprimé] / Ouamour Ep. Sayoud, Siham, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2009 . - 107 f. : ill. ; 30 cm + 1 CD-ROM.
Thèse de Doctorat: Electronique: Alger, Ecole Nationale Supérieure Polytechnique: 2009
Bibliogr. f. 100 - 107
Langues : Français (fre)
Mots-clés : Indexation audio
Segmentation de la parole
Fusion des classifieurs
Classifieurs statistiques
Réseaux de neurones SVMIndex. décimale : D001109 Résumé : Ce travail de thèse s’intéresse à l’indexation des émissions radio et télé-diffusées en classes de locuteurs, dans le but d’obtenir un archivage hiérarchique des interventions audio en fonction des différents locuteurs.
La tâche d’indexation fait appel à deux disciplines différentes, la première s’intéresse à découper le flux audio en segments homogènes: c’est la segmentation, tandis que la deuxième tâche consiste à identifier les différents segments ou bien les regrouper en classes de locuteurs: c’est l’étiquetage ou le regroupement.
Pour arriver à cette fin, nous avons proposé et implémenté deux systèmes:
• Le premier s’intéresse à l’indexation avec connaissances a priori des locuteurs où les identités des différents locuteurs, sont connues à l’avance par le système;
• Le deuxième traite la tâche d’indexation sans aucune connaissance des modèles des locuteurs.
Pour réaliser le premier système, nous avons développé un nouvel algorithme d’indexation que nous avons appelé ISI (Interlaced Speech Indexing).
Ce dernier est basé sur une indexation entrelacée en utilisant les mesures SOSM (Mesures Statistiques du Second Ordre).
Pour le second système, nous avons développé une nouvelle caractéristique relative du locuteur que nous avons appelée RSC (Relative Speaker Characteristic).
Nous avons implémenté trois classifieurs différents: un classifieur statistique, un réseau de neurones du type MLP (Multi-Layer Perceptron) et un classifieur SVM (Support Vector Machines).
Par la suite, nous avons proposé plusieurs architectures afin de fusionner ces classifieurs.
L’évaluation de nos systèmes a été faite sur une base de données de parole réelle: HUB-4 Broadcast News.
Les résultats obtenus ont montré la bonne performance de l’algorithme ISI, la pertinence de la nouvelle caractéristique RSC, ainsi que l’intérêt de la fusion quant à l’amélioration de la précision de segmentation et d’indexation.
Nous avons organisé notre document en quatre chapitres:
• Dans le chapitre 1, nous définissons certaines généralités sur la reconnaissance du locuteur et ses différentes disciplines, ensuite, nous présentons l’indexation par locuteurs et ses applications.
Nous détaillons après, les deux tâches principales de l’indexation, notamment la segmentation et le regroupement, tout en définissant les différents algorithmes existants dans la littérature, en rapport avec ces deux tâches;
• Le chapitre 2 expose un état de l’art détaillé sur les principales caractéristiques et les différents algorithmes relatifs à la segmentation et au regroupement par locuteurs;
• Au chapitre 3, nous définissons les différents classifieurs implémentés durant notre étude.
Nous expliquons ensuite les différents algorithmes que nous avons développés pour accomplir la tâche d’indexation avec et sans connaissances a priori des locuteurs.
Nous présentons aussi dans ce chapitre les différentes architectures que nous avons développées pour fusionner les différents classifieurs utilisés;
• Le dernier chapitre expose les résultats expérimentaux obtenus durant cette étude, avec des interprétations et des conclusions.
Une conclusion générale clôture ce travail de thèse, et quelques perspectives concernant les deux tâches étudiées (segmentation et regroupement) sont proposées.
Finalement, des références bibliographiques ainsi que des annexes utiles sont mises à la disposition du lecteur pour plus de détails.Exemplaires
Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire D001109A D001109 Papier Bibliothèque centrale Thèse de Doctorat Disponible D001109B D001109 Papier Bibliothèque centrale Thèse de Doctorat Disponible Documents numériques
OUAMOUR-SAYOUD.Siham.pdfURL
Titre : Pathologie du langage parlé arabe : cas des sigmatismes occlusifs et constrictifs Type de document : texte imprimé Auteurs : Benselama, Zoubir Abdeslem, Auteur ; Guerti, Mhania, Directeur de thèse Editeur : [S.l.] : [s.n.] Année de publication : 2007 Importance : 150 f. Présentation : ill. Format : 30 cm. Accompagnement : 1 CD-ROM. Note générale : Thèse d’état : Électronique : Alger, École Nationale Polytechnique : 2007
Bibliogr. f. 151 - 157 . Annexe [3] fLangues : Français (fre) Mots-clés : Pathologie du langage Arabe
Sigmatismes HMM/GMM ANN MFCCIndex. décimale : D003107 Résumé : L’étude de la pathologie du langage rentre dans un cadre pluridisciplinaire.
Généralement les différents défauts de prononciation sont corrigés à l'aide d'un orthophoniste qui utilise des méthodes très simplistes, parfois lentes et lassantes pour le patient.
Notre travail rentre dans un cadre d’entraînement à la bonne
prononciation des personnes souffrant de défauts langagiers
en vue d’élaborer un système d’aide à la décision à l'orthophoniste, en utilisant des méthodes graphiques et sonores, permettant de suivre l'évolution du patient présentant un sigmatisme en détectant précisément les phonèmes à corriger.
Pour mettre en œuvre notre travail, nous avons d’abord commencé par élaborer un corpus constitué de mots en Arabe représentant la pathologie que nous voulons traiter.
Dans notre cas il s’agit du sigmatisme occlusif ou constructif.
Par la suite nous avons extrait les meilleures caractéristiques acoustiques qui s’adaptent à notre travail: les Coefficients Cepstraux d'échelle MEL en fréquences (MFCC).
Ensuite nous avons appliqué deux classificateurs basés respectivement sur les HMM/GMM (Hidden Markov Models/ Gaussian Mixture Model) et les ANN (Artificial Neural Networks).
Les résultats obtenus nous ont donné un taux intéressent de reconnaissance de 87% ainsi qu’un taux de déviation du phonème pathologique par rapport au phonème sain le plus proche.
Notre système d'aide peut être aussi installé chez le patient afin de lui permettre de s’auto-corriger.
La première partie de cette thèse est constituée de deux chapitres donnant un état de l’art général sur le domaine de la parole.
Le premier chapitre à pour intention de présenter un état de l’art sur le traitement automatique de la parole ainsi que ses applications en insistant surtout sur la reconnaissance, les notions fondamentales sur la parole et son traitement.
Nous exposons tout d’abord les grands principes du traitement automatique de la langue avant de présenter les appareils phonatoire et auditif de l’être humain.
Nous présentons ensuite deux des taxonomies possibles pour les sons observables dans un signal de parole, l’une étant spécifique au Français tandis que l’autre est spécifique à l’Arabe.
Nous traitons enfin les problèmes de variabilité du signal de parole et énoncerons quelques unes des méthodes de représentation graphique du signal, qu’elles soient ou non dédiées à la parole et qu’elles soient reconnues ou non comme résistantes au bruit.
Le deuxième chapitre nous permet de présenter les trois grandes techniques de la reconnaissance des formes qui sont utilisées en Reconnaissance Automatique de la Parole (RAP): l’alignement temporel, les chaines de Markov et les modèles connexionnistes.
La présentation de ces derniers sera plus approfondie et sera précédée d’une brève présentation des connaissances de la neurobiologie qui ont servi de fondement à l’établissement des techniques neuromimétiques.
La deuxième partie de cette thèse permet de présenter les causes susceptibles de produire des pathologies du langage ainsi que les principales définitions des pathologies de la parole et ceci sera matérialisé dans le chapitre trois.
La troisième partie réalisée en deux chapitres nous permettant de présenter le développement de toute la chaine de reconnaissance avec une proposition du développement de notre travail en vue de la réalisation d’un système d’aide à l’orthophoniste et au patient représentant des mots pathologiques et cela en premier, dans le chapitre 4 représentant le développement du bloc d’extraction des caractéristiques du signal vocal à savoir les techniques classiques ainsi un nouveau procédé s’articulant sur la neuro predictive coding, par la suite le développement des trois grandes techniques de classification des formes qui sont utilisées en Reconnaissance Automatique de la Parole: l’alignement temporel (Dynamic Time Warping, DTW), les Chaînes de Markov et les modèles connexionnistes.
Dans le chapitre 5 nous représentons notre système d’aide qui s’articule sur les chaines de Markov ainsi que les Réseaux de Neurones en dégageant les résultats pour chaque variante.
Nous terminons notre travail par des conclusions et perspectives.Pathologie du langage parlé arabe : cas des sigmatismes occlusifs et constrictifs [texte imprimé] / Benselama, Zoubir Abdeslem, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2007 . - 150 f. : ill. ; 30 cm. + 1 CD-ROM.
Thèse d’état : Électronique : Alger, École Nationale Polytechnique : 2007
Bibliogr. f. 151 - 157 . Annexe [3] f
Langues : Français (fre)
Mots-clés : Pathologie du langage Arabe
Sigmatismes HMM/GMM ANN MFCCIndex. décimale : D003107 Résumé : L’étude de la pathologie du langage rentre dans un cadre pluridisciplinaire.
Généralement les différents défauts de prononciation sont corrigés à l'aide d'un orthophoniste qui utilise des méthodes très simplistes, parfois lentes et lassantes pour le patient.
Notre travail rentre dans un cadre d’entraînement à la bonne
prononciation des personnes souffrant de défauts langagiers
en vue d’élaborer un système d’aide à la décision à l'orthophoniste, en utilisant des méthodes graphiques et sonores, permettant de suivre l'évolution du patient présentant un sigmatisme en détectant précisément les phonèmes à corriger.
Pour mettre en œuvre notre travail, nous avons d’abord commencé par élaborer un corpus constitué de mots en Arabe représentant la pathologie que nous voulons traiter.
Dans notre cas il s’agit du sigmatisme occlusif ou constructif.
Par la suite nous avons extrait les meilleures caractéristiques acoustiques qui s’adaptent à notre travail: les Coefficients Cepstraux d'échelle MEL en fréquences (MFCC).
Ensuite nous avons appliqué deux classificateurs basés respectivement sur les HMM/GMM (Hidden Markov Models/ Gaussian Mixture Model) et les ANN (Artificial Neural Networks).
Les résultats obtenus nous ont donné un taux intéressent de reconnaissance de 87% ainsi qu’un taux de déviation du phonème pathologique par rapport au phonème sain le plus proche.
Notre système d'aide peut être aussi installé chez le patient afin de lui permettre de s’auto-corriger.
La première partie de cette thèse est constituée de deux chapitres donnant un état de l’art général sur le domaine de la parole.
Le premier chapitre à pour intention de présenter un état de l’art sur le traitement automatique de la parole ainsi que ses applications en insistant surtout sur la reconnaissance, les notions fondamentales sur la parole et son traitement.
Nous exposons tout d’abord les grands principes du traitement automatique de la langue avant de présenter les appareils phonatoire et auditif de l’être humain.
Nous présentons ensuite deux des taxonomies possibles pour les sons observables dans un signal de parole, l’une étant spécifique au Français tandis que l’autre est spécifique à l’Arabe.
Nous traitons enfin les problèmes de variabilité du signal de parole et énoncerons quelques unes des méthodes de représentation graphique du signal, qu’elles soient ou non dédiées à la parole et qu’elles soient reconnues ou non comme résistantes au bruit.
Le deuxième chapitre nous permet de présenter les trois grandes techniques de la reconnaissance des formes qui sont utilisées en Reconnaissance Automatique de la Parole (RAP): l’alignement temporel, les chaines de Markov et les modèles connexionnistes.
La présentation de ces derniers sera plus approfondie et sera précédée d’une brève présentation des connaissances de la neurobiologie qui ont servi de fondement à l’établissement des techniques neuromimétiques.
La deuxième partie de cette thèse permet de présenter les causes susceptibles de produire des pathologies du langage ainsi que les principales définitions des pathologies de la parole et ceci sera matérialisé dans le chapitre trois.
La troisième partie réalisée en deux chapitres nous permettant de présenter le développement de toute la chaine de reconnaissance avec une proposition du développement de notre travail en vue de la réalisation d’un système d’aide à l’orthophoniste et au patient représentant des mots pathologiques et cela en premier, dans le chapitre 4 représentant le développement du bloc d’extraction des caractéristiques du signal vocal à savoir les techniques classiques ainsi un nouveau procédé s’articulant sur la neuro predictive coding, par la suite le développement des trois grandes techniques de classification des formes qui sont utilisées en Reconnaissance Automatique de la Parole: l’alignement temporel (Dynamic Time Warping, DTW), les Chaînes de Markov et les modèles connexionnistes.
Dans le chapitre 5 nous représentons notre système d’aide qui s’articule sur les chaines de Markov ainsi que les Réseaux de Neurones en dégageant les résultats pour chaque variante.
Nous terminons notre travail par des conclusions et perspectives.Exemplaires
Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire D003107B D003107 Papier + ressource électronique Bibliothèque Annexe Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable D003107A D003107 Papier + ressource électronique Bibliothèque centrale Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable Documents numériques
BENSELAMA.Zoubir Abdeslem.pdfURL
Titre : Perception visuelle de la parole en vue de la lecture labiale Type de document : texte imprimé Auteurs : Mohamed Lamine Hamidatou, Auteur ; Guerti, Mhania, Directeur de thèse Editeur : [S.l.] : [s.n.] Année de publication : 2014 Importance : 117 f. Présentation : ill. Format : 30 cm. Accompagnement : 1 CD-ROM. Note générale : Thèse de Doctorat : Électronique : Alger, École Nationale Polytechnique : 2014
Bibliogr. f. 110 - 117Langues : Français (fre) Mots-clés : Segmentation
Suivi des points
Contours actifs
Lecture labiale
Séquence vidéo
Recalage des points
CubiquesIndex. décimale : D002414 Résumé : Dans le but de mettre en évidence la perception visuelle de la parole, et afin de contribuer à la lecture labiale, notre travail vise particulièrement l’extraction automatique en temps réel, des contours des lèvres et des paramètres labiaux d’une séquence vidéo, sans contraintes d’éclairage ou de maquillage.
Notre étude comporte deux étapes essentielles: l’initialisation semi-automatique pour l’extraction du contour externe des lèvres de la première image d’une séquence vidéo, et le suivi des mouvements des lèvres en vue de la Lecture Labiale (L.L).
Pour cela, nous avons proposé des algorithmes pour la détermination de certains Points Caractéristiques (PC) des lèvres, ainsi qu’une méthode de pente optimale permettant de tracer les cubiques formant les contours initiaux des lèvres.
Pour le suivi des PC, nous nous sommes basés sur la méthode de la mise en correspondance.
La minimisation des erreurs de suivi se fait à l’aide d’un algorithme de recalage afin de suivre convenablement les contours des lèvres.
Finalement, pour s’assurer de la performance de nos algorithmes, nous avons utilisé aussi une initialisation manuelle des PC.
Les résultats obtenus ont montré la rigueur de nos algorithmes et cela en comparant les graphes obtenus par l’initialisation manuelle avec ceux de l’initialisation semi-automatique.Perception visuelle de la parole en vue de la lecture labiale [texte imprimé] / Mohamed Lamine Hamidatou, Auteur ; Guerti, Mhania, Directeur de thèse . - [S.l.] : [s.n.], 2014 . - 117 f. : ill. ; 30 cm. + 1 CD-ROM.
Thèse de Doctorat : Électronique : Alger, École Nationale Polytechnique : 2014
Bibliogr. f. 110 - 117
Langues : Français (fre)
Mots-clés : Segmentation
Suivi des points
Contours actifs
Lecture labiale
Séquence vidéo
Recalage des points
CubiquesIndex. décimale : D002414 Résumé : Dans le but de mettre en évidence la perception visuelle de la parole, et afin de contribuer à la lecture labiale, notre travail vise particulièrement l’extraction automatique en temps réel, des contours des lèvres et des paramètres labiaux d’une séquence vidéo, sans contraintes d’éclairage ou de maquillage.
Notre étude comporte deux étapes essentielles: l’initialisation semi-automatique pour l’extraction du contour externe des lèvres de la première image d’une séquence vidéo, et le suivi des mouvements des lèvres en vue de la Lecture Labiale (L.L).
Pour cela, nous avons proposé des algorithmes pour la détermination de certains Points Caractéristiques (PC) des lèvres, ainsi qu’une méthode de pente optimale permettant de tracer les cubiques formant les contours initiaux des lèvres.
Pour le suivi des PC, nous nous sommes basés sur la méthode de la mise en correspondance.
La minimisation des erreurs de suivi se fait à l’aide d’un algorithme de recalage afin de suivre convenablement les contours des lèvres.
Finalement, pour s’assurer de la performance de nos algorithmes, nous avons utilisé aussi une initialisation manuelle des PC.
Les résultats obtenus ont montré la rigueur de nos algorithmes et cela en comparant les graphes obtenus par l’initialisation manuelle avec ceux de l’initialisation semi-automatique.Exemplaires
Code-barres Cote Support Localisation Section Disponibilité Spécialité Etat_Exemplaire D002414B D002414 Papier + ressource électronique Bibliothèque Annexe Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable D002414A D002414 Papier + ressource électronique Bibliothèque centrale Thèse de Doctorat Disponible Electronique Consultation sur place/Téléchargeable Documents numériques
HAMIDATOU.Mohamed Lamine.pdfURL PermalinkPermalinkPermalinkPermalinkPermalinkPermalinkPermalinkSynthèse de la parole par unités variables en vue d'un guide touristique en Algérie / Mohamed El Amine Boualam
PermalinkSystème d’aide orthophonique à la substitution phonémique Infantile basé sur les HMM/GMM / Ahcéne Abed
PermalinkPermalink