Les Inscriptions à la Bibliothèque sont ouvertes en
ligne via le site: https://biblio.enp.edu.dz
Les Réinscriptions se font à :
• La Bibliothèque Annexe pour les étudiants en
2ème Année CPST
• La Bibliothèque Centrale pour les étudiants en Spécialités
A partir de cette page vous pouvez :
Retourner au premier écran avec les recherches... |
Détail de l'auteur
Auteur Saeed, Khalid
Documents disponibles écrits par cet auteur
Affiner la rechercheA Speech-and-Speaker Identification System: Feature Extraction, Description, and Classification of Speech-Signal Image / Saeed, Khalid in IEEE transactions on industrial electronics, Vol. 54 N°2 (Avril 2007)
[article]
in IEEE transactions on industrial electronics > Vol. 54 N°2 (Avril 2007) . - 887-897 p.
Titre : A Speech-and-Speaker Identification System: Feature Extraction, Description, and Classification of Speech-Signal Image Titre original : Système d'identification de la parole et de haut-parleur : Extraction, description, et classification de dispositif d'image de son articulé Type de document : texte imprimé Auteurs : Saeed, Khalid, Auteur ; Nammous, Mohammed Kheir, Auteur Article en page(s) : 887-897 p. Note générale : Génie Electrique Langues : Anglais (eng) Mots-clés : Communication Humatronics Linear predictive coding Processing and recognition Speaker recognition Speech analysis Töeplitz matrix (TM) eigenvalues Understanding speech Communication Humatronique Codage prédictif linéaire Traitement et identification Identification d'orateur Analyse de la parole Valeurs propres de matrice de Töeplitz Parole d'arrangement Index. décimale : 621.38 Dispositifs électroniques. Tubes à électrons. Photocellules. Accélérateurs de particules. Tubes à rayons X Résumé : This paper discusses a speech-and-speaker (SAS) identification system based on spoken Arabic digit recognition. The speech signals of the Arabic digits from zero to ten are processed graphically (the signal is treated as an object image for further processing). The identifying and classifying methods are performed with Burg's estimation model and the algorithm of Toeplitz matrix minimal eigenvalues as the main tools for signal-image description and feature extraction. At the stage of classification, both conventional and neural-network-based methods are used. The success rate of the speaker-identifying system obtained in the presented experiments for individually uttered words is excellent and has reached about 98.8% in some cases. The miss rate of about 1.2% was almost only because of false acceptance (13 miss cases in 1100 tested voices). These results have promisingly led to the design of a security system for SAS identification. The average overall success rate was then 97.45% in recognizing one uttered word and identifying its speaker, and 92.5% in recognizing a three-digit password (three individual words), which is really a high success rate because, for compound cases, we should successfully test all the three uttered words consecutively in addition to and after identifying their speaker; hence, the probability of making an error is basically higher. The authors' major contribution to this task involves building a system to recognize both the uttered words and their speaker through an innovative graphical algorithm for feature extraction from the voice signal. This Toeplitz-based algorithm reduces the amount of computations from operations on an ntimesn matrix that contains n2 different elements to a matrix (of Toeplitz form) that contains only n elements that are different from each other.
Cet article discute un système d'identification de la parole et du haut-parleur (SAS) basé sur l'identification arabe parlée de chiffre. Les sons articulés des chiffres arabes de zéro à dix sont traités graphiquement (le signal est traité comme image d'objet pour une transformation plus ultérieure). Les méthodes de identification et classifiantes sont exécutées avec le modèle de l'évaluation de Burg et l'algorithme des valeurs propres minimales de matrice de Toeplitz comme outils de force pour la description de signal-image et l'extraction de dispositif. À l'étape des méthodes basées de réseau conventionnel et neurologique de classification, sont employés. Le taux de succès du haut-parleur identifiant le système obtenu en expériences présentées pour des mots individuellement poussés est excellent et a atteint environ 98.8% dans certains cas. Le taux de manque environ de 1.2% était presque seulement en raison d'acceptation fausse (13 manquent des cas dans 1100 voix examinées). Ces résultats ont prometteur mené à la conception d'un système de sécurité pour l'identification de SAS. Le taux global moyen de succès était alors 97.45% en identifiant un mot poussé et en identifiant son haut-parleur, et 92.5% en identifiant un mot de passe de trois chiffres (trois différents mots), qui est vraiment un taux élevé de succès parce que, pour des cas composés, nous devrions avec succès examiner tous trois mots poussés consécutivement en plus et après d'identifier leur haut-parleur ; par conséquent, la probabilité de faire une erreur est fondamentalement plus haute. La contribution principale des auteurs à ceci chargent implique d'établir un système pour identifier les les deux les mots poussés et leur haut-parleur par un algorithme graphique innovateur pour l'extraction de dispositif à partir du signal de voix. Cet algorithme basé par Toeplitz réduit la quantité de calculs des opérations sur une matrice de ntimesn qui contient différents éléments de N2 à une matrice (de forme de Toeplitz) qui contient seulement les éléments de n qui sont différents entre eux.DEWEY : 621 ISSN : 0278-0046 RAMEAU : Reconnaissance de la parole-- Matrices de Toeplitz En ligne : aida@ii.pb.bialystok.pl, nammous@mail.sy [article] A Speech-and-Speaker Identification System: Feature Extraction, Description, and Classification of Speech-Signal Image = Système d'identification de la parole et de haut-parleur : Extraction, description, et classification de dispositif d'image de son articulé [texte imprimé] / Saeed, Khalid, Auteur ; Nammous, Mohammed Kheir, Auteur . - 887-897 p.
Génie Electrique
Langues : Anglais (eng)
in IEEE transactions on industrial electronics > Vol. 54 N°2 (Avril 2007) . - 887-897 p.
Mots-clés : Communication Humatronics Linear predictive coding Processing and recognition Speaker recognition Speech analysis Töeplitz matrix (TM) eigenvalues Understanding speech Communication Humatronique Codage prédictif linéaire Traitement et identification Identification d'orateur Analyse de la parole Valeurs propres de matrice de Töeplitz Parole d'arrangement Index. décimale : 621.38 Dispositifs électroniques. Tubes à électrons. Photocellules. Accélérateurs de particules. Tubes à rayons X Résumé : This paper discusses a speech-and-speaker (SAS) identification system based on spoken Arabic digit recognition. The speech signals of the Arabic digits from zero to ten are processed graphically (the signal is treated as an object image for further processing). The identifying and classifying methods are performed with Burg's estimation model and the algorithm of Toeplitz matrix minimal eigenvalues as the main tools for signal-image description and feature extraction. At the stage of classification, both conventional and neural-network-based methods are used. The success rate of the speaker-identifying system obtained in the presented experiments for individually uttered words is excellent and has reached about 98.8% in some cases. The miss rate of about 1.2% was almost only because of false acceptance (13 miss cases in 1100 tested voices). These results have promisingly led to the design of a security system for SAS identification. The average overall success rate was then 97.45% in recognizing one uttered word and identifying its speaker, and 92.5% in recognizing a three-digit password (three individual words), which is really a high success rate because, for compound cases, we should successfully test all the three uttered words consecutively in addition to and after identifying their speaker; hence, the probability of making an error is basically higher. The authors' major contribution to this task involves building a system to recognize both the uttered words and their speaker through an innovative graphical algorithm for feature extraction from the voice signal. This Toeplitz-based algorithm reduces the amount of computations from operations on an ntimesn matrix that contains n2 different elements to a matrix (of Toeplitz form) that contains only n elements that are different from each other.
Cet article discute un système d'identification de la parole et du haut-parleur (SAS) basé sur l'identification arabe parlée de chiffre. Les sons articulés des chiffres arabes de zéro à dix sont traités graphiquement (le signal est traité comme image d'objet pour une transformation plus ultérieure). Les méthodes de identification et classifiantes sont exécutées avec le modèle de l'évaluation de Burg et l'algorithme des valeurs propres minimales de matrice de Toeplitz comme outils de force pour la description de signal-image et l'extraction de dispositif. À l'étape des méthodes basées de réseau conventionnel et neurologique de classification, sont employés. Le taux de succès du haut-parleur identifiant le système obtenu en expériences présentées pour des mots individuellement poussés est excellent et a atteint environ 98.8% dans certains cas. Le taux de manque environ de 1.2% était presque seulement en raison d'acceptation fausse (13 manquent des cas dans 1100 voix examinées). Ces résultats ont prometteur mené à la conception d'un système de sécurité pour l'identification de SAS. Le taux global moyen de succès était alors 97.45% en identifiant un mot poussé et en identifiant son haut-parleur, et 92.5% en identifiant un mot de passe de trois chiffres (trois différents mots), qui est vraiment un taux élevé de succès parce que, pour des cas composés, nous devrions avec succès examiner tous trois mots poussés consécutivement en plus et après d'identifier leur haut-parleur ; par conséquent, la probabilité de faire une erreur est fondamentalement plus haute. La contribution principale des auteurs à ceci chargent implique d'établir un système pour identifier les les deux les mots poussés et leur haut-parleur par un algorithme graphique innovateur pour l'extraction de dispositif à partir du signal de voix. Cet algorithme basé par Toeplitz réduit la quantité de calculs des opérations sur une matrice de ntimesn qui contient différents éléments de N2 à une matrice (de forme de Toeplitz) qui contient seulement les éléments de n qui sont différents entre eux.DEWEY : 621 ISSN : 0278-0046 RAMEAU : Reconnaissance de la parole-- Matrices de Toeplitz En ligne : aida@ii.pb.bialystok.pl, nammous@mail.sy