| Titre : |
Détection intelligente de la fraude dans les sinistres d’assurance santé |
| Type de document : |
document électronique |
| Auteurs : |
Nour Safouane Abdellaziz, Auteur ; Imene Bareche, Directeur de thèse |
| Editeur : |
[S.l.] : [s.n.] |
| Année de publication : |
2025 |
| Importance : |
1 fichier PDF (3.7 Mo) |
| Présentation : |
ill. |
| Note générale : |
Mode d'accès : accès au texte intégral par intranet.
Mémoire de Projet de Fin d’Études : Génie Industriel.Date Science et intelligence artificiel : Alger, École Nationale Polytechnique : 2025
Bibliogr. p. 116 - 121 |
| Langues : |
Français (fre) |
| Mots-clés : |
Assurance santé
Fraude
Apprentissage automatique
Labellisation
Semi-supervisée
Random Forest
SHAP
SMOTE
GNN
AXA |
| Index. décimale : |
PI00125 |
| Résumé : |
La fraude à l’assurance santé constitue un enjeu majeur pour les compagnies d’assurance, en raison de son impact financier croissant et de la complexification des schémas frauduleux. Dans un contexte où les approches traditionnelles reposant sur des règles fixes montrent leurs limites, ce mémoire propose une méthodologie innovante de détection automatisée de la fraude, en combinant techniques de data science, apprentissage automatique et expertise métier. Le travail a été mené dans le cadre d’un stage au sein d’AXA Assurance Algérie, à partir de données réelles de gestion des sinistres santé. L’approche développée repose sur une stratégie de labellisation semi-supervisée fondée sur des règles métier, la construction de variables comportementales par sinistre et par bénéficiaire, la réduction de dimensionnalité via l’analyse en composantes principales (PCA), et l’utilisation de modèles d’ensemble (Random Forest, régression logistique, VotingClassifier). Des techniques d’équilibrage comme SMOTE ont permis d’atténuer le déséquilibre entre classes, tandis que des outils d’explicabilité tels que SHAP et LIME ont renforcé l’interprétation des résultats.
Les résultats expérimentaux montrent une performance robuste, avec une AUC de 0,937 et un rappel de 79 % sur la classe fraude. Une discussion critique met en évidence les limites liées à la qualité des labels et à l’absence de données relationnelles, tout en proposant des pistes d’amélioration, notamment par l’intégration de modèles graphiques (GNN), l’apprentissage actif et l’industrialisation MLOps. Ce mémoire offre ainsi une base méthodologique solide et adaptable pour le développement de systèmes intelligents de détection de fraude en assurance santé. |
Détection intelligente de la fraude dans les sinistres d’assurance santé [document électronique] / Nour Safouane Abdellaziz, Auteur ; Imene Bareche, Directeur de thèse . - [S.l.] : [s.n.], 2025 . - 1 fichier PDF (3.7 Mo) : ill. Mode d'accès : accès au texte intégral par intranet.
Mémoire de Projet de Fin d’Études : Génie Industriel.Date Science et intelligence artificiel : Alger, École Nationale Polytechnique : 2025
Bibliogr. p. 116 - 121 Langues : Français ( fre)
| Mots-clés : |
Assurance santé
Fraude
Apprentissage automatique
Labellisation
Semi-supervisée
Random Forest
SHAP
SMOTE
GNN
AXA |
| Index. décimale : |
PI00125 |
| Résumé : |
La fraude à l’assurance santé constitue un enjeu majeur pour les compagnies d’assurance, en raison de son impact financier croissant et de la complexification des schémas frauduleux. Dans un contexte où les approches traditionnelles reposant sur des règles fixes montrent leurs limites, ce mémoire propose une méthodologie innovante de détection automatisée de la fraude, en combinant techniques de data science, apprentissage automatique et expertise métier. Le travail a été mené dans le cadre d’un stage au sein d’AXA Assurance Algérie, à partir de données réelles de gestion des sinistres santé. L’approche développée repose sur une stratégie de labellisation semi-supervisée fondée sur des règles métier, la construction de variables comportementales par sinistre et par bénéficiaire, la réduction de dimensionnalité via l’analyse en composantes principales (PCA), et l’utilisation de modèles d’ensemble (Random Forest, régression logistique, VotingClassifier). Des techniques d’équilibrage comme SMOTE ont permis d’atténuer le déséquilibre entre classes, tandis que des outils d’explicabilité tels que SHAP et LIME ont renforcé l’interprétation des résultats.
Les résultats expérimentaux montrent une performance robuste, avec une AUC de 0,937 et un rappel de 79 % sur la classe fraude. Une discussion critique met en évidence les limites liées à la qualité des labels et à l’absence de données relationnelles, tout en proposant des pistes d’amélioration, notamment par l’intégration de modèles graphiques (GNN), l’apprentissage actif et l’industrialisation MLOps. Ce mémoire offre ainsi une base méthodologique solide et adaptable pour le développement de systèmes intelligents de détection de fraude en assurance santé. |
|