BOUSSAIDI AbdellahCHAÏB IsmaïlESI, 06/04/2009
Introduction au
Datamining Concepts et techniques
Problème?
Montagne de données
connaissances
??
???
Datamining
Quoi Comment Jusqu’ou
?
Le datamining est un processus de découverte de connaissances
Bases de données et Datawarehouses
Datamining
connaissances
Quoi?
Pourquoi?
• Description
•Prédiction
Exemples d’application
• Segmentation des clients • Déterminer le panier de la ménagère • Détection de Fraude
Champs d’application
Avantages
Meilleure prise de décision
Renforcer la positioncompétitive de l’entreprise Transformer des masses de
données en information utile
Identifier les facteurs qui déterminent le comportement du client ;
Identifier les investissements les plus profitables et les moins couteux.
Quoi Comment Jusqu’ou
?
Le datamining est un processus itératif
Formaliser le
problème
Collecter les
données
Prétraitement des
données
Estimer le modèle
Interpréter le modèle
Application du processus de datamining : Les Télécoms
Formaliser le problème
Problématique:
• Segmentation des clients
• Taux de turn-over
Collecte de données
• Informations clients (nom, prénom, âge, profession..etc.);
• Durée d’appel par client;
• Heures d’appels;
• Appels non aboutis;
• …etc.
Prétraitement des données
• Atténuer le bruit Enlever les informations non pertinentes
• Sélectionner les données utiles Mieux vaut tout prendre !
• ACP…etc.
16Google Confidential
Estimer le modèleSélectionner le modèle adéquat
Réseaux De Neurones
RéseauxBayésiens
LogiqueFloue
SVM
ArbresDe décision
Metaheuristique
MéthodesStatistique
régression
17Google Confidential
Estimer le modèle
Vérification
Validation
MéthodesD’apprentissage
Réechan
• Implémenter la technique approprié
RéseauxBayésiens
LogiqueFloue
SVM
Réseaux De Neurones
18Google Confidential
Estimer le modèle
TechniquesDe datamining
Estimation
De l’erreur
Implémentation
logiciel
19Google Confidential
Interpréter le modèle et tirer les conclusions
Résultats
Interpréter le modèle et tirer les conclusions
Quoi Comment Jusqu’ou?
Le text mining
Le Text Mining
Text MiningProcess
Pourquoi?
80% de l’information enregistrée,
l’est sous forme textuelle
Quoi Comment Jusqu’ou?
Logiciels de datamining
Poids lourds• SAS• SPSS Clementine• Weka (Open-source)
Tendance : datamining dans la base de données
• Oracle Darwin Suite• SQL Server Analysis Services
Limites du datamining
• Effort considérable de développement.
• Etat inapproprié des données.
Perspectives
• Analyse de plus de données dans un minimum
de temps
• Exploration plus approfondie des données
• Datamining pour les PMEs.
• Datamining « domestique »
Conclusion
Données
Informations
Connaissances
Datamining
Merci pour votre
attention