Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de...
Transcript of Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de...
Filière Data Mining(Fouille de données)
Pierre Morizet-Mahoudeaux
Plan
• Objectifs
• Débouchés
• Formation
• UVs spécifiques
• UVs connexes
• Enseignants et partenaires
Structure générale des études à l’UTC
1
2
3
Fondamental Training
1st InternshipFondamental&Specialisation
Specialisation 2nd InternshipRèglement des études :
-Minimum 22 UVs réussies-Dont 14 dans lescatégories CF/CP
-NPML, communication-Culture générale-Validation stage et projet
Structure du département GI
Pierre Morizet
Les séjours à l’étranger
Double-diplômes :Cranfield (UK)Saragosse (Esp)Turin (It)*
Photographie d’une promotion
• Flux moyen : 150 diplômés par an• Profil moyen d’un diplômé du GI– 25 UV environ.• Dont 18 CF/CP• Plus de 3 mentionnées– 2 semestres en entreprise
• Quelques chiffres– Près de 40% ont passé au moins 6 mois dans un pays étranger– Plus de 20% sortiront avec 2 diplômes (DEA, Masters étrangers)
Objectifs
• Les entreprises et administrations sont confrontées à desdonnées surabondantes
•Extraire des informations permettant de faciliter les prisesde décision.
•Former des ingénieurs “mineurs” de données
– information = minerai
– ingénieur = mineur
Constat
Besoin
Réponse
Débouchés
•Deux orientations
– Informatique décisionnelle
– Gestion d’entrepôts de données
• Secteurs d’activités très variés :
– Entreprises utilisatrices : des multinationales à l’administrationen prililégiant les banques et les assurances ;
– Sociétés de Services et d’Ingénierie Informatiques (SSII)
– Editeurs de logiciels (SAS, SPPS...).
Débouchés
•Domaines d’applications
– Analyse de risque: assurance
– Analyse financière: tendance boursière
– Décisionnel : stratégie industrielle et commerciale
– Marketing: prospection de clients, CRM
– Médecine: recherche de structures génétiques,
– Prédiction : pic de pollution
– Gestion de stock
– ...
Formation
•Objectif double :
– structurer et constituer de vastes entrepôts de données àpartir de systèmes parfois hétérogènes
– « fouiller » ces données pour
• répondre à des questions précises,
• tester des hypothèses,
• réaliser des prédictions ou découvrir des relations cachées.
Formation UV’s spécifiques
•NF26 : Data Warehouse et décisionnel
• Principes de développement et d'exploitation des outilsinformatiques pour
• la conception et l'exploitation d'entrepôts de données
• la prise de décision
Concepts de base des modèles multidimensionnels;
Alimentation;
Interrogation, requêtage, OLAP (On-Line Analytical Processing).
Outils décisionnels (régression, CRM, tableaux de bord, …)
NF26
SY09
SY19
AP
MetadonnéesAnalysed’Impacts
Origine desdonnées
TempsRéel
Batch
Sources de données
Bases
ApplicationsMétiers, ERP
Fichiers, Web,XML, COBOL
BO Enterprise
PilotageReporting
Interrogation Analyses
Data WarehouseDat
a p
rofi
ling
MoteurETL
BO Data Integrator
Data Auditing
Data Validation
DataCleansing
Formation UV’s spécifiques
• SY09: Analyse de données pour le Data Mining
• Visualisation des données
• Exploration statistique
• Classification automatique
• Regression
NF26
SY09
SY19
AP
Formation UV’s spécifiques
• SY19 : Méthodes de décision statistiques
• Théorie de la décision
• Reconnaissance des formes
• Réseaux de neurones à couches
• Arbres de décision
NF26
SY09
SY19
AP
Formation UV’s spécifiques
• Atelier projet (en cours d’élaboration)
• En partenariat avec des industriels,
• Des problèmes concrets
• Réalisé par groupe de deux étudiants
• Suivi par un enseignant de l’équipe pédagogique de la filière.
NF26
SY09
SY19
AP
FormationsUVs Connexes
• Prérecquis du profil commun de branche
• SY02: Méthodes statistisques pour l’ingénieur
• NF16: Algorithmique et structures de données
• NF17: Bases de données
• UV’s liées:
• GE40: Management de projets
• LO17: Recherche d’information: indexation et multimédia
• LO18: Projet multimédia
• SR03: Programmation des applications internet
• LO20: Génie logiciel
• RO04: Optimisation discrète et continue
• RO05: Processus stochastiques
• RO06: Simulation et technique d’optimisation
• SY23: Vision et image
Enseignants et partenaires
• Partenaires industriels
• EDF,
• Micropole-Univers,
• Exalead
• KXEN
• SAS
• CEA
• ..
• Equipe pédagogique
• Stéphane Crozat (UTC),
• Thierry Denœux (UTC),
• Gérard Govaert (UTC),
• Pierre Morizet (UTC),
• Samuel Samson (Micropole-Univers)
Promotions FD
• Depuis l’automne 2004 20 étudiants/an en moyenne
• Domaines couverts en stages et projets– Informatique financière, workflow, reporting,
– traitement d’images, analyse de procédé,
– business intelligence, datawarehouse, décisonnel
– analyse multivariée, modèles prédictifs, règles d’association
• Entreprises ayant accueilli des projets de fin d’études FD– Bios-groupe Keyrus, Business & Decision, Cadexan, Cap
Gemini, CERF, CEA, CSC Infogerance, Dassault Systems,Ernst & Young, France Télécom, GDF, General Electric, GEHealthcare System, Glaxowellcome, IBM, INRIA, LegrandS.A, Logia-CMG-Unilog, Mereo, Mircropole Univers, Parexelinternational, PSA, Siemens, Société Générale, Solystic,Umanis Nord, Universités, …
Merci de votre attention…