Business Intelligence Vorstellung der Ergebnisse des Business Intelligence Projekts

Business Intelligence

Vorstellung der Ergebnisse

des Business Intelligence Projekts

Master Digitale Logistik und Management

Präsentiert von: Maxim Beifert, Mohamed Oukettou

Gliederung

Ist-Situation und Datenvorbereitung• Datensäberung• Datenreduktion

Data Mining Verfahren• Naive Bayes• Clustering mit K-Means• J48/ ID3

• Schlussfolgerung

Ist-Situation und Datenvorbereitung

Ist-Situation:

Insgesamt 54 und 234 Datensätze. Verschiedene Themen (Finanzen,

Wohnsituation, Studium, Freizeit, Verkehrsmittel, Zufriedenheit).

Datenvorbereitung• Datensäuberung: fehlende Daten manuell einfügen. inkonsistente Daten Betriebswirtschaft- Bachelor BW Wirtschaftsinformatik- Bachelor WI

Datenvorbereitung

• Datenreduktion (Ausgangspunkt 54*234= 12636) auf 34 Spalten und Datensätze von 234 auf 229 (34*229= 7786)

Ausblenden von Attributen: z.B wie bewegst dich in Wismar (Anderes und

Motorad) fast 100% benutzen kein Motorad sowie keinen anderen

Verkehrsmittel

Entfernen von Datensätze

Zusammenfassen von Attributen:– In welchen Wohnverhältnissen lebst du (Eigentumswohnung- Mietwohnung- Wohngemeinschaft-

Studentenwohnheim- Eltern)

– wie kommst Du zur Hochschule (Bahn, Bus, Auto, Fahrrad, ZuFuß)

– Wie bewegst Du Dich in Wismar (Bus- Auto- Fahrrad- Zu Fuß)

Datenvorbereitung

Finanzen Wohnsituation Studium Freizeit Verkehrsmittel Zufriedenheit

-Bafög- finanzielle Unterstützung - Arbeit- Budget

-Wohnverhältnis- Fläche

-Studiengang- Semester- Erstsudium- Grund für S in Wismar-Leistung im S

-Fernseher - Fernseh (Std)- Onlinespiele- (Std)-Sport-WE in Wismar

-Ankunft nach Wismar- Bewegung in Wismar

-Zufriedenheit mit der Lebens-situation- Zufriedenheit mit der S Leistung

Ziel: Zufriedenheit mit der aktuellen Lebenssituation als Student in Wismar vorhersagen

Data Mining Verfahren

• Naive Bayes:

Am Anfang wählen wir alle KategorienUnd erzielen wir die Ergebnisse:


• In einer anderen Vorgehensweise nehmen wir die Kategorien im einzelnen Die Tabelle zeigt die erzielten Ergebnisse

Themen Accuracy % ; Anzahl von Daten

Error % ; Anzahl von Daten

Finanzen 45,6 ; 21 54,3 ; 25

Studium 41,3 ; 19 58,6 ; 27

Wohnsituation 52,1 ; 24 47,8 ; 22

Freizeit 45,6 ; 21 54,3 ; 25

Zufriedenheit 52,1 ; 24 47,8 ; 22

Verkehrsmittel 58,6 ; 27 41,3 ; 19


• Clustering K-Means

• K= 5 k= 4


• Clustering K-Means


• Entscheidungsbaum mit J48 und ID3 • J48


• J 48

Themen Accuracy % ; Anzahl von Daten

Error % ; Anzahl von Daten

Finanzen 47,8 ; 22 52,17; 24

Studium 30,4; 14 69,5%; 32

Wohnsituation 47,8; 22 52,1; 24

Freizeit 54,3; 25 45,6; 21

Zufriedenheit 47,8; 22 52,1; 24

Verkehrsmittel 43,4; 20 56,5; 26


• ID3• Im allgemein das Verfahren von ID 3 Algorithmus sieht aus wie J48

Schlussfolgerung

• Umsetzung die Theorie in der Praxis

• Verwendung von verschiedenen Verfahren des Data Mining

• mit dem Naive Bayes Verfahren erzielt man die besten Ergebnisse

• J48 und ID3 sind Verfahren zur Generierung von Entscheidungsbäume

und liefern fast die gleiche Egebnisse

Business Intelligence Vorstellung der Ergebnisse des Business Intelligence Projekts

Documents

Transcript of Business Intelligence Vorstellung der Ergebnisse des Business Intelligence Projekts