Πρόλογος - ziti.gr · Σκέψεις για την 28η Οκτωβρίου 1940 ..... 62 Πεζά Χρονικό του 1940 ...
School of Mathematics Αριστοτελειο Πανεπιστημιο Aristotle...
Transcript of School of Mathematics Αριστοτελειο Πανεπιστημιο Aristotle...
R-Statistics Εισαγωγή
Iωαννης Αντωνιου Χαραλαμπος Μπρατσας [email protected] [email protected]
Μοντέλα Παλινδρόμησης και Επεξεργασία Γνώσης
ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ
Regression Models and Knowledge Processing WINTER SEMESTER
Τμημα Μαθηματικων Αριστοτελειο Πανεπιστημιο
Θεσσαλονικης
School of Mathematics Aristotle University of Thessaloniki
Τι είναι η R
R είναι μια γλώσσα προγραμματισμού για γνωσιακή επεξεργασία μέσω στατιστικής Μια σύγκριση: SPSS βασίζεται σε μενού, R βασίζεται εντολές SPSS είναι ακριβό, η R είναι δωρεάν SPSS είναι κεντρικά σχεδιασμένη, R έχει ένα μικρό
«πυρήνα» και χιλιάδες πακέτα (packages- έτοιμα προγράμματα) υποστήριξης. SPSS είναι συνήθως «μονόδρομος» για μια ανάλυση, R
συνήθως υπάρχουν πολοί τρόποι για να κάνεις την ίδια ανάλυση SPSS έχει σχεδιαστεί ώστε να είναι εύκολο "φιλικό", R απαιτεί επίπεδο γνώση στατιστικής και προγραμματισμού
Γιατί να μάθω την R
Συζητιέται πολύ
http://r4stats.com/articles/popularity/
Την παρακολουθούν πολλοί
http://r4stats.com/articles/popularity/
Ο αριθμός των θέσεων εργασίας - πιο δημοφιλές λογισμικό (U.S. analytics 2/2014).
Αριθμός των διαθέσιμων θέσεων εργασίας για R και SPSS (analytics February 19, 2014)
http://r4stats.com/articles/popularity/
Εισαγωγή στην R
R website: http://cran.r-project.org/
Windows installer file: http://cran.r-project.org/bin/windows/base/R-3.0.2-win.exe
Mac installer file: http://cran.r-project.org/bin/macosx/R-3.0.2.pkg
R Windows
Rstudio
Rstudio download link: http://www.rstudio.com/ide/download/desktop
To περιβάλλον του Rstudio
Βασικά Σύμβολα στην R
Περιγραφή R σύμβολο Παράδειγμα
Σχόλια # # αυτό είναι σχόλιο Απόδοση τιμής <- x<-sin(pi/2) Τελεστής παράθεσης c c(1,3.5,2.8) Στοιχείο επί στοιχείο
πολλαπλασιασμός * a*b Ύψωση σε δύναμη ^ a^b Υπόλοιπο διαίρεσης ακεραίων x/y %% 17%%5 Πηλίκο διαίρεσης ακεραίων x/y %/% 17%/%5 Ακολουθία αριθμών από a έως b
ανά h seq seq(0,20,2) Ακολουθία αριθμών ανά 1 : 0:20
Απόδοση τιμής - Ονομασία Αντικειμένων Ονόματα Κεφαλαία και πεζά λατινικά γράμματα, με τα ψηφία 0-9 σε οποιαδήποτε μη αρχική θέση και την τελεία ".", εκτός από περιπτώσεις όπως .49, 12.3, όπου θεωρείται ως υποδιαστολή δεκαδικού αριθμού
Διαχωριστικό των λέξεων:
. ή _
Ορισμένα ονόματα δεν τα χρησιμοποιούμε γιατί είναι εντολές
Σύνηθες Συναρτήσεις στην R Περιγραφή R σύμβολο Παράδειγμα ημίτονο, συνημίτονο, εφαπτομένη sin,cos,tan sin(pi/3) (=0.866..)
τόξο ημιτόνου, συνημιτόνου, εφαπτομένης αsin,αcos,αtan atan(seq(0,1,.25))/pi τετραγωνική ρίζα Sqrt sqrt(x) ακέραιο μέρος x, x floor(x), ceiling(x) φυσικός λογάριθμος Log log(x) Εκθετική συνάρτηση ex ex exp(x) παραγοντικό n! factorial(n) τυχαίοι αριθμοί στο (0,1) runif runif(100) τυχαίοι κανονικοί αριθμοί rnorm u=rnorm(100000,2,4) κανονική κατανομή pnorm, dnorm pnorm(1,2,4)
βαθμίδες, διάταξη rank, sort z=floor(10*runif(10));z; rank(z);sort(z)
διασπορά, συνδιασπορά var, cov var(u), cov(x,y) τυπ. απόκλιση, συντ. συσχέτισης sd, cor sd(u), cor(x,y)
ΑΝΤΙΚΕΙΜΕΝΑ ΣΤΗ ΓΛΩΣΣΑ R • Διανύσματα - Πίνακες
– Τα στοιχεία των διανυσμάτων μπορεί να είναι αριθμητικές ή λογικές τιμές ή και συμβολοσειρές (strings), δεν μπορούν όμως να αναμειγνύονται
– Πίνακες mxn διάστασης με στοιχεία ίδια με τα διανύσματα
• Λίστες – Πλαίσια (Frames) – Η λίστα είναι μία συλλογή ανόμοιων πληροφοριών που
αφορούν το ίδιο άτομο ή κατάσταση. – Ένα πλαίσιο δεδομένων είναι μία λίστα μεταβλητών
ίδιου μήκους αλλά ενδεχομένως διαφορετικού τύπου
Παραδείγματα στην R