Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian...
Transcript of Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian...
![Page 1: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/1.jpg)
STK335 Analisis Eksplorasi Data Pertemuan 07
Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaran
Bagus Sartono
![Page 2: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/2.jpg)
Outline
• Pendahuluan
• Ladder Transformation (Tukey, 1977)
• Box-Cox Transformation
![Page 3: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/3.jpg)
Mengapa Butuh Penduga yang Kekar (Robust)
• Terdapat kemungkinan adanya pencilan (outlier) dalam data yang kita miliki
• Sebaran dari data tidak selalu sama dengan yang kita asumsikan
• Perspektif lain: – Tidak semua orang rajin melakukan screening terhadap data
– Proses screening bisa jadi membuang-buang waktu
– Pada data multivariate, tidak mudah mendeteksi pencilan
– Pada pendugaan ukuran penyebaran, membuang pencilan akan menyebabkan penduganya bersifat under-estimate
![Page 4: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/4.jpg)
Apa itu statistik yang kekar?
• Statistik yang tidak sensitif jika ada pelanggaran asumsi atau data-data yang menyebabkan sebarannya sedikit berbeda dengan yang diasumsikan
![Page 5: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/5.jpg)
Ukuran Pemusatan yang Kekar
• Median
• Trimmed Mean (rataan terpangkas, rataan terpancung)
• Winsorized Mean
• M-estimator (penduga M)
![Page 6: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/6.jpg)
Median
siapa tidak kenal median?
![Page 7: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/7.jpg)
Trimmed Mean
• Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1
• Artinya sebanyak n data paling besar dan n data paling kecil disisihkan dan tidak ikut dalam perhitunganr rataan.
• Jika nilai αn tidak integer, bagian bilangan integer-nya yang digunakan
![Page 8: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/8.jpg)
M-estimator
• Prinsip dasar: memberikan bobot yang lebih kecil kepada data-data pencilan
![Page 9: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/9.jpg)
Ukuran Penyebaran yang Robust
• Ragam dan simpangan baku adalah ukuran penyebaran yang banyak digunakan. Namun keduanya sensitif terhadap keberadaan pencilan.
• Beberapa ukuran penyebaran yang kekar: – IQR, interquartile range, jarak/jangkauan antar kuartile
– MAD, median absolute deviation
– Gini’s mean difference
![Page 10: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/10.jpg)
IQR (inter quartile range)
• IQR didefinisikan sebagai selisih antara kuartil ketiga dengan kuartil pertama
IQR=Q3 – Q1
• Pada data yang menyebar normal, nilai simpangan baku adalah sebesar 1.34898 IQR.
![Page 11: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/11.jpg)
MAD (median absolute deviation)
• Merupakan ukuran penyebaran kekar yang paling banyak digunakan
• Definisi
MAD = median {|xi – median(x)|}
• Tahapan perhitungan – Hitung median dari data, beri nama median(x)
– Hitung selisih mutlak dari setiap data terhadap median(x)
– Hitung median dari selisih mutlah
• Pada data yang menyebar normal, nilai simpangan baku adalah sebesar 1.4826 MAD
![Page 12: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/12.jpg)
Gini’s mean difference
• Merupakan rata-rata dari setiap selisih antar amatan
• Pada data yang menyebar normal, simpangan baku dapat didekati sebesar G / 2
![Page 13: Penduga Kekar untuk Ukuran Pemusatan dan …Trimmed Mean • Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1 • Artinya sebanyak n data paling besar dan n data](https://reader030.fdocument.pub/reader030/viewer/2022040221/5e333d95efec220b44269b9b/html5/thumbnails/13.jpg)
• Prosedur di SAS yang dapat digunakan untuk menghasilkan nilai penduga kekar: – UNIVARIATE – STDIZE
• Ilustrasi proc univariate data=data robustscale trimmed=0.2
winsorized=0.2; var x; run;
proc stdize data=data method=huber pstat; var x; run;