dr.Ari
Probandari
Statistik itu ibaratnya alat. Kita harus
tahu kapan kita pake uji A, uji B, dst. Seperti juga kalo pake alat. Harus tahu
kapan pake obeng, kapan pake palu, dst.
Simpel
kan? So, jangan takut belajar statistic.
Tak
kenal maka tak sayang, jadi kita kenalan dulu sama si statistic.
Statistik adalah sebuah ilmu yang
pertumbuhannya seiring dengan perkembangan ilmu. Salah satu pengembangan ilmu
itu dengan meneliti. Nah, buat mengujinya maka pake statistic.
Jadi, statistic itu
1.
Untuk mendesain besar sampel
2.
Memeragakan/mendisplay hasilnya
3.
Mengambil kesimpulan
Kalo biostatistik, berarti statistic yang
diterapkan pada bidang kesehatan.
Statistik ada 2
1.
Statistic deskriptif: Cuma mendeskripsikan,
merangkum.
2.
Statistik inferensi: menghubungkan data dari
sampel untuk memperkirakan apa yang terjadi di populasi.
Uji statistic ada 2;
1.
Uji statistic parametric
2.
Uji statistic non parametric
Parametrik berasal dari kata parameter,
maksudnya ukuran. Ukuran apa? Ukuran tentang distribusi normal.
(ini
udah dijelasin sama pak wid kemarin teman…)
Skala ada 2
1.
Skala kategorikal
2.
Skala numeric: skala yang bisa diukur dengan
angka
(ini
juga udah dijelasin sama dr.muth teman…)
Jadi, langkahnya tu kita harus tahu dulu,
data kita itu numeric atau kategorikal.
Uji-uji statistic parametric dengan
distribusi normal bisa digunakan untuk yang datanya numeric.
Kalo datanya kategorik, berarti pake uji
statistic nonparametric.
Distribusi normal tu jadi syarat buat nguji
pake parametric.
Walaupun itu numeric, kalau distribusinya ga
normal, ya ga bisa pake parametric.
Contoh uji parametric: uji T, anova. (kayak yang dijelasin pak wid kemarin lah
teman…)
Distribusi normal itu adalah distribusi data
yang bentuknya seperti bell terbalik.
Jadi ntar ada nilai tertinggi yang sedikit,
nilai terendah juga dikit, tapi nilai yang sedang-sedang alias mean jadi
banyak.
(Jadi
bener kata pak wid kemarin teman. Kalo di distribusi normal tu mean, modus,
median sama alias saling berhimpit. Soalnya yang sering muncul kan di bagian
tengah. Sama aja median kan. Rata-ratanya juga otomatis di tengah-tengah itu)
Deviasi itu simpangan. Maksudnya simpangan
dari rerata.
Misalnya ada penelitian cek nilai IPK
mahasiswa PD09. Dari nilai itu ntar ada rerata (jumlah seluruh nilai dibagi
n-nya), dilihat juga modus, median, simpangannya.
Varian itu kuadrat dari standar deviasi.
(Kita
suruh liat buku teman tentang rumus-rumusnya)
Teori Central Limit:
Semakin banyak N-nya (semakin banyak ukuran
sampel) maka distribusinya makin normal.
Antara ngukur sampel 40 orang dengan 200
orang, gambarannya akan beda kan. Yang 200 jadi lebih merepresentasikan
populasinya.
(Ini
juga udah dijelasin pak wid)
Menentukan besar sampel ada 3 pendekatan.
1.
Pake rumus. Mau beda proporsi atau beda mean
idealnya berapa (udah dijelasin
prof.bhisma ni)
2.
Pendekatan power. Maksudnya kita nentui dulu
jumlah sampelnya. Misal ambil 50 sampel. Pertanyaannya, berapa kekuatan
penelitian kalau sampel 50.
3.
Rule of thumb. Aturan umum. Jadi sampel yang
diambil pake aturan umum yaitu 30 sampel.
(Kita
suruh nyari lagi ni, soalnya udah dijelasin tapi kita belum mudheng. Hehe)
Dari distribusi normal itu ada 2 data yang
penting yaitu:
-
Skewnes (kemiringan)
Distribusi
normal kemiringannya 0
-
Kurtosis (kelancipan)
Bagaimana cara tahu kalau data kita
terdistribusi normal?
1.
Gambar kurva distribusi normal
2.
Menghitung skewness (kemiringan) dan
kurtosis (kelancipan)
Ada
yang bilang kalo antara -1 sampe 1. Tapi ada yang bilang kalau antara 0 sampe
1.
3.
Pake tes uji normalitas. Misal kolmogorof
smirnov, salphiro wilk test
NON
PARAMETRIK
Data numeric/kategorikal. Numerik bisa uji
hipotesis uji perbedaan. Melihat perbedaan kadar kolesterol rata-rata mahasiswa
FK. Trus bandingkan populasi mahasiswa FK yang lain. Sama atau ga.
Harus tahu dulu numeric atau kategorikal.
Trus estimasti pada populasi beda atau ga.
Kayak gini ini namanya uji statistic hipotesis data numeric untuk satu grup.
Satu grup tu maksudnya dibandingkan dengan populasinya.
Di dalam kotak-kotak (di bukunya dr.ari) ada yang parametric dan nonparametric.
Parametrik ada T test.
Nonparametriknya ada “blablabla” (Lihat di bukunya dr.Ari aja ya…)
Cara menentukan tergantung:
-
Jenis data apa
-
Penelitian apa
-
Distribusi normal atau ga
Uji beda artinya kita membandingkan 2 pengukuran.
Dua kelompok bisa kelompok berpasangan, bisa kelompok yang independent.
-
Dua kelompok yang berbeda, berarti kelompok
yang independent.
o
Uji parametric: T test independent
o
Nonparametric: Mann-whitney test, median tes
-
Kalo kelompoknya sama diukur 2 kali berarti
pair.
o
Uji parametric: pair t test
o
Nonparametric: wilcoxon, sign test
-
Kalo lebih dari 2 grup:
o
Parametric: uji anova
o
Nonparametrik: kruskal-wallis
Misal kita ditanya, kenapa pake kruskal
wallis dan bukan pake anova?
Jawabnya: soalnya data saya numeric dan saya
mau mencari rerata. Tetapi setelah saya lakukan uji normalitas, ternyata
distribusi saya tidak normal sehingga saya tidak bisa memakai anova. Maka saya
memakai kruskal wallis.
Masih
inget tentang macam-macam skala kan? Yang NOIR tu lho (Nominal, Ordinal,
Interval, Rasio)
Sedikit
menambahkan cara mengingat aja, ordinal tu dari kata order (urutan). Jadi udah
ada urutan.
Mann-Whitney
test
Untuk membandingkan sesuatu yang skalanya:
-
ordinal
-
skala numeric yang tidak terdistribusi
normal. Jadi yang aslinya numeric diubah jadi ordinal karena kita bikin ranking
jadi rendah, sedang, tinggi
Dipakai pada 2 kelompok yang jumlah n1+n2
kurang dari 30.
Jadi, kalo sampel kita kecil, kita pake uji
ini.
Gimana cara merepresentasikan?
-
Data angka, karena n-nya kecil lalu dihitung
jadi rangking. Jadi yang dihitung bukan nilai observasinya, tapi rangkingnya.
-
Trus pake tabel, ntar dapet nilai p
-
Nilai p akan diinterpretasikan
Di awal penelitian, seorang peneliti
menentukan nilai signifikansi. Umumnya 5%. Ini ntar mempengaruhi besar sampel,
dll.
Ini ntar digunakan buat menyimpulkan. Nilai
P akan kurang dari nilai signifikansi atau lebih. Kalau P-nya kurang dari 5%
artinya signifikan secara statistic.
P itu kan probabilitas alias by
chance. Maksudnya besarnya probabilitas dari nilai yang kita ukur terjadi
secara kebetulan.
Jadi kalau diulang lagi, beda hasil itu
adalah by chance (kebetulan).
Kalau nilai P-nya kurang dari 5% berarti
probabilitasnya kecil. Berarti kalau dihitung lagi terus menerus, hasilnya akan
memiliki kemungkinan lebih besar untuk sama.
Kalau P-nya besar (lebih dari 5%), kalau
kita ambil sampel dari populasi itu dan diukur lagi, bisa-bisa ada perbedaan.
Jadi, semakin P-nya kecil maka semakin
konsisten hasil penelitian kita.
Satu lagi yang diperhatikan yaitu confidence
interval. Confidence interval itu bisa untuk mengetahui perbedaan proporsi.
Misal data kita kategorik, kita bisa uji
proporsi (dalam bentu persen).
Proporsi ini bisa diestimasi pada populasi
dalam bentuk range. Namanya aja estimasi, berarti dalam bentuk range kan.
Jadi kita bisa hitung berapa range-nya.
Kalo data kita prediksinya tinggi, estimasi
akan makin sempit.
Kruskal
Wallis
Uji statistic nonparamaterik untuk kelompok
yang lebih dari 2.
(Jadi,
temennya anova ni. Tapi dia distribusi dan variasinya ga normal)
Rumusnya beda. Yang diinterpretasi nilai
P-nya.
Kalau rerata & standar deviasi termasuk ukuran
parametric test.
Kalau nonparametric, bisa lihat rangking,
median.
Jadi ntar confidence intervalnya juga bukan
confidence interval mean, tapi confidence interval skala/rangk.
Terima kasih kembali sudah berkunjung.. :)
ReplyDeletenanya dong, kalau penelitian 2 sampel independent, maunya uji beda pake uji T-test, tapi ternyata n1 jumlahnya 30 buah, sedangkan n2 cuma dapet 6 buah. bisa tetep pake T-test gak? apa harus ganti pake non-parametrik?
ReplyDeletemohon maaf.., saya sendiri kurang paham.
ReplyDeletemungkin bisa dimasukkan dulu dengan SPSS. Jika dari hasil analisis SPSS tidak memenuhi, mungkin bisa pakai non-parametrik.
mohon maaf..
wallahua'lam