Ada beberapa kriteria kebaikan model yang harus terpenuhi oleh model persamaan yang dihasilkan oleh rumpun analisis regresi logistik (biner, multinomial dan atau ordinal). Pada prinsipnya pemahaman dasar dapat diperoleh dari analisis regresi karena secara umum adalah sama yaitu menguji secara umum model persamaan regresi dan uji keberartian variabel secara parsial.
Beberapa teknik pengujian pada rumpun analisis regresi logistik (biner, multinomial dan atau ordinal) diantaranya uji rasio likelihood, uji wald, deviansi, uji hosmer-lemeshow dan kriteria informasi. Secara definisi dan pemahaman dalam penggunaannya kita akan coba uraikan secara singkat satu per satu pada uraian berikut.
- Uji Rasio Likelihood
Misalkan dimiliki 2 model regresi logistik untuk dataset yang sama dengan model regresi kedua tersarang dalam model pertama. Maka model pertama dinamakan model lengkap (full model-model dengan semua parameter), sedangkan model kedua dinamakan model tereduksi (reduced model-model hanya konstanta atau sebagian parameter).
Uji statistik untuk memperbandingkan kedua model tersebut dapat dilakukan dengan uji rasio likelihood. Jika model pertama memiliki fungsi likehood −2 ln L1 dengan (p + k) parameter dan model kedua memiliki fungsi likehood −2 ln L2 dengan p parameter, maka statistik pengujinya adalah:
Dimana persamaan di atas berdistribusi khi-kuadrat dengan derajat bebas (p + k) – p = k. Seandainya hasil uji statistik tidak menunjukkan perbedaan antara model lengkap dengan model tereduksi, maka berdasarkan prinsip parsimoni yang dipilih adalah model tereduksi.
- Uji Wald
Dengan uji rasio likelihood dapat diuji kemaknaan 1 ataupun beberapa prediktor (variabel bebas) sekaligus. Jika uji melibatkan dua atau lebih prediktor dan diperoleh hasil bermakna, tidak diketahui prediktor mana saja yang menyebabkan kemaknaan tersebut. Uji Wald menguji kemaknaan tiap prediktor satu demi satu, masing-masing terhadap hipotesis H0 : bj = 0.
Sebagian ahli Statistika menganggapnya sebagai pengujian ganda (multiple testings) yang memerlukan koreksi untuk kesalahan tipe I-nya, misalnya dengan metode Bonferroni.
Statistik penguji untuk uji Wald adalah:
Dimana persamaan di atas berdistribusi normal baku. Jika hendak digunakan koreksi Bonferroni, maka seandainya terdapat (p + 1) parameter dalam model (b0 ,b1, . . . ,bp ) dan akan digunakan tingkat signifikansi, maka batas kemaknaan yang seharusnya digunakan adalah:
- Deviansi
Deviansi (deviance) merupakan ukuran kebaikan-suai (goodness of fit; GOF) yang lazim digunakan untuk model regresi logistik. Deviansi adalah rasio antara fungsi likelihood model peneliti dengan fungsi likelihood model jenuh:
Lc : Likelihood model peneliti, yaitu model yang menggunakan estimasi koefisien regresi b dan akan dihitung deviansinya. Lmax : Likelihood model jenuh
Model jenuh (saturated model) adalah model yang jumlah parameternya sama dengan ukuran sampel. Model jenuh akan menghasilkan prediksi nilai-nilai respons yang sempurna:
Deviansi memiliki rentang nilai yang berkisar dari nol sampai dengan positif tak berhingga. Jika model peneliti memiliki (p + 1) parameter, maka deviansinya dianggap berdistribusi khi-kuadrat dengan derajat bebas {(n – (p + 1)} = (n – p – 1). Uji hipotesis kebaikan-suai dengan statistik deviansi menguji hipotesis H0 : Model sesuai data vs H1 : Model tak-sesuai data.
Dalam kenyataannya, uji hipotesis kebaikan-suai dengan statistik deviansi ini dapat menggunakan individu anggota sampel ataupun kelompok pola kovariat sebagai unit analisis. Kelompok pola kovariat (covariate pattern group) adalah kelompok yang beranggotakan subjek yang memiliki himpunan nilai prediktor yang sama. Penggunaan unit analisis yang berbeda ini akan menghasilkan nilai statistik penguji yang berbeda (rumus perhitungannya memang berbeda) dengan derajat bebas yang berbeda pula.
Pada uji hipotesis yang menggunakan kelompok pola kovariat sebagai unit analisis, maka jika jumlah kelompok pola kovariat sama dengan k, statistik penguji dianggap berdistribusi khi-kuadrat dengan derajat bebas {k – (p + 1)} = (k – p – 1).
Statistik deviansi juga dapat digunakan pada uji rasio likelihood yang memperbandingkan dua model hirarkis, yaitu model pertama tersarang dalam model kedua. Jika model pertama memiliki statistik deviansi Dev1 (b) dengan jumlah parameter (p1 +1) dan model kedua memiliki statistik deviansi Dev2 (b) dengan jumlah parameter (p2 +1), maka statistik penguji rasio likelihood-nya adalah:
Dimana persamaan di atas yang berdistribusi khi-kuadrat dengan derajat bebas (p1 + p2).
- Uji Hosmer-Lemeshow
Sebagian ahli menganggap uji kebaikan-suai 1 model dengan statistik deviansi kurang valid karena pada uji untuk 1 model statistik deviansi kurang mendekati distribusi khi-kuadrat. Perbaikannya adalah dengan uji Hosmer-Lemeshow, yang juga merupakan uji khi-kuadrat tetapi bukan terhadap kelompok-kelompok pola kovariat, melainkan kelompok kuantil. Kuantil yang lazim digunakan adalah desil, dengan membagi sampel menjadi 10 desil.
- Kriteria Informasi
Kriteria informasi (informational criteria) adalah statistik untuk model yang estimasi parameternya diperoleh dengan memaksimumkan fungsi likelihood-nya, digunakan untuk memperbandingkan kebaikan-suai 2 model hirarkis (salah satu model tersarang dalam model lainnya) ataupun 2 model non-hirarkis. Dua kriteria informasi yang dibahas di sini yaitu AIC (Akaike’s Informational Criteria) dan BIC (Bayesian Informational Criteria).
Pada perbandingan 2 model dengan statistik AIC dan BIC tidak dikenal distribusi statistik penguji, sehingga nilai p-nya tak dapat dihitung. Model yang dipilih adalah model dengan nilai AIC dan BIC yang lebih kecil. Kriteria penilaian selisih relatif nilai AIC antara 2 model A dan B dengan asumsi AICA < AICB menurut Hilbe (2009) adalah:
Kriteria penilaian selisih absolut nilai BIC antara 2 model A dan B dengan asumsi BICA < BICB menurut Raftery (1986) adalah:
Untuk memperluas dan memperdalam pemahaman terhadap uji kebaikan dari rumpun model regresi logistik, lebih lanjut para peneliti atau data master bisa mempelajari melalui literatur yang lebih lengkap dan mengaplikasikan data riil pada software statistik rujukan (mis : SPSS) untuk mendapatkan gambaran riil angka pengujian yang diperoleh terhadap rumpun model regresi logistik yang dihasilkan dari data. SEMANGAT MEMPELAJARI!!!
Sumber Buku : Johan Harlan, Univ. Gunadarma.
——————————————————————————————————————————————————————————
- Jika rekan peneliti memerlukan bantuan Survey Lapangan, Survey Online ataupun Olah Data dapat menghubungi mobilestatistik.com di :
- WhatsApp : 081321709749
- Email : welcome@mobilestatistik.com
- Klik “Konsultasi Gratis” untuk mendapatkan informasi atau solusi terkait dengan pertanyaan-pertanyaan seputar metodologi penelitian.
——————————————————————————————————————————————————————————