Yang banyak dibicarakan ketika menggunakan metoda statistik adalah uji normalitas. Dalam konteks regresi berbeda dalam penentuan objek uji variabel-nya. Dalam penentuan suatu metode yang akan digunakan apakah rumpun parametrik atau non parametrik kita menguji normalitas data atas variabel-variabel yang akan diujikan. Sedangkan uji normalitas yang diterapkan pada regresi dalam rangkan menghasilkan model yang optimal (BLUE) yaitu salah satunya pengujian normailtas pada faktor gangguan ui (disturbace) yang dihasilkan dari model regresi.
Distribusi Probabilitas Gangguan (ui)
Seperti kita ketahui bahwa metode populis dalam menaksir persamaan regresi adalah dengan metode kuadrat terkecil biasa (ordinary least square, OLS). Dengan menggunakan metode OLS akan dihasilkan model persamaan regresi linier beserta faktor gangguan (ui). Asumsi yang dibuat mengenai ui hanyalah bahwa gangguan yang dihasilkan memiliki nilai yang diharapkan (rata-rata) nol, tidak berkorelasi dan memiliki varians konstan. Kalau tujuan dari OLS hanya untuk melakukan penaksiran titik, maka OLS akan mencukupi. Tetapi penaksiran titik hanyalah satu aspek inferensi statistik, sedangkan lainnya adalah pengujian statistik.
Jadi, perhatian kita tidak hanya dalam mendapatkan nilai koefisien regresi (b), tetapi dalam menggunakannya untuk membuat penyataan atau kesimpulan mengenai koefisien regresi (b) yang sebenarnya. Lebih umum lagi, tujuan kita bukan semata-mata untuk memperoleh fungsi regresi sampel, tetapi menggunakannya dalam mengambil kesimpulan mengenai fungsi regresi populasi. Karena tujuan kita adalah penaksiran maupun pengujian hipotesis, kita perlu menetapkan spesifikasi distribusi, utamanya pada probablitias gangguan (disturbance) ui.
Asumsi Kenormalan
Regresi linier normal klasik mengasumsikan bahwa tiap ui didistribusikan secara normal dengan rata-rata nol dan varians σ2. Kenapa harus distribusi normal? Ada beberapa alasan diantaranya :
- ui merupakan pengaruh gabungan (terhadap variabel tak bebas) dari sejumlah besar variabel bebas yang tidak dimunculkan secara explisit dalam model regresi. Pengaruh variabel-variabel yang diabaikan ini diharapkan kecil dan dalam keadaan paling baik, random. Berdasarkan pendekatan central limit theorem dapat ditunjukkan bahwa kalau ada sejumlah besar variabel random yang didistribusikan secara independen dan identik, maka distribusi jumlahnya cenderung ke distribusi normal bila banyaknya variabel seperti itu meningkat tak terbatas.
- Suatu varians dari central limit theorem menyatakan bahwa bahkan apabila banyaknya variabel tidak sangat besar atau jika variabel ini tidak independen benar, jumlahnya masih bisa didistribusikan secara normal.
- Dengan asumsi kenormalan, distribusi probabilitas penaksir OLS dengan mudah diperoleh, karena merupakan sifat distribusi normal bahwa setiap fungsi linier dari variabel-variabel yang diditribusikan secara normal dengan sendirinya didistribusikan secara normal. Maka berlaku jika faktor gangguan ui berdistribusi normal, maka penaksir OLS yaitu koefisien regresi (b) juga berdistribusi normal.
- Distribusi normal adalah distribusi yang relatif sederhana yang hanya melibatkan dua parameter (rata-rata dan varians), distribusi ini sangat dikenal dan sifat-sifat teoritisnya telah dipelajari secara luas dalam statistik matematik.
Sifat-sifat Penaksir OLS Menurut Asumsi Normalitas
- Penaksir OLS tidak bias
- Penaksir OLS mempunyai varians yang minimum. Ini berarti penaksir OLS tidak bias dengan varians yang minimum dikatakan sebagai penaksir yang efisien
- Konsisten yaitu dengan meningkatnya ukuran sampel secara tak terbatas, penaksir mengarah ke (convergen) nilai populasi yang sebenarnya
Dari uraian di atas kiranya dapat kita sama-sama pahami bahwa untuk memahami penggunaan asumsi normalitas pada model regresi yang dihasilkan, fokus perhatian kita adalah pada faktor gangguan ui atau umum digunakan dalam proses pengujian oleh software SPSS yaitu pengujian nilai residual yang dihasilkan oleh model regresi. Secara prinsip semakin kecil residual yang dihasilkan dapat diartikan semakin presisi model yang dihasilkan untuk meramalkan hasil yang sebenarnya terjadi secara numerik (angka). Oleh karenanya pada bahasan sebelumnya disebutkan bahwa rata-rata untuk faktor gangguan ui mendekati atau sama dengan nol adalah baik.
Selain itu, nilai varians (nilai keragaman) dari residual yang cenderung konsisten menandakan bahwa nilai gangguan tiap pengamatan dari nilai rata-ratanya cenderung konsisten dan ini yang diharapkan dari suatu peramalan yang dihasilkan dari suatu model. Dengan terpenuhi dua konsep tersebut maka terpenuhilah asumsi normalitas pada faktor gangguan ui dimana rata-rata cenderung mendekati atau sama dengan nol (0) dan varians cenderung konstan.
Efek dari terpenuhinya faktor gangguan ui yang memenuhi asumsi normalitas, maka dalam hal ini menunjukkan bahwa koefisien regresi (b) yang dihasilkan dalam model juga semakin baik dan memiliki distribusi normal pula. Oleh karenanya, teramat penting dalam suatu penaksiran model regresi terpenuhi asumsi normalitas pada nilai gangguan ui dengan benefit-benefit yang telah dipaparkan sebelumnya.
Sumber : Guzarati, Zain, Ekonometrika Dasar
———————————————————————————————————————————————————-
- Jika rekan peneliti memerlukan bantuan Survey Lapangan, Survey Online ataupun Olah Data dapat menghubungi mobilestatistik.com di :
- WhatsApp : 0813 2170 9749
- Email : welcome@mobilestatistik.com
- Klik “Konsultasi Gratis” untuk mendapatkan informasi atau solusi terkait dengan pertanyaan-pertanyaan seputar metodologi penelitian.
- “1st Kirim Pertanyaan, Kami Jawab . . . InsyaAllah”
———————————————————————————————————————————————————-