Memahami Konsep Variabel Dummy Pada Regresi (Y-Dummy)

Memahami Konsep Variabel Dummy Pada Regresi (Y-Dummy)

Pada artikel sebelumnya kita telah membahas konsepsi regresi dengan data kualitatif pada variabel bebas atau X-dummy. Perlakuan regresi dengan variabel bebas dummy tidak jauh berbeda dengan perlakuan regresi dengan variabel bebas semua dalam nilai kuantitatif dengan skala ukur interval atau rasio. Perbedaan hanya dari pemecahan variabel kualitatif ke dalam beberapa variabel disesuaikan dengan jumlah kategori yang dimiliki oleh variabel tersebut. Berbeda dengan konsepsi yang dibahas ketika X-dummy, pada kesempatan kali kita akan membahas konsepsi variabel jika variabel tak bebas bersifat kualitatif atau kategori, Y-dummy.

Variabel Tak Bebas Dummy

Misal kita ingin mempelajari partisipasi tenaga kerja laki-laki dewasa sebagai fungsi dari tingkat pengangguran, tingkat upah rata-rata pendapatan keluarga, pendidikan dan seterustnya. Sekarang seseorang bisa termasuk dalam tenaga kerja atau tidak. Jadi, variabel tak bebas, partisipasi tenaga kerja, hanya dapat mengambil dua nilai : 1 jika seseorang termasuk tenaga kerja dan 0 jika ia tidak.

Ciri unik dari contoh di atas adalah bahwa variabel tak bebas adalah jenis yang memperoleh jawaban ya atau tidak; yaitu bersifat dikotomi (0 dan 1). Model linear yang menyatakan Y yang bersifat dikotomi sebagai fungsi linear dari variabel yang menjelaskan X disebut model probabilitas linear (LPM) karena harapan bersyarat (ekspektasi) dari Y untuk X tertentu, dapat diinterpretasikan sebagai probabilitas (peluang) bersyarat yang kejadiannya akan terjadi (Y = 1) untuk X tertentu, jika dinotasikan maka Pr (Y = 1 | X).

Dengan memisalkan P = probabilitas bahwa Y = 1 (yaitu kejadian tadi terjadi) dan 1 – P = probabilitas bahwa Y = 0 (yaitu kejadian tadi tidak terjadi), maka variabel Y mempunyai distribusi dimana Y = 0 maka probabilitasnya adalah 1 – P dan Y = 1 maka probabilitasnya adalah P.

Perlu diperhatikan oleh peneliti uraian konsep dan notasi tersebut penting dalam formulasi model secara matematis dan teknik dalam pengumpulan serta pencatatan data yang akan digunakan dalam analisa suatu model regresi dengan variabel tak bebas (Y) sebagai variabel kualitatif atau kategori.

Penaksiran OLS Model Probabilitas Linear (LPM)

Model regresi dengan variabel tak bebas (Y) bersifat dikotomi (0 dan 1), parameternya dapat ditaksir dengan prosedur kuadrat terkecil biasa (OLS). Akan tetapi akan menghadapi beberapa masalah khusus diantarannya :

  1. Ketidaknormalan faktor gangguan ui (disturbance). Meskipun OLS tidak memerlukan gangguan ui untuk didistribusikan secara normal, kita mengasumsikan bahwa faktor gangguan tadi didistribusikan secara demikian (normal) untuk maksud pengambilan keputusan (inferensi) yang bersifat statistik yaitu pengujian hipotesis. Tetapi asumsi normalitas untuk gangguan ui tidak dapat dipertahankan lagi untuk model LPM, seperti Y, faktor gangguan ui hanya menghasilkan dua angka yaitu 0 dan 1.
  2. Varians heteroskedastik dari gangguan. Dalam model LPM, homoskedastik dari gangguan ui yang dihasilkan model dengan OLS, tidak dapat dipertahankan lagi. Pembuktian secara matematis menunjukkan bahwa varians gangguan ui ­adalah heteroskedastik, secara sederhana, karena varian dari model LPM tergantung pada harapan bersyarat dari Y, yang tentu saja, tergantung pada nilai yang diambil oleh X. Jadi varian gangguan ui tergantung pada X dan jadi tidak homoskedastik. (baca artikel “Asumsi Non Heteroskedastisitas Dalam Regresi).
  3. Tidak terpenuhinya 0 ≤ E(Y|X) ≤ 1. Karena E(Y|X) yang merupakan nilai taksiran (ekspektasi) dari Y, dalam model probabilitas linear (LPM) mengukur probabilitas (peluang) bersyarat dari kejadian Y yang terjadi dengan syarat X, maka harus perlu terletak antara 0 dan 1. Meskipun merupakan suatu pernyataan apriori, tidak ada jaminan bahwa nilai taksiran dari Y, penaksir dari E(Y|X), akan memenuhi kriteria 0 ≤ E(Y|X) ≤ 1 dan ini merupakan masalah dalam penaksiran OLS dari LPM.

 

Perbaikan Kelemahan OLS Model Probabilitas Linear (LPM) :

Seperti telah diutarakan di atas, bahwa menggunakan metode OLS dalam penaksiran model regresi dengan variabel tak bebas (Y) kualitatif atau dokotomi bukan tanpa masalah, berikut beberapa usaha dalam menanggulangi kelemahan metode OLS yang diterapkan pada model LPM.

  1. Tidak terpenuhinya asumsi normalitas mungkin tidak sekritis seperti yang terlihat karena kita tahu taksiran titik OLS masih tetap tak bias. Lebih jauh lagi, dengan meningkatnya ukuran sampel sampai tak terbatas, dapat ditunjukkan bahwa penaksir OLS cenderung untuk pada umumnya didistribusikan secara normal. Oleh karena itu, dalam sampel besar penarikan kesimpulan secara statistik (pengujian hipotesis) dari LPM akan mengikuti prosedur OLS yang biasa di bawah asumsi normalitas. (baca juga artikel “Asumsi Normalitas Dalam Regresi).
  2. Kita ketahui bahwa dengan adanya heteroskedastisitas penaksir OLS meskipun tidak bias, tidak efisien yaitu taksiran yang dihasilkan tidak mempunyai varians minimum. Karena varians ui tergantung pada nilai yang diharapkan dari Y bersyarat atas nilai X, Var ui = P(1-P), satu cara untuk memcahkan masalah heteroskedastisitas adalah dengan mentransformasikan data dengan membagi kedua sisi model regresi dengan akar kuadrat dari Var ui. Dimana nilai P sendiri diperoleh dari nilai taksiran model regresi dengan variabel tak bebas (Y) kualitatif, dengan tidak memandang terlebih dahulu permasalahan heteroskedastisitas.
  3. Ada dua cara untuk mendapatkan apakah Y yang ditaksir terdapat antara 0 dan 1. Prosedur pertama adalah dengan menaksir LPM yang ditaksir terletak antara 0 dan 1. Jika beberapa di antaranya lebih kecil dari 0 (minus), maka Y taksiran diasumsikan bernilai 0; jika taksiran Y lebih besar dari 1, maka Y diasumsikan bernilai 1. Prosedur kedua, dengan memikirkan suatu teknik penaksiran yang akan menjamin bahwa probabilitas bersyarat yang ditaksir Y akan terletak antara 0 dan 1. Beberapa metode itu tersedia salah satu diantaranya adalah model LOGIT.

 

Istilah LOGIT mungkin familiar bagi sebagian peneliti, LOGIT merupakan suatu model regresi yang dibangun dengan bantuan transformasi logistik pada model yang dibangun. Seperti disebutkan pada pemaparan di atas, fungsi LOGIT ini sangat bermanfaat dalam memastikan nilai taksiran Y dari model regresi dengan variabel tak bebas (Y) bersifat katogori, berada antara 0 dan 1. Pada pembahasan selanjutnya kita akan sedikit menguraikan secara jelas model regresi LOGIT.

———————————————————————————————————————————————————-

  1. Jika rekan peneliti memerlukan bantuan Survey Lapangan, Survey Online ataupun Olah Data dapat menghubungi mobilestatistik.com di :
  1. Klik “Konsultasi Gratis” untuk mendapatkan informasi atau solusi terkait dengan pertanyaan-pertanyaan seputar metodologi penelitian.
  • “1st Kirim Pertanyaan, Kami Jawab . . . InsyaAllah”

———————————————————————————————————————————————————-

online survey BPKH RI | LISREL | SEM | Eviews | Analisis Faktor | Validitas | SWOT | Dummy


survey lapangan kampung ketandan I path analisis | analisis jalur | LISREL

Leave a Reply

Your email address will not be published. Required fields are marked *