Analisis Regresi Data Spasial (GWR)

Pada artikel sebelumnya kita sudah banyak membahas pola hubungan antar variabel yang asimetris salah satu diantaranya adalah analisis regresi linear baik itu dalam konsep linear sederhana ataupun multivariat (lebih dari satu variabel bebas). Dalam analisis regresi linear, kita sudah membahas pula beberapa asumsi regresi linear klasik yang berguna dalam memastikan bahwa model yang dihasilkan oleh data “baik”, baik itu dari segi penaksiran parameter yang dihasilkan (nilai beta) dan proporsionalnya selang kepercayaan dalam pengujian hipotesis (uji F dan t). Regresi Spasial!

Pada kesempatan kali ini kita akan sedikit membahas analisis regresi dari perspektif kewilayahan (spasial). Pada bahasan pengujian heteroskedastisitas pada model regresi, sudah sedikit dibahas adanya pengaruh heteroskedastisitas pada model regresi yang dihasilkan, yaitu adanya keberagaman varians dari faktor gangguan yang akan mengganggu pada hasil penaksiran yang dihasilkan oleh model regresi. Salah satu faktor yang memungkinkan yang dapat menyebabkan heteroskedastisitas pada model adalah faktor kewilayahan atau spasial. Sehingga perlakuan pada data yang akan dibentuk menjadi sebuah model regresi terdapat penyesuaian diantaranya pada pembahasan sebelumnya (artikel : Asumsi Non Heteroskedastisitas Pada Model Regresi), pada poin pertama, dengan menggunakan nilai koefisien regresi b yang dihasilkan dari kuadrat terkecil tertimbang/terboboti (weighted least square-WLS)

Data Spasial

Data spasial merupakan data yang memuat informasi tentang atribut dan informasi lokasi. Sedangkan data bukan spasial hanya memuat informasi tentang atribut saja. Sebagai ilustrasi, data produk yang dihasilkan oleh suatu perusahaan berdasarkan banyaknya karyawan merupakan contoh data bukan spasial. Banyaknya orang yang bertahan dari suatu penyakit di berbagai daerah di suatu negara merupakan contoh data spasial (Fortheringham et al, 2002).

Data spasial merupakan sebuah data yang berorientasi geografis, memiliki sistem koordinat tertentu sebagai dasar referensinya dan mempunyai dua bagian penting yang membuatnya berbeda dari data lain, yaitu informasi lokasi (spatial) dan deskriptif (attribute) yang dijelaskan sebagai berikut :

Informasi lokasi (spatial) berkaitan dengan suatu koordinat geografi yaitu lintang (latitude) dan bujur (longitude)
Informasi deskriptif (attribute) atau informasi non-spasial, suatu lokasi yang memiliki beberapa keterangan seperti populasi atau jenis vegetasi. (Fikri, dkk, 2009)

Data spasial secara sederhana dapat diartikan sebagai data yang memiliki referensi keruangan (geografi). Setiap bagian dari data tersebut selain memberikan gambaran tentang suatu fenomena, juga dapat memberikan informasi mengenai lokasi dan juga persebaran dari fenomena tersebut dalam suatu ruang (wilayah). Apabila dikaitkan dengan cara penyajian data, maka peta merupakan bentuk/cara penyajian data spasial yang paling tepat.

Analisis terhadap data spasial memerlukan perhatian lebih dibandingkan dengan analisis terhadap data bukan spasial. Kondisi dari suatu lokasi pengamatan akan berbeda dengan lokasi pengamatan yang lain. Meskipun demikian, kondisi disuatu lokasi pengamatan akan memiliki hubungan yang erat dengan lokasi pengamatan lain yang berdekatan.

Hal tersebut sesuai dengan hukum I Tobler yang dikemukakan oleh Tobler (Tobler’s first law of geography) dalam Schanbenberger dan Gotway (2005), yaitu “Everything is related to everything else, but near thing are more related than distant thing.” Yang berarti “Segala sesuatu saling berhubungan satu dengan yang lainya, tetapi sesuatu yang dekat lebih mempunyai pengaruh daripada sesuatu yang jauh.”

Hubungan tersebut dinamakan efek spasial. Efek spasial di sini terkait dengan perbedaan karakteristik lingkungan dan geografis antar lokasi pengamatan sehingga masing-masing pengamatan kemungkinan memiliki variasi yang berbeda atau terdapat perbedaan pengaruh variabel prediktor terhadap variabel respon untuk setiap lokasi pengamatan. Efek spasial ini kemudian disebut sebagai keragaman spasial atau heterogenitas spasial.

Oleh karena itu, diperlukan sebuah metode statistika yang diharapkan dapat mengantisipasi heterogenitas spasial. Metode statistika tersebut yaitu metode regresi terboboti geografis atau Geographically Weighted Regression (GWR).

Geographically Weighted Regression (GWR)

Model regresi terbboboti geografi (RTG) atau Geographically Weighted Regression (GWR) pertama kali diperkenalkan oleh Fotheringham pada tahun 1967. Model GWR adalah pengembangan dari model regresi linear klasik atau ordinary linear regression (OLR). Model GWR adalah model regresi yang dikembangkan untuk memodelkan data dengan variabel respon yang bersifat kontinu dan mempertimbangkan aspek spasial atau lokasi.

Pendekatan yang dilakukan dalam GWR adalah pendekatan titik. Setiap nilai parameter ditaksir pada setiap titik lokasi pengamatan, sehingga setiap titik lokasi pengamatan mempunyai nilai parameter yang berbeda-beda.

Penaksiran Keofisien Regresi GWR

Penaksiran regresi pada Geographically Weighted Regression (GWR) dilakukan dengan menggunakan metode kuadrat terkecil terboboti atau Weighted Least Square (WLS), yaitu metode kuadrat terkecil dengan memberikan pembobotan yang berbeda pada setiap titik lokasi pengamatan. Pembobotan tersebut berupa matriks diagonal dimana elemen-elemen diagonalnya merupakan sebuah fungsi pembobot dari titik lokasi pengamatan.

Misalkan pembobot untuk setiap titik lokasi pengamatan (u_i, v_j) adalah W_ij, maka koefisien regrei pada titik lokasi pengamatan (u_i,v_j) ditaksir dengan menambahkan pembobot W_ij pada persamaan regresi dan meminimumkan jumlah kuadrat error-nya.

(perhitungan manual penaksir regresi linear dapat diaplikasikan dengan menggunakan matriks –lebih dari 2 variabel bebas, dengan adanya pembobotan spasial maka fungsi matriks awal digabung dengan matriks bobot spasial-W_ij)

Pembobot Model GWR

Peran pembobot dalam GWR merupakan aspek penting. Pembobot tersebut bergantung pada jarak antar titik lokasi pengamatan. Seperti penjelasan sebelumnya, pembobot tersebut berupa berupa matriks diagonal dimana elemen-elemen diagonalnya merupakan sebuah fungsi pembobotan dari setiap titik lokasi pengamatan. Fungsi dari matriks pembobot adalah untuk menentukan atau menaksir parameter yang berbeda pada setiap titik lokasi pengamatan.

Matriks pembobot pada GWR merupakan matriks pembobot berbasis pada kedekatan titik lokasi pengamatan ke-i dengan titik lokasi pengamatan lainnya. Pengamatan terdekat ke titik lokasi pengamatan ke-i umumnya diasumsikan memiliki pengaruh paling besar terhadap penaksiran parameter di titik lokasi pengamatan ke-i. Oleh karena itu, matriks pembobot W (u_i,v_j) akan semakin besar seperti jarak yang semakin dekat.

Terdapat beberapa cara yang dapat digunakan untuk menentukan nilai pembobot. Pertama, yang paling sederhana adalah dengan memberikan bobot sebesar 1 untuk setiap titik lokasi pengamatan i dan j. Sehingga, model yang dihasilkan apabila menggunakan fungsi pembobot ini adalah model regresi linear klasik (OLR). Kedua, pembobot dalam GWR juga dapat ditentukan dengan menggunakan fungsi invers jarak yang melibatkan d_ij (jarak euclidean antara titik lokasi pengamatan ke-i dengan titik pengamatan ke-j dan b (bandwidth) yang dianalogikan sebagai radius (b) suatu lingkaran, sehingga sebuah titik lokasi pengamatan yang berada dalam radius lingkaran masih dianggap berpengaruh dalam membentuk parameter di titik lokasi pengamatan ke-i. Fungsi invers jarak akan memberikan bobot = 1, jika titik lokasi ke-j berada di dalam radius b. Sedangkan jika titik lokasi ke-j berada di luar radius b dari titik lokasi ke-i, maka fungsi invers jarak akan memiliki bobot = 0. Ketiga, matriks pembobot W (u_i,v_j) dapat ditentukan dengan menggunakan fungsi Kernel. Fungsi Kernel memberikan pembobotan sesuai bandwidth optimum yang nilainya bergantung pada kondisi data. Terdapat dua jenis fungsi Kernel dalam GWR, yaitu fungsi Kernel tetap atau fixed Kernel dan fungsi Kernel adaptif atau adaptif Kernel (Wheeler dan Antonio, 2010).

Fungsi Kernel Tetap : memiliki bandwidth yang sama pada setiap titik lokasi pengamatan. Diantaranya : fungsi Kernel Gaussian dan fungsi Kernel Bi-square.
Fungsi Kernel adaptif : memiliki bandwidth yang berbeda untuk setiap lokasi pengamatan. Hal ini disebabkan kemampuan fungsi Kernel adaptif yang dapat disesuaikan dengan kondisi titik-titik pengamatan. Bila titik-titik lokasi pengamatan tersebar secara padat disekitar lokasi pengamatan ke-i maka bandwidth yang diperoleh relatif sempit. Sebaliknya jika titik-titik lokasi pengamatan memiliki jarak yang relatif jauh dari titik lokasi ke-i maka bandwidth yang diperoleh akan semakin luas (Dwinata,2012). Diantaranya : fungsi Kernel Gaussian dan fungsi Kernel Bi-square.

Bandwidth pada GWR

Dalam fungsi Kernel di atas, terdapat parameter bandwitdh yang nilainya tidak diketahui. Sehingga perlu dilakukan penaksiran terhadap parameter bandwidth tersebut. Bandwidth dapat dianalogikan sebagai radius (b) suatu lingkaran, sehingga sebuah titik lokasi pengamatan yang berada dalam radius (b) lingkaran masih dianggap berpengaruh dalam membentuk parameter di titik lokasi pengamatan ke-i. Pemilihan bandwidth optimum dalam GWR merupakan hal yang penting karena akan mempengaruhi ketepatan model terhadap data.

Nilai bandwidth yang sangat kecil akan mengakibatkan penaksiran parameter di lokasi pengamatan ke-i semakin bergantung pada titik lokasi pengamatan lain yang memiliki jarak terdekat dengan lokasi pengamatan ke-i, sehingga varians yang dihasilkan akan semakin besar. Sebaliknya, jika nilai bandwidth sangat besar makan akan mengakibatkan bias semakin besar, sehingga model yang diperoleh terlalu halus (Dwinata, 2012).

Metode yang digunakan untuk menentukan bandwidth optimum salah satunya adalah metode validasi silang atau cross validation (CV). Nilai bandwidth optimum diperoleh ketika CV minimum (Fotheringham, 2002).

Langkah-langkah analisis

Adapun langkah-langkah analisis yang dilakukan dengan menggunakan Geographically Weighted Regression (GWR) adalah :

Mendeskripsikan variabel respon (Y) dan variabel-variabel prediktor (X) yang akan dilibatkan dalam pembentukan model regresi
Menganalisis model regresi linear klasik atau Ordinary Linear Regression (OLR) dengan langkah-langkah sebagai berikut :
- Melakukan uji asumsi residual atau asumsi regresi linear klasik (normalitas, multikolinearitas, heteroskedastisitas, autokorelasi)
- Menaksir parameter model regresi linear klasik dengan metode kuadrat terkecil atau Ordinary Least Square (OLS)
- Melakukan uji keberartian model regresi linear berganda (uji F dan uji t)
Menganalisis model Geographically Weighted Regression (GWR) dengan langkah-langkah sebagai berikut :
- Menentukan koordinat longitude-latitude tiap titik wilayah pengamatan
- Menentukan bandwidth salah satunya berdasarkan kriteria CV minimum
- Menghitung matriks pembobot (W_ij) tiap titik wilayah pengamatan dengan fungsi Kernel
- Menaksir parameter GWR dengan menggunakan bandwidth optimum
Membandingkan jumlah kuadrat residual atau residual sum of square dan koefisien determinasi R² model dari OLS dan model GWR dengan pembobot fixed Kernel dan GWR dengan pembobot adaptive Kernel.
Menginterpretasi dan menyimpulkan hasil yang diperoleh.

Dari uraian secara konsep, terlihat begitu kompleks perhitungan regresi dengan menggunakan Geographically Weighted Regression (GWR). Yang perlu diperhatikan oleh peneliti dan data analis adalah dari tahapan atau proses perhitungan dari Geographically Weighted Regression (GWR) itu sendiri agar tidak menimbulkan kebingungan. Pemahaman terhadap detail dari komponen penyusun uji Geographically Weighted Regression (GWR) dapat dipahami secara bertahap sesuai dengan urutan tahapan analisis dengan mempertimbangkan peran dan fungsi komponen tersebut dalam analisi Geographically Weighted Regression (GWR).

Keterbatasan dari peneliti atau data analis dalam meng-olahdata hasil pengumpulan data dari lapangan mungkin akan ditemui. Akan tetapi kini sudah tersedia banyak software pendukung yang dapat digunakan peneliti atau data analis untuk memudahkan dalam men-generate model dari Geographically Weighted Regression (GWR). Beberapa diantaranya adalah software GWR, OpenJump, OpenGeoDa atau karena biasanya analisis Geographically Weighted Regression (GWR) bersinggungan dengan proses mapping atau pemetaan, bagi peneliti atau data analis dapat menggunakan pula software dalam rumpun ArcGis, ArcView untuk menghasilkan peta tematik sesuai dengan kasus yang sedang diteliti.

Pada kesempatan selanjutnya kita coba akan ulas secara singkat software pendukung dalam analisis Geographically Weighted Regression (GWR). SEMANGAT MEMAHAMI !!!

———————————————————————————————————————————————————-

Jika rekan peneliti memerlukan bantuan Survey Lapangan, Survey Online ataupun Olah Data dapat menghubungi mobilestatistik.com di :

WhatsApp : 081321709749
Email : welcome@mobilestatistik.com

Klik “Konsultasi Gratis” untuk mendapatkan informasi atau solusi terkait dengan pertanyaan-pertanyaan seputar metodologi penelitian.

“1^st Kirim Pertanyaan, Kami Jawab . . . InsyaAllah”

———————————————————————————————————————————————————-

Leave a Reply Cancel reply