Pada kesempatan kali ini kita akan sharing pengalaman kita di lapangan, survey lapangan atau sebar kuesioner, yang berbeda dengan sharing pada kesempatan sebelumnya. Survey lapangan atau sebar kuesioner kali ini, hendak menggali informasi atau perspektif dari komunitas atau individu yang peduli lingkungan secara lokal, dalam hal ini perilaku warga dalam memelihara lingkungan dan keasrian danau yang berada dilingkungan tempat tinggalnya (survey lapangan kapasitas masyarakat sekitar danau di Wilayah Pesanggrahan). Sekali lagi bahwa persiapan fisik maupun pengetahuan terhadap medan lapangan yang akan dijadikan sasaran pengambilan data haruslah diperhatikan. Karena banyak hal-hal yang tidak bisa kita prediksikan dapat terjadi dan menjadi tantangan tersendiri di lapangan.
Objek dari survey lapangan atau sebar kuesioner lapangan kali ini dalam kategori gampang-gampang susah. Target spesifik yang menjadi kriteria dari responden adalah warga masyarakat yang tinggal disekitar Danau Cavalio di wilayah kelurahan Pesanggrahan, Jakarta Selatan. Kriteria objek yang cukup mudah pada perkiraan awal karena seperti kita tahu bahwa warga masyarakat biasanya welcome dengan riset, apalagi dilakukan kaitannya dengan pendidikan.
Pada realitanya didapati pula kesulitan tertentu, di antaranya adalah faktor usia dan latar belakang pendidikan responden yang kebanyakan kita temui tidak lagi muda dan berpendidikan mayoritas di bawah SMA (Sekolah Menengah Atas), sehingga teknik komunikasi mengharuskan ekstra understanding agar maksud dari penelitian ini dapat tersampaikan dengan baik. Selain itu, wilayah sebaran warga masyarakat yang random (tersebar dan berlokasi di gang-gang) menjadi tantangan tersendiri bagi tim kita dilapangan.
Crew lapangan yang diturunkan pada survey lapangan kali ini sebanyak 3 orang. Rata-rata tenaga yang kita pakai berusia antara 20 s.d 25 tahun. Selain muda semangatnya pun OK untuk menjaga kualitas hasil survey yang kita lakukan. Selain itu, crew yang well educated (rata-rata sedang menempuh perkuliahan) memberikan nilai plus tersendiri, selain dari pola bahasa dalam komunikasi yang baik, yang terpenting behave yang menyenangkan bagi responden kita.
Meskipun relatif tidak ada kendala yang berarti di lapangan yang tim kita temui, planning dan strategi yang terukur dalam melakukan survey lapangan tetap perlu diperhatikan. Perlu pendekatan kepada para tokoh masyarakat agar penerimaan warga terhadap tim lapangan kita tidak terkendala. Dan benefit-nya para tokoh masyarakat dapat secara tidak langsung menjadi pemandu bagi tim kita dilapangan. Dan hal ini memudahkan tim kita dilapangan dalam mendapatkan responden, sehingga berpengaruh pada proses pengambilan data di lapangan yang relatif lebih cepat.
Gambar 1. Sebar Kuesioner Kapasitas Warga Sekita Danau Cavalio, Pesanggrahan
Tools lain yang kita gunakan dalam mendapatkan target sampel adalah gimmick atau souvenir survey yang tepat (mis : paket sembako), hal sangat sepele tapi sangat bermanfaat dalam proses persuasif kepada calon responden. Meskipun perlu ada budget tambahan dalam RAB peneliti, akan tetapi hal ini worthed untuk dilakukan dalam mempercepat proses survey lapangan.
Sharing singkat ini, semoga bermanfaat dalam membantu rekan-rekan peneliti dalam membangun frame awal sebelum melakukan survey dilapangan. Kami akan share banyak pengalaman kami di lapangan pada kesempatan yang lain. SEMANGAT MENELITI!!!
Pada dua artikel terdahulu kita sudah sedikit banyak memaparkan metode dalam menghasilkan model regresi data deret waktu, yaitu rumpun metode penghalusan eksponensial (eksponensial sederhana, Holt, Winters dan Holt–Winters) dan metode Box-Jenkins. Pastinya para pembaca menemukan kerumitan dalam memahami metode-metode yang sudah paparkan sebelumnya, karena secara naratif penuh dengan konsepsi matematis yang cukup kompleks. Setidaknya pada tahap awal, para pembaca dapat lebih menekankan pemahaman pada ciri tiap metode dan tahapan dalam melakukan analisis data deret waktu, hal ini dapat mempermudah dalam penerapan pada data dan aplikasi pada software pembantu. Pada tahap lanjut para pembaca dapat memfokuskan pada pembentukan model matematis yang diperlukan dalam peramalan dari hasil output software pembantu yang digunakan.
Pada kesempatan kali ini kita akan coba uraikan satu metode lain dari analisis data deret waktu yang mungkin diperlukan bagi para peneliti dan sesuai dengan kondisi data yang dimilikinya, metode tersebut adalah metode autoregresi stepwise.
Sekali lagi, diperlukan pengalaman dan sensitifitas peneliti atau data master dalam menentukan dan memutuskan metode yang paling tepat bagi data deret waktu yang dimiliki. Assistansi maupun konseling yang dilakukan bersama expertise maupun praktisi sangat disarankan untuk mengkonfirmasikan self judgement terhadap penentuan metode dan interpretasi dari hasil olah data regresi deret waktu.
Metode Autoregresi Stepwise
Metode ini dikenalkan oleh C.W. Granger dan P. Newbold sekitar tahun 1977, yang merupakan bagian (subset) dari metode Box-Jenkins, dengan konsepsi yang lebih sederhana. Pada metode Box-Jenkins, model regresi deret waktu yang digunakan untuk peramalan adalah ARIMA (p,q,k), sedangkan metode ini didasarkan pada konsepsi bahwa jika data berautokorelasi, maka model hubungan fungsionalnya adalah AR (k), dengan alasan diantaranya adalah
Model AR (k) adalah model dasar dari regresi deret waktu
Membangun model AR (k) yang cocok untuk peramalan lebih mudah dari model MA (p) atau ARMA (k,p)
Sedangkan konsepsi perhitungan dari metode autoregresi stepwise adalah sebagai berikut
Lakukan proses menstasionerkan data dan seperti sudah dikemukakan jika trendnya linear maka proses diferensi orde 1 sudah cukup, tetapi jika tidak linear maka lakukan transformasi linearitas selanjutnya proses diferensi orde 1 untuk hasil transformasi
Tentukan Lag autokorelasi minimum yang mungkin, misal sama dengan M. Granger dan Newbold menyarankan ambil M = 13 jika data kuartal dan M = 25 jika data bulanan.
Bangun model regresi deret waktu dengan persamaan berikut,
Dimana: Wt = Xt – Xt-1; Xt merupakan data deret waktu dengan trend linear, γs(1) merupakan koefisien autoregresi stepwise orde 1 dan et(1) merupakan kekeliruan model autoregresi stepwise orde 1.
Lakukan penaksiran parameter secara bertahap untuk setiap S = 1, 2, . . , M dan hitung nilai-nilai ramalannya.
Proses penaksiran dihentikan jika jumlah kuadrat residu pada langkah ke-j sudah cukup kecil dari langkah sebelumnya dan model yang dihasilkan dapat digunakan sebagai model ramalan.
Pemilihan Metode
Banyak faktor yang harus dijadikan bahan pertimbangan untuk melakukan suatu proses peramalan data deret waktu, beberapa diantaranya,
Tujuan melakukan peramalan
Derajat keteparan yang diinginkan
Ketersediaan waktu, biaya, sumber daya manusia dan fasilitas
Tidak ada aturan yang mengikat untuk memutuskan penggunaan salah satu metode peramalan berdasarkann pertimbangan yang telah dibuat, sehingga jika ada beberapa metode yang dapat digunakan maka pilihan harus pada metode yang memiliki efisiensi dengan tingkat kekeliruan yang paling kecil.
Dalam ilmu statistika peramalan didasarkan pada sebuah model regresi, jika sebuah model ramalan dipilih maka harus dipertimbangkan adalah
Keberartian dari penaksir koefisien regresi yang dapat dilakukan berdasarkan analisis varians
Kekeliruan baku model yang dapat ditelaah berdasarkan analisis residual
Dipenuhi tidaknya asumsi yang dapat dilakukan berdasarkan sebuah pengujian hipotesis
Lead time maksimum yang harus sesuai dengan ukuran sampel.
Sekalipun kompleks dan cenderung rumit dalam proses pembentukan model regresi data deret waktu, berdasar pada pemahaman yang sempurna akan basic informasi pada data deret waktu yang dimiliki, akan mempermudah peneliti atau data master dalam proses pengaplikasian data pada software support yang dipilihnya, baik itu SPSS, SAS, MINITAB dan yang lainnya, berdasarkan pemilihan metode yang tepat pula.
Seperti pembahasan yang sudah kita paparkan pada artikel sebelumnya, bahwa model regresi data deret waktu berbeda dengan metode yang digunakan dalam menghasilkan data deret waktu. Pada pembahasan artikel sebelumnya sedikit kita bahas konsepsi metode dalam rumpun penghalusan exponensial (exponential smoothing) yang terdiri dari metode eksponensial sederhana, Holt, Winters dan Holt-Winters. Prinsip pada metode-metode tersebut adalah indentifikasi pada pola data deret waktu (trend dan pola musiman) dan pembobotan pada pembentukan modelnya. Selain itu, metode-metode tersebut relatif tidak begitu fokus pada pemenuhan kebagusan data deret waktu dalam pembentukan modelnya. Box-Jenkins!
Pada kesempatan kali ini kita akan membahas metode lainnya yang sangat memperhatikan faktor kebagusan data deret waktu dalam membentuk modelnya. Metode yang dimaksud adalah metode Box-Jenkins. Oleh karenanya sebelum pada pemahaman terkait dengan spesifik konten metode didalamnya, ada baiknya para pembaca memahami konsep dasar dari data deret waktu yang telah kita tuliskan pada artikel-artikel sebelumnya, baik itu terkait dengan autokorelasi, stasioneritas data, transformasi data hingga ke model-model regresi data deret waktu. Pemahaman tersebut setidaknya dapat memudahkan memandu para pembaca dalam memahami setiap tahapan yang akan dijelasakan pada metode Box-Jenkins.
Sekali lagi, diperlukan pengalaman dan sensitifitas peneliti atau data master dalam menentukan dan memutuskan metode yang paling tepat bagi data deret waktu yang dimiliki. Assistansi maupun konseling yang dilakukan bersama expertise maupun praktisi sangat disarankan untuk mengkonfirmasikan self judgement terhadap penentuan metode dan interpretasi dari hasil olah data regresi deret waktu.
Metode Box-Jenkins
Proses peramalan dengan metode ini dikenalkan dan dikembangkan oleh G.E.P Box dan G.M. Jenkins pada tahun 1960-an. Peramalan dengan metode Box-Jenkins pada umumnya akan memberikan hasil yang lebih baik dari metode-metode peramalan lain, sebab metode ini tidak mengabaikan kaidah-kaidah pada data deret waktu, tetapi proses perhitungannya cukup kompleks jika dibandingkan dengan metode peramalan yang lainnya. Berdasarkan pengalaman jika diinginkan hasil yang baik, ukuran sampel untuk digunakan dalam peramalan dengan metode Box-Jenkins paling kecil 50 dan lebih baik lagi jika lebih dari 100.
Peramalan dengan metode Box-Jenkins didasarkan pada model regresi deret waktu stasioner tanpa komponen musiman, sehingga jika yang dianalisis data bulanan maka perlu ditelaah keberadaan komponen musimannya, sebab jika ada, komponen ini harus dieliminasi melalui proses diferensiasi. Langkah-langkah penting yang harus dilakukan jika akan melakukan peramalan dengan metode Box-Jenkins adalah sebagai berikut,
Petakan data atas waktu dan telaah mengenai bentuk trend, kestabilan varians dan keberadaan komponen musiman, untuk menentukan bentuk transformasi kelinearnan trend, kestabilan varians dan eliminasi komponen musiman (jika ada).
Hitung ACF dan PACF dan gambarkan korelogramnya untuk data asli dan data hasil transformasi untuk menelaah orde diferensi dan autoregresi yang akan diambil.
Bagun model-model ARIMA (k,q,p) yang kemungkinan cocok untuk data yang dimiliki
Lakukan penaksiran parameter untuk setiap model yang dibangun
Lakukan analisis varians atau analisis residual untuk menentukan model ramalan yang akan digunakan. Model ramalan yang digunakan adalah model yang signifikan dengan kekeliruan baku model yang paling kecil.
Jika diperlukan maka deskripsikan model-model alternatifnya.
Peramalan dengan metode Box-Jenkins data harus stasioner dan tidak memiliki komponen musiman. Sehingga tahap pertama dari proses peramalan dengan metode ini adalah proses diferensi untuk menstasionerkan data dan menghilangkan komponen musiman (jika ada). Jika trend linear dan tidak ada komponen musiman maka diferensi orde-1 biasanya sudah cukuup untuk menstasionerkan data. Tetapi jika trend linear dan ada komponen musiman dengan periode p ≤ 12 (pada umunya p = 12, tetapi untuk beberapa kasus, misalnya dalam bidang klimatologi bisa saja p < 12 sehingga dalam satu tahun komponen musiman lebih dari satu), maka orde diferensinya p jika musiman aditif dan 2/p jika multifikatif.
Dalam prakteknya proses diferensi dengan orde paling besar sama dengan p sudah cukup untuk menghilangkan komponen musiman, baik yang aditif atau multifikatif, sebab jika orde diferensi terlalu tinggi akan menyebabkan banyak data hilang (secara matematis jika orde diferensi p maka data hilang akan sebanyak p+1 buah). Dalam hal ini trend tidak linear seperti sudah dikemukakan sebelum melakukan proses diferensi harus dilakukan proses linearitas trend.
Jika model yang cocok sudah diperoleh berdasarkan sampel berukuran n, maka selanjutnya lakukan ramalan untuk k langkah ke depan (sebaiknya k < ¼ n). Box-Jenkins mengemukakan model ramalan cukup baik untuk digunakan jika nilai residu, yaitu selisih antara nilai pengamatan dengan nilai ramalannya cukup kecil, sehingga setiap nilai ramalan yang diperoleh perlu ditelaah kewajarannya berdasarkan nilai residu tersebut.
Metode Box-Jenkins Dengan Trend dan Musiman
Sudah dikemukakan sebelumnya, model regresi deret waktu yang digunakan sebagai model ramalan dengan metode Box-Jenkins adalah model ARIMA (k,p,q) tanpa komponen trend dan musiman, sehingga jika ada maka komponen-komponen tersebut harus dieliminasi dulu melalui proses diferensi dan selanjutnya model ARIMA (k,q.p) dibangun berdasarkan data yang telah dieliminasi. Konsepsi ini secara statistis dapat digeneralisasikan dalam model ARIMA (k,q,p) trend-musiman, yang biasa dinamakan model Box-Jenkins (K,k,P,p) dengan persamaan sebagai berikut,
Dengan ΓK(B), lk(B12), ΨP(B), ψp(B12), masing-masing polinom atas operator backshift B dengan orde masing-masing k (orde AR), K (orde AR musiman), p ( orde MA) dan P (orde MA musiman). at merupakan “kekeliruan Box-Jenkins yang merupakan variabel acak tidak terukur dengan rata-rata nol dan varians konstan. Dan Wt merupakan variabel yang dibangun dari variabel Xt berdasarkan proses diferensi untuk mengeliminasi komponen trend dan musiman,
Dengan d merupakan orde diferensi untuk mengeliminasi komponen trend dan D untuk komponen musiman. Sebagai misal jika d = D = 1 dan K = p = 1 serta k = P = 0 maka model Box-Jenkins-nya adalah sebagai berikut,
Maka
Jika ditelaah, maka persamaan di atas merupakan gabungan model ARMA (1,1) dengan proses diferensi orde 1, sehingga persamaan di atas selanjutnya dinamakan model trend-musiman ARIMA (1,1,1) atau model Box-Jenkins (1,0,0,1).
Walaupun metode Box-Jenkins dan Holt-Winters adalah proses peramalan untuk data yang memiliki komponen trend dan musiman, tetapi ada perbedaan yang mencolok antara keduanya. Metode Holt-Winters adalah proses peramalan berdasarkan analisi “keluarga model regresi sederhana”, sedangkan metode Box-Jenkins berdasarkan analisis “pemilihan model trend-musiman ARIMA”, dengan proses yang lebih kompleks daripada metode Holt-Winters.
Pada akhirnya, sekalipun kompleks dan cenderung rumit dalam proses pembentukan model regresi data deret waktu, berdasar pada pemahaman yang sempurna akan informasi dasar pada data deret waktu yang dimiliki, akan mempermudah peneliti atau data master dalam proses pengaplikasian data pada software support yang dipilihnya, baik itu SPSS, SAS, MINITAB dan yang lainnya, berdasarkan pemilihan metode yang tepat pula.
Pada kesempatan yang lalu dalam beberapa artikel kita sudah banyak membahas konsepsi tentang data deret waktu dan model regresi deret waktu. Perlakuan terhadap data deret waktu lebih kompleks dibandingkan kita memperlakukan data cross sectional dalam pembentukan model regresi. Perlu effort lebih dari peneliti atau data master dalam memperlakukan data deret waktu, mulai dari sensitifitas pada visual data maupun sensitifitas dalam penentuan metode matematis yang tepat dalam men-treatment data yang dimilikinya. Exponential Smoothing!
Pemaparan pada artikel sebelumnya kita banyak membahas terkait dengan bagaimana bentuk ideal dari data deret waktu yang dapat membantu peneliti dalam memperoleh nilai ramalan yang robust berdasarkan model regresi data deret waktu yang terbentuk berdasarkan metode yang digunakannya, dan umumnya dengan urutan penjelasan sebelumnya merujuk kepada metode Box-Jenkins. Sedangkan metode lainnya yang relatif tidak terlalu memperhatikan secara detail urutan kebagusan data deret waktu diantaranya adalah metode Exponential Sederhana, Holt, Winters dan Holt-Winters.
Nah, pada beberapa artikel kedepan kita akan coba menguraikan secara singkat secara pengertiaan dan konsepsi beberapa metode yang dapat digunakan pada data deret waktu dalam membentuk suatu model regresi data deret waktu. Beberapa metode yang akan kita paparkan diantaranya Exponential Sedehana, Holt, Winters, Holt-Winters, Box-Jenkins dan Autoregresi Stepwise. Sekali lagi, diperlukan pengalaman dan sensitifitas peneliti atau data master dalam menentukan dan memutuskan metode yang paling tepat bagi data deret waktu yang dimiliki. Assistansi maupun konseling yang dilakukan bersama expertise maupun praktisi sangat disarankan untuk mengkonfirmasikan self judgement terhadap penentuan metode dan interpretasi dari hasil olah data regresi deret waktu.
Metode Exponential Sederhana
Metode penghalusan eksponensial (exponential smoothing) merupakan metode peramalan univariat, yang dikenalkan oleh C.C Holt pada sekitar tahun 1958. Metode penghalusan sederhana digunakan jika data tidak memiliki komponen musiman dan trend. Misalkan dimiliki sampel data deret waktu x1, x2, . . . ,xn, yang tidak memiliki komponen trend dan musiman, dan diinginkan nilai ramalan untuk k waktu ke depan (lead time), dimana k < n. Jika peramalan dilakukan dengan metode penghalusan sederhana, maka proses dilakukan secara bertahap dimulai dengan lead time 1, berdasarkan sebuah kombinasi linear pembobotan sampai dengan lead time ke-k,
Dengan Ci adalah pembobot, 0 < Ci < 1, dan Ʃ Ci = 1. Untuk menentukan nilai-nilai pembobot, salah satu cara adalah dengan menggunakan persamaan di bahwa ini dan nilai α dihitung dengan metode rekursif.
Note : Lead time ke k sama dengan “waktu mendatang ke k”
Metode Holt
Peramalan dengan penghalusan eksponen sederhana dilakukan jika data tidak mengandung komponen trend dan musiman, sedangkan jika mengandung komponen trend tetapi tidak mengandung komponen musiman, maka harus digunakan metode Holt, yaitu metode penghalusan eksponensial dengan dua kali pembobotan.
Metode ini pada awalnya digunakan untuk data bulanan yang tidak memiliki komponen musiman dan dalam perkembangnya dapat digunakan untuk data tahunan dengan proses analisisnya mengadopsi proses untuk data bulanan. Misalkan dimiliki sampel data deret waktu x1, x2, . . . ,xn, yang tidak memiliki komponen musiman. Jika dideskripsikan, mt adalah taksiran rata-rata pada bulan yang sama (current mean) untuk bulan ke t, dimana t = 1, 2, … , 12. Tt adalah taksiran pola trend pada bulan ke t, dimana t = 1, 2, … , 12. Maka formulasi pembobotannya adalah sebagai berikut,
Dimana 0 < α dan γ < 1 yang merupakan konstantan real dan xt merupakan pengamatan terakhir bulan ke-t. Peramalan nilai data waktu ke-t dengan lead time ke-k dihitung dengan persamaan,
Note : Lead time ke k sama dengan “waktu mendatang ke k”
Metode Winters
Metode ini merupakan penghalusan eksponensial juga dan digunakan jika data memiliki komponen musiman, tetapi tidak memiliki komponen trend. Metode ini digunakan juga jika data adalah data bulanan, sebab musiman hanya dideskripsikan pada data bulanan. Secara umum, yang dimaksud dengan musiman adalah komponen siklis dengan periode 12 bulan.
Konsepsi perhitungan metode Winters indentik dengan metode Holt, yaitu penghalusan eksponensial dengan dua kali pembobotan. Misalkan dimiliki sampel data deret waktu x1, x2, . . . ,xn, yang memiliki komponen musiman, tetapi tidak memiliki komponen trend. Selanjutnya jika didefinisikan mt adalah taksiran rata-rata pada bulan yang sama untuk bulan ke-t, t = 1, 2, .. , 12. Dan st adalah faktor musiman pada bulan ke-t, t = 1, 2, .. , 12 serta komponen musimannya multiplikatip dengan persamaan,
Maka formulasi pembobotannya adalah sebagai berikut,
Dan nilai ramalan untuk lead time ke-h, dihitung dengan formulasi,
Sedangkan jika komponen musimannya aditif dengan persamaan,
Dengan formulasi pembobotannya adalah sebagai berikut,
Dan nilai ramalan untuk lead time ke-h, diitung dengan formulasi,
Pada formulasi pembobotan, xt pengamatan terakhir pada bulan ke-t, α dan δ merupakan konstanta real, dimana 0 < α dan δ < 1. Sedangkan lead time h = 1, 2, .., 12.
Metode Holt-Winter
Metode peramalan Holt-Winter merupakan gabungan dari metode Holt dan metode Winters, digunakan untuk peramalan jika data memiliki komponen trend dan musiman. Metode ini juga merupakan penghalusan eksponensial dengan tiga kali pembobotan.
Misalkan dimiliki sampel data deret waktu x1, x2, . . . ,xn, yang memiliki komponen trend dan musiman. Selanjutnya jika didefinisikan mt adalah taksiran rata-rata pada bulan yang sama untuk bulan ke-t. st adalah faktor musiman pada bulan ke-t. dan Tt adalah pola trend pada bulan ke-t. Maka formulasi pembobotan Holt-Winters jika komponen musimannya aditif adalah
Dan jika komponen musimannya multifikatif,
Proses perhitungan untuk α, γ dan δ sama seperti pada metode Holt.
Sekalipun kompleks dan cendeung rumit dalam proses pembentukan model regresi data deret waktu, berdasar pada pemahaman yang sempurna akan informasi dasar pada data deret waktu yang dimiliki, akan mempermudah peneliti atau data master dalam proses pengaplikasian data pada software support yang dipilihnya, baik itu SPSS, SAS, MINITAB dan yang lainnya, berdasarkan pemilihan metode yang tepat pula.
Pada kesempatan kali ini kita akan sharing pengalaman kita di lapangan, survey lapangan atau sebar kuesioner, yang berbeda dengan sharing pada kesempatan sebelumnya. Survey lapangan atau sebar kuesioner kali ini, hendak menggali informasi atau perspektif dari para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat), tepatnya informasi atau perspektif para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dalam hal pajak dan kepatuhan pajak. Sekali lagi bahwa persiapan fisik maupun pengetahuan terhadap medan lapangan yang akan dijadikan sasaran pengambilan data haruslah diperhatikan. Karena banyak hal-hal yang tidak bisa kita prediksikan dapat terjadi dan menjadi tantangan tersendiri dilapangan.
Objek dari survey lapangan atau sebar kuesioner lapangan kali ini dalam kategori gampang-gampang susah. Target spesifik yang menjadi kriteria dari responden adalah subjek pajak para professional dalam hal ini pekerja yang memiliki domisili di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dan memiliki NPWP. Target yang kita tetapkan sesuai kriteria yang disepakati adalah para professional yang beraktifitas atau bekerja sebagai PNS, BUMN ataupun Pegawai Swasta lainnya yang memenuhi kriteria yang ditetapkan.
Crew lapangan yang diturunkan pada survey lapangan kali ini sebanyak 2 orang. Rata-rata tenaga yang kita pakai berusia antara 20 s.d 25 tahun. Selain muda semangatnya pun OK untuk menjaga kualitas hasil survey yang kita lakukan. Selain itu, crew yang well educated (rata-rata sedang menempuh perkuliahan) memberikan nilai plus tersendiri, selain dari pola bahasa dalam komunikasi yang baik, yang terpenting behave yang menyenangkan bagi responden kita.
Meskipun relatif tidak ada kendala yang berarti di lapangan yang tim kita temui, planning dan strategi yang terukur dalam melakukan survey lapangan tetap perlu diperhatikan. Calon responden yang kita hadapi adalah responden yang tetap memiliki kecenderungan untuk menolak sangat tinggi dikarenakan issue yang melatarbelakangi survey lapangan ini sedikit “menakutkan” (framing PAJAK). Perlu penjelasan yang persuasif dan ringan agar dapat meyakinkan calon responden atas tujuan survey yang dilakukan tidak menyentuh hal-hal yang sensitif tentang private information yang sangat dijaga kerahasiaanya oleh responden (misal : pendapatan atau pengeluaran, karena sensitif terhadap taksiran PAJAK).
Easyness dari proses survey ini adalah jumlah populasi kriteria responden yang sangat banyak, sehingga memudahkan tim lapangan dalam memperoleh target sampel. Tools lain yang kita gunakan dalam mendapatkan target sampel tersebut adalah gimmick atau souvenir survey, hal sangat sepele tapi sangat bermanfaat dalam proses persuasif kepada calon responden. Meskipun perlu ada budget tambahan dalam RAB peneliti, akan tetapi hal ini worthed untuk dilakukan dalam mempercepat proses survey lapangan.
Sharing singkat ini, semoga bermanfaat dalam membantu rekan-rekan peneliti dalam membangun frame awal sebelum melakukan survey dilapangan. Kami akan share banyak pengalaman kami di lapangan pada kesempatan yang lain. SEMANGAT MENELITI!!!
Pada kesempatan kali ini kita akan sharing pengalaman kita di lapangan, survey lapangan atau sebar kuesioner, yang berbeda dengan sharing pada kesempatan sebelumnya. Survey lapangan atau sebar kuesioner kali ini, hendak menggali informasi atau perspektif dari para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat), tepatnya informasi atau perspektif para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dalam hal pajak dan kepatuhan pajak. Sekali lagi bahwa persiapan fisik maupun pengetahuan terhadap medan lapangan yang akan dijadikan sasaran pengambilan data haruslah diperhatikan. Karena banyak hal-hal yang tidak bisa kita prediksikan dapat terjadi dan menjadi tantangan tersendiri dilapangan.
Objek dari survey lapangan atau sebar kuesioner lapangan kali ini dalam kategori gampang-gampang susah. Target spesifik yang menjadi kriteria dari responden adalah subjek pajak para professional dalam hal ini pekerja yang memiliki domisili di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dan memiliki NPWP. Target yang kita tetapkan sesuai kriteria yang disepakati adalah para professional yang beraktifitas atau bekerja sebagai PNS, BUMN ataupun Pegawai Swasta lainnya yang memenuhi kriteria yang ditetapkan.
Crew lapangan yang diturunkan pada survey lapangan kali ini sebanyak 2 orang. Rata-rata tenaga yang kita pakai berusia antara 20 s.d 25 tahun. Selain muda semangatnya pun OK untuk menjaga kualitas hasil survey yang kita lakukan. Selain itu, crew yang well educated (rata-rata sedang menempuh perkuliahan) memberikan nilai plus tersendiri, selain dari pola bahasa dalam komunikasi yang baik, yang terpenting behave yang menyenangkan bagi responden kita.
Meskipun relatif tidak ada kendala yang berarti di lapangan yang tim kita temui, planning dan strategi yang terukur dalam melakukan survey lapangan tetap perlu diperhatikan. Calon responden yang kita hadapi adalah responden yang tetap memiliki kecenderungan untuk menolak sangat tinggi dikarenakan issue yang melatarbelakangi survey lapangan ini sedikit “menakutkan” (framing PAJAK). Perlu penjelasan yang persuasif dan ringan agar dapat meyakinkan calon responden atas tujuan survey yang dilakukan tidak menyentuh hal-hal yang sensitif tentang private information yang sangat dijaga kerahasiaanya oleh responden (misal : pendapatan atau pengeluaran, karena sensitif terhadap taksiran PAJAK).
Easyness dari proses survey ini adalah jumlah populasi kriteria responden yang sangat banyak, sehingga memudahkan tim lapangan dalam memperoleh target sampel. Tools lain yang kita gunakan dalam mendapatkan target sampel tersebut adalah gimmick atau souvenir survey, hal sangat sepele tapi sangat bermanfaat dalam proses persuasif kepada calon responden. Meskipun perlu ada budget tambahan dalam RAB peneliti, akan tetapi hal ini worthed untuk dilakukan dalam mempercepat proses survey lapangan.
Sharing singkat ini, semoga bermanfaat dalam membantu rekan-rekan peneliti dalam membangun frame awal sebelum melakukan survey dilapangan. Kami akan share banyak pengalaman kami di lapangan pada kesempatan yang lain. SEMANGAT MENELITI!!!
Pada kesempatan kali ini kita akan sharing pengalaman kita di lapangan, survey lapangan atau sebar kuesioner, yang berbeda dengan sharing pada kesempatan sebelumnya. Survey lapangan atau sebar kuesioner kali ini, hendak menggali informasi atau perspektif dari para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat), tepatnya informasi atau perspektif para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dalam hal pajak dan kepatuhan pajak. Sekali lagi bahwa persiapan fisik maupun pengetahuan terhadap medan lapangan yang akan dijadikan sasaran pengambilan data haruslah diperhatikan. Karena banyak hal-hal yang tidak bisa kita prediksikan dapat terjadi dan menjadi tantangan tersendiri dilapangan.
Objek dari survey lapangan atau sebar kuesioner lapangan kali ini dalam kategori gampang-gampang susah. Target spesifik yang menjadi kriteria dari responden adalah subjek pajak para professional dalam hal ini pekerja yang memiliki domisili di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dan memiliki NPWP. Target yang kita tetapkan sesuai kriteria yang disepakati adalah para professional yang beraktifitas atau bekerja sebagai PNS, BUMN ataupun Pegawai Swasta lainnya yang memenuhi kriteria yang ditetapkan.
Crew lapangan yang diturunkan pada survey lapangan kali ini sebanyak 2 orang. Rata-rata tenaga yang kita pakai berusia antara 20 s.d 25 tahun. Selain muda semangatnya pun OK untuk menjaga kualitas hasil survey yang kita lakukan. Selain itu, crew yang well educated (rata-rata sedang menempuh perkuliahan) memberikan nilai plus tersendiri, selain dari pola bahasa dalam komunikasi yang baik, yang terpenting behave yang menyenangkan bagi responden kita.
Meskipun relatif tidak ada kendala yang berarti di lapangan yang tim kita temui, planning dan strategi yang terukur dalam melakukan survey lapangan tetap perlu diperhatikan. Calon responden yang kita hadapi adalah responden yang tetap memiliki kecenderungan untuk menolak sangat tinggi dikarenakan issue yang melatarbelakangi survey lapangan ini sedikit “menakutkan” (framing PAJAK). Perlu penjelasan yang persuasif dan ringan agar dapat meyakinkan calon responden atas tujuan survey yang dilakukan tidak menyentuh hal-hal yang sensitif tentang private information yang sangat dijaga kerahasiaanya oleh responden (misal : pendapatan atau pengeluaran, karena sensitif terhadap taksiran PAJAK).
Easyness dari proses survey ini adalah jumlah populasi kriteria responden yang sangat banyak, sehingga memudahkan tim lapangan dalam memperoleh target sampel. Tools lain yang kita gunakan dalam mendapatkan target sampel tersebut adalah gimmick atau souvenir survey, hal sangat sepele tapi sangat bermanfaat dalam proses persuasif kepada calon responden. Meskipun perlu ada budget tambahan dalam RAB peneliti, akan tetapi hal ini worthed untuk dilakukan dalam mempercepat proses survey lapangan.
Sharing singkat ini, semoga bermanfaat dalam membantu rekan-rekan peneliti dalam membangun frame awal sebelum melakukan survey dilapangan. Kami akan share banyak pengalaman kami di lapangan pada kesempatan yang lain. SEMANGAT MENELITI!!!
Pada kesempatan kali ini kita akan sharing pengalaman kita di lapangan, survey lapangan atau sebar kuesioner, yang berbeda dengan sharing pada kesempatan sebelumnya. Survey lapangan atau sebar kuesioner kali ini, hendak menggali informasi atau perspektif dari para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat), tepatnya informasi atau perspektif para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dalam hal pajak dan kepatuhan pajak. Sekali lagi bahwa persiapan fisik maupun pengetahuan terhadap medan lapangan yang akan dijadikan sasaran pengambilan data haruslah diperhatikan. Karena banyak hal-hal yang tidak bisa kita prediksikan dapat terjadi dan menjadi tantangan tersendiri dilapangan.
Objek dari survey lapangan atau sebar kuesioner lapangan kali ini dalam kategori gampang-gampang susah. Target spesifik yang menjadi kriteria dari responden adalah subjek pajak para professional dalam hal ini pekerja yang memiliki domisili di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dan memiliki NPWP. Target yang kita tetapkan sesuai kriteria yang disepakati adalah para professional yang beraktifitas atau bekerja sebagai PNS, BUMN ataupun Pegawai Swasta lainnya yang memenuhi kriteria yang ditetapkan.
Crew lapangan yang diturunkan pada survey lapangan kali ini sebanyak 2 orang. Rata-rata tenaga yang kita pakai berusia antara 20 s.d 25 tahun. Selain muda semangatnya pun OK untuk menjaga kualitas hasil survey yang kita lakukan. Selain itu, crew yang well educated (rata-rata sedang menempuh perkuliahan) memberikan nilai plus tersendiri, selain dari pola bahasa dalam komunikasi yang baik, yang terpenting behave yang menyenangkan bagi responden kita.
Meskipun relatif tidak ada kendala yang berarti di lapangan yang tim kita temui, planning dan strategi yang terukur dalam melakukan survey lapangan tetap perlu diperhatikan. Calon responden yang kita hadapi adalah responden yang tetap memiliki kecenderungan untuk menolak sangat tinggi dikarenakan issue yang melatarbelakangi survey lapangan ini sedikit “menakutkan” (framing PAJAK). Perlu penjelasan yang persuasif dan ringan agar dapat meyakinkan calon responden atas tujuan survey yang dilakukan tidak menyentuh hal-hal yang sensitif tentang private information yang sangat dijaga kerahasiaanya oleh responden (misal : pendapatan atau pengeluaran, karena sensitif terhadap taksiran PAJAK).
Easyness dari proses survey ini adalah jumlah populasi kriteria responden yang sangat banyak, sehingga memudahkan tim lapangan dalam memperoleh target sampel. Tools lain yang kita gunakan dalam mendapatkan target sampel tersebut adalah gimmick atau souvenir survey, hal sangat sepele tapi sangat bermanfaat dalam proses persuasif kepada calon responden. Meskipun perlu ada budget tambahan dalam RAB peneliti, akan tetapi hal ini worthed untuk dilakukan dalam mempercepat proses survey lapangan.
Sharing singkat ini, semoga bermanfaat dalam membantu rekan-rekan peneliti dalam membangun frame awal sebelum melakukan survey dilapangan. Kami akan share banyak pengalaman kami di lapangan pada kesempatan yang lain. SEMANGAT MENELITI!!!
Pada kesempatan kali ini kita akan sharing pengalaman kita di lapangan, survey lapangan atau sebar kuesioner, yang berbeda dengan sharing pada kesempatan sebelumnya. Survey lapangan atau sebar kuesioner kali ini, hendak menggali informasi atau perspektif dari para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat), tepatnya informasi atau perspektif para professional di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dalam hal pajak dan kepatuhan pajak. Sekali lagi bahwa persiapan fisik maupun pengetahuan terhadap medan lapangan yang akan dijadikan sasaran pengambilan data haruslah diperhatikan. Karena banyak hal-hal yang tidak bisa kita prediksikan dapat terjadi dan menjadi tantangan tersendiri dilapangan.
Objek dari survey lapangan atau sebar kuesioner lapangan kali ini dalam kategori gampang-gampang susah. Target spesifik yang menjadi kriteria dari responden adalah subjek pajak para professional dalam hal ini pekerja yang memiliki domisili di Jakarta (Barat, Timur, Selatan, Utara dan Pusat) dan memiliki NPWP. Target yang kita tetapkan sesuai kriteria yang disepakati adalah para professional yang beraktifitas atau bekerja sebagai PNS, BUMN ataupun Pegawai Swasta lainnya yang memenuhi kriteria yang ditetapkan.
Crew lapangan yang diturunkan pada survey lapangan kali ini sebanyak 2 orang. Rata-rata tenaga yang kita pakai berusia antara 20 s.d 25 tahun. Selain muda semangatnya pun OK untuk menjaga kualitas hasil survey yang kita lakukan. Selain itu, crew yang well educated (rata-rata sedang menempuh perkuliahan) memberikan nilai plus tersendiri, selain dari pola bahasa dalam komunikasi yang baik, yang terpenting behave yang menyenangkan bagi responden kita.
Meskipun relatif tidak ada kendala yang berarti di lapangan yang tim kita temui, planning dan strategi yang terukur dalam melakukan survey lapangan tetap perlu diperhatikan. Calon responden yang kita hadapi adalah responden yang tetap memiliki kecenderungan untuk menolak sangat tinggi dikarenakan issue yang melatarbelakangi survey lapangan ini sedikit “menakutkan” (framing PAJAK). Perlu penjelasan yang persuasif dan ringan agar dapat meyakinkan calon responden atas tujuan survey yang dilakukan tidak menyentuh hal-hal yang sensitif tentang private information yang sangat dijaga kerahasiaanya oleh responden (misal : pendapatan atau pengeluaran, karena sensitif terhadap taksiran PAJAK).
Easyness dari proses survey ini adalah jumlah populasi kriteria responden yang sangat banyak, sehingga memudahkan tim lapangan dalam memperoleh target sampel. Tools lain yang kita gunakan dalam mendapatkan target sampel tersebut adalah gimmick atau souvenir survey, hal sangat sepele tapi sangat bermanfaat dalam proses persuasif kepada calon responden. Meskipun perlu ada budget tambahan dalam RAB peneliti, akan tetapi hal ini worthed untuk dilakukan dalam mempercepat proses survey lapangan.
Sharing singkat ini, semoga bermanfaat dalam membantu rekan-rekan peneliti dalam membangun frame awal sebelum melakukan survey dilapangan. Kami akan share banyak pengalaman kami di lapangan pada kesempatan yang lain. SEMANGAT MENELITI!!!
Pada kesempatan yang lalu kita sudah membahas konsep perluasan dari analisis regresi dengan mempertimbangkan ketergantungan pada aspek kewilayahan (spasial). Pada dasarnya penggunaan regresi spasial harus dipastikan bahwa ketergantungan atau keberagaman dari aspek wilayah signifikan pada model regresi sehingga penggunaan regresi spasial pada data merupakan langkah yang tepat, akan tetapi jika hasil pengujian tidak signifikan maka regresi biasa merupakan langkah tepat yang sederhana. Selain itu, pembahasan pengaplikasian data pada software GWR 4 dapat membantu peneliti atau data master dalam memahami tahapan dalam menghasilkan model regresi yang terboboti oleh kewilayahan (spasial).
Pada kesempatan kali ini akan sedikit diuraikan pemahaman terhadap salah satu intrumen yang ada pada regresi spasial yang sangat menentukan dalam mengukur baik atau tidaknya model regresi spasial yang dihasilkan oleh data yaitu metode yang erat kaitannya dengan bandwidth yang dihasilkan untuk model. Pembahasan kali ini ada kaitannya juga dengan pertanyaan pembaca, yang hendak memahami secara konsepsi apa itu dan teknik penentuan bandwidth.
Definisi Bandwidth
Secara teoritis, bandwidth merupakan lingkaran dengan radius (b) dari titik pusat lokasi yang digunakan sebgai dasar penentuan bobot setiap pengamatan terhadap model regresi pada lokasi tersebut. Untuk pengamatan-pengamatan yang dekat dengan lokasi i maka akan lebih berpengaruh dalam membentuk parameter model lokasi ke-i. Karena itu pengamatan-pengamatan yang terletak di dalam radius (b) masih dianggap berpengaruh terhadap model pada lokasi tersebut, sehingga akan diberi bobot yang akan bergantung pada fungsi yang digunakan.
Metode pemilihan bandwidth sangat penting digunakan untuk pendugaan fungsi kernel yang tepat. Nilai bandwidth yang sangat kecil akan mengakibatkan varians membesar. Hal tersebut dapat disebabkan karena jika nilai bandwidth sangat kecil maka akan sedikit pengamatan yang berbeda pada radius (b). Namun ketika nilai bandwidth yang sangat besar akan mengakibatkan varians mengecil. Sehingga untuk menghindari varians yang tidak homogen akibat nilai pendugaan koefisien parameter yang meningkat, maka diperlukan suatu cara untuk memilih bandwidth yang tepat.
Menurut Fortheringham, dkk (2002) beberapa metode pilihan untuk pemilihan bandwidth optimum adalah sebagai berikut : 1) Cross Validation; 2) Akaike Information Criterion (AIC); 3) Generalized Cross Validation (GCV) dan 4) Bayesian Information Criterion (BIC).
Definisi Fungsi Likelihood
Karena dalam beberapa metode yang digunakan untuk menentukan bandwidth terdapat istilah likelihood, yang merupakan istilah matematik statistik, ada baiknya kita coba sampaikan sedikit pengertian terkait dengan likelihood atau fungsi likelihood yang merujuk pada definisi atau konsepsi yang diuraikan pada literatur rujukan.
Ide umum yang melatarbelakangi metode maksimum likelihood adalah sebagai berikut. Misalkan f(x,θ) merupakan fungsi kepadatan (density function) dari variabel random X dan misalkan θ merupakan parameter fungsi kepadatan. Kalau kita mengamati suatu sampel random X1, X2, . . , XN, maka penaksiran maksimum likelihood dari θ adalah nilai θ yang mempunyai probabilitas terbesar untuk menghasilkan sampel yang diamati. Dengan perkataan lain, taksiran maksimum likelihood dari θ adalah yang memaksimumkan fungsi kepadatan (density function). Note : fungsi kepadatan dapat diperjelas dengan pengdekatan distribusi peluang (jenis distribusi peluang yang sesuai dengan data).
Secara prinsipil pemahaman atas fungsi likelihood yang didapat dari literatur adalah sebagai berikut.
In frequentist inference, a likelihood function (often simply the likelihood) is a function of the parameters of a statistical model, given specific observed data. Likelihood functions play a key role in frequentist inference, especially methods of estimating a parameter from a set of statistics. In informal contexts, “likelihood” is often used as a synonym for “probability”. In mathematical statistics, the two terms have different meanings. Probability in this technical context describes the plausibility of a future outcome, given a model parameter value, without reference to any observed data. Likelihood describes the plausibility of a model parameter value, given specific observed data.
Cross Validation
Cross validation adalah salah satu teknik dalam mendapatkan nilai bandwidth yang sangat berguna dalam mendapatkan nilai pembobotan yang akan digunakan dalam proses perhitungan model regresi spasial. Jika dilihat dari perumusan yang digunakan untuk mendapatkan nilai bandwidth, CV, memiliki pola perumusan yang paling sederhana, seperti tampak pada perumusan CV berikut,
dengan y taksiran (y topi) adalah nilai penaksir yi dimana pengamatan di lokasi (ui,vj) dihilangkan dari proses estimasi. Untuk mendapatkan nilai radius (b) yang optimal maka diperoleh dari radius (b) yang menghasilkan nilai CV yang minimum.
Jika kita merujuk pada pemahaman dasar tentang cross validasi dan keluar telebih dahulu dari konsep bandwidth maka cross validasi dapat dimaknai sesuai dengan definisi dari literatur sebagai berikut.
“Cross-validation, sometimes called rotation estimation, is a model validation technique for assessing how the results of a statistical analysis will generalize to an independent data set. It is mainly used in settings where the goal is prediction, and one wants to estimate how accurately a predictive model will perform in practice. In a prediction problem, a model is usually given a dataset of known data on which training is run (training dataset), and a dataset of unknown data (or first seen data) against which the model is tested (called the validation dataset or testing set).The goal of cross validation is to define a dataset to “test” the model in the training phase (i.e., the validation set), in order to limit problems like overfitting, give an insight on how the model will generalize to an independent dataset (i.e., an unknown dataset, for instance from a real problem), etc.
One round of cross-validation involves partitioning a sample of data into complementary subsets, performing the analysis on one subset (called the training set), and validating the analysis on the other subset (called the validation set or testing set). To reduce variability, in most methods multiple rounds of cross-validation are performed using different partitions, and the validation results are combined (e.g. averaged) over the rounds to estimate a final predictive model.
Secara ringkas definisi teori di atas menunjukkan bahwa proses cross validasi melibatkan 2 konsep kelompok data dimana terdapat kelompok data validasi (test data) dan kelompok data rill (training data) yang diambil dari populasi yang sama dan jika dilakukan pemodelan pada dua kelompok data tersebut akan menghasilkan model yang relatif sama. Sedangkan apabila dihasilkan model yang tidak sama maka pada model yang dihasilkan (training data) terdapat masalah overfitting.
Gambar 1. Ilutrasi Data Fitting Berdasarkan Kriteria Cross Validation
Jika kita kembalikan kepada konsepsi bandwith maka fungsi cross validasi diterapkan pada data yang sama, berdasarkan konsepsi rumus di atas, kelompok data validasi (test data) diambil dengan cara menghilangkan nilai titik data ke-i untuk dibandingkan dengan kelompok data keseluruhan (training data) dengan cara iterasi sampai diiperoleh nilai CV yang minimum.
Akaike Information Criterion (AIC)
Konsepsi pada AIC tidak jauh beda dengan konsepsi pada CV. Yang pada intinya mengkomparasikan model yang mungkin dibentuk dari suatu set data yang dapat menghasilkan model dengan kekeliruan seminimal mungkin. Sehingga kaitannya dengan konsepsi regresi spasial khususnya pada pemilihan bandwidth, maka akan dipilih nilai AIC yang dapat meminimalkan kekeliruan model atau meminimalkan hilangnya informasi dari data pada model yang terbentuk.
Jika kita merujuk pada pemahaman dasar tentang AIC dan keluar telebih dahulu dari konsep bandwidth maka AIC dapat dimaknai sesuai dengan definisi dari literatur sebagai berikut.
The Akaike information criterion (AIC) is an estimator of the relative quality of statistical models for a given set of data. Given a collection of models for the data, AIC estimates the quality of each model, relative to each of the other models. Thus, AIC provides a means for model selection.
AIC does not provide a test of a model in the sense of testing a null hypothesis. It tells nothing about the absolute quality of a model, only the quality relative to other models. Thus, if all the candidate models fit poorly, AIC will not give any warning of that.
Misal kita memiliki model-model statistik dari suatu set data. Dengan k adalah jumlah parameter dalam model yang akan ditaksir dan L adalah nilai maksimum dari fungsi likelihood model. Maka AIC dapat dirumuskan secara matematis sebagai berikut :
Dengan kriteria berdasarkan definisi yang didapat dari literatur sebagai berikut,
Given a set of candidate models for the data, the preferred model is the one with the minimum AIC value. Thus, AIC rewards goodness of fit (as assessed by the likelihood function), but it also includes a penalty that is an increasing function of the number of estimated parameters. The penalty discourages overfitting, because increasing the number of parameters in the model almost always improves the goodness of the fit.
Bayesian Information Criterion (BIC)
Sama halnya dengan AIC, BIC berdasar pada fungsi likelihood dari suatu set data. Fungsi dari BIC adalah sebuah kriteria dalam pemilihan model terbaik dari suatu set model (banyak model). Dimana yang menjadi kriteria adalah model yang memiliki nilai BIC yang paling rendah adalah model yang paling baik.
Dimana L adalah nilai maksimum dari fungsi likelihood dari model; n adalah ukuran sampel dan k adalah jumlah parameter model yang ditaksir (termasuk konstantan, koefisien beta dan error).
Pada prinsipnya konsepsi penggunaan BIC dengan AIC adalah sama, yang membedakan adalah pada operator penalti bagi parameter yang digunakan dalam kedua model perumusan. Dimana pada AIC operator penalti yang digunakan adalah “2k” sedangkan pada BIC operator yang digunakan adalah “ln(n)k”.
Dan secara prinsipil perbedaan antara AIC dan BIC yang didapat dari literatur adalah sebagai berikut.
A point made by several researchers is that AIC and BIC are appropriate for different tasks. In particular, BIC is argued to be appropriate for selecting the “true model” (i.e. the process that generated the data) from the set of candidate models, whereas AIC is not appropriate. To be specific, if the “true model” is in the set of candidates, then BIC will select the “true model” with probability 1, as n → ∞; in contrast, when selection is done via AIC, the probability can be less than 1. Proponents of AIC argue that this issue is negligible, because the “true model” is virtually never in the candidate set. Indeed, it is a common aphorism in statistics that “all models are wrong”; hence the “true model” (i.e. reality) cannot be in the candidate set.
Guna memandu pemahaman pada para peneliti atau data master, ada baiknya kita sarankan untuk memahami terlebih dahulu secara mendalam konsep CV dibandingkan dengan AIC dan BIC. CV relatif sederhana (sebagai analogi pahami gambar 1) dalam segi memahami dalam konsepsi matematisnya dibandingkan dengan konsepsi matematis pada AIC dan BIC. Namun secara umum ketiga kriteria CV, AIC dan BIC dalam hal penerapannya pada konsepsi bandwitdh pada pemodelan regresi spasial dapat dijadikan dasar pertimbangan yang saling melengkapi, dikarenakan secara aplikasi (pada software GWR 4) ketiga ukuran tersebut muncul dan dapat dikomparasikan sehingga memudahkan peneliti dalam menentukan pemilihan model regresi spasial yang ideal pada data yang dimilikinya. SEMANGAT MEMAHAMI!!!