Pembahasan kita sekarang menginjak lebih banyak pada pembahasan tentang analisis dalam rumpun multivariat. Pada bahasan sebelumnya kita sudah banyak membahas tentang regresi, analisis faktor, path analysis dan struktural equation modeling (SEM). Analisis tersbut merupakan rumpun dari analisis multivariat. Pada bahasan kali ini kita akan sedikit banyak mengupas analisis lain dalam multivariat yaitu principal component analysis. Sekilas mirip dengan analisis faktor eksploratori atau pun analisis faktor konfirmatori, akan tetapi analisis komponen utama (AKU) atau principal component analysis (PCA) dalam aplikasinya lebih sederhana dibandingkan dengan analisis faktor.
Pada bahasan sebelumnya, pada pengujian asumsi regresi linear klasik bab multikolinearitas sedikit dibahas dalam hal perbaikan model regresi jika terdapat masalah multikolinearitas. Fungsi dari principal component analysis (PCA) adalah dengan merangkum banyak variabel bebas (X) yang memiliki indikasi saling berkorelasi ataupun saling mempengaruhi menjadi satu atau lebih variabel baru yang memuat kombinasi dari variabel-variabel bebas (X) sebelumnya, yang akan memungkinkan menghilangkan masalah multikolinearitas ketika dibentuk suatu model regresi (regresi komponen utama).
Pada kesempatan kali ini kita akan sedikit banyak menguraikan analisis principal component analysis (PCA) dari segi konsepsi dan bagaimana menghasilkan komponen yang optimal dari sekelompok banyak variabel.
Principal Component Analysis (PCA)
Pada dasarnya analisis komponen utama (PCA) bertujuan menerangkan struktur varians-kovarians melalui kombinasi linear dari variabel-variabel. Secara umum analisis komponen utama bertujuan untuk mereduksi data dan menginterpretasikannya. Meskipun dari dari p buah variabel asal dapat diturunkan menjadi p buah komponen utama untuk menerangkan keragaman total sistem (p buah variabel), namun seringkali keragaman total itu dapat diterangkan secara memuaskan oleh sejumlah kecil komponen utama, misal, oleh k buah komponen utama, dimana k < p (k lebih kecil dari pada p). Dalam hal ini, k buah komponen utama dapat menggantikan p buah variabel asal.
Analisis komponen utama sering kali dilakukan tidak saja merupakan akhir dari suatu pengolahan data tetapi juga merupakan tahap (langkah) antara dalam kebanyakan penelitian yang bersifat lebih besar (luas). Sebagai misal dalam analisis regresi komponen utama (principal component regression), maka analisis komponen utama akan merupakan tahap antara karena komponen utama dipergunakan sebagai input dalam membangun analisis regresi, demikian pula dalam analisis kluster, komponen utama dipergunakan sebagai input untuk melakukan pengelompokan.
Konsep Dasar Principal Component Analysis (PCA)
- Komponen utama pertama adalah kombinasi linear terbobot dari variabel asal yang dapat menerangkan keragaman terbesar.
- Komponen utama kedua adalah kombinasi linear terboboti dari variabel asal yang tidak berkorelasi dengan komponen utama pertama, serta memaksimumkan sisa keragaman data setelah diterangkan oleh komponen utama pertama.
- Dan seterusnya.
Sebagai catatan dalam penggunaan principal component analysis (PCA), pertama, apabila satuan dari variabel (X) yang digunakan dalam membangun komponen utama tidak sama, maka variabel perlu ditransformasikan terlebih dahulu kedalam angka baku (Z). Kedua, ada dua jenis bentuk input dalam pemrosesan pembentukan komponen utama yaitu matriks varians-kovarians dan matriks korelasi, matriks varians-kovarians digunakan jika satuan dari variabel sama dan matriks korelasi digunkan jika satuan dari variabel tidak sama dan variabel di transformasikan ke dalam bentuk angka baku (Z). Ketiga, penentuan dalam penggunaan jenis matriks sebagai input dari perhitungan komponen utama (S atau R) menentukan dalam formulasi yang digunakan dalam rangka menghitung besarnya bagian atau persentase keragaman total yang mampu diterangkan oleh komponen utama ke-j dan formulasi yang digunakan untuk mengukur keeratan hubungan (korelasi) antara variabel asal dengan komponen utama yang tebentuk. Keempat, perhitungan nilai skor komponen utama diperoleh dari hasil perkalian nilai variabel (X) dengan nilai vektor eigen yang dihasilkan dari proses perhitungan (bukan dari hasil perkalian faktor loading dengan nilai variabel X-nya).
Kriteria Dalam Principal Componen Analysis (PCA)
Biasanya dalam principal component analysis (PCA), dari p buah komponen utama yang ada dipilih k buah komponen utama saja yang telah mampu menerangkan keragaman data cukup tinggi, katakanlah sekitar 80% s.d 90% dengan kriteria k < p. Misal, apabila p berukuran besar, sedangkan diketahui bahwa sekitar 80% s.d 90% keragaman total telah mampu diterangkan satu, dua atau tiga komponen utama pertama, maka komponen-komponen utama tersebut telah dapat menggantikan p buah variabel asal tanpa mengurangi informasi yang banyak.
Selanjutnya untuk menentukan variabel mana yang berkontribusi besar pada tiap komponen utama yang terbentuk, ditentukan berdasarkan nilai keeratan hubungan (nilai loading) yang dihasilkan antara variabel asal dengan komponen utama. Besar kontribusi untuk masing-masing variabel penelitian dalam komponen utama ditentukan dengan semakin tinggi nilai loading yang dihasilkan, berdasarkan kriteria korelasi di mana nilai korelasi lebih besar atau sama dengan 0.500 memiliki hubungan yang kuat dan sebaliknya untuk nilai korelasi lebih kecil dari 0.500 memiliki hubungan yang lemah.
Penentuan Banyak Komponen Utama
Penentuan banyaknya komponen utama yang akan di ekstrak dapat ditentukan beberapa cara diantaranya:
- Kriteria eigen value, ditentukan dengan memilih komponen utama yang memiliki nilai eigen lebih besar atau sama dengan satu (1). Komponen utama dengan nilai eigen kurang dari satu (1) dikeluarkan dari analisis.
- Kriteria apriori. Dalam hal ini peneliti sudah menetapkan terlebih dahulu berapa banyak komponen utama yang akan diekstrak.
- Kriteria persentase varians. Banyaknya komponen utama yang akan diekstrak ditentukan oleh persentase kumulatif varians (bahasan sebelumnya)
- Scree test. Dilakukan dengan membuat plot eigen value terhadap komponen utama berdasarkan urutan perolehannya. Kurva yang diperoleh menjadi dasar penetapan banyaknya komponen utama yang akan diekstrak. Banyak komponen utama ditentukan apabila kurva menjadi datar dengan melihat pada sumbu komponen utama.
Dengan mengetahui dan memahami fungsi dari principal componen analysis (PCA), para peneliti, khususnya peneliti pemula dapat dengan mudah mengaplikasikannya pada teori dan data lapangan yang dimilikinya. Principal componen analysis (PCA) juga bermanfaat dalam regrouping variabel-variabel dengan melakukan penamaan ulang pada komponen utama yang terbentuk, dengan melihat karakteristik dominan variabel yang menyusunya. SEMANGAT MENCOBA!!!
———————————————————————————————————————————————————-
- Jika rekan peneliti memerlukan bantuan Survey Lapangan, Survey Online ataupun Olah Data dapat menghubungi mobilestatistik.com di :
- WhatsApp : 081321709749
- Email : welcome@mobilestatistik.com
- Klik “Konsultasi Gratis” untuk mendapatkan informasi atau solusi terkait dengan pertanyaan-pertanyaan seputar metodologi penelitian.
- “1st Kirim Pertanyaan, Kami Jawab . . . InsyaAllah”
———————————————————————————————————————————————————-