Matriks faktor. Konsep teoritis dasar analisis faktor

Contoh berikut didasarkan pada data fiktif terkait studi kepuasan hidup. Misalkan kuesioner dikirim ke 100 orang dewasa yang dipilih secara acak. Kuesioner berisi 10 item yang dirancang untuk mengukur kepuasan kerja, kepuasan hobi, kepuasan kehidupan rumah, dan kepuasan umum di bidang kehidupan lainnya. Tanggapan atas pertanyaan dimasukkan ke dalam komputer dan diskalakan sehingga rata-rata semua item kira-kira 100.

Hasilnya ditempatkan di file data Factor.sta. Anda dapat membuka file ini menggunakan opsi File - Open; kemungkinan besar file data ini terletak di direktori /Examples/Datasets. Di bawah ini adalah daftar variabel dalam file ini (pilih Semua Spesifikasi Variabel dari menu Data untuk daftar).

Tujuan analisis . Tujuan analisis adalah untuk mempelajari hubungan antara kepuasan dalam berbagai bidang aktivitas. Secara khusus, sebaiknya mempelajari pertanyaan tentang jumlah faktor yang "tersembunyi" di balik berbagai bidang kegiatan dan signifikansinya.

Pilihan analisis. Pilih Analisis Faktor dari menu Analisis - Analisis Eksplorasi Multivariat untuk menampilkan panel peluncuran modul Analisis Faktor. Klik tombol Variabel pada Launchpad (lihat di bawah) dan pilih semua 10 variabel dalam file ini.



Pilihan lain . Untuk melakukan analisis faktor standar, kotak dialog ini memiliki semua yang Anda butuhkan. Untuk mendapatkan ringkasan perintah lain yang tersedia dari landasan peluncuran, Anda dapat memilih sebagai berkas masukan matriks korelasi (menggunakan bidang file Data). Di bidang Penghapusan PD, Anda dapat memilih pengecualian baris demi baris atau berpasangan atau substitusi rata-rata untuk data yang hilang.

Tentukan metode ekstraksi faktor. Kami sekarang menekan tombol OK untuk melanjutkan ke kotak dialog berikutnya yang disebut Tentukan Metode Ekstraksi Faktor. Dengan menggunakan kotak dialog ini, Anda dapat melihat statistik deskriptif, melakukan analisis regresi berganda, memilih metode ekstraksi faktor, memilih jumlah faktor maksimum, nilai eigen minimum, dan tindakan lain yang terkait dengan spesifikasi metode ekstraksi faktor. Sekarang mari kita pergi ke tab Deskriptif.



Lihat statistik deskriptif. Sekarang klik pada View Corr./Average/Std. di jendela ini untuk membuka jendela Lihat Statistik Deskriptif.



Anda sekarang dapat melihat statistik deskriptif secara grafis atau dengan tabel hasil.

Perhitungan matriks korelasi. Klik tombol Correlations pada tab Advanced untuk menampilkan tabel hasil dengan korelasi.



Semua korelasi dalam tabel hasil ini positif, dan beberapa korelasi signifikan. Misalnya, variabel Hobby_1 dan Miscel_1 berkorelasi pada level 0,90. Beberapa korelasi (misalnya, korelasi antara kepuasan di tempat kerja dan kepuasan di rumah) tampak relatif kecil. Sepertinya matriks memiliki struktur yang berbeda.

Metode seleksi. Sekarang klik tombol Cancel pada kotak dialog View Descriptive Statistics untuk kembali ke kotak dialog Specify Factor Extraction Method. Anda dapat memilih dari beberapa metode pemilihan pada tab Tingkat Lanjut (lihat tab Tingkat Lanjut dari kotak dialog Tentukan Metode Ekstraksi Faktor untuk penjelasan masing-masing metode, dan Tinjauan Pendahuluan untuk penjelasan Metode Komponen Utama dan Metode Faktor Utama). Dalam contoh ini, defaultnya adalah Principal Components, Max. jumlah faktor berisi nilai 10 (jumlah faktor maksimum dalam contoh ini) dan bidang Min. memiliki nilainya berisi 0 (nilai minimum untuk perintah ini).



Klik OK untuk melanjutkan analisis.

Lihat hasil. Anda dapat melihat hasil analisis faktor di kotak dialog Hasil Analisis Faktor. Pertama pilih tab Varians yang Dijelaskan.



Menampilkan nilai eigen . Penugasan nilai eigen dan kegunaannya bagi pengguna dalam memutuskan berapa banyak faktor yang harus ditinggalkan (diinterpretasikan) telah dijelaskan dalam Tinjauan Pendahuluan. Sekarang klik tombol Nilai Eigen untuk mendapatkan tabel dengan nilai eigen, persentase varian total, nilai eigen terakumulasi, dan persentase terakumulasi.


Seperti terlihat pada tabel, nilai eigen untuk faktor pertama adalah 6,118369; itu. proporsi varian yang dijelaskan oleh faktor pertama adalah sekitar 61,2%. Perhatikan bahwa nilai-nilai ini ternyata mudah dibandingkan di sini, karena 10 variabel dianalisis, dan oleh karena itu jumlah semua nilai eigen ternyata adalah 10. Faktor kedua mencakup sekitar 18% varian. Faktor lain mengandung tidak lebih dari 5%varian total.Pilihan sejumlah faktor. Bagian Ikhtisar Pendahuluan secara singkat menjelaskan bagaimana nilai eigen yang dihasilkan dapat digunakan untuk memutuskan berapa banyak faktor yang akan dipertahankan dalam model. Menurut uji Kaiser (Kaiser, 1960), Anda harus membiarkan faktor dengan nilai eigen lebih besar dari 1. Berdasarkan tabel di atas, hasil pengujian dalam dua faktor dipilih.

Kriteria scree . Sekarang klik tombol Scree Plot untuk mendapatkan plot nilai eigen untuk menerapkan tes scree Cattell (Cattell, 1966). Grafik di bawah ini telah dilengkapi dengan segmen yang menghubungkan nilai eigen yang berdekatan untuk membuat kriteria lebih visual. Cattell menyatakan, berdasarkan metode Monte Carlo, bahwa titik di mana penurunan terus menerus dari nilai eigen melambat dan di luarnya tingkat nilai eigen yang tersisa hanya mencerminkan "kebisingan" acak. Pada grafik di bawah, titik ini mungkin sesuai dengan faktor 2 atau 3 (seperti yang ditunjukkan oleh panah). Oleh karena itu, cobalah kedua solusi tersebut dan lihat mana yang memberikan gambaran yang lebih memadai.



Sekarang pertimbangkan pemuatan faktor.

Beban faktor . Seperti dijelaskan pada bagian Ikhtisar Pendahuluan, pemuatan faktor dapat diartikan sebagai korelasi antara faktor dan variabel. Karena itu, mereka paling mewakili informasi penting di mana interpretasi faktor didasarkan. Pertama, mari kita lihat pemuatan faktor (tidak miring) untuk kesepuluh faktor. Di tab Beban dari kotak dialog Hasil analisis faktor, di bidang Rotasi faktor, tetapkan nilai tanpa rotasi dan klik tombol Beban faktor untuk menampilkan tabel beban.



Ingatlah bahwa pemilihan faktor terjadi sedemikian rupa sehingga faktor-faktor berikutnya memiliki varians yang semakin berkurang (lihat bagian Tinjauan Pendahuluan). Oleh karena itu, tidak mengherankan jika faktor pertama memiliki beban tertinggi. Perhatikan bahwa tanda-tanda pemuatan faktor penting hanya untuk menunjukkan bahwa variabel dengan pemuatan berlawanan pada faktor yang sama berinteraksi dengan faktor ini dengan cara yang berlawanan. Namun, Anda dapat mengalikan semua muatan dalam kolom dengan -1 dan membalik tandanya. Dalam semua hal lainnya, hasilnya akan tetap tidak berubah.

Rotasi solusi faktor. Seperti yang dijelaskan di bagian Ikhtisar Pendahuluan, orientasi sebenarnya dari faktor-faktor dalam ruang faktor bersifat arbitrer, dan setiap rotasi faktor mereproduksi korelasi sama seperti rotasi lainnya. Oleh karena itu, tampaknya wajar untuk merotasi faktor sedemikian rupa untuk memilih struktur faktor yang paling mudah diinterpretasikan. Sebenarnya, istilah struktur sederhana diciptakan dan didefinisikan oleh Thurstone (1947) terutama untuk menggambarkan kondisi di mana faktor-faktor ditandai dengan beban tinggi pada beberapa variabel dan beban rendah pada yang lain, dan juga ketika terdapat beberapa beban silang yang besar, yaitu terdapat beberapa variabel dengan muatan yang signifikan pada lebih dari satu faktor. Metode rotasi komputasi paling standar untuk memperoleh struktur sederhana adalah metode rotasi varimax yang diusulkan oleh Kaiser (Kaiser, 1958). Metode lain yang dikemukakan oleh Harman (Harman, 1967) adalah metode quartimax, biquartimax, dan equimax (lihat Harman, 1967).

Pemilihan rotasi . Pertama pertimbangkan jumlah faktor yang ingin Anda tinggalkan untuk diputar dan ditafsirkan. Sebelumnya diputuskan bahwa jumlah faktor yang paling masuk akal dan dapat diterima adalah dua, tetapi berdasarkan kriteria scree, diputuskan juga untuk memperhitungkan keputusan dengan tiga faktor. Klik tombol Cancel untuk kembali ke kotak dialog Set Factor Extraction Method, dan ubah field Maximum number of factors pada tab Quick dari 10 menjadi 3, lalu klik tombol OK untuk melanjutkan analisis.

Sekarang mari kita putar menggunakan metode varimax. Di tab Beban kotak dialog Hasil analisis faktor, di bidang Rotasi faktor, atur nilai Varimax awal.



Tekan tombol Beban faktor untuk menampilkan hasil beban faktor yang dihasilkan dalam tabel.


Menampilkan solusi saat memutar tiga faktor. Tabel menunjukkan pembebanan yang signifikan pada faktor pertama untuk semua variabel kecuali yang berhubungan dengan rumah. Faktor 2 memiliki muatan yang cukup signifikan untuk semua variabel kecuali yang berhubungan dengan kepuasan kerja. Faktor 3 hanya memiliki satu muatan signifikan pada variabel Home_1. Fakta bahwa faktor ketiga sarat dengan hanya satu variabel membuat orang bertanya-tanya apakah hasil yang baik dapat diperoleh tanpa faktor ketiga?

Tinjau solusi di bawah rotasi dua faktor . Klik tombol Batal lagi di kotak dialog Hasil Analisis Faktor untuk kembali ke kotak dialog Tentukan Metode Ekstraksi Faktor. Ubah bidang Jumlah faktor maksimum pada tab Cepat dari 3 menjadi 2 dan klik OK untuk masuk ke kotak dialog Hasil Analisis Faktor. Pada tab Beban, di bidang Faktor rotasi, atur nilai Awal ke Varimax dan klik tombol Beban faktor.


Faktor 1, seperti terlihat pada tabel, memiliki loading tertinggi untuk variabel yang berhubungan dengan kepuasan kerja. Ini memiliki beban terkecil pada variabel yang berhubungan dengan kepuasan rumah. Beban lainnya mengambil nilai tengah. Faktor 2 memiliki loading tertinggi untuk variabel yang berhubungan dengan kepuasan di rumah, loading terendah untuk kepuasan di tempat kerja, rata-rata loading untuk variabel yang tersisa.

Interpretasi solusi untuk rotasi dua faktor . Apakah mungkin untuk menafsirkan model ini? Tampaknya kedua faktor tersebut paling baik diidentifikasi sebagai kepuasan kerja (faktor 1) dan kepuasan kehidupan di rumah (faktor 2). Kepuasan terhadap hobi seseorang dan berbagai aspek kehidupan lainnya tampaknya berkaitan dengan keduanya. Model ini menunjukkan, dalam arti tertentu, bahwa kepuasan kerja dan kehidupan rumah dalam sampel ini mungkin tidak bergantung satu sama lain, namun keduanya berkontribusi pada kepuasan dengan hobi dan aspek kehidupan lainnya.

Diagram keputusan berdasarkan rotasi dua faktor . Untuk mendapatkan scatterplot dari dua faktor, klik tombol 2M Load Plot di tab Loads dari kotak dialog Factor Analysis Results. Diagram di bawah hanya menunjukkan dua beban untuk setiap variabel. Perhatikan bahwa scatterplot mengilustrasikan dengan baik dua faktor independen dan 4 variabel (Hobby_1, Hobby_2, Miscel_1, Miscel_2) dengan beban silang.



Sekarang mari kita lihat seberapa baik matriks kovarian yang diamati dapat direproduksi oleh solusi dua faktor.

Matriks korelasi yang direproduksi dan residual. Klik tombol Reproduced and Residual Correlations pada tab Explained Variance untuk mendapatkan dua tabel dengan matriks korelasi yang direplikasi dan matriks korelasi residual (diamati dikurangi korelasi yang direplikasi).



Entri dalam tabel Residual Correlations dapat diartikan sebagai "jumlah" korelasi yang tidak dapat dipertanggungjawabkan oleh dua faktor yang dihasilkan. Tentu saja, elemen diagonal dari matriks mengandung standar deviasi yang tidak dapat ditanggung oleh faktor-faktor ini, yang sama dengan akar kuadrat dari satu dikurangi kesamaan masing-masing untuk kedua faktor tersebut (ingat bahwa kesamaan variabel adalah varians, yang dapat dijelaskan oleh sejumlah faktor yang dipilih). Jika Anda memeriksa matriks ini dengan cermat, Anda dapat melihat bahwa sebenarnya tidak ada korelasi residual yang lebih besar dari 0,1 atau kurang dari -0,1 (sebenarnya, hanya sebagian kecil yang mendekati nilai ini). Selain itu, dua faktor pertama mencakup sekitar 79% dari total varians (lihat % kumulatif nilai eigen di tabel hasil).

"Rahasia" dari contoh yang baik . Contoh yang baru saja Anda pelajari sebenarnya memberikan solusi yang hampir sempurna untuk masalah dua faktor. Ini menentukan sebagian besar varians, memiliki interpretasi yang masuk akal, dan mereproduksi matriks korelasi dengan penyimpangan sedang (korelasi residual). Faktanya, data nyata jarang memungkinkan untuk mendapatkan solusi sederhana seperti itu, dan faktanya kumpulan data fiktif ini diperoleh dengan menggunakan generator bilangan acak dengan distribusi normal yang tersedia di sistem. Dengan cara khusus, dua faktor ortogonal (independen) "dimasukkan" ke dalam data, yang dengannya korelasi antar variabel dihasilkan. Contoh analisis faktor ini mereproduksi dua faktor sebagaimana adanya (yaitu faktor kepuasan kerja dan faktor kepuasan kehidupan rumah tangga). Jadi, jika sebuah fenomena (dan bukan buatan, seperti dalam contoh, data) mengandung kedua faktor ini, maka dengan mengisolasinya, Anda dapat mempelajari sesuatu tentang struktur tersembunyi atau laten dari fenomena tersebut.

Hasil lainnya . Sebelum membuat kesimpulan akhir, kami memberikan komentar singkat tentang hasil lainnya.

komunitas . Untuk memperoleh generalitas solusi, klik tombol Generalities di tab Explained Variance dari kotak dialog Factor Analysis Results. Ingatlah bahwa kesamaan suatu variabel adalah fraksi varians yang dapat direproduksi untuk sejumlah faktor tertentu. Rotasi ruang faktor tidak mempengaruhi jumlah generalitas. Kesamaan yang sangat rendah untuk satu atau dua variabel (dari banyak dalam analisis) dapat menunjukkan bahwa variabel-variabel tersebut tidak dijelaskan dengan baik oleh model.

Koefisien nilai. Koefisien faktor dapat digunakan untuk menghitung nilai faktor pada setiap observasi. Koefisien itu sendiri biasanya kurang menarik, tetapi nilai faktor berguna dalam analisis lebih lanjut. Untuk menampilkan koefisien, klik tombol Koefisien Nilai Faktor pada tab Nilai pada kotak dialog Hasil Analisis Faktor.

Nilai faktor. Nilai faktorial dapat dianggap sebagai nilai saat ini untuk setiap responden yang disurvei (yaitu, untuk setiap observasi dari tabel data asli). Tombol Nilai Faktor pada tab Nilai dari kotak dialog Hasil Analisis Faktor memungkinkan Anda untuk menghitung nilai faktor. Nilai-nilai ini dapat disimpan untuk nanti dengan mengklik tombol Simpan Nilai.

Komentar terakhir. Analisis faktor bukanlah prosedur yang mudah. Siapa pun yang terus-menerus menggunakan analisis faktor dengan banyak (misalnya 50 atau lebih) variabel dapat melihat banyak contoh "perilaku patologis" seperti: nilai eigen negatif dan solusi yang tidak dapat ditafsirkan, matriks khusus, dll. Jika Anda tertarik menggunakan analisis faktor untuk menentukan atau faktor signifikan untuk sejumlah besar variabel, Anda harus mempelajarinya dengan cermat panduan terperinci(misalnya, buku Harman (Harman, 1968)). Jadi, karena banyak keputusan penting dalam analisis faktor bersifat subyektif (jumlah faktor, metode rotasi, interpretasi beban), bersiaplah bahwa diperlukan beberapa pengalaman sebelum Anda merasa yakin dengannya. Modul Analisis Faktor telah dirancang khusus untuk memudahkan pengguna beralih secara interaktif di antara jumlah faktor yang berbeda, rotasi, dll., untuk menguji dan membandingkan solusi yang berbeda.

Contoh ini diambil dari sistem bantuan RFP STATISTIK oleh StatSoft

ANALISIS FAKTOR STATISTIK

Korelasi (faktor.sta) Penghapusan baris demi baris dari PD n=100

Variabel

KERJA_1

KERJA_2

KERJA_3

RUMAH NOMOR 1

RUMAH 2

RUMAH 3

Seperti yang terlihat dari matriks korelasi, variabel yang berhubungan dengan kepuasan kerja lebih berkorelasi satu sama lain, dan variabel yang berhubungan dengan kepuasan di rumah juga lebih berkorelasi satu sama lain. Korelasi antara kedua jenis variabel tersebut (variabel yang berhubungan dengan kepuasan kerja dan variabel yang berhubungan dengan kepuasan di rumah) relatif kecil. Oleh karena itu tampaknya masuk akal bahwa ada dua faktor yang relatif independen (dua jenis faktor) yang tercermin dalam matriks korelasi: yang satu berhubungan dengan kepuasan kerja dan yang lainnya berhubungan dengan kepuasan kehidupan rumah tangga.

    Beban faktor

Tahap kedua analisis faktor adalah pemilihan faktor awal baik dengan metode komponen utama atau dengan metode faktor utama. Hasil dari contoh kita adalah solusi dua faktor. Pertimbangkan korelasi antara variabel dan dua faktor (atau variabel "baru"). Korelasi ini disebut korelasi faktor.

Tabel 3.16

Tabel beban faktor (metode komponen utama)

ANALISIS FAKTOR STATISTIK

Beban Faktor (Tanpa Rotasi) Komponen Utama

Variabel

Faktor 1

Faktor 2

Variasi total

Bagian dari total disp.

Seperti dapat dilihat dari Tabel 3.16, faktor pertama lebih berkorelasi dengan variabel daripada faktor kedua (karena nilai bobot beban untuk setiap variabel faktor pertama lebih besar daripada faktor kedua). Ini jelas karena, seperti disebutkan di atas, faktor-faktor diekstraksi secara berurutan dan mengandung varians total yang semakin sedikit (lihat bagian Eigenvalues ​​​​dan jumlah faktor yang dibedakan, halaman 61).

    Metode Rotasi Faktor

Tahap ketiga analisis faktor adalah perputaran beban faktor yang dihasilkan dari tahap sebelumnya. Metode rotasi tipikal adalah strateginya varimax, quartimax, Dan equimax. Tujuan dari metode ini adalah untuk mendapatkan matriks pemuatan yang dapat dipahami (dapat ditafsirkan), yaitu faktor-faktor yang secara jelas ditandai dengan pemuatan yang tinggi (misalnya, lebih besar dari 0,7) untuk beberapa variabel dan pemuatan yang rendah untuk yang lain. Model umum ini terkadang disebut struktur sederhana.

Gagasan rotasi dengan metode varimax dijelaskan di atas (lihat bagian Metode Komponen Utama, halaman 60). Metode ini juga dapat diterapkan pada contoh yang sedang dipertimbangkan. Seperti sebelumnya, tugas kita adalah menemukan rotasi yang memaksimalkan dispersi sepanjang sumbu baru; atau, dengan kata lain, untuk mendapatkan matriks beban untuk setiap faktor sedemikian rupa sehingga berbeda sebanyak mungkin, dan ada kemungkinan interpretasi sederhananya. Di bawah ini adalah tabel beban pada faktor yang diputar.

Tabel 3.17

Tabel beban faktor (rotasi - varimax)

ANALISIS FAKTOR STATISTIK

Beban Faktor (Varimax Normalisasi) Ekstraksi: Komponen Utama

Variabel

Faktor 1

Faktor 2

Variasi total

Bagian dari total disp.

Seperti terlihat pada Tabel 3.17, faktor pertama ditandai dengan tingginya beban pada variabel yang berhubungan dengan kepuasan kerja, dan faktor kedua ditandai dengan kepuasan di rumah. Dari sini kita dapat menyimpulkan bahwa kepuasan yang diukur dengan kuesioner terdiri dari dua bagian: kepuasan dengan rumah dan pekerjaan. Dengan demikian, diproduksi klasifikasi variabel yang sedang dipelajari. Berdasarkan klasifikasi yang diperoleh, faktor pertama dapat disebut faktor kepuasan kerja (atau faktor nilai sosial) dan, karenanya, faktor kedua, faktor kepuasan rumah (atau faktor nilai pribadi).

    Interpretasi hasil analisis faktor

Tahap akhir dari analisis faktor adalah interpretasi yang bermakna dari faktor-faktor yang diperoleh sebagai hasil rotasi. Di sini, peneliti dituntut untuk memiliki latar belakang teori yang baik dan pengetahuan tentang hasil eksperimen yang sudah terakumulasi di bidang penelitian ini.

Dalam praktiknya, interpretasi faktor terdiri dari alokasi bobot faktor yang signifikan (variabel referensi) untuk masing-masing faktor. Tidak ada kriteria pasti untuk membedakan antara bobot (beban) faktor yang signifikan dan yang tidak signifikan. Misalnya, dalam kasus sampel besar (beberapa ratus orang atau lebih), muatan 0,3 atau lebih terkadang dianggap signifikan. Ketika sampel dikurangi menjadi beberapa puluh orang, bobot urutan 0,4-0,5 digunakan sebagai bobot yang signifikan.

Interpretasi faktor tidak selalu berjalan mulus; dalam beberapa kasus ini hanya hipotetis (misalnya, dalam kasus penggunaan data yang sesuai dengan jenis skala yang berbeda), dan kadang-kadang penulis benar-benar mengabaikannya, karena faktor tersebut mencakup tes yang sulit untuk melihat kesamaan apa pun.

Idealnya (distribusi variabel tidak berbeda dengan normal), interpretasi hasil analisis faktor dapat dimulai dengan analisis matriks korelasi, kemudian berlanjut ke factor loadings (pemilihan variabel acuan). Langkah selanjutnya adalah membandingkan hasil matriks korelasi dengan faktor terpilih yang memiliki bobot signifikan. Dan terakhir, tahap terakhir adalah analisis terhadap generalisasi yang diperoleh dari isi dan sifat variabel (fitur) yang diteliti yang memiliki korelasi tertinggi dengan faktor ini. Penamaan faktor dilakukan dengan memperhatikan variabel acuan yang mendapat bobot paling besar dan memiliki korelasi paling tinggi dengan faktor tersebut. Misalnya, jika tes yang menilai kemampuan untuk menangkap materi yang tidak masuk akal memiliki beban berat yang tinggi pada faktor ini, maka yang terakhir dapat disebut sebagai faktor "memori rotasi".

Persamaan Dasar

Sebelumnya, hampir semua buku teks dan monograf tentang analisis faktor memberikan penjelasan tentang cara melakukan perhitungan dasar “secara manual” atau menggunakan alat hitung sederhana (aritmometer atau kalkulator). Saat ini, karena kompleksitas dan sejumlah besar perhitungan yang diperlukan untuk membangun matriks hubungan, mengidentifikasi faktor, dan memutarnya, mungkin tidak ada satu orang pun yang tidak menggunakan analisis faktor saat melakukan analisis faktor. komputer yang kuat dan program terkait.

Oleh karena itu, kami akan fokus pada matriks (kumpulan data) apa yang paling signifikan yang dapat diperoleh selama analisis faktor, bagaimana matriks tersebut terkait satu sama lain dan bagaimana matriks tersebut dapat digunakan untuk menginterpretasikan data. Semua perhitungan yang diperlukan dapat dilakukan dengan menggunakan apa saja program komputer(misalnya, SPSS atau STADIA).

DI DALAM tab. 1 daftar matriks yang paling penting untuk analisis komponen utama dan analisis faktor diberikan. Daftar ini terutama berisi matriks hubungan (antar variabel, antara faktor, antara variabel dan faktor), skor standar (menurut variabel dan faktor), bobot regresi (untuk menghitung skor faktor menggunakan skor berdasarkan variabel), dan matriks pemetaan hubungan faktor. dan variabel setelah rotasi miring. DI DALAM tab. 1 matriks nilai eigen dan vektor eigen yang sesuai juga diberikan. Nilai eigen (nilai eigen) dan vektor eigen dijelaskan mengingat pentingnya pemilihan faktor, penggunaan sejumlah besar istilah khusus dalam hal ini, dan juga koneksi dekat nilai eigen dan varian dalam penelitian statistik.

Tabel 1

Matriks paling umum digunakan dalam analisis faktor

Penamaan Nama Ukuran Keterangan
R Matriks hubungan pxp Hubungan antar variabel
D Matriks Data Khusus Nxp Data primer - nilai pengamatan yang tidak standar pada variabel primer
Z Matriks Data Standar Nxp Nilai pengamatan yang dibakukan oleh variabel primer
F Matriks Nilai Faktor Nx F Nilai standar pengamatan berdasarkan faktor
A Matriks pemuatan faktor Matriks pemetaan faktor px F Koefisien regresi untuk faktor-faktor umum, asalkan variabel yang diamati merupakan kombinasi linear dari faktor-faktor tersebut. Dalam kasus rotasi ortogonal - hubungan antara variabel dan faktor
DI DALAM Matriks koefisien nilai faktor px F Koefisien Regresi Menghitung Nilai Faktor Menggunakan Nilai Variabel
S Matriks struktural px F Hubungan antara variabel dan faktor
F Matriks korelasi faktor F X F Korelasi antar faktor
L Matriks nilai eigen (diagonal) F X F Nilai Eigen (karakteristik, akar laten); setiap faktor sesuai dengan satu nilai eigen
V matriks vektor Eigen F X F Vektor (karakteristik) sendiri; setiap nilai eigen sesuai dengan satu vektor eigen

Catatan. Saat menentukan ukuran, jumlah baris x jumlah kolom diberikan: R- jumlah variabel, N- jumlah pengamatan, F- jumlah faktor atau komponen. Jika matriks hubungan R tidak merosot dan memiliki peringkat yang sama dengan R, maka itu benar-benar menonjol R nilai eigen dan vektor eigen, bukan F. Namun, hanya kepentingan F dari mereka. Oleh karena itu, sisanya p-f tidak ditampilkan.

Untuk matriks S Dan F hanya rotasi miring yang diterapkan, sisanya - rotasi ortogonal dan miring.

Himpunan data yang disiapkan untuk analisis faktor terdiri dari hasil pengukuran (survei) sejumlah besar subjek (responden) pada skala (variabel) tertentu. DI DALAM tab. 2 serangkaian data diberikan, yang secara kondisional dapat dianggap memenuhi persyaratan analisis faktor.

Lima responden yang mendaftar ke biro perjalanan untuk membeli tiket ke resor tepi laut ditanyai tentang pentingnya empat kondisi (variabel) untuk memilih tujuan liburan musim panas bagi mereka. Kondisi variabel tersebut adalah: biaya tur, kenyamanan kompleks, suhu udara, suhu air. Semakin penting, dari sudut pandang responden, kondisi ini atau itu baginya, semakin penting ia menghubungkannya. Tugas penelitian adalah mempelajari model hubungan antar variabel dan mengidentifikasi akar penyebab yang menentukan pilihan resor. (Contohnya, tentu saja, sangat disederhanakan untuk tujuan ilustrasi dan pendidikan, dan tidak boleh dianggap serius dalam aspek yang bermakna.)

Matriks hubungan ( tab. 2) dihitung sebagai korelasi. Perhatikan struktur hubungan di dalamnya, disorot dengan vertikal dan garis horizontal. Korelasi tinggi di kuadran kiri atas dan kanan bawah menunjukkan bahwa peringkat biaya tur dan kenyamanan kompleks saling terkait, serta peringkat suhu udara dan suhu air. Dua kuadran lainnya menunjukkan bahwa suhu udara dan kenyamanan kompleks saling berhubungan, serta kenyamanan kompleks dan suhu air.

Sekarang mari kita coba menggunakan analisis faktor untuk mendeteksi struktur korelasi ini, yang mudah terlihat dengan mata telanjang dalam matriks korelasi kecil (dalam matriks besar, ini sangat sulit dilakukan).

Meja 2

Data untuk analisis faktor (studi kasus)

Turis Variabel
Harga tiket Tingkat kenyamanan Suhu udara Suhu air
T1
T2
T3
T4
T5

Matriks korelasi

Harga tiket Tingkat kenyamanan Suhu udara Suhu air
Harga tiket 1,000 -0,953 -0,055 -0,130
Tingkat kenyamanan -0,953 1,000 -,091 -0,036
Suhu udara -0,055 -0,091 1,000 0,990
Suhu air -0,130 -0,036 0,990 1,000

Faktorisasi

Teorema penting dari aljabar matriks menyatakan bahwa matriks yang memenuhi kondisi tertentu dapat didiagonalisasi, yaitu diubah menjadi matriks dengan angka pada diagonal utama dan nol pada semua posisi lainnya. Matriks hubungan termasuk dalam jenis matriks yang dapat didiagonalisasi. Transformasi dilakukan sesuai dengan rumus:

itu. matriks R didiagonalisasi dengan mengalikannya terlebih dahulu (dari kiri) dengan matriks transposisi V, dilambangkan dengan V', dan kemudian (dari kanan) dengan matriks V itu sendiri.

Kolom dalam matriks V disebut vektor eigen, dan nilai pada diagonal utama matriks L disebut nilai eigen. Vektor eigen pertama sesuai dengan nilai eigen pertama, dan seterusnya. (untuk lebih jelasnya lihat Lampiran 1).

Karena fakta bahwa dalam contoh di atas empat variabel dipertimbangkan, kami memperoleh empat nilai eigen dengan vektor eigen yang sesuai. Tetapi karena tujuan analisis faktor adalah untuk menggeneralisasi matriks hubungan melalui faktor sesedikit mungkin, dan setiap nilai eigen sesuai dengan faktor potensial yang berbeda, biasanya hanya faktor dengan nilai eigen besar yang diperhitungkan. Dengan solusi faktorial yang "baik", matriks hubungan yang dihitung diperoleh dengan menggunakan ini set terbatas faktor, praktis menduplikasi matriks hubungan.

Dalam contoh kami, ketika tidak ada batasan pada jumlah faktor, nilai eigen 2,02, 1,94, 0,04, dan 0,00 dihitung untuk masing-masing dari empat kemungkinan faktor. Hanya untuk dua faktor pertama, nilai eigennya cukup besar untuk menjadi bahan pertimbangan lebih lanjut. Oleh karena itu, hanya dua faktor pertama yang diekstraksi ulang. Mereka memiliki nilai eigen masing-masing 2,00 dan 1,91, seperti yang ditunjukkan pada Tabel 1. 3. Menggunakan Persamaan (6) dan memasukkan nilai dari contoh di atas, kita mendapatkan:

(Semua nilai yang dihitung komputer adalah sama; perhitungan "manual" mungkin berbeda karena ketidakakuratan pembulatan.)

Perkalian kiri dari matriks vektor eigen dengan yang ditransposisikan ke matriks tersebut menghasilkan matriks identitas E (dengan satu pada diagonal utama dan nol lainnya). Oleh karena itu, kita dapat mengatakan bahwa transformasi matriks hubungan menurut rumus (6) tidak mengubahnya sendiri, tetapi hanya mengubahnya menjadi bentuk analisis yang lebih nyaman:

Misalnya:

Tabel 3

Vektor eigen dan nilai eigen yang sesuai untuk studi kasus yang sedang dipertimbangkan

Vektor eigen 1 Vektor Eigen 2
-.283 .651
.177 -.685
.658 .252
.675 .207
Nilai eigen 1 Nilai eigen 2
2.00 1.91

Karena matriks korelasi dapat didiagonalkan, aljabar matriks vektor eigen dan nilai eigen dapat diterapkan untuk memperoleh hasil analisis faktor (lihat Lampiran 1). Jika matriks dapat didiagonalkan, maka semua informasi penting tentang struktur faktor dimuat dalam bentuk diagonalnya. Dalam analisis faktor, nilai eigen sesuai dengan varians yang dijelaskan oleh faktor tersebut. Faktor dengan nilai eigen terbesar menjelaskan varians terbesar, dan seterusnya, hingga menjadi faktor dengan nilai eigen kecil atau negatif, yang biasanya tidak disertakan dalam analisis. Perhitungan nilai eigen dan vektor eigen sangat melelahkan, dan kemampuan menghitungnya bukanlah kebutuhan mutlak bagi seorang psikolog yang menguasai analisis faktor untuk tujuan praktisnya sendiri. Namun, keakraban dengan prosedur ini tidak ada salahnya, jadi dalam Lampiran 1 kami memberikan contoh perhitungan nilai eigen dan vektor eigen pada matriks kecil.

Untuk menemukan nilai eigen matriks persegi p x p perlu dicari akar polinomial berderajat p, dan untuk mencari vektor eigen, perlu diselesaikan persamaan p dengan p yang tidak diketahui dengan batasan sisi tambahan, yang untuk p>3 jarang dilakukan secara manual. Setelah vektor eigen dan nilai eigen ditemukan, analisis faktor lainnya (atau analisis komponen utama) menjadi kurang lebih jelas (lihat Persamaan 8-11).

Persamaan (6) dapat direpresentasikan sebagai: R=V'LV, (8)

itu. matriks hubungan dapat dianggap sebagai produk dari tiga matriks - matriks nilai eigen, matriks vektor eigen yang sesuai, dan matriks yang dialihkan ke matriks tersebut.

Setelah transformasi, matriks nilai eigen L dapat direpresentasikan sebagai berikut:

dan karenanya: R=VÖLÖL V’ (10)

atau (yang sama): R=(VÖL)(ÖL V’)

Dilambangkan: A=(VÖL), dan A’=(ÖL V’), lalu R=AA’ (11)

itu. matriks hubungan juga dapat direpresentasikan sebagai produk dari dua matriks, yang masing-masing merupakan kombinasi dari vektor eigen dan akar kuadrat dari nilai eigen.

Persamaan (11) sering disebut persamaan fundamental analisis faktor. Ini mengungkapkan pernyataan bahwa matriks hubungan adalah produk dari matriks pemuatan faktor (A) dan transposnya.

Persamaan (10) dan (11) juga menunjukkan bahwa proporsi perhitungan yang signifikan dalam metode analisis faktor dan komponen utama adalah untuk menentukan nilai eigen dan vektor eigen. Setelah ini diketahui, matriks faktor pra-rotasi diperoleh dengan perkalian matriks langsung:

Dalam contoh kami:

Matriks pemuatan faktor adalah matriks hubungan (diartikan sebagai koefisien korelasi) antara faktor dan variabel. Kolom pertama adalah korelasi antara faktor pertama dan masing-masing variabel pada gilirannya: biaya tur (-0,400), kenyamanan kompleks (0,251), suhu udara (0,932), suhu air (. 956). Kolom kedua adalah korelasi antara faktor kedua dan masing-masing variabel: biaya tur (0,900), kenyamanan kompleks (-,947), suhu udara (0,348), suhu air (0,286). Faktor tersebut ditafsirkan berdasarkan variabel yang sangat terkait dengannya (yaitu, memiliki beban tinggi di atasnya). Jadi, faktor pertama terutama "iklim" (suhu udara dan air), sedangkan faktor kedua adalah "ekonomi" (biaya tur dan kenyamanan kompleks).

Ketika menginterpretasikan faktor-faktor tersebut, perlu diperhatikan fakta bahwa variabel yang memiliki beban tinggi pada faktor pertama (suhu udara dan suhu air) berkorelasi positif, sedangkan variabel yang memiliki beban tinggi pada faktor kedua (biaya perjalanan dan kenyamanan kompleks) berkorelasi negatif (Anda tidak dapat mengharapkan kenyamanan luar biasa dari resor murah). Faktor pertama disebut unipolar (semua variabel dikelompokkan pada satu kutub), dan yang kedua disebut bipolar (variabel dipecah menjadi dua kelompok yang berlawanan - dua kutub). Variabel dengan beban faktor bertanda plus membentuk kutub positif, dan yang bertanda minus membentuk kutub negatif. Pada saat yang sama, nama kutub "positif" dan "negatif" saat menafsirkan faktor tersebut tidak memiliki arti evaluatif "buruk" dan "baik". Pilihan tanda terjadi selama perhitungan secara acak. Mengganti semua tanda dengan kebalikannya (semua plus dengan minus, dan semua minus dengan plus) tidak mengubah solusi. Analisis tanda hanya diperlukan untuk identifikasi kelompok (apa yang bertentangan dengan apa). Dengan kesuksesan yang sama, satu tiang bisa disebut kanan, yang lain kiri. Dalam contoh kita, biaya variabel voucher ternyata berada di kutub positif (kanan), berlawanan dengan kenyamanan variabel kompleks di kutub negatif (kiri). Dan faktor ini bisa diartikan (dinamai) sebagai "Ekonomi dan Kenyamanan". Responden yang masalah tabungannya signifikan ternyata benar - mereka menerima nilai faktorial dengan tanda tambah. Saat memilih resor, mereka lebih fokus pada murahnya dan bukan pada kenyamanan. Responden yang tidak menghemat uang untuk liburan (harga voucher tidak terlalu mengganggu mereka) dan ingin bersantai, pertama-tama, dalam kondisi nyaman, ternyata berada di sebelah kiri - mereka mendapat nilai faktor dengan a "tanda kurang.

Namun, harus diingat bahwa semua variabel sangat berkorelasi dengan kedua faktor tersebut. Dengan ini contoh sederhana interpretasinya jelas, tetapi dalam kasus data nyata, tidak semuanya sesederhana itu. Biasanya, suatu faktor lebih mudah diinterpretasikan jika hanya sebagian kecil dari variabel yang berkorelasi tinggi dengannya, dan sisanya tidak.

Rotasi ortogonal

Rotasi biasanya diterapkan setelah ekstraksi faktor untuk memaksimalkan korelasi tinggi dan meminimalkan korelasi rendah. Ada banyak metode rotasi, tetapi yang paling umum digunakan adalah rotasi varimax, yang merupakan prosedur maksimisasi varians. Rotasi ini memaksimalkan varian pemuatan faktor dengan membuat pemuatan tinggi lebih tinggi dan pemuatan rendah lebih rendah dari hari masing-masing faktor. Tujuan tersebut dicapai melalui matriks transformasi L:

A sebelum belokan L=A setelah belokan,

itu. matriks beban faktor sebelum belokan dikalikan dengan matriks transformasi dan hasilnya adalah matriks beban faktor setelah belokan. Dalam contoh kami:

Bandingkan matriks sebelum dan sesudah rotasi. Perhatikan bahwa matriks setelah rotasi memiliki bobot faktor rendah yang lebih rendah dan bobot faktor tinggi yang lebih tinggi daripada matriks sebelum rotasi. Perbedaan beban yang ditekankan memfasilitasi interpretasi faktor dan memungkinkan untuk memilih variabel yang sangat terkait dengannya.

Unsur-unsur matriks transformasi memiliki interpretasi geometris khusus:

Matriks transformasi adalah matriks sinus dan cosinus sudut ψ yang dilalui rotasi. (Oleh karena itu, nama transformasinya adalah rotasi, karena dari sudut pandang geometris, sumbu diputar di sekitar asal ruang faktor.) Dalam contoh kita, sudut ini kira-kira 19 derajat: cos19°= 0,946 dan sin19° = 0,325. Secara geometris, ini sesuai dengan rotasi sumbu faktorial sebesar 19 derajat di sekitar titik asal. (Lihat di bawah untuk informasi lebih lanjut tentang aspek geometri rotasi.)

TAHAPAN ANALISIS FAKTOR

Ada sembilan tahap analisis faktor. Untuk kejelasan, kami menyajikan tahapan-tahapan ini dalam diagram, dan kemudian memberikan deskripsi singkatnya.

Tahapan analisis faktor ditunjukkan pada gambar.

Beras.

PERUMUSAN MASALAH DAN KONSTRUKSI MATRIKS KORELASI

Formulasi masalah. Penting untuk secara jelas mendefinisikan tujuan analisis faktor. Variabel yang menjadi sasaran analisis faktor ditetapkan berdasarkan penelitian sebelumnya, perhitungan teoretis, atau atas kebijaksanaan peneliti. Variabel perlu diukur selang atau relatif skala. Pengalaman menunjukkan bahwa ukuran sampel harus empat sampai lima kali lebih besar dari jumlah variabel.

Konstruksi matriks korelasi. Analisis didasarkan pada matriks korelasi antar variabel. Kelayakan melakukan analisis faktor ditentukan oleh adanya korelasi antar variabel. Jika korelasi antara semua variabel kecil, maka analisis faktor tidak berguna. Variabel yang berhubungan erat satu sama lain cenderung berkorelasi tinggi dengan faktor atau faktor yang sama.

Untuk menguji kelayakan menggunakan model faktorial, ada beberapa statistik. Tes kebulatan Bartlett menguji hipotesis nol bahwa tidak ada korelasi antara variabel dalam populasi. Artinya kita sedang mempertimbangkan pernyataan bahwa matriks korelasi populasi adalah matriks identitas yang semua elemen diagonalnya sama dengan satu, dan yang lainnya sama dengan nol. Tes kebulatan didasarkan pada konversi determinan matriks korelasi menjadi statistik chi-kuadrat. Jika statistiknya besar, hipotesis nol ditolak. Jika hipotesis nol tidak ditolak, maka analisis faktor tidak tepat. Statistik berguna lainnya adalah uji kecukupan sampel Kaiser-Meyer-Olkin (KMO). Koefisien ini membandingkan nilai koefisien korelasi yang diamati dengan nilai koefisien korelasi parsial. Nilai KMO yang kecil - statistik menunjukkan bahwa korelasi antar pasangan variabel tidak dapat dijelaskan oleh variabel lain, yang berarti penggunaan analisis faktor tidak tepat.

Setelah mengenal konsep pemuatan faktor dan luas perubahan sendi, kita dapat melangkah lebih jauh, lagi-lagi menggunakan peralatan matriks untuk presentasi, yang unsur-unsurnya kali ini adalah koefisien korelasi.

Matriks koefisien korelasi yang diperoleh, biasanya secara eksperimental, disebut matriks korelasi, atau matriks korelasi.

Elemen matriks ini adalah koefisien korelasi antara semua variabel dari populasi tertentu.

Jika kita memiliki, misalnya, satu set yang terdiri dari tes, maka jumlah koefisien korelasi yang diperoleh secara eksperimental adalah

Koefisien ini mengisi setengah dari matriks yang terletak di salah satu sisi diagonal utamanya. Di sisi lain, jelas ada koefisien yang sama, sejak, dll. Oleh karena itu, matriks korelasinya simetris.

Skema 3.2. Matriks korelasi penuh

Ada satu di diagonal matriks ini karena setiap variabel memiliki korelasi +1 dengan dirinya sendiri.

Matriks korelasi yang elemen diagonal utamanya sama dengan 1 disebut "matriks penuh" korelasi (Skema 3.2) dan dilambangkan

Perlu dicatat bahwa dengan menempatkan unit, atau korelasi setiap variabel dengan dirinya sendiri, pada diagonal utama, kami memperhitungkan varian total setiap variabel yang diwakili dalam matriks. Dengan demikian, pengaruh tidak hanya faktor umum, tetapi juga faktor spesifik diperhitungkan.

Sebaliknya, jika pada diagonal utama matriks korelasi terdapat elemen yang sesuai dengan generalitas dan hanya terkait dengan varians umum variabel, maka hanya pengaruh faktor umum yang diperhitungkan, pengaruh faktor spesifik dan kesalahan diperhitungkan dihilangkan, yaitu spesifisitas dan varian kesalahan dibuang.

Matriks korelasi, di mana elemen diagonal utama sesuai dengan generalitas, disebut tereduksi dan dilambangkan dengan R (Skema 3.3).

Skema 3.3. Mengurangi matriks korelasi

Kami telah berbicara tentang pemuatan faktor, atau pengisian variabel tertentu dengan faktor tertentu. Pada saat yang sama, ditekankan bahwa beban faktor berbentuk koefisien korelasi antara variabel tertentu dan faktor tertentu.

Matriks yang kolom-kolomnya terdiri dari muatan faktor tertentu dalam kaitannya dengan semua variabel dari populasi tertentu, dan barisan muatan faktor dari variabel tertentu, disebut matriks faktor, atau matriks faktor. Di sini Anda juga dapat berbicara tentang matriks faktor lengkap dan tereduksi. Unsur-unsur dari matriks faktorial penuh sesuai dengan total unit varians dari setiap variabel dari populasi yang diberikan. Jika beban pada faktor umum dilambangkan dengan c, dan beban faktor spesifik dilambangkan dengan dan, maka matriks faktor lengkap dapat direpresentasikan sebagai berikut:

Skema 3.4. Matriks faktor lengkap untuk empat variabel

Matriks faktor yang ditampilkan di sini terdiri dari dua bagian, bagian pertama berisi elemen yang terkait dengan empat variabel dan tiga faktor umum, yang semuanya diasumsikan berlaku untuk semua variabel. Itu tidak makan kondisi yang diperlukan, karena beberapa elemen dari bagian pertama matriks mungkin sama dengan nol, yang berarti bahwa beberapa faktor tidak berlaku untuk semua variabel. Unsur-unsur bagian pertama dari matriks adalah beban faktor persekutuan (misalnya, unsur menunjukkan beban faktor persekutuan kedua dengan variabel pertama).

Di bagian kedua matriks, kita melihat 4 pemuatan faktor karakteristik, satu di setiap baris, yang sesuai dengan spesifisitasnya. Masing-masing faktor ini hanya mengacu pada satu variabel. Semua elemen lain dari bagian matriks ini sama dengan nol. Faktor karakteristik jelas dapat dipecah menjadi spesifik dan terkait kesalahan.

Kolom matriks faktor mencirikan faktor dan pengaruhnya terhadap semua variabel. Garis mencirikan variabel dan isinya dengan berbagai faktor, dengan kata lain, struktur faktorial dari variabel tersebut.

Saat menganalisis hanya bagian pertama dari matriks, kita berurusan dengan matriks faktor yang menunjukkan varian total dari setiap variabel. Bagian matriks ini disebut bagian tereduksi dan dilambangkan dengan F. Matriks ini tidak memperhitungkan pemuatan faktor karakteristik dan tidak memperhitungkan varian spesifik. Ingatlah bahwa, sesuai dengan apa yang dikatakan di atas tentang varians umum dan pemuatan faktor, yang merupakan akar kuadrat dari varians umum, jumlah kuadrat elemen dari setiap baris matriks faktor tereduksi F sama dengan generalitas dari variabel yang diberikan

Dengan demikian, jumlah kuadrat dari semua elemen baris matriks penuh faktor sama dengan , atau total varian dari variabel ini.

Karena analisis faktor berfokus pada faktor-faktor umum, kami terutama akan menggunakan korelasi yang dikurangi dan matriks faktor yang dikurangi dalam hal berikut.




Memuat...
Atas