Πίνακας παραγόντων. Βασικές θεωρητικές έννοιες παραγοντικής ανάλυσης

Το παρακάτω παράδειγμα βασίζεται σε εικονικά δεδομένα που σχετίζονται με μελέτες ικανοποίησης από τη ζωή. Ας υποθέσουμε ότι το ερωτηματολόγιο στάλθηκε σε 100 τυχαία επιλεγμένους ενήλικες. Το ερωτηματολόγιο περιείχε 10 στοιχεία σχεδιασμένα να μετρήσουν την ικανοποίηση από την εργασία, την ικανοποίηση από το χόμπι, την ικανοποίηση από τη ζωή στο σπίτι και τη γενική ικανοποίηση σε άλλους τομείς της ζωής. Οι απαντήσεις στις ερωτήσεις εισήχθησαν στον υπολογιστή και κλιμακώθηκαν έτσι ώστε ο μέσος όρος όλων των στοιχείων ήταν περίπου 100.

Τα αποτελέσματα τοποθετήθηκαν στο αρχείο δεδομένων Factor.sta. Μπορείτε να ανοίξετε αυτό το αρχείο χρησιμοποιώντας την επιλογή Αρχείο - Άνοιγμα. είναι πολύ πιθανό αυτό το αρχείο δεδομένων να βρίσκεται στον κατάλογο /Examples/Datasets. Ακολουθεί μια λίστα με τις μεταβλητές σε αυτό το αρχείο (επιλέξτε Όλες οι προδιαγραφές μεταβλητών από το μενού Δεδομένα για μια λίστα).

Σκοπός ανάλυσης . Σκοπός της ανάλυσης είναι να μελετήσει τη σχέση μεταξύ ικανοποίησης σε διάφορους τομείς δραστηριότητας. Ειδικότερα, είναι επιθυμητό να μελετηθεί το ζήτημα του αριθμού των παραγόντων που «κρύβονται» πίσω από διάφορους τομείς δραστηριότητας και τη σημασία τους.

Επιλογή ανάλυσης. Επιλέξτε Factor Analysis από το μενού Analysis - Multivariate Exploratory Analysis για να εμφανιστεί ο πίνακας εκκίνησης της ενότητας Factor Analysis. Κάντε κλικ στο κουμπί Μεταβλητές στο Launchpad (δείτε παρακάτω) και επιλέξτε και τις 10 μεταβλητές σε αυτό το αρχείο.



Αλλες επιλογές . Για να εκτελέσετε τυπική ανάλυση παραγόντων, αυτό το πλαίσιο διαλόγου έχει όλα όσα χρειάζεστε. Για να πάρεις ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑάλλες εντολές που είναι διαθέσιμες από την επιφάνεια εκκίνησης, μπορείτε να επιλέξετε ως αρχείο εισόδουπίνακα συσχέτισης (χρησιμοποιώντας το πεδίο αρχείου δεδομένων). Στο πεδίο Κατάργηση PD, μπορείτε να επιλέξετε γραμμή προς γραμμή ή κατά ζεύγη εξαίρεση ή αντικατάσταση μέσης τιμής για δεδομένα που λείπουν.

Καθορίστε τη μέθοδο εξαγωγής παράγοντα. Πατάμε τώρα το κουμπί OK για να προχωρήσουμε στο επόμενο πλαίσιο διαλόγου που ονομάζεται Καθορισμός μεθόδου εξαγωγής παράγοντα. Χρησιμοποιώντας αυτό το πλαίσιο διαλόγου, μπορείτε να προβάλετε περιγραφικά στατιστικά στοιχεία, να εκτελέσετε ανάλυση πολλαπλής παλινδρόμησης, να επιλέξετε μια μέθοδο εξαγωγής παραγόντων, να επιλέξετε τον μέγιστο αριθμό παραγόντων, τις ελάχιστες ιδιοτιμές και άλλες ενέργειες που σχετίζονται με τις ιδιαιτερότητες των μεθόδων εξαγωγής παραγόντων. Τώρα ας πάμε στην καρτέλα Περιγραφική.



Προβολή περιγραφικών στατιστικών. Τώρα κάντε κλικ στο View Corr./Average/Std. σε αυτό το παράθυρο για να ανοίξετε το παράθυρο Προβολή περιγραφικών στατιστικών.



Τώρα μπορείτε να προβάλετε τα περιγραφικά στατιστικά στοιχεία γραφικά ή με πίνακες αποτελεσμάτων.

Υπολογισμός του πίνακα συσχέτισης. Κάντε κλικ στο κουμπί Συσχετίσεις στην καρτέλα Για προχωρημένους για να εμφανιστεί ένας πίνακας αποτελεσμάτων με συσχετίσεις.



Όλες οι συσχετίσεις σε αυτόν τον πίνακα αποτελεσμάτων είναι θετικές και ορισμένες συσχετίσεις είναι σημαντικές. Για παράδειγμα, οι μεταβλητές Hobby_1 και Miscel_1 συσχετίζονται στο επίπεδο 0,90. Ορισμένες συσχετίσεις (για παράδειγμα, οι συσχετίσεις μεταξύ ικανοποίησης στην εργασία και ικανοποίησης στο σπίτι) φαίνονται σχετικά μικρές. Φαίνεται ότι ο πίνακας έχει κάποια ξεχωριστή δομή.

Μέθοδος επιλογής. Τώρα κάντε κλικ στο κουμπί Άκυρο στο παράθυρο διαλόγου Προβολή περιγραφικών στατιστικών για να επιστρέψετε στο παράθυρο διαλόγου Καθορισμός μεθόδου εξαγωγής συντελεστή. Μπορείτε να επιλέξετε από διάφορες μεθόδους επιλογής στην καρτέλα Για προχωρημένους (δείτε την καρτέλα Για προχωρημένους του πλαισίου διαλόγου Καθορισμός μεθόδου εξαγωγής συντελεστή για μια περιγραφή κάθε μεθόδου και μια εισαγωγική επισκόπηση για μια περιγραφή της μεθόδου κύριου στοιχείου και της μεθόδου κύριου παράγοντα). Σε αυτό το παράδειγμα, η προεπιλογή είναι το Principal Components, Max. ο αριθμός των παραγόντων περιέχει την τιμή 10 (ο μέγιστος αριθμός παραγόντων σε αυτό το παράδειγμα) και το πεδίο Min. τα δικά η τιμή περιέχει 0 (την ελάχιστη τιμή για αυτήν την εντολή).



Κάντε κλικ στο OK για να συνεχίσετε την ανάλυση.

Προβολή αποτελεσμάτων. Μπορείτε να προβάλετε τα αποτελέσματα της παραγοντικής ανάλυσης στο πλαίσιο διαλόγου Αποτελέσματα ανάλυσης παραγόντων. Πρώτα επιλέξτε την καρτέλα Εξηγούμενη διακύμανση.



Εμφάνιση ιδιοτιμών . Η εκχώρηση ιδιοτιμών και η χρησιμότητά τους στον χρήστη για να αποφασίσει πόσους παράγοντες θα αφήσει (ερμηνεία) έχουν περιγραφεί στην Εισαγωγική Ανασκόπηση. Τώρα κάντε κλικ στο κουμπί Ιδιοτιμές για να λάβετε έναν πίνακα με ιδιοτιμές, συνολικό ποσοστό διακύμανσης, συσσωρευμένες ιδιοτιμές και συσσωρευμένα ποσοστά.


Όπως φαίνεται από τον πίνακα, η ιδιοτιμή για τον πρώτο παράγοντα είναι 6,118369. εκείνοι. το ποσοστό διακύμανσης που εξηγείται από τον πρώτο παράγοντα είναι περίπου 61,2%. Σημειώστε ότι αυτές οι τιμές έτυχε να είναι εύκολα συγκρίσιμες εδώ, αφού αναλύονται 10 μεταβλητές και επομένως το άθροισμα όλων των ιδιοτιμών αποδεικνύεται 10. Ο δεύτερος παράγοντας περιλαμβάνει περίπου το 18% της διακύμανσης. Άλλοι παράγοντες δεν περιέχουν περισσότερο από 5%συνολική διακύμανση.Επιλογή αριθμού παραγόντων. Η ενότητα Εισαγωγική Επισκόπηση περιγράφει εν συντομία πώς οι προκύπτουσες ιδιοτιμές μπορούν να χρησιμοποιηθούν για να αποφασίσουν πόσοι παράγοντες θα διατηρηθούν στο μοντέλο. Σύμφωνα με τη δοκιμή του Kaiser (Kaiser, 1960), θα πρέπει να αφήσετε τους παράγοντες με ιδιοτιμές μεγαλύτερες από 1. Από τον παραπάνω πίνακα προκύπτει ότι η δοκιμή έχει ως αποτέλεσμα την επιλογή δύο παραγόντων.

Κριτήριο Scree . Τώρα κάντε κλικ στο κουμπί Scree Plot για να λάβετε μια γραφική παράσταση ιδιοτιμής για την εφαρμογή της δοκιμής scree του Cattell (Cattell, 1966). Το παρακάτω γράφημα έχει συμπληρωθεί με τμήματα που συνδέουν γειτονικές ιδιοτιμές για να κάνουν το κριτήριο πιο οπτικό. Ο Cattell δηλώνει, με βάση τη μέθοδο Monte Carlo, ότι το σημείο όπου η συνεχής πτώση των ιδιοτιμών επιβραδύνεται και πέρα ​​από το οποίο το επίπεδο των υπόλοιπων ιδιοτιμών αντανακλά μόνο τυχαίο «θόρυβο». Στο παρακάτω γράφημα, αυτό το σημείο μπορεί να αντιστοιχεί σε συντελεστή 2 ή 3 (όπως υποδεικνύεται από τα βέλη). Επομένως, δοκιμάστε και τις δύο λύσεις και δείτε ποια δίνει μια πιο κατάλληλη εικόνα.



Τώρα εξετάστε τις συντελεστές φόρτωσης.

Συντελεστικά φορτία . Όπως περιγράφεται στην ενότητα Εισαγωγική Επισκόπηση, οι φορτίσεις παραγόντων μπορούν να ερμηνευθούν ως συσχετίσεις μεταξύ παραγόντων και μεταβλητών. Ως εκ τούτου, αντιπροσωπεύουν τα περισσότερα σημαντικές πληροφορίεςστην οποία βασίζεται η ερμηνεία των παραγόντων. Αρχικά, ας δούμε τις (χωρίς κλίση) φορτώσεις παραγόντων και για τους δέκα παράγοντες. Στην καρτέλα Φορτία του πλαισίου διαλόγου Αποτελέσματα ανάλυσης συντελεστών, στο πεδίο Περιστροφή παραγόντων, ορίστε την τιμή χωρίς περιστροφή και κάντε κλικ στο κουμπί Συντελεστικά φορτία για να εμφανιστεί ο πίνακας φορτίων.



Θυμηθείτε ότι η επιλογή των παραγόντων έγινε με τέτοιο τρόπο ώστε οι επόμενοι παράγοντες περιλάμβαναν όλο και μικρότερη διακύμανση (βλ. ενότητα Εισαγωγική επισκόπηση). Επομένως, δεν προκαλεί έκπληξη το γεγονός ότι ο πρώτος παράγοντας έχει το υψηλότερο φορτίο. Σημειώστε ότι τα σημάδια των φορτίων παραγόντων είναι σημαντικά μόνο για να δείξουν ότι οι μεταβλητές με αντίθετες φορτίσεις στον ίδιο παράγοντα αλληλεπιδρούν με αυτόν τον παράγοντα με αντίθετο τρόπο. Ωστόσο, μπορείτε να πολλαπλασιάσετε όλα τα φορτία σε μια στήλη με -1 και να αντιστρέψετε τα σημάδια. Κατά τα άλλα, τα αποτελέσματα θα παραμείνουν αμετάβλητα.

Περιστροφή του διαλύματος παράγοντα. Όπως περιγράφεται στην ενότητα Εισαγωγική Επισκόπηση, ο πραγματικός προσανατολισμός των παραγόντων σε έναν χώρο παραγόντων είναι αυθαίρετος και οποιαδήποτε εναλλαγή παραγόντων αναπαράγει συσχετισμούς εξίσου καλά με άλλες περιστροφές. Ως εκ τούτου, φαίνεται φυσικό να εναλλάσσονται οι παράγοντες με τέτοιο τρόπο ώστε να επιλέγεται η δομή παραγόντων που είναι πιο εύκολο να ερμηνευθεί. Στην πραγματικότητα, ο όρος απλή δομή επινοήθηκε και ορίστηκε από τον Thurstone (1947) κυρίως για να περιγράψει συνθήκες όπου οι παράγοντες χαρακτηρίζονται από υψηλά φορτία σε ορισμένες μεταβλητές και χαμηλά φορτία σε άλλες, καθώς και όταν υπάρχουν πολλές μεγάλες διασταυρούμενες φορτίσεις, δηλ. υπάρχουν πολλές μεταβλητές με σημαντικές φορτίσεις σε περισσότερους από έναν παράγοντες. Η πιο τυπική μέθοδος υπολογιστικής περιστροφής για την απόκτηση μιας απλής δομής είναι η μέθοδος περιστροφής varimax που προτάθηκε από τον Kaiser (Kaiser, 1958). Άλλες μέθοδοι που προτείνονται από τον Harman (Harman, 1967) είναι οι μέθοδοι quartimax, biquartimax και equimax (βλέπε Harman, 1967).

Επιλογή περιστροφής . Αρχικά, εξετάστε τον αριθμό των παραγόντων που θέλετε να αφήσετε για εναλλαγή και ερμηνεία. Προηγουμένως, είχε αποφασιστεί ότι ο πιο εύλογος και αποδεκτός αριθμός παραγόντων είναι δύο, αλλά με βάση το κριτήριο scree αποφασίστηκε να ληφθεί επίσης υπόψη μια απόφαση με τρεις παράγοντες. Κάντε κλικ στο κουμπί Άκυρο για να επιστρέψετε στο πλαίσιο διαλόγου Ορισμός μεθόδου εξαγωγής συντελεστή και αλλάξτε το πεδίο Μέγιστος αριθμός παραγόντων στην καρτέλα Γρήγορη από 10 σε 3 και, στη συνέχεια, κάντε κλικ στο κουμπί OK για να συνεχίσετε την ανάλυση.

Τώρα ας κάνουμε περιστροφή χρησιμοποιώντας τη μέθοδο varimax. Στην καρτέλα Φορτία του πλαισίου διαλόγου Αποτελέσματα ανάλυσης παραγόντων, στο πεδίο Περιστροφή παραγόντων, ορίστε την αρχική τιμή Varimax.



Πατήστε το κουμπί Συντελεστικά φορτία για να εμφανίσετε τα αποτελέσματα των συντελεστών φορτίων που προκύπτουν στον πίνακα.


Εμφάνιση της λύσης κατά την περιστροφή τριών παραγόντων. Ο πίνακας δείχνει τις σημαντικές φορτίσεις στον πρώτο παράγοντα για όλες τις μεταβλητές εκτός από αυτές που σχετίζονται με το σπίτι. Ο παράγοντας 2 έχει αρκετά σημαντικά φορτία για όλες τις μεταβλητές εκτός από αυτές που σχετίζονται με την ικανοποίηση από την εργασία. Ο παράγοντας 3 έχει μόνο ένα σημαντικό φορτίο στη μεταβλητή Home_1. Το γεγονός ότι ο τρίτος παράγοντας είναι πολύ φορτωμένος μόνο από μία μεταβλητή αναρωτιέται κανείς εάν το ίδιο καλό αποτέλεσμα μπορεί να επιτευχθεί χωρίς τον τρίτο παράγοντα;

Ανασκόπηση της λύσης υπό την εναλλαγή δύο παραγόντων . Κάντε ξανά κλικ στο κουμπί Άκυρο στο παράθυρο διαλόγου Αποτελέσματα ανάλυσης παραγόντων για να επιστρέψετε στο πλαίσιο διαλόγου Καθορισμός μεθόδου εξαγωγής συντελεστών. Αλλάξτε το πεδίο Μέγιστος αριθμός παραγόντων στην καρτέλα Γρήγορη από 3 σε 2 και κάντε κλικ στο OK για να μεταβείτε στο παράθυρο διαλόγου Αποτελέσματα ανάλυσης παραγόντων. Στην καρτέλα Φορτία, στο πεδίο Συντελεστές περιστροφής, ορίστε την αρχική τιμή σε Varimax και κάντε κλικ στο κουμπί Φορτώσεις συντελεστών.


Ο παράγοντας 1, όπως φαίνεται από τον πίνακα, έχει τα υψηλότερα φορτία για μεταβλητές που σχετίζονται με την ικανοποίηση από την εργασία. Έχει τις μικρότερες επιβαρύνσεις σε μεταβλητές που σχετίζονται με την ικανοποίηση στο σπίτι. Άλλα φορτία λαμβάνουν ενδιάμεσες τιμές. Ο παράγοντας 2 έχει τις υψηλότερες φορτίσεις για τις μεταβλητές που σχετίζονται με την ικανοποίηση στο σπίτι, τις χαμηλότερες φορτίσεις για την ικανοποίηση στην εργασία, τις μέσες φορτίσεις για τις υπόλοιπες μεταβλητές.

Ερμηνεία της λύσης για περιστροφή δύο παραγόντων . Είναι δυνατή η ερμηνεία αυτό το μοντέλο? Φαίνεται ότι οι δύο παράγοντες αναγνωρίζονται καλύτερα ως η ικανοποίηση από την εργασία (παράγοντας 1) και η ικανοποίηση από τη ζωή στο σπίτι (συντελεστής 2). Η ικανοποίηση με τα χόμπι του και διάφορες άλλες πτυχές της ζωής φαίνεται να σχετίζεται και με τα δύο. Αυτό το μοντέλο υποδηλώνει, κατά μία έννοια, ότι η ικανοποίηση από την εργασία και τη ζωή στο σπίτι σε αυτό το δείγμα μπορεί να είναι ανεξάρτητη μεταξύ τους, αλλά και τα δύο συμβάλλουν στην ικανοποίηση με τα χόμπι και άλλες πτυχές της ζωής.

Διάγραμμα απόφασης που βασίζεται στην εναλλαγή δύο παραγόντων . Για να αποκτήσετε ένα διάγραμμα διασποράς δύο παραγόντων, κάντε κλικ στο κουμπί 2M Load Plot στην καρτέλα Loads του παραθύρου διαλόγου Αποτελέσματα ανάλυσης παραγόντων. Το παρακάτω διάγραμμα δείχνει απλώς δύο φορτία για κάθε μεταβλητή. Σημειώστε ότι το διάγραμμα διασποράς απεικονίζει καλά δύο ανεξάρτητους παράγοντες και 4 μεταβλητές (Hobby_1, Hobby_2, Miscel_1, Miscel_2) με διασταυρούμενες φορτίσεις.



Τώρα ας δούμε πόσο καλά ο παρατηρούμενος πίνακας συνδιακύμανσης μπορεί να αναπαραχθεί με μια λύση δύο παραγόντων.

Αναπαραγόμενος και υπολειπόμενος πίνακας συσχέτισης. Κάντε κλικ στο κουμπί Αναπαραγωγή και υπολειπόμενες συσχετίσεις στην καρτέλα Επεξηγημένη διακύμανση για να λάβετε δύο πίνακες με έναν αναπαραγόμενο πίνακα συσχέτισης και έναν πίνακα υπολειπόμενων συσχετισμών (παρατηρήθηκαν μείον αναδιπλασιασμένες συσχετίσεις).



Οι εγγραφές στον πίνακα Υπολειμματικών Συσχετίσεων μπορούν να ερμηνευθούν ως το "άθροισμα" των συσχετίσεων που δεν μπορούν να υπολογιστούν από τους δύο προκύπτοντες παράγοντες. Φυσικά, τα διαγώνια στοιχεία του πίνακα περιέχουν μια τυπική απόκλιση για την οποία δεν μπορούν να ευθύνονται αυτοί οι παράγοντες, η οποία είναι ίση με την τετραγωνική ρίζα του ενός μείον τις αντίστοιχες κοινότητες για τους δύο παράγοντες (υπενθυμίζουμε ότι η κοινότητα της μεταβλητής είναι η διακύμανση, που μπορεί να εξηγηθεί από τον επιλεγμένο αριθμό παραγόντων). Εάν εξετάσετε προσεκτικά αυτόν τον πίνακα, μπορείτε να δείτε ότι στην πραγματικότητα δεν υπάρχουν υπολειπόμενες συσχετίσεις μεγαλύτερες από 0,1 ή μικρότερες από -0,1 (στην πραγματικότητα, μόνο ένας μικρός αριθμός από αυτούς είναι κοντά σε αυτήν την τιμή). Προσθέστε σε αυτό ότι οι δύο πρώτοι παράγοντες περιλαμβάνουν περίπου το 79% της συνολικής διακύμανσης (δείτε το αθροιστικό % των ιδιοτιμών στον πίνακα αποτελεσμάτων).

Το «μυστικό» ενός καλού παραδείγματος . Το παράδειγμα που μόλις μελετήσατε δίνει στην πραγματικότητα μια σχεδόν τέλεια λύση στο πρόβλημα των δύο παραγόντων. Καθορίζει το μεγαλύτερο μέρος της διακύμανσης, έχει μια λογική ερμηνεία και αναπαράγει έναν πίνακα συσχέτισης με μέτριες αποκλίσεις (υπολειπόμενοι συσχετισμοί). Στην πραγματικότητα, τα πραγματικά δεδομένα σπάνια επιτρέπουν τη λήψη μιας τόσο απλής λύσης και στην πραγματικότητα αυτό το εικονικό σύνολο δεδομένων ελήφθη χρησιμοποιώντας μια γεννήτρια τυχαίων αριθμών με κανονική κατανομή διαθέσιμη στο σύστημα. Με ειδικό τρόπο «εισάχθηκαν» στα δεδομένα δύο ορθογώνιοι (ανεξάρτητοι) παράγοντες, σύμφωνα με τους οποίους δημιουργήθηκαν συσχετίσεις μεταξύ μεταβλητών. Αυτό το παράδειγμα παραγοντικής ανάλυσης αναπαράγει τους δύο παράγοντες όπως ήταν (δηλ. παράγοντας ικανοποίησης από την εργασία και παράγοντα ικανοποίησης από τη ζωή στο σπίτι). Έτσι, εάν ένα φαινόμενο (και όχι τεχνητό, όπως στο παράδειγμα, δεδομένα) περιείχε αυτούς τους δύο παράγοντες, τότε απομονώνοντάς τους, θα μπορούσατε να μάθετε κάτι για την κρυφή ή λανθάνουσα δομή του φαινομένου.

Άλλα αποτελέσματα . Πριν κάνουμε ένα τελικό συμπέρασμα, δίνουμε σύντομα σχόλια για άλλα αποτελέσματα.

κοινότητες . Για να λάβετε τις γενικότητες της λύσης, κάντε κλικ στο κουμπί Γενικότητες στην καρτέλα Εξηγημένη διακύμανση του πλαισίου διαλόγου Αποτελέσματα ανάλυσης παραγόντων. Θυμηθείτε ότι η κοινότητα μιας μεταβλητής είναι το κλάσμα της διακύμανσης που μπορεί να αναπαραχθεί για έναν δεδομένο αριθμό παραγόντων. Η περιστροφή του χώρου παραγόντων δεν επηρεάζει το μέγεθος της γενικότητας. Πολύ χαμηλές κοινότητες για μία ή δύο μεταβλητές (από πολλές στην ανάλυση) μπορεί να υποδηλώνουν ότι αυτές οι μεταβλητές δεν εξηγούνται καλά από το μοντέλο.

Συντελεστές αξίας. Οι συντελεστές παραγόντων μπορούν να χρησιμοποιηθούν για τον υπολογισμό των τιμών των παραγόντων για κάθε παρατήρηση. Οι ίδιοι οι συντελεστές έχουν συνήθως μικρό ενδιαφέρον, αλλά οι τιμές των παραγόντων είναι χρήσιμες σε περαιτέρω ανάλυση. Για να εμφανίσετε τους συντελεστές, κάντε κλικ στο κουμπί Συντελεστές τιμής παράγοντα στην καρτέλα Τιμές του πλαισίου διαλόγου Αποτελέσματα ανάλυσης παραγόντων.

Τιμές παραγόντων. Οι παραγοντικές τιμές μπορούν να θεωρηθούν ως οι τρέχουσες τιμές για κάθε ερωτώμενο που ερευνάται (δηλαδή, για κάθε παρατήρηση του αρχικού πίνακα δεδομένων). Το κουμπί Factor Values ​​στην καρτέλα Values ​​στο παράθυρο διαλόγου Factor Analysis Results σάς επιτρέπει να υπολογίσετε τις τιμές των παραγόντων. Αυτές οι τιμές μπορούν να αποθηκευτούν για αργότερα κάνοντας κλικ στο κουμπί Αποθήκευση τιμών.

Τελικό σχόλιο. Η παραγοντική ανάλυση δεν είναι εύκολη διαδικασία. Όποιος χρησιμοποιεί συνεχώς παραγοντική ανάλυσημε πολλές (π.χ. 50 ή περισσότερες) μεταβλητές θα μπορούσαν να φανούν πολλά παραδείγματα «παθολογικής συμπεριφοράς», όπως: αρνητικές ιδιοτιμές και μη ερμηνεύσιμες λύσεις, ειδικοί πίνακες κ.λπ. Εάν ενδιαφέρεστε να χρησιμοποιήσετε την παραγοντική ανάλυση για να καθορίσετε ή σημαντικούς παράγοντες για μεγάλο αριθμό μεταβλητών, θα πρέπει να μελετήσετε προσεκτικά οποιαδήποτε αναλυτικός οδηγός(για παράδειγμα, το βιβλίο του Harman (Harman, 1968)). Έτσι, δεδομένου ότι πολλές από τις κρίσιμες αποφάσεις στην παραγοντική ανάλυση είναι εγγενώς υποκειμενικές (αριθμός παραγόντων, μέθοδος περιστροφής, ερμηνεία φορτίσεων), να είστε προετοιμασμένοι ότι απαιτείται κάποια εμπειρία πριν αισθανθείτε σίγουροι για αυτήν. Η ενότητα Factor Analysis έχει σχεδιαστεί ειδικά για να διευκολύνει τον χρήστη να εναλλάσσει διαδραστικά μεταξύ διαφορετικών αριθμών παραγόντων, περιστροφών κ.λπ., ώστε να δοκιμάζει και να συγκρίνει διαφορετικές λύσεις.

Αυτό το παράδειγμα λαμβάνεται από σύστημα βοήθειας RFP ΣΤΑΤΙΣΤΙΚΗαπό την StatSoft

ΣΤΑΤΙΣΤΙΚΗ ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ

Συσχετίσεις (factor.sta) Αφαίρεση γραμμή προς γραμμή του PD n=100

Μεταβλητός

WORK_1

WORK_2

WORK_3

ΣΠΙΤΙ ΑΡΙΘΜΟΣ 1

ΣΠΙΤΙ 2

ΤΟ ΣΠΙΤΙ 3

Όπως φαίνεται από τον πίνακα συσχέτισης, οι μεταβλητές που σχετίζονται με την ικανοποίηση στην εργασία συσχετίζονται περισσότερο μεταξύ τους και οι μεταβλητές που σχετίζονται με την ικανοποίηση στο σπίτι συσχετίζονται επίσης περισσότερο μεταξύ τους. Οι συσχετίσεις μεταξύ αυτών των δύο τύπων μεταβλητών (μεταβλητές που σχετίζονται με την ικανοποίηση στην εργασία και μεταβλητές που σχετίζονται με την ικανοποίηση στο σπίτι) είναι σχετικά μικρές. Ως εκ τούτου, φαίνεται εύλογο ότι υπάρχουν δύο σχετικά ανεξάρτητοι παράγοντες (δύο τύποι παραγόντων) που αντικατοπτρίζονται στον πίνακα συσχέτισης: ο ένας σχετίζεται με την ικανοποίηση από την εργασία και ο άλλος με την ικανοποίηση από τη ζωή στο σπίτι.

    Συντελεστικά φορτία

Το δεύτερο στάδιο της παραγοντικής ανάλυσης είναι η αρχική επιλογή παραγόντων είτε με τη μέθοδο των κύριων συνιστωσών είτε με τη μέθοδο των κύριων παραγόντων. Το αποτέλεσμα για το παράδειγμά μας είναι μια λύση δύο παραγόντων. Εξετάστε τις συσχετίσεις μεταξύ μεταβλητών και δύο παραγόντων (ή «νέων» μεταβλητών). Αυτές οι συσχετίσεις ονομάζονται συσχετίσεις παραγόντων.

Πίνακας 3.16

Πίνακας συντελεστών φορτίων (μέθοδος κύριας συνιστώσας)

ΣΤΑΤΙΣΤΙΚΗ ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ

Συντελεστικά φορτία (Χωρίς περιστροφή) Κύρια εξαρτήματα

Μεταβλητός

Παράγοντας 1

Παράγοντας 2

Συνολική διακύμανση

Μερίδιο της συνολικής διανομής.

Όπως φαίνεται από τον Πίνακα 3.16, ο πρώτος παράγοντας συσχετίζεται περισσότερο με τις μεταβλητές από τον δεύτερο (καθώς οι τιμές των φορτίων βάρους για κάθε μεταβλητή του πρώτου παράγοντα είναι μεγαλύτερες από τη δεύτερη). Αυτό είναι προφανές γιατί, όπως αναφέρθηκε παραπάνω, οι παράγοντες εξάγονται διαδοχικά και περιέχουν όλο και μικρότερη συνολική διακύμανση (βλ. ενότητα Ιδιοτιμές και ο αριθμός των διακεκριμένων παραγόντων, σελίδα 61).

    Μέθοδοι περιστροφής παραγόντων

Το τρίτο στάδιο της παραγοντικής ανάλυσης είναι η εναλλαγή των συντελεστών φορτίων που προκύπτουν από το προηγούμενο στάδιο. Τυπικές μέθοδοι περιστροφής είναι οι στρατηγικές varimax, τεταρτημαξ, Και equimax. Ο στόχος αυτών των μεθόδων είναι να ληφθεί ένας κατανοητός (ερμηνεύσιμος) πίνακας φόρτωσης, δηλαδή παράγοντες που επισημαίνονται σαφώς με υψηλές φορτίσεις (για παράδειγμα, μεγαλύτερες από 0,7) για ορισμένες μεταβλητές και χαμηλές φορτίσεις για άλλες. Αυτό το γενικό μοντέλο μερικές φορές ονομάζεται απλή δομή.

Η ιδέα της περιστροφής με τη μέθοδο varimaxπεριγράφηκε παραπάνω (βλ. ενότητα Μέθοδος κύριου στοιχείου, σελίδα 60). Αυτή η μέθοδος μπορεί επίσης να εφαρμοστεί στο υπό εξέταση παράδειγμα. Όπως και πριν, το καθήκον μας είναι να βρούμε μια περιστροφή που μεγιστοποιεί τη διασπορά κατά μήκος των νέων αξόνων. ή, με άλλα λόγια, να ληφθεί ένας πίνακας φορτίων για κάθε παράγοντα με τέτοιο τρόπο ώστε να διαφέρουν όσο το δυνατόν περισσότερο και να υπάρχει δυνατότητα απλής ερμηνείας τους. Παρακάτω είναι ένας πίνακας φορτίων σε περιστρεφόμενους συντελεστές.

Πίνακας 3.17

Πίνακας συντελεστικού φορτίου (περιστροφή - varimax)

ΣΤΑΤΙΣΤΙΚΗ ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ

Συντελεστικά φορτία (Varimax Normalized) Εξαγωγή: Κύρια εξαρτήματα

Μεταβλητός

Παράγοντας 1

Παράγοντας 2

Ολική διακύμανση

Μερίδιο της συνολικής διανομής.

Όπως φαίνεται από τον Πίνακα 3.17, ο πρώτος παράγοντας χαρακτηρίζεται από υψηλά φορτία στις μεταβλητές που σχετίζονται με την ικανοποίηση στην εργασία και ο δεύτερος παράγοντας χαρακτηρίζεται από την ικανοποίηση στο σπίτι. Από αυτό μπορούμε να συμπεράνουμε ότι η ικανοποίηση που μετράται από το ερωτηματολόγιο αποτελείται από δύο μέρη: ικανοποίηση από το σπίτι και την εργασία. Έτσι, παράγεται ταξινόμησηοι μεταβλητές που μελετώνται. Με βάση την λαμβανόμενη ταξινόμηση, ο πρώτος παράγοντας μπορεί να ονομαστεί παράγοντας ικανοποίησης από την εργασία (ή παράγοντας κοινωνικών αξιών) και, κατά συνέπεια, ο δεύτερος παράγοντας, παράγοντας ικανοποίησης από το σπίτι (ή παράγοντας προσωπικών αξιών).

    Ερμηνεία των αποτελεσμάτων της παραγοντικής ανάλυσης

Το τελικό στάδιο της παραγοντικής ανάλυσης είναι μια ουσιαστική ερμηνεία των παραγόντων που λαμβάνονται ως αποτέλεσμα της εναλλαγής. Εδώ, ο ερευνητής απαιτείται να έχει ένα καλό θεωρητικό υπόβαθρο και γνώση των πειραματικών αποτελεσμάτων που έχουν ήδη συσσωρευτεί σε αυτόν τον τομέα έρευνας.

Στην πράξη, η ερμηνεία των παραγόντων συνίσταται στην κατανομή σημαντικών βαρών παραγόντων (μεταβλητές αναφοράς) για κάθε έναν από τους παράγοντες. Δεν υπάρχουν ακριβή κριτήρια για τη διαφοροποίηση μεταξύ σημαντικών βαρών παραγόντων (φορτία) και ασήμαντων. Για παράδειγμα, στην περίπτωση μεγάλων δειγμάτων (πολλές εκατοντάδες άτομα ή περισσότερα), φορτίσεις 0,3 ή περισσότερο θεωρούνται μερικές φορές σημαντικές. Όταν το δείγμα μειώνεται σε πολλές δεκάδες άτομα, χρησιμοποιούνται βάρη της τάξης του 0,4–0,5 ως σημαντικά.

Η ερμηνεία των παραγόντων δεν προχωρά πάντα ομαλά. Σε ορισμένες περιπτώσεις είναι μόνο υποθετικό (για παράδειγμα, στην περίπτωση χρήσης δεδομένων που αντιστοιχούν σε διαφορετικούς τύπους κλίμακες) και μερικές φορές οι συγγραφείς το εγκαταλείπουν εντελώς, καθώς ο παράγοντας περιλαμβάνει δοκιμές στις οποίες είναι δύσκολο να δει κανείς κάτι κοινό.

Στην ιδανική περίπτωση (η κατανομή των μεταβλητών δεν διαφέρει από την κανονική), η ερμηνεία των αποτελεσμάτων της παραγοντικής ανάλυσης μπορεί να ξεκινήσει με την ανάλυση του πίνακα συσχέτισης και, στη συνέχεια, να προχωρήσουμε σε φορτίσεις παραγόντων (επιλογή μεταβλητών αναφοράς). Το επόμενο βήμα είναι η σύγκριση των αποτελεσμάτων του πίνακα συσχέτισης και των επιλεγμένων παραγόντων που περιέχουν σημαντικά βάρη. Και, τέλος, το τελευταίο στάδιο είναι η ανάλυση των ληφθέντων γενικοτήτων του περιεχομένου και της φύσης των μελετώμενων μεταβλητών (χαρακτηριστικών) που έχουν την υψηλότερη συσχέτιση με αυτόν τον παράγοντα. Η ονομασία των παραγόντων πραγματοποιείται λαμβάνοντας υπόψη εκείνες τις μεταβλητές αναφοράς που έχουν λάβει τα μέγιστα βάρη και έχουν την υψηλότερη συσχέτιση με τον παράγοντα. Για παράδειγμα, εάν οι δοκιμές που αξιολογούν την ικανότητα σύλληψης μη-λογικού υλικού έχουν υψηλά φορτία βάρους σε αυτόν τον παράγοντα, τότε ο τελευταίος μπορεί να ονομαστεί παράγοντας "περιστροφικής μνήμης".

Βασικές Εξισώσεις

Προηγουμένως, σχεδόν όλα τα σχολικά βιβλία και οι μονογραφίες για την παραγοντική ανάλυση παρείχαν μια εξήγηση για τον τρόπο διεξαγωγής βασικών υπολογισμών «χειροκίνητα» ή χρησιμοποιώντας μια απλή υπολογιστική συσκευή (αριθμόμετρο ή αριθμομηχανή). Σήμερα, λόγω της πολυπλοκότητας και του μεγάλου όγκου των υπολογισμών που απαιτούνται για τη δημιουργία μιας μήτρας σχέσεων, τον εντοπισμό παραγόντων και την περιστροφή τους, πιθανότατα δεν υπάρχει ούτε ένα άτομο που να μην χρησιμοποιούσε την παραγοντική ανάλυση κατά τη διεξαγωγή της παραγοντικής ανάλυσης. ισχυρούς υπολογιστέςκαι σχετικά προγράμματα.

Ως εκ τούτου, θα επικεντρωθούμε σε ποιους είναι οι πιο σημαντικοί πίνακες (σύνολα δεδομένων) που μπορούν να ληφθούν κατά τη διάρκεια της παραγοντικής ανάλυσης, πώς σχετίζονται μεταξύ τους και πώς μπορούν να χρησιμοποιηθούν για την ερμηνεία δεδομένων. Όλοι οι απαραίτητοι υπολογισμοί μπορούν να γίνουν χρησιμοποιώντας οποιοδήποτε πρόγραμμα υπολογιστή(για παράδειγμα, SPSS ή STADIA).

ΣΕ αυτί. 1δίνεται μια λίστα με τους πιο σημαντικούς πίνακες για την ανάλυση των κύριων συνιστωσών και την ανάλυση παραγόντων. Αυτή η λίστα περιέχει κυρίως πίνακες σχέσεων (μεταξύ μεταβλητών, μεταξύ παραγόντων, μεταξύ μεταβλητών και παραγόντων), τυποποιημένες βαθμολογίες (ανά μεταβλητές και κατά παράγοντες), βάρη παλινδρόμησης (για υπολογισμό βαθμολογιών παραγόντων με χρήση βαθμολογιών ανά μεταβλητές) και πίνακες χαρτογράφησης σχέσεων παραγόντων. και μεταβλητές μετά από λοξή περιστροφή. ΣΕ αυτί. 1Δίνονται επίσης πίνακες ιδιοτιμών και αντίστοιχα ιδιοδιανύσματα. Οι ιδιοτιμές (ιδιοτιμές) και τα ιδιοδιανύσματα περιγράφονται λόγω της σημασίας τους για την επιλογή των παραγόντων, τη χρήση μεγάλου αριθμού ειδικών όρων από αυτή την άποψη, καθώς και στενή σύνδεσηΙδιοτιμές και διακύμανση στη στατιστική έρευνα.

Τραπέζι 1

Πίνακες που χρησιμοποιούνται συχνότερα στην παραγοντική ανάλυση

Ονομασία Ονομα Μέγεθος Περιγραφή
R Πίνακας σχέσεων pxp Σχέσεις μεταξύ μεταβλητών
ρε Προσαρμοσμένη μήτρα δεδομένων Nxp Πρωτεύοντα δεδομένα - μη τυποποιημένες τιμές παρατηρήσεων σε πρωτεύουσες μεταβλητές
Ζ Τυποποιημένος πίνακας δεδομένων Nxp Τυποποιημένες τιμές παρατηρήσεων κατά πρωτεύουσες μεταβλητές
φά Πίνακας συντελεστών αξίας N x φά Τυποποιημένες τιμές των παρατηρήσεων ανά παράγοντες
ΕΝΑ Πίνακας φόρτωσης συντελεστών Πίνακας αντιστοίχισης παραγόντων px φά Συντελεστές παλινδρόμησης για κοινούς παράγοντες, με την προϋπόθεση ότι οι παρατηρούμενες μεταβλητές είναι ένας γραμμικός συνδυασμός παραγόντων. Στην περίπτωση της ορθογώνιας περιστροφής - σχέσεις μεταξύ μεταβλητών και παραγόντων
ΣΕ Πίνακας συντελεστών τιμών παραγόντων px φά Συντελεστές παλινδρόμησης για τον υπολογισμό τιμών παραγόντων με χρήση μεταβλητών τιμών
μικρό Δομική μήτρα px φά Σχέσεις μεταξύ μεταβλητών και παραγόντων
φά Πίνακας συσχέτισης παραγόντων φάΧ φά Συσχετισμοί μεταξύ παραγόντων
μεγάλο Πίνακας ιδιοτιμών (διαγώνιος) φάΧ φά Ιδιοτιμές (χαρακτηριστικές, λανθάνουσες ρίζες). κάθε παράγοντας αντιστοιχεί σε μία ιδιοτιμή
V Ιδιοδιανυσματικός πίνακας φάΧ φά Ίδια (χαρακτηριστικά) διανύσματα. κάθε ιδιοτιμή αντιστοιχεί σε ένα ιδιοδιάνυσμα

Σημείωση.Κατά τον καθορισμό του μεγέθους, δίνεται ο αριθμός των σειρών x ο αριθμός των στηλών: R- αριθμός μεταβλητών, Ν- αριθμός παρατηρήσεων, φά- τον αριθμό των παραγόντων ή στοιχείων. Αν ο πίνακας σχέσεων Rδεν είναι εκφυλισμένος και έχει βαθμό ίσο με R,τότε πραγματικά ξεχωρίζει Rιδιοτιμές και ιδιοδιανύσματα, όχι φά. Ωστόσο, μόνο ενδιαφέρον φάαπό αυτούς. Ως εκ τούτου, τα υπόλοιπα p-fδεν εμφανίζονται.

Σε πίνακες μικρόΚαι φάεφαρμόζεται μόνο λοξή περιστροφή, τα υπόλοιπα - ορθογώνια και λοξή περιστροφή.

Το σύνολο των δεδομένων που προετοιμάζεται για την παραγοντική ανάλυση αποτελείται από τα αποτελέσματα των μετρήσεων (έρευνα) μεγάλου αριθμού υποκειμένων (αποκριθέντων) σε ορισμένες κλίμακες (μεταβλητές). ΣΕ αυτί. 2δίνεται μια σειρά δεδομένων, τα οποία μπορούν υπό όρους να θεωρηθούν ότι ικανοποιούν τις απαιτήσεις της παραγοντικής ανάλυσης.

Πέντε ερωτηθέντες που υπέβαλαν αίτηση σε ταξιδιωτικό γραφείο για να αγοράσουν εισιτήριο σε παραθαλάσσιο θέρετρο ερωτήθηκαν σχετικά με τη σημασία για αυτούς των τεσσάρων συνθηκών (μεταβλητών) για την επιλογή ενός προορισμού καλοκαιρινών διακοπών. Αυτές οι μεταβλητές συνθήκες ήταν: το κόστος της ξενάγησης, η άνεση του συγκροτήματος, η θερμοκρασία του αέρα, η θερμοκρασία του νερού. Όσο πιο σημαντική, από τη σκοπιά του ερωτώμενου, είχε γι' αυτόν αυτή ή εκείνη η συνθήκη, τόσο μεγαλύτερη σημασία της απέδιδε. Το ερευνητικό έργο ήταν να μελετήσει το μοντέλο της σχέσης μεταξύ των μεταβλητών και να εντοπίσει τις βασικές αιτίες που καθορίζουν την επιλογή του καταλύματος. (Το παράδειγμα, φυσικά, είναι εξαιρετικά απλοποιημένο για επεξηγηματικούς και εκπαιδευτικούς σκοπούς και δεν πρέπει να λαμβάνεται σοβαρά υπόψη από μια ουσιαστική πτυχή.)

Πίνακας σχέσεων ( αυτί. 2) υπολογίστηκε ως συσχέτιση. Δώστε προσοχή στη δομή των σχέσεων σε αυτό, που επισημαίνονται με κάθετη και οριζόντιες γραμμές. Οι υψηλοί συσχετισμοί στο πάνω αριστερό και το κάτω δεξιό τεταρτημόριο δείχνουν ότι οι βαθμολογίες για το κόστος της περιήγησης και την άνεση του συγκροτήματος είναι αλληλένδετες, καθώς και οι βαθμολογίες για τη θερμοκρασία του αέρα και τη θερμοκρασία του νερού. Τα άλλα δύο τεταρτημόρια δείχνουν ότι η θερμοκρασία του αέρα και η άνεση του συγκροτήματος σχετίζονται, καθώς και η άνεση του συγκροτήματος και η θερμοκρασία του νερού.

Τώρα ας προσπαθήσουμε να χρησιμοποιήσουμε την παραγοντική ανάλυση για να ανιχνεύσουμε αυτή τη δομή συσχετίσεων, που είναι εύκολα ορατή με γυμνό μάτι σε έναν μικρό πίνακα συσχέτισης (σε έναν μεγάλο πίνακα, αυτό είναι πολύ δύσκολο να γίνει).

πίνακας 2

Δεδομένα για παραγοντική ανάλυση (μελέτη περίπτωσης)

Τουρίστες Μεταβλητές
Τιμή εισιτηρίου Επίπεδο άνεσης Θερμοκρασία του αέρα Θερμοκρασία νερού
Τ1
Τ2
Τ3
Τ4
Τ5

Πίνακας συσχέτισης

Τιμή εισιτηρίου Επίπεδο άνεσης Θερμοκρασία του αέρα Θερμοκρασία νερού
Τιμή εισιτηρίου 1,000 -0,953 -0,055 -0,130
Επίπεδο άνεσης -0,953 1,000 -,091 -0,036
Θερμοκρασία του αέρα -0,055 -0,091 1,000 0,990
Θερμοκρασία νερού -0,130 -0,036 0,990 1,000

Παραγοντοποίηση

Ένα σημαντικό θεώρημα από την άλγεβρα πινάκων δηλώνει ότι οι πίνακες που ικανοποιούν ορισμένες συνθήκες μπορούν να διαγωνοποιηθούν, δηλ. μετατρέπεται σε πίνακα με αριθμούς στην κύρια διαγώνιο και μηδενικά σε όλες τις άλλες θέσεις. Οι πίνακες σχέσεων ανήκουν συγκεκριμένα στον τύπο των διαγωνοποιήσιμων πινάκων. Ο μετασχηματισμός πραγματοποιείται σύμφωνα με τον τύπο:

εκείνοι. Ο πίνακας R διαγωνίζεται πολλαπλασιάζοντάς τον πρώτα (από αριστερά) με τον μετατιθέμενο πίνακα V, που συμβολίζεται με V', και στη συνέχεια (από τα δεξιά) με τον ίδιο τον πίνακα V.

Οι στήλες στον πίνακα V ονομάζονται ιδιοδιανύσματα και οι τιμές στην κύρια διαγώνιο του πίνακα L ονομάζονται ιδιοτιμές. Το πρώτο ιδιοδιάνυσμα αντιστοιχεί στην πρώτη ιδιοτιμή και ούτω καθεξής. (για περισσότερες λεπτομέρειες βλ. Παράρτημα 1).

Λόγω του γεγονότος ότι στο παραπάνω παράδειγμα εξετάζονται τέσσερις μεταβλητές, λαμβάνουμε τέσσερις ιδιοτιμές με τα αντίστοιχα ιδιοδιανύσματά τους. Επειδή όμως ο στόχος της παραγοντικής ανάλυσης είναι η γενίκευση του πίνακα σχέσεων μέσω όσο το δυνατόν λιγότερων παραγόντων και κάθε ιδιοτιμή αντιστοιχεί σε διαφορετικούς πιθανούς παράγοντες, συνήθως λαμβάνονται υπόψη μόνο παράγοντες με μεγάλες ιδιοτιμές. Με μια "καλή" παραγοντική λύση, ο πίνακας των υπολογιζόμενων σχέσεων λαμβάνεται χρησιμοποιώντας αυτήν περιορισμένο σύνολοπαράγοντες, πρακτικά διπλασιάζει τη μήτρα των σχέσεων.

Στο παράδειγμά μας, όταν δεν υπάρχουν περιορισμοί στον αριθμό των παραγόντων, οι ιδιοτιμές 2.02, 1.94, .04 και .00 υπολογίζονται για καθένα από τους τέσσερις πιθανούς παράγοντες. Μόνο για τους δύο πρώτους παράγοντες, οι ιδιοτιμές είναι αρκετά μεγάλες ώστε να αποτελέσουν αντικείμενο περαιτέρω εξέτασης. Επομένως, μόνο οι δύο πρώτοι παράγοντες επανεξάγονται. Έχουν ιδιοτιμές 2,00 και 1,91, αντίστοιχα, όπως φαίνεται στον Πίνακα 1. 3. Χρησιμοποιώντας την εξίσωση (6) και εισάγοντας τις τιμές από το παραπάνω παράδειγμα, παίρνουμε:

(Όλες οι τιμές που υπολογίζονται από υπολογιστή είναι οι ίδιες· οι "μη αυτόματες" υπολογισμοί ενδέχεται να διαφέρουν λόγω ανακρίβειων στρογγυλοποίησης.)

Ο αριστερός πολλαπλασιασμός του πίνακα των ιδιοδιανυσμάτων με αυτό που μεταφέρεται σε αυτόν δίνει τον πίνακα ταυτότητας E (με μονάδες στην κύρια διαγώνιο και άλλα μηδενικά). Επομένως, μπορούμε να πούμε ότι ο μετασχηματισμός του πίνακα σχέσεων σύμφωνα με τον τύπο (6) δεν τον αλλάζει από μόνος του, αλλά τον μετατρέπει μόνο σε μια πιο βολική μορφή για ανάλυση:

Για παράδειγμα:

Πίνακας 3

Ιδιοδιανύσματα και αντίστοιχες ιδιοτιμές για την υπό εξέταση περίπτωση

Ιδιοδιάνυσμα 1 Ιδιοδιάνυσμα 2
-.283 .651
.177 -.685
.658 .252
.675 .207
Ιδιοτιμή 1 Ιδιοτιμή 2
2.00 1.91

Δεδομένου ότι ο πίνακας συσχέτισης είναι διαγωνιζόμενος, η άλγεβρα πινάκων των ιδιοδιανυσμάτων και των ιδιοτιμών μπορεί να εφαρμοστεί σε αυτόν για να ληφθούν τα αποτελέσματα της παραγοντικής ανάλυσης (βλ. Παράρτημα 1). Εάν ένας πίνακας μπορεί να διαγωνοποιηθεί, τότε όλες οι βασικές πληροφορίες σχετικά με τη δομή του παράγοντα περιέχονται στη διαγώνια μορφή του. Στην παραγοντική ανάλυση, οι ιδιοτιμές αντιστοιχούν στη διακύμανση που εξηγείται από τους παράγοντες. Ο παράγοντας με τη μεγαλύτερη ιδιοτιμή εξηγεί τη μεγαλύτερη διακύμανση και ούτω καθεξής, μέχρι να καταλήξει σε παράγοντες με μικρές ή αρνητικές ιδιοτιμές, οι οποίοι συνήθως μένουν εκτός ανάλυσης. Οι υπολογισμοί των ιδιοτιμών και των ιδιοδιανυσμάτων είναι πολύ επίπονοι και η δυνατότητα υπολογισμού τους δεν είναι απόλυτη αναγκαιότητα για έναν ψυχολόγο που κατέχει την ανάλυση παραγόντων για τους δικούς του πρακτικούς σκοπούς. Ωστόσο, η εξοικείωση με αυτή τη διαδικασία δεν βλάπτει, επομένως στο Παράρτημα 1 δίνουμε ως παράδειγμα τον υπολογισμό των ιδιοτιμών και των ιδιοδιανυσμάτων σε έναν μικρό πίνακα.

Για να βρείτε ιδιοτιμές τετράγωνη μήτρα p x p είναι απαραίτητο να βρεθούν οι ρίζες ενός πολυωνύμου βαθμού p, και για να βρεθούν τα ιδιοδιανύσματα, είναι απαραίτητο να λυθούν εξισώσεις p με p αγνώστους με πρόσθετους περιορισμούς πλευράς, κάτι που για p>3 σπάνια γίνεται με το χέρι. Μόλις βρεθούν τα ιδιοδιανύσματα και οι ιδιοτιμές, η υπόλοιπη παραγοντική ανάλυση (ή η ανάλυση των κύριων συνιστωσών) γίνεται περισσότερο ή λιγότερο σαφής (βλ. Εξισώσεις 8-11).

Η εξίσωση (6) μπορεί να αναπαρασταθεί ως: R=V'LV, (8)

εκείνοι. ο πίνακας σχέσεων μπορεί να θεωρηθεί ως γινόμενο τριών πινάκων - του πίνακα των ιδιοτιμών, του πίνακα των αντίστοιχων ιδιοδιανυσμάτων και του πίνακα που μεταφέρεται σε αυτόν.

Μετά τον μετασχηματισμό, ο πίνακας των ιδιοτιμών L μπορεί να αναπαρασταθεί ως εξής:

και επομένως: R=VÖLÖL V’ (10)

ή (που είναι το ίδιο): R=(VÖL)(ÖL V’)

Σημειώστε: A=(VÖL) και A’=(ÖL V’), μετά R=AA’ (11)

εκείνοι. ο πίνακας σχέσεων μπορεί επίσης να αναπαρασταθεί ως γινόμενο δύο πινάκων, καθένας από τους οποίους είναι ένας συνδυασμός ιδιοδιανυσμάτων και τετραγωνικών ριζών ιδιοτιμών.

Η εξίσωση (11) ονομάζεται συχνά η θεμελιώδης εξίσωση της παραγοντικής ανάλυσης. Εκφράζει τον ισχυρισμό ότι ο πίνακας σχέσεων είναι το γινόμενο του πίνακα φόρτισης συντελεστών (A) και της μεταφοράς του.

Οι εξισώσεις (10) και (11) δείχνουν επίσης ότι ένα σημαντικό ποσοστό των υπολογισμών στις μεθόδους της παραγοντικής ανάλυσης και των κύριων συνιστωσών είναι ο προσδιορισμός των ιδιοτιμών και των ιδιοδιανυσμάτων. Μόλις αυτά γίνουν γνωστά, ο πίνακας συντελεστών προ-περιστροφής λαμβάνεται με πολλαπλασιασμό του άμεσου πίνακα:

Στο παράδειγμά μας:

Ο πίνακας φόρτωσης παραγόντων είναι ένας πίνακας σχέσεων (ερμηνεύονται ως συντελεστές συσχέτισης) μεταξύ παραγόντων και μεταβλητών. Η πρώτη στήλη είναι οι συσχετίσεις μεταξύ του πρώτου παράγοντα και κάθε μεταβλητής με τη σειρά του: το κόστος της περιήγησης (-.400), η άνεση του συγκροτήματος (.251), η θερμοκρασία του αέρα (0.932), η θερμοκρασία του νερού (. 956). Η δεύτερη στήλη είναι οι συσχετισμοί μεταξύ του δεύτερου παράγοντα και κάθε μεταβλητής: το κόστος της ξενάγησης (.900), η άνεση του συγκροτήματος (-.947), η θερμοκρασία του αέρα (.348), η θερμοκρασία του νερού (.286). Ο παράγοντας ερμηνεύεται με βάση μεταβλητές που συνδέονται στενά με αυτόν (δηλαδή έχουν υψηλά φορτία σε αυτόν). Άρα, ο πρώτος παράγοντας είναι κυρίως «κλιματικός» (θερμοκρασία αέρα και νερού), ενώ ο δεύτερος είναι «οικονομικός» (το κόστος της ξενάγησης και η άνεση του συγκροτήματος).

Κατά την ερμηνεία αυτών των παραγόντων, θα πρέπει να δοθεί προσοχή στο γεγονός ότι οι μεταβλητές που έχουν υψηλά φορτία στον πρώτο παράγοντα (θερμοκρασία αέρα και θερμοκρασία νερού) συσχετίζονται θετικά, ενώ οι μεταβλητές που έχουν υψηλά φορτία στον δεύτερο παράγοντα (κόστος εκδρομής και η άνεση του συγκροτήματος) συσχετίζονται αρνητικά (δεν μπορείτε να περιμένετε μεγάλη άνεση από ένα φτηνό θέρετρο). Ο πρώτος παράγοντας ονομάζεται μονοπολικός (όλες οι μεταβλητές ομαδοποιούνται σε έναν πόλο) και ο δεύτερος ονομάζεται διπολικός (οι μεταβλητές χωρίζονται σε δύο αντίθετες ομάδες - δύο πόλους). Οι μεταβλητές με συντελεστές φορτίου με πρόσημο συν σχηματίζουν θετικό πόλο και αυτές με αρνητικό πρόσημο σχηματίζουν αρνητικό πόλο. Ταυτόχρονα, οι ονομασίες των πόλων «θετικός» και «αρνητικός» κατά την ερμηνεία του παράγοντα δεν έχουν την αξιολογική σημασία του «κακού» και του «καλού». Η επιλογή του σημείου γίνεται κατά τους υπολογισμούς τυχαία. Η αντικατάσταση όλων των σημείων με τα αντίθετά τους (όλα τα συν με πλην και όλα τα πλην με συν) δεν αλλάζει τη λύση. Η ανάλυση των σημείων είναι απαραίτητη μόνο για τον προσδιορισμό των ομάδων (τι είναι αντίθετο με τι). Με την ίδια επιτυχία, ο ένας πόλος μπορεί να λέγεται δεξιός, ο άλλος αριστερός. Στο παράδειγμά μας, το μεταβλητό κόστος του κουπονιού αποδείχθηκε ότι ήταν στον θετικό (δεξιό) πόλο· είναι αντίθετο με τη μεταβλητή άνεση του συγκροτήματος στον αρνητικό (αριστερό) πόλο. Και αυτός ο παράγοντας μπορεί να ερμηνευτεί (ονομαστεί) ως "Οικονομία και Άνεση". Οι ερωτηθέντες για τους οποίους το πρόβλημα της εξοικονόμησης είναι σημαντικό αποδείχθηκαν στα δεξιά - έλαβαν παραγοντικές τιμές με σύμβολο συν. Όταν επιλέγουν ένα θέρετρο, εστιάζουν περισσότερο στη φθηνότητα του και λιγότερο στην άνεση. Οι ερωτηθέντες που δεν εξοικονομούν χρήματα στις διακοπές (η τιμή ενός κουπονιού δεν τους ενοχλεί πολύ) και που θέλουν να χαλαρώσουν, πρώτα απ 'όλα, σε άνετες συνθήκες, αποδείχθηκαν στα αριστερά - έλαβαν τιμές συντελεστών με σύμβολο "μείον".

Ωστόσο, θα πρέπει να ληφθεί υπόψη ότι όλες οι μεταβλητές συσχετίζονται σε μεγάλο βαθμό και με τους δύο παράγοντες. Μέσα σε αυτό ένα απλό παράδειγμαη ερμηνεία είναι προφανής, αλλά στην περίπτωση των πραγματικών δεδομένων, δεν είναι όλα τόσο απλά. Συνήθως, ένας παράγοντας είναι ευκολότερο να ερμηνευτεί εάν μόνο ένα μικρό μέρος των μεταβλητών συσχετίζεται σε μεγάλο βαθμό με αυτόν και οι υπόλοιπες όχι.

Ορθογώνια περιστροφή

Η περιστροφή εφαρμόζεται συνήθως μετά την εξαγωγή των παραγόντων για τη μεγιστοποίηση των υψηλών συσχετίσεων και την ελαχιστοποίηση των χαμηλών. Υπάρχουν πολλές μέθοδοι περιστροφής, αλλά η πιο συχνά χρησιμοποιούμενη είναι η περιστροφή varimax, η οποία είναι μια διαδικασία μεγιστοποίησης διασποράς. Αυτή η περιστροφή μεγιστοποιεί τις διακυμάνσεις της φόρτισης των συντελεστών καθιστώντας τις υψηλές φορτίσεις υψηλότερες και τις χαμηλές φορτίσεις χαμηλότερες από την ημέρα κάθε παράγοντα. Αυτός ο στόχος επιτυγχάνεται μέσω πίνακες μετασχηματισμού L:

A πριν τη στροφή L=A μετά τη στροφή,

εκείνοι. ο πίνακας συντελεστών φορτίων πριν από τη στροφή πολλαπλασιάζεται με τον πίνακα μετασχηματισμού και το αποτέλεσμα είναι ο πίνακας συντελεστών φορτίων μετά τη στροφή. Στο παράδειγμά μας:

Συγκρίνετε πίνακες πριν και μετά την περιστροφή. Σημειώστε ότι ο πίνακας μετά την περιστροφή έχει χαμηλά βάρη συντελεστών χαμηλότερα και υψηλά βάρη παραγόντων υψηλότερα από τον πίνακα πριν από την περιστροφή. Η τονισμένη διαφορά στα φορτία διευκολύνει την ερμηνεία του παράγοντα και καθιστά δυνατή την αναμφισβήτητη επιλογή μεταβλητών που συνδέονται στενά με αυτόν.

Τα στοιχεία του πίνακα μετασχηματισμού έχουν μια ειδική γεωμετρική ερμηνεία:

Ο πίνακας μετασχηματισμού είναι ο πίνακας ημιτόνων και συνημιτόνων της γωνίας ψ μέσω της οποίας εκτελείται η περιστροφή. (Επομένως, το όνομα του μετασχηματισμού είναι περιστροφή, επειδή από γεωμετρική άποψη, οι άξονες περιστρέφονται γύρω από την αρχή του χώρου των παραγόντων.) Στο παράδειγμά μας, αυτή η γωνία είναι περίπου 19 μοίρες: cos19°= .946 και sin19° =.325. Γεωμετρικά, αυτό αντιστοιχεί σε περιστροφή των παραγοντικών αξόνων κατά 19 μοίρες γύρω από την αρχή. (Δείτε παρακάτω για περισσότερα σχετικά με τις γεωμετρικές πτυχές της περιστροφής.)

ΣΤΑΔΙΑ ΠΑΡΑΓΟΝΤΙΚΗΣ ΑΝΑΛΥΣΗΣ

Υπάρχουν εννέα στάδια παραγοντικής ανάλυσης. Για λόγους σαφήνειας, παρουσιάζουμε αυτά τα στάδια στο διάγραμμα και στη συνέχεια δίνουμε μια σύντομη περιγραφή.

Τα στάδια της παραγοντικής ανάλυσης φαίνονται στο σχήμα.

Ρύζι.

ΔΙΑΤΥΠΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗ ΤΟΥ ΜΗΤΡΟΥ ΣΥΣΧΕΤΙΣΗΣ

Διατύπωση προβλήματος.Είναι απαραίτητο να καθοριστούν με σαφήνεια οι στόχοι της παραγοντικής ανάλυσης. Οι μεταβλητές που υπόκεινται σε παραγοντική ανάλυση ορίζονται με βάση παλαιότερες έρευνες, θεωρητικούς υπολογισμούς ή κατά την κρίση του ερευνητή. Οι μεταβλητές πρέπει να μετρώνται σε διάστημαή συγγενήςκλίμακα. Η εμπειρία δείχνει ότι το μέγεθος του δείγματος θα πρέπει να είναι τέσσερις έως πέντε φορές μεγαλύτερο από τον αριθμό των μεταβλητών.

Κατασκευή του πίνακα συσχέτισης.Η ανάλυση βασίζεται στον πίνακα συσχέτισης μεταξύ των μεταβλητών. Η σκοπιμότητα εκτέλεσης της παραγοντικής ανάλυσης καθορίζεται από την παρουσία συσχετισμών μεταξύ μεταβλητών. Εάν οι συσχετίσεις μεταξύ όλων των μεταβλητών είναι μικρές, τότε η παραγοντική ανάλυση είναι άχρηστη. Οι μεταβλητές που συνδέονται στενά μεταξύ τους τείνουν να συσχετίζονται σε μεγάλο βαθμό με τον ίδιο παράγοντα ή παράγοντες.

Για να ελεγχθεί η σκοπιμότητα χρήσης ενός παραγοντικού μοντέλου, υπάρχουν αρκετά στατιστικά στοιχεία. Το τεστ σφαιρικότητας του Bartlett ελέγχει τη μηδενική υπόθεση ότι δεν υπάρχει συσχέτιση μεταξύ των μεταβλητών στον πληθυσμό. Αυτό σημαίνει ότι εξετάζουμε τη δήλωση ότι ο πίνακας συσχέτισης πληθυσμού είναι ένας πίνακας ταυτότητας στον οποίο όλα τα διαγώνια στοιχεία είναι ίσα με ένα και όλα τα άλλα είναι ίσα με μηδέν. Η δοκιμή σφαιρικότητας βασίζεται στη μετατροπή της ορίζουσας του πίνακα συσχέτισης σε μια στατιστική χ-τετράγωνο. Εάν το στατιστικό είναι μεγάλο, η μηδενική υπόθεση απορρίπτεται. Εάν η μηδενική υπόθεση δεν απορριφθεί, τότε η παραγοντική ανάλυση είναι ακατάλληλη. Ένα άλλο χρήσιμο στατιστικό είναι το τεστ επάρκειας δειγμάτων Kaiser-Meyer-Olkin (KMO). Αυτός ο συντελεστής συγκρίνει τις τιμές των παρατηρούμενων συντελεστών συσχέτισης με τις τιμές των συντελεστών μερικής συσχέτισης. Μικρές τιμές KMO - τα στατιστικά δείχνουν ότι οι συσχετίσεις μεταξύ ζευγών μεταβλητών δεν μπορούν να εξηγηθούν από άλλες μεταβλητές, πράγμα που σημαίνει ότι η χρήση της παραγοντικής ανάλυσης είναι ακατάλληλη.

Έχοντας εξοικειωθεί με τις έννοιες της συντελεστικής φόρτισης και της περιοχής των αλλαγών της άρθρωσης, μπορούμε να προχωρήσουμε περαιτέρω, χρησιμοποιώντας ξανά τη συσκευή των πινάκων για παρουσίαση, τα στοιχεία των οποίων αυτή τη φορά θα είναι συντελεστές συσχέτισης.

Ο πίνακας των συντελεστών συσχέτισης που λαμβάνεται, κατά κανόνα, πειραματικά, ονομάζεται πίνακας συσχέτισης ή πίνακας συσχέτισης.

Τα στοιχεία αυτού του πίνακα είναι οι συντελεστές συσχέτισης μεταξύ όλων των μεταβλητών του δεδομένου πληθυσμού.

Εάν έχουμε, για παράδειγμα, ένα σύνολο που αποτελείται από δοκιμές, τότε ο αριθμός των συντελεστών συσχέτισης που λαμβάνονται πειραματικά θα είναι

Αυτοί οι συντελεστές γεμίζουν το μισό του πίνακα που βρίσκεται στη μία πλευρά της κύριας διαγωνίου του. Από την άλλη πλευρά είναι, προφανώς, οι ίδιοι συντελεστές, αφού κλπ. Επομένως, ο πίνακας συσχέτισης είναι συμμετρικός.

Σχήμα 3.2. Πλήρης πίνακας συσχέτισης

Υπάρχουν κάποιες στη διαγώνιο αυτού του πίνακα επειδή κάθε μεταβλητή έχει συσχετισμό +1 με τον εαυτό της.

Ένας πίνακας συσχέτισης του οποίου τα κύρια διαγώνια στοιχεία είναι ίσα με 1 ονομάζεται «πλήρης πίνακας» συσχέτισης (Σχήμα 3.2) και συμβολίζεται

Θα πρέπει να σημειωθεί ότι τοποθετώντας μονάδες, ή συσχετισμούς κάθε μεταβλητής με τον εαυτό της, στην κύρια διαγώνιο, λαμβάνουμε υπόψη τη συνολική διακύμανση κάθε μεταβλητής που αναπαρίσταται στον πίνακα. Έτσι, λαμβάνεται υπόψη η επιρροή όχι μόνο γενικών, αλλά και ειδικών παραγόντων.

Αντίθετα, εάν στην κύρια διαγώνιο του πίνακα συσχέτισης υπάρχουν στοιχεία που αντιστοιχούν στις γενικότητες και σχετίζονται μόνο με τη γενική διακύμανση των μεταβλητών, τότε λαμβάνεται υπόψη μόνο η επιρροή γενικών παραγόντων, η επιρροή συγκεκριμένων παραγόντων και σφαλμάτων είναι εξαλείφεται, δηλ. απορρίπτεται η ειδικότητα και η διακύμανση των σφαλμάτων.

Ο πίνακας συσχέτισης, στον οποίο τα στοιχεία της κύριας διαγωνίου αντιστοιχούν στις γενικότητες, ονομάζεται ανηγμένη και συμβολίζεται με R (Σχήμα 3.3).

Σχήμα 3.3. Μειωμένος πίνακας συσχέτισης

Έχουμε ήδη μιλήσει για τη φόρτωση παραγόντων ή την πλήρωση μιας δεδομένης μεταβλητής με έναν συγκεκριμένο παράγοντα. Ταυτόχρονα, τονίστηκε ότι το συντελεστικό φορτίο έχει τη μορφή συντελεστή συσχέτισης μεταξύ μιας δεδομένης μεταβλητής και ενός δεδομένου παράγοντα.

Ένας πίνακας του οποίου οι στήλες αποτελούνται από τις φορτίσεις ενός δεδομένου παράγοντα σε σχέση με όλες τις μεταβλητές ενός δεδομένου πληθυσμού και τις σειρές των φορτίων παραγόντων μιας δεδομένης μεταβλητής, ονομάζεται πίνακας παραγόντων ή πίνακας παραγόντων. Εδώ μπορείτε επίσης να μιλήσετε για τον πλήρη και μειωμένο πίνακα παραγόντων. Τα στοιχεία του πλήρους παραγοντικού πίνακα αντιστοιχούν στη συνολική μοναδιαία διακύμανση κάθε μεταβλητής από τον δεδομένο πληθυσμό. Εάν τα φορτία σε γενικούς παράγοντες συμβολίζονται με c και τα φορτία συγκεκριμένων παραγόντων συμβολίζονται με και, τότε ο πλήρης πίνακας παραγόντων μπορεί να αναπαρασταθεί ως εξής:

Σχήμα 3.4. Πλήρης παράγοντας μήτρας για τέσσερις μεταβλητές

Ο πίνακας παραγόντων που παρουσιάζεται εδώ αποτελείται από δύο μέρη Το πρώτο μέρος περιέχει στοιχεία που σχετίζονται με τέσσερις μεταβλητές και τρεις κοινούς παράγοντες, όλοι από τους οποίους υποτίθεται ότι ισχύουν για όλες τις μεταβλητές. Δεν τρώει απαραίτητη προϋπόθεση, αφού ορισμένα στοιχεία του πρώτου μέρους του πίνακα μπορεί να είναι ίσα με μηδέν, πράγμα που σημαίνει ότι ορισμένοι παράγοντες δεν ισχύουν για όλες τις μεταβλητές. Τα στοιχεία του πρώτου μέρους του πίνακα είναι τα φορτία των κοινών παραγόντων (για παράδειγμα, το στοιχείο δείχνει το φορτίο του δεύτερου κοινού παράγοντα με την πρώτη μεταβλητή).

Στο δεύτερο μέρος του πίνακα, βλέπουμε 4 φορτώσεις χαρακτηριστικών παραγόντων, έναν σε κάθε σειρά, που αντιστοιχεί στην ιδιαιτερότητά τους. Καθένας από αυτούς τους παράγοντες αναφέρεται σε μία μόνο μεταβλητή. Όλα τα άλλα στοιχεία αυτού του τμήματος του πίνακα είναι ίσα με μηδέν. Οι χαρακτηριστικοί παράγοντες μπορούν προφανώς να αναλυθούν σε συγκεκριμένους και σε σχέση με σφάλματα.

Η στήλη του πίνακα παραγόντων χαρακτηρίζει τον παράγοντα και την επιρροή του σε όλες τις μεταβλητές. Η γραμμή χαρακτηρίζει τη μεταβλητή και το περιεχόμενό της με διάφορους παράγοντες, με άλλα λόγια, την παραγοντική δομή της μεταβλητής.

Όταν αναλύουμε μόνο το πρώτο μέρος του πίνακα, έχουμε να κάνουμε με έναν πίνακα παραγόντων που δείχνει τη συνολική διακύμανση κάθε μεταβλητής. Αυτό το τμήμα του πίνακα ονομάζεται μειωμένο τμήμα και συμβολίζεται με F. Αυτός ο πίνακας δεν λαμβάνει υπόψη το φορτίο των χαρακτηριστικών παραγόντων και δεν λαμβάνει υπόψη τη συγκεκριμένη διακύμανση. Θυμηθείτε ότι, σύμφωνα με όσα αναφέρθηκαν παραπάνω για τις γενικές διακυμάνσεις και τα φορτία παραγόντων, που είναι οι τετραγωνικές ρίζες των γενικών διακυμάνσεων, το άθροισμα των τετραγώνων των στοιχείων κάθε σειράς του μειωμένου συντελεστή πίνακα F είναι ίσο με τη γενικότητα της δεδομένης μεταβλητής

Αντίστοιχα, το άθροισμα των τετραγώνων όλων των στοιχείων της σειράς του πλήρους πίνακα των παραγόντων είναι ίσο με ή τη συνολική διακύμανση αυτής της μεταβλητής.

Δεδομένου ότι η παραγοντική ανάλυση εστιάζει σε κοινούς παράγοντες, θα χρησιμοποιήσουμε κυρίως τη μήτρα μειωμένης συσχέτισης και μειωμένων παραγόντων σε όσα ακολουθούν.




Φόρτωση...
Μπλουζα