Tényezőmátrix. A faktoranalízis elméleti alapfogalmai

A következő példa az élettel való elégedettség vizsgálatához kapcsolódó fiktív adatokon alapul. Tegyük fel, hogy a kérdőívet 100 véletlenszerűen kiválasztott felnőttnek küldték el. A kérdőív 10 tételt tartalmazott, amelyek a munkával való elégedettséget, a hobbival való elégedettséget, az otthoni élettel való elégedettséget és az élet egyéb területein való általános elégedettséget mérték. A kérdésekre adott válaszokat bevittük a számítógépbe, és úgy skáláztuk, hogy az összes item átlaga megközelítőleg 100 legyen.

Az eredmények a Factor.sta adatfájlba kerültek. Ezt a fájlt a Fájl - Megnyitás opcióval nyithatja meg; a legvalószínűbb, hogy ez az adatfájl a /Examples/Datasets könyvtárban található. Az alábbiakban a fájlban található változók listája látható (a listához válassza az Adatok menü Minden változó specifikációja lehetőséget).

Az elemzés célja . Az elemzés célja az elégedettség kapcsolatának vizsgálata a különböző tevékenységi területeken. Különösen kívánatos a különböző tevékenységi területek mögött „rejtett” tényezők számának és jelentőségének vizsgálata.

Az elemzés kiválasztása. A Faktorelemzés modul indítópaneljének megjelenítéséhez válassza az Elemzés - Többváltozós feltáró elemzés menü Faktorelemzés menüpontját. Kattintson a Változók gombra az Indítópulton (lásd lent), és válassza ki a fájl mind a 10 változóját.



Egyéb opciók . A szabványos faktorelemzés elvégzéséhez ez a párbeszédpanel mindent tartalmaz, amire szüksége van. Megszerzéséért áttekintés az indítópultról elérhető egyéb parancsok közül választhat bemeneti fájl korrelációs mátrix (az Adatfájl mező használatával). A PD eltávolítása mezőben kiválaszthatja a hiányzó adatok soronkénti vagy páronkénti kizárását vagy átlagos helyettesítését.

Adja meg a faktorkivonási módszert. Most megnyomjuk az OK gombot, hogy továbblépjünk a következő párbeszédpanelhez, melynek neve Specify Factor Extraction Method. Ezen a párbeszédpanelen megtekintheti a leíró statisztikákat, többszörös regressziós elemzést végezhet, kiválaszthat egy faktorkivonási módszert, kiválaszthatja a faktorok maximális számát, minimális sajátértékeit és egyéb, a faktorkivonási módszerek sajátosságaihoz kapcsolódó műveleteket. Most menjünk a Leíró lapra.



Tekintse meg a leíró statisztikákat. Most kattintson a View Corr./Average/Std. ebben az ablakban a Leíró statisztikák megtekintése ablak megnyitásához.



Mostantól megtekintheti a leíró statisztikákat grafikusan vagy eredménytáblázatokkal.

A korrelációs mátrix számítása. Kattintson a Korrelációk gombra a Speciális lapon a korrelációkat tartalmazó eredmények táblázatának megjelenítéséhez.



Ebben az eredménytáblázatban minden korreláció pozitív, és néhány összefüggés szignifikáns. Például a Hobby_1 és a Vegyes_1 változók 0,90-es szinten korrelálnak. Egyes összefüggések (például a munkahelyi elégedettség és az otthoni elégedettség közötti összefüggések) viszonylag kicsinek tűnnek. Úgy tűnik, hogy a mátrixnak van valami különálló szerkezete.

Kiválasztási módszer. Most kattintson a Mégse gombra a Leíró statisztikák megtekintése párbeszédpanelen, hogy visszatérjen a Tényezőkivonási módszer megadása párbeszédpanelhez. A Speciális lapon többféle kiválasztási mód közül választhat (az egyes módszerek leírását lásd a Tényezőkivonási módszer megadása párbeszédpanel Speciális lapján, a főkomponens módszer és a főtényező módszer leírását a Bevezető áttekintésben találja). Ebben a példában az alapértelmezett a fő összetevők, max. a tényezők száma a 10 értéket (a faktorok maximális száma ebben a példában) és a Min. mezőt tartalmazza. saját az érték 0-t tartalmaz (a parancs minimális értéke).



Az elemzés folytatásához kattintson az OK gombra.

Eredmények megtekintése. A faktorelemzés eredményeit a Faktorelemzési eredmények párbeszédpanelen tekintheti meg. Először válassza ki az Explained Variance lapot.



Sajátértékek megjelenítése . A sajátértékek hozzárendelését és azok hasznosságát a felhasználó számára annak eldöntésében, hogy hány tényezőt kell elhagyni (értelmezni) a Bevezető áttekintésben leírták. Most kattintson a Sajátértékek gombra, hogy megkapja a sajátértékeket, a teljes varianciaszázalékot, a felhalmozott sajátértékeket és a felhalmozott százalékokat tartalmazó táblázatot.


Amint a táblázatból látható, az első tényező sajátértéke 6,118369; azok. az első tényezővel magyarázott varianciaarány megközelítőleg 61,2%. Megjegyzendő, hogy ezek az értékek itt könnyen összehasonlíthatók voltak, mivel 10 változót elemeznek, és ezért az összes sajátérték összege 10. A második tényező a variancia körülbelül 18%-át tartalmazza. Egyéb tényezők legfeljebb 5%-ot tartalmaznakteljes variancia.A tényezők számának megválasztása. A Bevezető áttekintés rész röviden leírja, hogy az eredményül kapott sajátértékek hogyan használhatók annak eldöntésére, hogy hány tényezőt kell megtartani a modellben. A Kaiser-teszt (Kaiser, 1960) szerint 1-nél nagyobb sajátértékű tényezőket kell hagyni. A fenti táblázatból következik, hogy a teszt két tényező kiválasztását eredményezi.

Esztrich kritérium . Most kattintson a Scree Plot gombra, hogy megkapja a Cattell-féle simítóteszt alkalmazásához szükséges sajátérték diagramot (Cattell, 1966). Az alábbi grafikont kiegészítettük a szomszédos sajátértékeket összekötő szegmensekkel, hogy a kritérium vizuálisabb legyen. Cattell a Monte Carlo-módszer alapján kijelenti, hogy az a pont, ahol a sajátértékek folyamatos esése lelassul, és amelyen túl a fennmaradó sajátértékek szintje csak véletlenszerű "zajt" tükröz. Az alábbi grafikonon ez a pont 2-es vagy 3-as tényezőnek felelhet meg (a nyilak szerint). Ezért próbálja ki mindkét megoldást, és nézze meg, melyik ad megfelelőbb képet.



Most vegye figyelembe a faktorterheléseket.

Tényezőterhelések . A Bevezető áttekintés részben leírtak szerint a faktorterhelések a tényezők és a változók közötti korrelációkként értelmezhetők. Ezért ők képviselik a legtöbbet fontos információ amelyen a tényezők értelmezése alapul. Először nézzük meg mind a tíz faktor (döntetlen) tényezőterhelését. A Tényezőelemzés eredményei párbeszédpanel Loads lapján a Tényezők elforgatása mezőben állítsa be az értéket elforgatás nélkül, majd kattintson a Tényezőterhelések gombra a terhelések táblázatának megjelenítéséhez.



Emlékezzünk vissza, hogy a faktorok kiválasztása úgy történt, hogy a későbbi tényezők egyre kisebb szórást tartalmaztak (lásd a Bevezető áttekintést). Ezért nem meglepő, hogy az első tényező a legnagyobb terhelést. Megjegyezzük, hogy a faktorterhelések jelei csak azért fontosak, hogy megmutassuk, hogy az ugyanazon faktoron ellentétes terhelésű változók ellenkező módon hatnak ezzel a tényezővel. Az oszlopban lévő összes terhelést azonban megszorozhatja -1-gyel, és megfordíthatja az előjeleket. Minden más tekintetben az eredmények változatlanok maradnak.

A faktormegoldás elforgatása. A Bevezető áttekintés részben leírtak szerint a tényezők tényleges orientációja egy faktortérben tetszőleges, és bármely faktorforgatás ugyanolyan jól reprodukálja a korrelációkat, mint más elforgatások. Ezért természetesnek tűnik, hogy a faktorokat úgy forgatjuk, hogy a legkönnyebben értelmezhető faktorszerkezetet válasszuk ki. Valójában az egyszerű szerkezet kifejezést Thurstone (1947) alkotta meg és definiálta főként olyan állapotok leírására, amikor a tényezőket egyes változókra nagy terhelések, más változókra alacsony terhelések jellemzik, valamint akkor is, amikor több nagy keresztterhelés van, pl. számos olyan változó van, amelyek több tényezőt is jelentős mértékben terhelnek. A legszokványosabb számítási forgatási módszer egy egyszerű struktúra előállítására a Kaiser által javasolt varimax rotációs módszer (Kaiser, 1958). Más Harman által javasolt módszerek (Harman, 1967) a quartimax, biquartimax és equimax módszerek (lásd Harman, 1967).

Forgatás kiválasztása . Először is fontolja meg, hány tényezőt szeretne hagyni forgatni és értelmezni. Korábban úgy döntöttek, hogy a legvalószínűbb és legelfogadhatóbb faktorszám a kettő, de a simítókritérium alapján úgy döntöttek, hogy három tényezős döntést is figyelembe vesznek. Kattintson a Mégse gombra, hogy visszatérjen a Tényezőkivonási módszer beállítása párbeszédpanelhez, és módosítsa a Tényezők maximális száma mezőt a Gyors lapon 10-ről 3-ra, majd kattintson az OK gombra az elemzés folytatásához.

Most forgassuk a varimax módszerrel. A Tényezőelemzés eredményei párbeszédpanel Loads lapján, a Tényezők elforgatása mezőben állítsa be a kezdeti Varimax értékét.



Nyomja meg a Factor loads gombot, hogy megjelenítse az eredményül kapott faktorbetöltések eredményét a táblázatban.


A megoldás megjelenítése három tényező elforgatásakor. A táblázat az első tényező szignifikáns terheléseit mutatja az összes változó esetében, kivéve a házzal kapcsolatosakat. A 2. faktor minden változóra meglehetősen jelentős terhelést tartalmaz, kivéve a munkával való elégedettséggel kapcsolatosakat. A 3. faktornak csak egy jelentős terhelése van a Home_1 változóban. Az a tény, hogy a harmadik faktort csak egy változó terheli erősen, elgondolkodtat, vajon elérhető-e ugyanolyan jó eredmény a harmadik faktor nélkül?

A megoldás áttekintése két tényező rotációja mellett . Kattintson ismét a Mégse gombra a Tényezőelemzési eredmények párbeszédpanelen, hogy visszatérjen a Tényezőkivonási módszer megadása párbeszédpanelhez. Módosítsa a Gyors lap Tényezők maximális száma mezőjét 3-ról 2-re, majd kattintson az OK gombra a Tényezőelemzés eredményei párbeszédpanel megnyitásához. A Terhelések lap Elforgatási tényezők mezőjében állítsa be a Kezdeti értéket Varimax-ra, majd kattintson a Betöltési tényező gombra.


Az 1. faktor, amint az a táblázatból is látható, a legmagasabb terhelésekkel rendelkezik a munkával való elégedettséggel kapcsolatos változókra. Az otthoni elégedettséggel kapcsolatos változókat terheli a legkisebb terhek. Más terhelések közbenső értékeket vesznek fel. A 2. faktor terhelése a legmagasabb az otthoni elégedettséggel kapcsolatos változókhoz, a legalacsonyabb a munkahelyi elégedettséghez, az átlagos terhelés a többi változóhoz.

A kéttényezős forgatás megoldásának értelmezése . Lehet-e értelmezni ezt a modellt? Úgy tűnik, hogy a két tényező a legjobban a munkával való elégedettség (1. faktor) és az otthoni élettel való elégedettség (2. faktor) azonosítható. Úgy tűnik, hogy a hobbival és az élet számos más területével való elégedettség mindkettőhöz kapcsolódik. Ez a modell bizonyos értelemben azt sugallja, hogy ebben a mintában a munkával és az otthoni élettel való elégedettség független lehet egymástól, de mindkettő hozzájárul a hobbikkal és az élet egyéb területeivel való elégedettséghez.

Két tényező rotációján alapuló döntés diagramja . Két tényező szórásdiagramjának megjelenítéséhez kattintson a 2M Load Plot gombra a Tényezőelemzési eredmények párbeszédpanel Loads lapján. Az alábbi diagram egyszerűen két terhelést mutat minden változóhoz. Vegye figyelembe, hogy a szórásdiagram jól szemléltet két független tényezőt és 4 változót (Hobby_1, Hobby_2, Vegyes_1, Vegyes_2) keresztterheléssel.



Most nézzük meg, hogy a megfigyelt kovarianciamátrix mennyire reprodukálható kétfaktoros megoldással.

Reprodukált és reziduális korrelációs mátrix. Kattintson a Reprodukált és maradék korrelációk gombra az Explained Variance lapon, hogy két táblát kapjon replikált korrelációs mátrixszal és egy maradék korrelációs mátrixszal (megfigyelt mínusz replikált korreláció).



A Residual Correlations táblázat bejegyzései a két eredő tényezővel nem számolható összefüggések "összegeként" értelmezhetők. Természetesen a mátrix átlós elemei tartalmaznak egy szórást, amelyért ezek a tényezők nem tehetők felelőssé, ami egyenlő az egy négyzetgyökével mínusz a két tényező megfelelő közössége (emlékezzünk arra, hogy a változó közössége a szórás, ami a választott tényezõszámmal magyarázható). Ha figyelmesen megvizsgálja ezt a mátrixot, láthatja, hogy valójában nincsenek 0,1-nél nagyobb vagy -0,1-nél kisebb reziduális korrelációk (valójában csak kis részük van közel ehhez az értékhez). Tegyük hozzá, hogy az első két tényező a teljes variancia körülbelül 79%-át tartalmazza (lásd a sajátértékek kumulatív %-át az eredménytáblázatban).

A jó példa "titka". . Az imént tanulmányozott példa valójában csaknem tökéletes megoldást ad a kéttényezős problémára. Ez határozza meg a variancia nagy részét, ésszerű értelmezése van, és mérsékelt eltérésekkel (maradék korrelációk) korrelációs mátrixot reprodukál. Valójában a valós adatok ritkán tesznek lehetővé ilyen egyszerű megoldást, és valójában ezt a fiktív adathalmazt egy, a rendszerben elérhető, normális eloszlású véletlenszám-generátor segítségével kaptuk. Speciális módon két ortogonális (független) tényezőt „bevezettünk” az adatokba, amelyek alapján a változók közötti összefüggéseket generáltuk. A faktoranalízis ezen példája a két faktort úgy reprodukálja, ahogy volt (azaz a munkával való elégedettségi faktort és az otthoni élettel való elégedettségi faktort). Így, ha egy jelenség (és nem mesterséges, mint a példában az adat) tartalmazta ezt a két tényezőt, akkor ezek elkülönítésével megtudhat valamit a jelenség rejtett vagy látens szerkezetéről.

Egyéb eredmények . Mielőtt a végső következtetést levonnánk, rövid megjegyzéseket teszünk más eredményekről.

közösségek . A megoldás általánosságainak megtekintéséhez kattintson az Általánosságok gombra a Tényezőelemzési eredmények párbeszédpanel Explained Variance lapján. Emlékezzünk vissza, hogy egy változó közössége a variancia azon hányada, amely adott számú tényezőre reprodukálható. A faktortér elforgatása nem befolyásolja az általánosság mértékét. Egy vagy két változó nagyon alacsony közös vonása (az elemzésben szereplő sok közül) azt jelezheti, hogy ezeket a változókat nem magyarázza meg megfelelően a modell.

Értékegyütthatók. A faktoregyütthatókat minden megfigyelés faktorértékének kiszámításához lehet használni. Maguk az együtthatók általában kevéssé érdekesek, de a faktorértékek hasznosak a további elemzésben. Az együtthatók megjelenítéséhez kattintson a Tényezőérték-együtthatók gombra a Tényezőelemzési eredmények párbeszédpanel Értékek lapján.

Tényezőértékek. A faktorértékek minden egyes megkérdezett válaszadó aktuális értékének tekinthetők (azaz az eredeti adattáblázat minden egyes megfigyeléséhez). A Tényezőelemzési eredmények párbeszédpanel Értékek lapján található Tényezőértékek gomb lehetővé teszi a faktorértékek kiszámítását. Ezeket az értékeket elmentheti későbbre az Értékek mentése gombra kattintva.

Utolsó megjegyzés. A faktorelemzés nem egyszerű eljárás. Bárki, aki folyamatosan használja faktoranalízis sok (pl. 50 vagy több) változóval sok példát láthatunk a „kóros viselkedésre”, mint például: negatív sajátértékek és értelmezhetetlen megoldások, speciális mátrixok stb. Ha érdekli a faktoranalízis használata számos változó vagy szignifikáns tényező meghatározására, alaposan tanulmányozza bármelyiket részletes útmutató(például Harman könyve (Harman, 1968)). Így, mivel a faktoranalízisben számos kritikus döntés eleve szubjektív (a tényezők száma, a forgatás módja, a terhelések értelmezése), készüljön fel arra, hogy bizonyos tapasztalatok szükségesek, mielőtt magabiztosnak érezné magát. A Factor Analysis modult kifejezetten arra tervezték, hogy megkönnyítse a felhasználó számára az interaktív váltást a különböző számú faktor, elforgatás stb. között, így a különböző megoldásokat tesztelheti és összehasonlíthatja.

Ez a példa innen származik súgórendszer RFP STATISZTIKA a StatSoft által

STATISTIKA TÉNYEZŐ ELEMZÉS

Korrelációk (faktor.sta) A PD soronkénti eltávolítása n=100

Változó

WORK_1

WORK_2

WORK_3

1. SZÁMÚ HÁZ

HÁZ 2

A HÁZ 3

Amint az a korrelációs mátrixból látható, a munkahelyi elégedettséggel kapcsolatos változók jobban korrelálnak egymással, és az otthoni elégedettséggel kapcsolatos változók is jobban korrelálnak egymással. E két változótípus (a munkahelyi elégedettséggel és az otthoni elégedettséggel kapcsolatos változók) között viszonylag kicsi a korreláció. Ezért valószínűnek tűnik, hogy a korrelációs mátrixban két viszonylag független tényező (kétféle tényező) tükröződik: az egyik a munkával, a másik pedig az otthoni élettel való elégedettségre vonatkozik.

    Tényezőterhelések

A faktoranalízis második szakasza a faktorok kezdeti kiválasztása vagy a főkomponensek módszerével, vagy a főtényezők módszerével. Példánk eredménye egy kéttényezős megoldás. Tekintsük a változók és két tényező (vagy „új” változó) közötti összefüggéseket. Ezeket a korrelációkat faktorkorrelációknak nevezzük.

3.16. táblázat

Tényezőterhelési táblázat (főkomponens módszer)

STATISTIKA TÉNYEZŐ ELEMZÉS

Tényezőterhelések (forgás nélkül) fő összetevők

Változó

1. faktor

2. faktor

Teljes variancia

Részesedés a teljes diszk.

Amint a 3.16. táblázatból látható, az első tényező jobban korrelál a változókkal, mint a második (mivel az első tényező minden egyes változójának súlyterhelési értékei nagyobbak, mint a másodiké). Ez nyilvánvaló, mert amint fentebb említettük, a faktorok szekvenciálisan kerülnek kivonásra, és egyre kevesebb teljes variancia van benne (lásd a részt Sajátértékek és a megkülönböztetett tényezők száma, 61. oldal).

    Tényezőrotációs módszerek

A faktoranalízis harmadik szakasza az előző szakaszból eredő faktorterhelések forgatása. Tipikus rotációs módszerek a stratégiák varimax, quartimax, És equimax. Ezeknek a módszereknek a célja egy érthető (értelmezhető) terhelési mátrix létrehozása, vagyis olyan tényezők, amelyeket egyes változók esetében egyértelműen magas (például 0,7-nél nagyobb), míg mások esetében alacsony terhelések jellemeznek. Ezt az általános modellt néha ún egyszerű szerkezet.

A módszer szerinti forgatás ötlete varimax fentebb leírtuk (lásd a részt Főkomponens módszer, 60. oldal). Ez a módszer a vizsgált példára is alkalmazható. Az eddigiekhez hasonlóan az a feladatunk, hogy olyan forgást találjunk, amely maximalizálja a diszperziót az új tengelyek mentén; vagy más szóval, hogy minden tényezőhöz terhelési mátrixot kapjunk úgy, hogy azok a lehető legnagyobb mértékben különbözzenek egymástól, és lehetőség legyen egyszerű értelmezésére. Az alábbiakban egy táblázat található az elforgatott tényezők terheléseiről.

3.17. táblázat

Tényezőterhelési táblázat (forgatás - varimax)

STATISTIKA TÉNYEZŐ ELEMZÉS

Tényezőterhelések (Varimax normalizált) extrakció: fő összetevők

Változó

1. faktor

2. faktor

Teljes variancia

Részesedés a teljes diszk.

Amint a 3.17. táblázatból látható, az első tényezőt a munkahelyi elégedettséggel kapcsolatos változók nagy terhelése jellemzi, a második tényezőt pedig az otthoni elégedettség. Ebből arra következtethetünk, hogy a kérdőívvel mért elégedettség két részből áll: az otthonnal és a munkával való elégedettségből. Így előállított osztályozás a vizsgált változókat. A kapott besorolás alapján az első faktort munkával való elégedettségi faktornak (vagy társadalmi értékfaktornak), ennek megfelelően a másodikat otthoni elégedettségi faktornak (vagy személyes értékfaktornak) nevezhetjük.

    A faktoranalízis eredményeinek értelmezése

A faktoranalízis utolsó szakasza a rotáció eredményeként kapott faktorok értelmes értelmezése. Itt a kutatónak jó elméleti háttérrel és az ezen a kutatási területen már felhalmozott kísérleti eredmények ismeretével kell rendelkeznie.

A gyakorlatban a faktorok értelmezése abból áll, hogy mindegyik faktorhoz jelentős faktorsúlyokat (referenciaváltozókat) rendelnek hozzá. Nincsenek pontos kritériumok a jelentős tényezősúlyok (terhelések) és a jelentéktelenek megkülönböztetésére. Például nagy minták (több száz fő vagy több) esetén a 0,3 vagy annál nagyobb terhelések néha jelentősnek számítanak. Ha a mintát több tíz főre redukáljuk, akkor a 0,4–0,5 nagyságrendű súlyokat használjuk szignifikánsnak.

A tényezők értelmezése nem mindig megy zökkenőmentesen; bizonyos esetekben csak hipotetikus (például különböző típusú skáláknak megfelelő adatok használata esetén), és néha a szerzők teljesen elhagyják, mivel a faktor olyan teszteket tartalmaz, amelyekben nehéz valami közöset látni.

Ideális esetben (a változók eloszlása ​​nem tér el a normáltól) a faktoranalízis eredményeinek értelmezése kezdődhet a korrelációs mátrix elemzésével, majd áttérhet a faktorterhelésekre (referenciaváltozók kiválasztása). A következő lépés a korrelációs mátrix és a kiválasztott, szignifikáns súlyokat tartalmazó tényezők összehasonlítása. És végül, az utolsó szakasz a kapott általánosságok elemzése azon vizsgált változók (jellemzők) tartalmára és természetére vonatkozóan, amelyek a legmagasabb korrelációt mutatják ezzel a tényezővel. A faktorok elnevezése azon referenciaváltozók figyelembevételével történik, amelyek a legnagyobb súlyt kapták és a faktorral a legmagasabb korrelációt mutatják. Például, ha a nem szenzoros anyagok rögzítésének képességét értékelő tesztek nagy súlyterheléssel bírnak erre a tényezőre, akkor ez utóbbit "forgási memória" tényezőnek nevezhetjük.

Alapegyenletek

Korábban szinte minden faktoranalízissel foglalkozó tankönyv és monográfia magyarázatot adott arra vonatkozóan, hogyan kell az alapvető számításokat "kézi" vagy egyszerű számolóeszköz (aritmométer vagy számológép) segítségével elvégezni. Manapság az összefüggések mátrixának felépítéséhez, a faktorok azonosításához és rotációjához szükséges bonyolultság és nagyszámú számítás miatt valószínűleg nem maradt egyetlen ember sem, aki ne alkalmazna faktoranalízist a faktoranalízis során. erős számítógépekés a kapcsolódó programok.

Ezért arra fogunk koncentrálni, hogy melyek a faktoranalízis során nyerhető legjelentősebb mátrixok (adatsorok), hogyan kapcsolódnak egymáshoz és hogyan használhatók fel adatok értelmezésére. Az összes szükséges számítás bármelyik segítségével elvégezhető számítógépes program(például SPSS vagy STADIA).

BAN BEN lapon. 1 a főkomponens-analízishez és a faktoranalízishez szükséges legfontosabb mátrixok listája szerepel. Ez a lista főleg kapcsolati mátrixokat (változók között, faktorok között, változók és faktorok között), standardizált pontszámokat (változók és faktorok szerint), regressziós súlyokat (a faktorpontszámok változók szerinti pontszámok segítségével történő kiszámításához) és faktorkapcsolat-leképezési mátrixokat tartalmaz. és változók ferde elforgatás után. BAN BEN lapon. 1 a sajátértékek mátrixai és a megfelelő sajátvektorok is megadva vannak. A sajátértékeket (sajátértékeket) és a sajátvektorokat a faktorok kiválasztásában betöltött fontosságuk, a nagyszámú speciális kifejezés használatára tekintettel írják le, valamint szoros kapcsolat sajátértékek és variancia a statisztikai kutatásban.

Asztal 1

A faktoranalízisben leggyakrabban használt mátrixok

Kijelölés Név Méret Leírás
R Kapcsolati mátrix pxp Változók közötti kapcsolatok
D Egyedi adatmátrix Nxp Elsődleges adatok - az elsődleges változókra vonatkozó megfigyelések nem szabványosított értékei
Z Szabványosított adatmátrix Nxp A megfigyelések standardizált értékei elsődleges változók szerint
F Tényezőérték mátrix N x f A megfigyelések standardizált értékei tényezők szerint
A Tényezőbetöltő mátrix Tényezőleképezési mátrix px f A közös tényezők regressziós együtthatói, feltéve, hogy a megfigyelt változók a tényezők lineáris kombinációja. Ortogonális forgatás esetén - a változók és tényezők közötti kapcsolatok
BAN BEN Tényezőértékek együtthatómátrixa px f Regressziós együtthatók a faktorértékek kiszámításához változó értékek használatával
S Strukturális mátrix px f Változók és tényezők közötti kapcsolatok
F Tényezőkorrelációs mátrix f x f Tényezők közötti összefüggések
L Sajátérték mátrix (átlós) f x f Sajátértékek (jellegzetes, látens gyökerek); minden tényező egy sajátértéknek felel meg
V Sajátvektor mátrix f x f Saját (karakterisztikus) vektorok; minden sajátérték egy sajátvektornak felel meg

Jegyzet. A méret megadásakor a sorok száma x az oszlopok száma kerül megadásra: R- a változók száma, N- megfigyelések száma, f- a tényezők vagy összetevők száma. Ha a kapcsolati mátrix R nem degenerált, és rangja egyenlő R, akkor valójában kiemelkedik R sajátértékek és sajátvektorok, nem f. Azonban csak érdekesség f tőlük. Ezért a maradék p-f nem jelennek meg.

A mátrixokhoz SÉs F csak ferde forgatást alkalmazunk, a többit ortogonális és ferde forgatást alkalmazunk.

A faktoranalízishez előkészített adatsor nagyszámú alany (válaszadó) bizonyos skálákon (változókon) végzett mérések (felmérés) eredményeiből áll. BAN BEN lapon. 2 adattömböt adunk meg, amely feltételesen a faktoranalízis követelményeit kielégítőnek tekinthető.

Öt válaszadónak, akik utazási irodához fordultak, hogy jegyet vegyenek egy tengerparti üdülőhelyre, kérdéseket tettek fel arra vonatkozóan, hogy a nyári üdülési célpont kiválasztásában milyen jelentőséggel bír számukra a négy feltétel (változó). Ezek a változó feltételek a következők voltak: a túra költsége, a komplexum kényelme, levegő hőmérséklet, víz hőmérséklete. Minél fontosabb volt számára a válaszadó szempontjából ez vagy az a feltétel, annál nagyobb jelentőséget tulajdonított neki. A kutatási feladat a változók közötti kapcsolat modelljének tanulmányozása és az üdülőhely kiválasztását meghatározó kiváltó okok azonosítása volt. (Természetesen szemléltető és oktatási céllal rendkívül leegyszerűsített a példa, érdemi szempontból nem szabad komolyan venni.)

Kapcsolati mátrix ( lapon. 2) korrelációként számítottuk ki. Ügyeljen a benne lévő kapcsolatok szerkezetére, amelyet a függőleges ill vízszintes vonalak. A bal felső és a jobb alsó negyed magas korrelációi azt mutatják, hogy a túra költségére és a komplexum kényelmére vonatkozó értékelések összefüggenek egymással, valamint a levegő hőmérsékletére és a víz hőmérsékletére vonatkozó értékelések. A másik két kvadráns azt mutatja, hogy a komplexum léghőmérséklete és komfortérzete, valamint a komplexum komfortérzete és a víz hőmérséklete összefügg.

Most próbáljuk meg faktoranalízissel kimutatni a korrelációknak ezt a struktúráját, amely szabad szemmel könnyen látható egy kis korrelációs mátrixban (nagy mátrixban ezt nagyon nehéz megtenni).

2. táblázat

Adatok faktoranalízishez (esettanulmány)

Turisták Változók
Jegyár Komfort szint Levegő hőmérséklet Vízhőmérséklet
T1
T2
T3
T4
T5

Korrelációs mátrix

Jegyár Komfort szint Levegő hőmérséklet Vízhőmérséklet
Jegyár 1,000 -0,953 -0,055 -0,130
Komfort szint -0,953 1,000 -,091 -0,036
Levegő hőmérséklet -0,055 -0,091 1,000 0,990
Vízhőmérséklet -0,130 -0,036 0,990 1,000

Faktorizáció

A mátrixalgebra egyik fontos tétele kimondja, hogy bizonyos feltételeket kielégítő mátrixok diagonalizálhatók, pl. mátrixsá alakítjuk, amelynek főátlóján számok, az összes többi helyen nullák találhatók. A kapcsolati mátrixok kifejezetten a diagonalizálható mátrixok típusába tartoznak. Az átalakítás a következő képlet szerint történik:

azok. Az R mátrixot úgy diagonalizáljuk, hogy először (balról) megszorozzuk a transzponált V mátrixszal, amelyet V'-vel jelölünk, majd (jobbról) magával a V mátrixszal.

A V mátrix oszlopait sajátvektoroknak, az L mátrix főátlóján lévő értékeket pedig sajátértékeknek nevezzük. Az első sajátvektor megfelel az első sajátértéknek, és így tovább. (további részletekért lásd az 1. mellékletet).

Tekintettel arra, hogy a fenti példában négy változót veszünk figyelembe, négy sajátértéket kapunk a hozzájuk tartozó sajátvektorokkal. De mivel a faktoranalízis célja a kapcsolati mátrix általánosítása a lehető legkevesebb faktoron keresztül, és minden sajátérték különböző potenciális tényezőknek felel meg, általában csak a nagy sajátértékekkel rendelkező tényezőket veszik figyelembe. "Jó" faktoriális megoldásnál az ennek felhasználásával kapott számított összefüggések mátrixa limitált készlet tényezőket, gyakorlatilag megkettőzi a kapcsolatok mátrixát.

Példánkban, amikor nincs korlátozás a faktorok számára, a 2,02, 1,94, 0,04 és 0,00 sajátértékeket a rendszer a négy lehetséges tényező mindegyikére kiszámítja. Csak az első két tényező esetében a sajátértékek elég nagyok ahhoz, hogy további vizsgálat tárgyát képezzék. Ezért csak az első két tényezőt vonják ki újra. Sajátértékük 2,00 és 1,91, amint azt az 1. táblázat mutatja. 3. A (6) egyenlet felhasználásával és a fenti példából származó értékek beillesztésével kapjuk:

(Minden számítógéppel számított érték megegyezik; a "kézi" számítások eltérhetnek a kerekítési pontatlanságok miatt.)

A sajátvektorok mátrixának bal oldali szorzata a rá transzponáltal megkapja az E azonosságmátrixot (egyesekkel a főátlón és a többi nullán). Ezért azt mondhatjuk, hogy a kapcsolati mátrix (6) képlet szerinti átalakítása önmagában nem változtatja meg, hanem csak egy kényelmesebb elemzési formává alakítja át:

Például:

3. táblázat

Sajátvektorok és a megfelelő sajátértékek a vizsgált esettanulmányhoz

1. sajátvektor 2. sajátvektor
-.283 .651
.177 -.685
.658 .252
.675 .207
Sajátérték 1 2. sajátérték
2.00 1.91

Mivel a korrelációs mátrix diagonalizálható, a sajátvektorok és sajátértékek mátrixalgebrája alkalmazható rá, hogy megkapjuk a faktoranalízis eredményeit (lásd 1. melléklet). Ha egy mátrix diagonalizálható, akkor a faktorstruktúrával kapcsolatos minden lényeges információ átlós formában található. A faktoranalízis során a sajátértékek a faktorok által magyarázott varianciának felelnek meg. A legnagyobb sajátértékkel rendelkező tényező magyarázza a legnagyobb szórást, és így tovább, egészen addig, amíg kis vagy negatív sajátértékű tényezőkhöz jutunk, amelyek általában kimaradnak az elemzésből. A sajátértékek és a sajátvektorok kiszámítása nagyon munkaigényes, és a számításuk képessége nem feltétlenül szükséges egy pszichológus számára, aki saját gyakorlati céljaira sajátítja el a faktoranalízist. Ennek az eljárásnak az ismerete azonban nem árt, ezért az 1. függelékben példaként adjuk meg a sajátértékek és sajátvektorok kiszámítását egy kis mátrixon.

Sajátértékek keresése négyzetmátrix p x p meg kell találni a p fokú polinom gyökét, a sajátvektorok kereséséhez pedig p egyenleteket kell megoldani p ismeretlennel további oldalkorlátozásokkal, ami p>3 esetén ritkán történik manuálisan. A sajátvektorok és sajátértékek megtalálása után a faktoranalízis (vagy a főkomponens-analízis) többi része többé-kevésbé egyértelművé válik (lásd a 8-11. egyenleteket).

A (6) egyenlet a következőképpen ábrázolható: R=V'LV, (8)

azok. a kapcsolati mátrix három mátrix - a sajátértékek mátrixa, a megfelelő sajátvektorok mátrixa és a rá transzponált mátrix - szorzatának tekinthető.

A transzformáció után az L sajátértékek mátrixa a következőképpen ábrázolható:

és ezért: R=VÖLÖL V’ (10)

vagy (ami ugyanaz): R=(VÖL)(ÖL V’)

Jelölje: A=(VÖL), és A’=(ÖL V’), majd R=AA’ (11)

azok. a kapcsolati mátrix két mátrix szorzataként is ábrázolható, amelyek mindegyike sajátvektorok és sajátértékek négyzetgyökeinek kombinációja.

A (11) egyenletet gyakran a faktoranalízis alapegyenletének nevezik. Azt az állítást fejezi ki, hogy a kapcsolati mátrix az (A) faktorbetöltő mátrix és annak transzponálása szorzata.

A (10) és (11) egyenletek azt is mutatják, hogy a faktoranalízis módszereiben és a főkomponensekben a számítások jelentős része a sajátértékek és sajátvektorok meghatározása. Ha ezek ismertek, a forgatás előtti tényező mátrixot közvetlen mátrixszorzással kapjuk meg:

Példánkban:

A faktorterhelési mátrix a faktorok és változók közötti kapcsolatok mátrixa (korrelációs együtthatóként értelmezve). Az első oszlop az első tényező és az egyes változók közötti összefüggéseket tartalmazza: a túra költsége (-,400), a komplexum kényelme (,251), a levegő hőmérséklete (,932), a víz hőmérséklete (. 956). A második oszlop a második tényező és az egyes változók közötti összefüggéseket tartalmazza: a túra költsége (.900), a komplexum kényelme (-.947), a levegő hőmérséklete (.348), a víz hőmérséklete (.286). A faktort a hozzá erősen kapcsolódó (azaz nagy terhelésű) változók alapján értelmezzük. Tehát az első tényező főként „klimatikus” (levegő- és vízhőmérséklet), míg a második „gazdaságos” (a túra költsége és a komplexum kényelme).

Ezen tényezők értelmezésekor figyelni kell arra, hogy azok a változók, amelyek az első tényezőt (levegő- és vízhőmérsékletet) nagy mértékben terhelik, pozitívan korrelálnak, míg azok a változók, amelyek a második tényezőt (egy túra költsége, ill. a komplexum kényelme) negatívan korrelálnak (egy olcsó üdülőhelytől nem várhat nagy kényelmet). Az első tényezőt unipolárisnak nevezik (minden változó egy póluson van csoportosítva), a másodikat pedig bipolárisnak (a változók két ellentétes csoportra - két pólusra - oszlanak). A plusz előjelű faktorterhelésű változók pozitív, a mínusz előjelűek negatív pólust alkotnak. Ugyanakkor a „pozitív” és „negatív” pólus elnevezése a faktor értelmezésekor nem rendelkezik „rossz” és „jó” értékelő jelentéssel. Az előjel kiválasztása a számítások során történik véletlenszerűen. Ha minden jelet az ellentétükre cserélünk (minden pluszt mínuszra, és minden mínuszt pluszra), nem változtat a megoldáson. A jelek elemzése csak a csoportok azonosításához szükséges (mivel mi áll szemben). Ugyanilyen sikerrel az egyik pólust jobbnak, a másikat balnak nevezhetjük. Példánkban az utalvány változó költsége a pozitív (jobb) póluson mutatkozott meg, szemben a negatív (bal) póluson lévő komplex változó kényelmével. Ez a tényező pedig „Gazdaság és kényelem”-ként értelmezhető (nevezhető). Azok a válaszadók, akik számára jelentős a megtakarítási probléma, jobb oldalon álltak - pluszjellel faktorértékeket kaptak. Az üdülőhely kiválasztásakor inkább annak olcsóságára és kevésbé a kényelmére helyezik a hangsúlyt. Azok a válaszadók, akik nem spórolnak nyaralni (az utalvány ára nem nagyon zavarja őket), és akik elsősorban kényelmes körülmények között szeretnének pihenni, baloldaliak voltak - faktorértékeket kaptak egy „mínusz” jel.

Ugyanakkor szem előtt kell tartani, hogy minden változó erősen korrelál mindkét tényezővel. Ezen belül egyszerű példa az értelmezés kézenfekvő, de valós adatok esetén nem minden ilyen egyszerű. Általában egy faktor könnyebben értelmezhető, ha a változóknak csak egy kis része van vele szoros összefüggésben, a többi pedig nem.

Ortogonális forgatás

A rotációt általában a faktor extrakció után alkalmazzák a magas korrelációk maximalizálása és az alacsony korrelációk minimalizálása érdekében. Számos forgatási módszer létezik, de a leggyakrabban használt varimax rotáció, amely egy varianciamaximalizálási eljárás. Ez a forgatás maximalizálja a faktorterhelési eltéréseket azáltal, hogy a magas terheléseket magasabbra, az alacsony terheléseket pedig alacsonyabbra teszi, mint az egyes tényezők napja. Ez a cél azáltal valósul meg transzformációs mátrixok L:

A kanyar előtt L=A kanyar után,

azok. a forduló előtti faktorterhelési mátrixot megszorozzuk a transzformációs mátrixszal, és az eredmény a fordulat utáni faktorterhelések mátrixa. Példánkban:

Hasonlítsa össze a mátrixokat a forgatás előtt és után. Ne feledje, hogy az elforgatás utáni mátrixban az alacsony faktorsúlyok alacsonyabbak és a magas faktorsúlyok magasabbak, mint a forgatás előtti mátrixban. A hangsúlyos terheléskülönbség megkönnyíti a faktor értelmezését, és lehetővé teszi a vele szorosan összefüggő változók egyértelmű kiválasztását.

A transzformációs mátrix elemeinek sajátos geometriai értelmezése van:

A transzformációs mátrix a ψ szög szinuszainak és koszinuszainak mátrixa, amelyen keresztül az elforgatás történik. (Ezért a transzformáció neve elforgatás, mert geometriai szempontból a tengelyek a faktortér origója körül forognak.) Példánkban ez a szög megközelítőleg 19 fok: cos19°= .946 és sin19° =.325. Geometriailag ez a faktoriális tengelyek origó körüli 19 fokkal történő elforgatásának felel meg. (A forgatás geometriai vonatkozásairól lásd alább.)

A TÉNYEZŐELEMZÉS SZAKASZAI

A faktoranalízisnek kilenc szakasza van. Az érthetőség kedvéért ezeket a szakaszokat az ábrán mutatjuk be, majd röviden ismertetjük őket.

A faktoranalízis szakaszait az ábra mutatja.

Rizs.

A PROBLÉMA MEGFOGALMAZÁSA ÉS A KORRELÁCIÓS MÁTRIX FELÉPÍTÉSE

Probléma megfogalmazása. A faktoranalízis céljait egyértelműen meg kell határozni. A faktoranalízisnek alávetett változók beállítása korábbi kutatások, elméleti számítások alapján vagy a kutató döntése alapján történik. A változókat be kell mérni intervallum vagy relatív skála. A tapasztalat azt mutatja, hogy a minta méretének négyszer-ötször nagyobbnak kell lennie, mint a változók száma.

A korrelációs mátrix felépítése. Az elemzés a változók közötti korrelációs mátrixon alapul. A faktoranalízis elvégzésének célszerűségét a változók közötti összefüggések megléte határozza meg. Ha az összes változó közötti korreláció kicsi, akkor a faktoranalízis hiábavaló. Az egymással szorosan összefüggő változók általában erősen korrelálnak ugyanazzal a tényezővel vagy tényezőkkel.

A faktoriális modell használatának tesztelésére számos statisztikai adat áll rendelkezésre. A Bartlett-féle szfericitásteszt azt a nullhipotézist teszteli, hogy a sokaság változói között nincs korreláció. Ez azt jelenti, hogy figyelembe vesszük azt az állítást, hogy a populációs korrelációs mátrix egy olyan identitásmátrix, amelyben minden átlós elem egyenlő eggyel, a többi pedig nullával. A szférikussági teszt a korrelációs mátrix determinánsának khi-négyzet statisztikává való konvertálásán alapul. Ha a statisztika nagy, a nullhipotézist elvetjük. Ha a nullhipotézist nem utasítják el, akkor a faktoranalízis nem megfelelő. Egy másik hasznos statisztika a Kaiser-Meyer-Olkin (KMO) minta megfelelőségi tesztje. Ez az együttható összehasonlítja a megfigyelt korrelációs együtthatók értékeit a parciális korrelációs együtthatók értékeivel. A KMO-statisztika kis értékei azt jelzik, hogy a változópárok közötti összefüggések nem magyarázhatók más változókkal, ami azt jelenti, hogy a faktoranalízis alkalmazása nem megfelelő.

Megismerve a faktorterhelés fogalmát és a közös változások területét, tovább mehetünk, ismét a mátrixok bemutatására szolgáló apparátust használva, melynek elemei ezúttal a korrelációs együtthatók lesznek.

A kísérleti úton kapott korrelációs együtthatók mátrixát rendszerint korrelációs mátrixnak vagy korrelációs mátrixnak nevezzük.

Ennek a mátrixnak az elemei az adott sokaság összes változója közötti korrelációs együtthatók.

Ha van például egy tesztekből álló halmazunk, akkor a kísérleti úton kapott korrelációs együtthatók száma

Ezek az együtthatók kitöltik a mátrix főátlójának egyik oldalán található felét. A másik oldalon nyilvánvalóan ugyanazok az együtthatók, mivel stb. Ezért a korrelációs mátrix szimmetrikus.

3.2. Teljes korrelációs mátrix

Ennek a mátrixnak az átlóján vannak ilyenek, mert minden változónak +1 korrelációja van önmagával.

Egy olyan korrelációs mátrixot, amelynek fő átlós elemei egyenlőek 1-gyel, a korreláció „teljes mátrixának” nevezzük (3.2. ábra), és jelöljük.

Megjegyzendő, hogy az egyes változók egységeinek vagy önmagával való korrelációinak a főátlóra helyezésével figyelembe vesszük a mátrixban megjelenített egyes változók teljes varianciáját. Így nemcsak általános, hanem konkrét tényezők befolyását is figyelembe veszik.

Ellenkezőleg, ha a korrelációs mátrix főátlóján az általánosságoknak megfelelő és csak a változók általános varianciájához kapcsolódó elemek vannak, akkor csak az általános tényezők hatását vesszük figyelembe, a konkrét tényezők és hibák befolyását kiküszöböljük, azaz a hibák specifitását és varianciáját elvetjük.

A korrelációs mátrixot, amelyben a főátló elemei megfelelnek az általánosságoknak, redukáltnak nevezzük, és R-vel jelöljük (3.3. ábra).

3.3. Csökkentett korrelációs mátrix

A faktorterhelésről, vagyis egy adott változó konkrét faktorral való kitöltéséről már volt szó. Ugyanakkor hangsúlyozták, hogy a faktorterhelésnek van egy adott változó és egy adott tényező közötti korrelációs együttható formája.

Azt a mátrixot, amelynek oszlopai egy adott faktornak egy adott sokaság összes változójához viszonyított terheléseiből és egy adott változó faktorterheléseinek soraiból állnak, faktormátrixnak vagy faktormátrixnak nevezzük. Itt lehet beszélni a teljes és csökkentett faktoros mátrixról is. A teljes faktoriális mátrix elemei az adott sokaságból származó egyes változók teljes egységvarianciájának felelnek meg. Ha az általános tényezők terheléseit c-vel, a specifikus tényezők terheléseit pedig és -vel jelöljük, akkor a teljes tényezőmátrix a következőképpen ábrázolható:

3.4. Teljes faktormátrix négy változóhoz

Az itt bemutatott faktormátrix két részből áll, az első rész négy változóhoz kapcsolódó elemeket és három közös faktort tartalmaz, amelyek mindegyike minden változóra vonatkozik. Nem eszik szükséges feltétel, mivel a mátrix első részének egyes elemei egyenlőek lehetnek nullával, ami azt jelenti, hogy bizonyos tényezők nem vonatkoznak minden változóra. A mátrix első részének elemei a közös tényezők terhelései (például az elem a második közös tényező terhelését mutatja az első változóval).

A mátrix második részében 4 karakterisztikus faktor terhelést látunk, minden sorban egyet, amely megfelel a sajátosságuknak. Ezen tényezők mindegyike csak egy változóra vonatkozik. A mátrix ezen részének minden más eleme nulla. A jellemző tényezők nyilvánvalóan specifikus és hibás tényezőkre bonthatók.

A faktormátrix oszlopa a faktort és annak minden változóra gyakorolt ​​hatását jellemzi. A sor különféle tényezőkkel jellemzi a változót és annak tartalmát, vagyis a változó faktorszerkezetét.

Ha csak a mátrix első részét elemezzük, akkor az egyes változók teljes varianciáját mutató faktormátrixszal állunk szemben. A mátrixnak ezt a részét redukált résznek nevezzük, és F-nek jelöljük. Ez a mátrix nem veszi figyelembe a jellemző tényezők terhelését, és nem veszi figyelembe a fajlagos szórást. Emlékezzünk vissza, hogy az általános szórásokról és faktorterhelésekről, amelyek az általános szórások négyzetgyökei, az előzőekben elmondottaknak megfelelően az F redukált faktormátrix egyes sorai elemeinek négyzetösszege megegyezik az általánossággal. az adott változóból

Ennek megfelelően a faktorok teljes mátrixa sorának összes elemének négyzetösszege egyenlő , vagy ennek a változónak a teljes varianciája.

Mivel a faktoranalízis a közös tényezőkre fókuszál, a következőkben elsősorban a csökkentett korrelációs és redukált faktormátrixot használjuk.




Betöltés...
Top