"R ашиглан өгөгдлийг статистик дүн шинжилгээ хийх, дүрслэх" арга зүйн гарын авлага. Статистикийн шинжилгээ ба өгөгдлийн дүрслэл R-ээр зааварчилгаа

"R өвсний үндэс жимсний навчийг АШИГЛАН СТАТИСТИК ШИНЖИЛГЭЭ БА МЭДЭЭЛЛИЙГ ДҮРСҮҮЛЭХ НЬ Heidelberg - London - Tolyatti 2014,..."

-- [ Хуудас 1 ] --

С.Э. Мастицкий, В.К. Шитиков

СТАТИСТИК ШИНЖИЛГЭЭ БА

Р

өвсний үндэс жимсний навч

Хайдельберг - Лондон - Тольятти

2014 он, Сергей Эдуардович Мастицкий, Владимир Кириллович Шитиков

Вэбсайт: http://r-analytics.blogspot.com

Энэ ажлыг лицензийн дагуу түгээдэг

Creative Commons "Атрибут - Арилжааны бус

ашиглах – Дэлхий даяар ижил нэр томъёо 4.0”. Энэхүү лицензийн дагуу та энэ ажлыг чөлөөтэй хуулж, тарааж, өөрчилж болно нарийн заалттүүний зохиогчид ба эх сурвалж. Хэрэв та энэ ажлыг өөрчлөх эсвэл ажилдаа ашиглах юм бол үр дүнг зөвхөн ижил эсвэл ижил төстэй лицензийн дагуу тарааж болно. Энэхүү бүтээлийг зохиогчийн зөвшөөрөлгүйгээр арилжааны зорилгоор ашиглахыг хориглоно. Лицензийн талаарх дэлгэрэнгүй мэдээллийг www.creativecommons.com сайтаас авна уу

Энэ номыг дараах байдлаар харна уу.

Мастицкий С.Е., Шитиков В.К. (2014) Статистикийн дүн шинжилгээболон мэдээллийн дүрслэл R.

– Цахим ном, нэвтрэх хаяг:

http://r-analytics.blogspot.com

ӨМНӨХ ҮГ 5

1. СТАТИСТИКИЙН ОРЧНЫ ҮНДСЭН БҮРДЭЛТ R 8


1.1. Үүссэн түүх, зохион байгуулалтын үндсэн зарчим 8 R орчин

1.2. R 11 командын консолын интерфейстэй ажиллах

1.3. R Commander 13 багц цэстэй ажиллах

1.4. Объект, багц, функц, төхөөрөмж 17

2. ХЭЛНИЙ ТОДОРХОЙЛОЛТ R 23

2.1. R 23 Өгөгдлийн төрлүүд

2.2. Вектор ба матриц 24

2.3. Хүчин зүйл 29

2.4. Жагсаалт ба хүснэгт 31

2.5. R 37 руу өгөгдөл импортлох

2.6. Огноо, цагийн дүрслэл; цаг хугацааны цуврал 40

2.7. Тооцооллын зохион байгуулалт: функц, салбар, гогцоо 46

2.8. Application-50 функцийг ашиглан R хэл дээрх векторжуулсан тооцоолол

3. ГРАФИКИЙН ҮНДСЭН ОНЦЛОГ R 58

3.1. plot() 58 функцын график болон графикийн параметрүүд

3.2. Гистограмм, цөмийн нягтын функц, 66 cdplot() функц

3.3. Спан диаграм 74

3.4. Дугуй ба баганан график 77

3.5. Кливленд ба 1D тархалтын график 84

4. ТОДОРХОЙЛОЛТЫН СТАТИСТИК, ХЭРЭГСЭЛ 97

ТАРХИАЛТ

–  –  –

ӨМНӨХ ҮГ

Дэлхий ертөнцийг танин мэдэх гол хэрэгслүүдийн нэг бол янз бүрийн эх сурвалжаас хүний ​​хүлээн авсан өгөгдлийг боловсруулах явдал юм. Орчин үеийн статистик шинжилгээний мөн чанар нь ирж буй мэдээллийн урсгалыг судлах, дүрслэх, тайлбарлахаас бүрдэх интерактив үйл явц юм.

Сүүлийн 50 жилийн түүх бол мэдээллийн шинжилгээний технологийн хөгжлийн түүх мөн.

Зохиогчдын нэг нь 60-аад оны сүүлч, 200 кг-аас дээш жинтэй "Промин-2" хувийн компьютерийн 150 нүднээс "үйл ажиллагааны талбар" дээр металл тээглүүрээр шивсэн хос корреляцийг тооцоолох анхны програмаа дурсан санаж байна.

Өнөө үед өндөр хүчин чадалтай, боломжийн үнэтэй компьютерууд програм хангамжухамсарлахыг зөвшөөрнө бүтэн мөчлөгМэдээллийн технологийн процесс нь ерөнхийдөө дараах үе шатуудаас бүрдэнэ.

° боловсруулсан өгөгдөлд хандах (тэдгээрийг өөр өөр эх сурвалжаас ачаалах, хоорондоо холбогдсон эх сурвалжийн хүснэгтүүдийг бөглөх);

° ачаалагдсан үзүүлэлтүүдийг засварлах (дутуулагдсан утгыг солих, устгах, функцийг илүү тохиромжтой хэлбэрт хөрвүүлэх);

° өгөгдлийн тайлбар (өгөгдлийн хэсэг бүр юу болохыг санах);

° өгөгдлийн бүтцийн талаархи ерөнхий мэдээллийг олж авах (шинжилсэн үзүүлэлтүүдийг тодорхойлохын тулд тайлбар статистикийг тооцоолох);

° өгөгдөл, тооцооллын график дүрслэл нь ойлгомжтой мэдээллийн хэлбэрийг бий болгодог (нэг зураг үнэндээ заримдаа мянган үгтэй байдаг);

° өгөгдлийн загварчлал (хамаарал олох, статистик таамаглалыг шалгах);

° үр дүнг танилцуулах (хүснэгт, хэвлэн нийтлэх чанарын хүснэгтийг бэлтгэх).

Хэрэглэгчийн мэдэлд хэдэн арван хэрэглээний програм хангамжийн багц байдаг орчинд сонголт хийх асуудал хамааралтай (хэрэв бид "буридан илжиг" -ийг эргэн санавал заримдаа эмгэнэлтэй байдаг): практик ажилд ямар өгөгдөл анализ хийх програм хангамжийг илүүд үзэх ёстой вэ? Энэ нь ихэвчлэн шийдэгдэж буй асуудлын онцлог, боловсруулах алгоритмын үр ашиг, програм худалдан авах зардал, мөн шинжээчийн амт, хувийн сонголт зэргийг харгалзан үздэг. Үүний зэрэгцээ, жишээ нь, Statistica загвар нь механик цэсийн товчлууруудтай бөгөөд тооцоолох үйл явцын явцыг бие даан хянахыг илүүд үздэг бүтээлч судлаачдын сэтгэлд нийцэхгүй. нэгтгэх янз бүрийн төрөлдүн шинжилгээ хийх, завсрын үр дүнд хандах, өгөгдлийн дэлгэцийн хэв маягийг хянах, өөрийн өргөтгөлүүдийг нэмэх програм хангамжийн модулиудэцсийн тайлангуудыг Matlab, SPSS гэх мэт өндөр түвшний командын хэлний хэрэгслүүдийг багтаасан арилжааны тооцооллын системүүд шаардлагатай хэлбэрээр бэлтгэж болно. Тэдгээрийн маш сайн хувилбар бол орчин үеийн, байнга хөгжиж буй R програм хангамжийн орчин юм. ерөнхий зориулалтын статистик платформ.



Өнөөдөр R нь чөлөөтэй тархсан статистикийн шинжилгээний системүүдийн дунд маргаангүй тэргүүлэгч болсон нь жишээ нь 2010 онд R систем жил бүр нээлттэй эх сурвалжийн уралдааны ялагч болсон нь нотлогдож байна. програм хангамжийн бүтээгдэхүүн Bossie шагналыг хэд хэдэн төрөлд олгодог. Дэлхийн тэргүүлэгч их сургуулиуд, томоохон компаниудын шинжээчид, судалгааны төвүүд шинжлэх ухаан, техникийн тооцоолол хийх, мэдээллийн томоохон төслүүдийг бий болгохдоо R-г байнга ашигладаг. Энэхүү хүрээлэн буй орчны багцад суурилсан статистикийг өргөнөөр сургаж, шинжлэх ухааны нийгэмлэгийн бүх талын дэмжлэг нь R скриптийг авчрах нь аажмаар сэтгүүлийн нийтлэл, эрдэмтдийн хоорондын албан бус харилцааны аль алинд нь нийтээр хүлээн зөвшөөрөгдсөн "стандарт" болж байгааг харуулж байна. ертөнц.

Мэдээжийн хэрэг, орос хэлээр ярьдаг хэрэглэгчдэд R-ийг эзэмшихэд тулгарч буй гол бэрхшээл бол энэ орчны бараг бүх бичиг баримтууд дээр байгаа явдал юм. Англи хэл. Зөвхөн 2008 оноос хойш А.В. Шипунова, Е.М. Балдина, С.В. Петрова, И.С. Зарядова, А.Г. Буховец болон бусад сонирхогчид, арга зүйн гарын авлага, номууд орос хэл дээр гарч ирэв (тэдгээрийн холбоосыг энэ номын төгсгөлд байгаа ном зүйгээс олж болно; мөн холбоосууд байдаг. боловсролын нөөц, зохиогчид нь орос хэлээр ярьдаг хэрэглэгчдийн дунд R-ийг сурталчлахад бодит хувь нэмэр оруулдаг).

Энэхүү гарын авлагад 2011 оноос хойш "R: Өгөгдлийн шинжилгээ ба дүрслэл" блогт зохиогчдын нэгний нийтэлсэн арга зүйн нийтлэлүүдийг нэгтгэн харуулав.

(http://r-analytics.blogspot.com). Уншигчдын тав тухыг хангах үүднээс энэ бүх тархай бутархай материалыг төвлөрсөн хэлбэрээр толилуулж, зарим хэсгийг бүрэн дүүрэн болгох нь зүйтэй гэж үзсэн.

Эхний гурван бүлэгт R-ийн интерактив бүрэлдэхүүн хэсгүүдтэй ажиллах дэлгэрэнгүй заавар, хэлний дэлгэрэнгүй тайлбар, орчны үндсэн график шинж чанарууд багтсан болно.

Номын энэ хэсэг нь програмчлалын чиглэлээр анхлан суралцаж буй хүмүүст ойлгомжтой боловч R хэлийг мэддэг уншигч тэндээс сонирхолтой кодын хэсгүүдийг олох эсвэл график параметрүүдийн тайлбарыг лавлагаа болгон ашиглаж болно.

Дараах бүлгүүдэд (4-8) өгөгдөл боловсруулах, статистик загвар бүтээх нийтлэг журмуудыг тайлбарласан бөгөөд үүнийг хэдэн арван жишээгээр харуулав. Үүнд: Товч тодорхойлолтшинжилгээний алгоритмууд, олж авсан үндсэн үр дүн, тэдгээрийн боломжит тайлбар. Хэрэглээний статистикийн олон тооны гарын авлагад хамаарах "ёслол"-ын үг хэллэгийг урвуулан ашиглах, сайн мэддэг теоремуудыг иш татах, олон түвшний тооцооллын томъёог авчрахыг бид аль болох арилгахыг хичээсэн. Юуны өмнө практик хэрэглээнд анхаарлаа хандуулсан - уншигч уншсан зүйлдээ хөтлөгдөн өөрийн өгөгдөлд дүн шинжилгээ хийж, үр дүнг хамтран ажиллагсаддаа танилцуулж болно.

Энэ хэсгийн хэсгүүдийг танилцуулсан материалын нарийн төвөгтэй байдал болгон барьсан болно.

4, 5-р бүлгүүд нь зөвхөн их сургуулийн анхан шатны сургалтын хүрээнд статистикийг сонирхдог уншигчдад зориулагдсан болно. 6, 7-р бүлэгт ерөнхий шугаман загваруудын нэгдсэн онолын хүрээнд дисперс ба регрессийн шинжилгээг танилцуулж, загваруудыг судлах, бүтцийг тодорхойлох янз бүрийн алгоритмуудыг үзүүлэв. 8-р бүлэг зарим хүмүүст зориулагдсан болно орчин үеийн аргуудерөнхий регрессийн загвар бүтээх, дүн шинжилгээ хийх.

Судлаач орон зайн дүн шинжилгээ хийх, үр дүнг газарзүйн газрын зураг, диаграмм дээр харуулахыг байнга сонирхож байдаг тул 9-р бүлэгт ийм дүрслэх аргуудын зарим жишээг үзүүлэв.

Бид арга зүйн гарын авлагыг оюутнууд, аспирантууд, түүнчлэн R орчныг ашиглан өгөгдөлд дүн шинжилгээ хийж, дүрслэн харуулахыг сурах хүсэлтэй залуу, нэр хүндтэй эрдэмтэдэд зориулав. Энэхүү гарын авлагыг уншсаны эцэст та . R хэрхэн ажилладаг, эндээс нэмэлт мэдээлэл авах, түүнчлэн энгийн бөгөөд нэлээд төвөгтэй өгөгдөлд дүн шинжилгээ хийх даалгавруудыг хэрхэн шийдвэрлэх талаар авах боломжтой.

Номын бүх бүлгүүдэд зориулсан R кодын скрипт бүхий файлууд, мөн тэдгээрийг хэрэгжүүлэхэд шаардлагатай анхны өгөгдлийн хүснэгтүүдийг GitHub репозитороос https://github.com/r-tutorials, түүнчлэн үнэгүй татаж авах боломжтой. ОХУ-ын ШУА-ийн Волга мөрний сав газрын экологийн хүрээлэнгийн вэбсайтаас http://www.ievbras.ru/ecostat/Kiril/R/Scripts.zip линкээс авна уу.

Энэхүү гарын авлагын текстийг зохиогчийн хэвлэлд танилцуулсан тул бидний бүх хүчин чармайлтыг үл харгалзан үсгийн алдаа, дүрмийн алдаа, бүтэлгүй эргэлттэй байх магадлалтай гэдгийг тэмдэглэх нь зүйтэй. Эдгээр болон бусад илэрсэн дутагдлуудыг мэдээлсэн уншигч танд бид талархах болно цахим шуудан [имэйлээр хамгаалагдсан]Мөн энэ ажлын талаар та бүхний санал хүсэлт, санал хүсэлт байвал бид талархах болно.

–  –  –

1. СТАТИСТИКИЙН ОРЧНЫ ҮНДСЭН БҮРДЭЛТҮҮД Р

1.1. R орчин үүссэн түүх ба зохион байгуулалтын үндсэн зарчмууд Статистикийн дүн шинжилгээ ба өгөгдлийг дүрслэх R систем нь дараахь үндсэн хэсгүүдээс бүрдэнэ.

° програмчлалын хэл өндөр түвшин R, энэ нь нэг мөрөнд объект, вектор, матриц, жагсаалт гэх мэт янз бүрийн үйлдлийг хэрэгжүүлэх боломжийг олгодог;

° тусдаа багц (багц) -д цуглуулсан өгөгдөл боловсруулах олон тооны функц;

° Орчны бүрэлдэхүүн хэсгүүдийн шинэчлэлтүүд, онлайн тусламж, R-ийн анхан шатны сургалт болон шинээр гарч ирж буй бэрхшээлүүдийн талаар дараагийн зөвлөгөө өгөхөд зориулагдсан төрөл бүрийн боловсролын нөөцүүдийг багтаасан дэвшилтэт дэмжлэгийн систем.

Аяллын эхлэл нь 1993 онд Шинэ Зеландын хоёр залуу эрдэмтэн Росс Ихака, Роберт Жентельман нар R гэж нэрлэсэн шинэ бүтээн байгуулалтаа зарласнаас хойш эхэлсэн. Тэд арилжааны статистик мэдээлэл боловсруулах S-PLUS системийн програмчлалын хэлийг үндэс болгон авчээ. хялбархан өргөтгөх боломжтой модульчлагдсан архитектураараа өвөг дээдсээсээ ялгаатай үнэгүй нээлттэй эхийн хэрэгжилтийг бий болгосон. Удалгүй "CRAN" (Цогц R архивын сүлжээ - http://cran.r-project.org) гэсэн товчлолоор алдартай R-д багцуудыг хадгалах, түгээх тархсан систем бий болсон нь зохион байгуулах гол санаа юм. Энэ нь өгөгдөл боловсруулах хэрэглүүрийг байнга өргөжүүлэх, хамтын туршилт, үйл ажиллагааны тархалт юм.

Олон мянган амин хувиа хичээсэн оюуны хөгжүүлэгчдийн хүчирхэг "хамтын тагнуул" -ын тасралтгүй, сайн зохицуулалттай хүчин чармайлтын ийм бүтээгдэхүүн нь лицензийн үнэ нь хэдэн мянган доллар байж болох арилжааны статистикийн хөтөлбөрүүдээс хамаагүй илүү үр дүнтэй болох нь тогтоогджээ. . R бол мэргэжлийн статистикчдын дуртай хэл учраас хүн бүр сүүлийн үеийн ололт амжилтСтатистикийн шинжлэх ухаан нь дэлхий даяарх R хэрэглэгчдэд нэмэлт номын сан хэлбэрээр маш хурдан нэвтэрч байна. Өнөөдөр ямар ч арилжааны статистикийн шинжилгээний систем ийм хурдацтай хөгжиж чадахгүй байна. R нь нэмэлт номын сангийн зохиогчид болон R системд алдааны талаар мэдээлдэг олон тооны хэрэглэгчдийн армитай бөгөөд тэдгээрийг цаг алдалгүй засдаг.

R тооцооллын хэл нь хэдийгээр үүнийг эзэмшихийн тулд бага зэрэг хүчин чармайлт, гайхалтай хайлтын ур чадвар, нэвтэрхий толь бичгийн санах ой шаардагддаг ч олон янзаараа бараг "атом шиг шавхагдашгүй" тооцооллыг хурдан гүйцэтгэх боломжийг олгодог. 2014 оны 7-р сарын байдлаар дэлхийн өнцөг булан бүрт байгаа сонирхогчид R-д зориулж 6,739 нэмэлт номын сан бичсэн бөгөөд үүнд 137,506 функц (доороос харна уу).

http://www.rdocumentation.org), системийн үндсэн чадавхийг ихээхэн өргөжүүлдэг. Өнөөдөр R багц хэлбэрээр хараахан хэрэгжээгүй байгаа статистикийн аргуудын аль нэгийг төсөөлөхөд маш хэцүү байдаг, үүнд мэдээжийн хэрэг бүхэл бүтэн "ноёнтны багц": шугаман болон ерөнхий шугаман загварууд, шугаман бус регрессийн загварууд, туршилтууд орно. дизайн, цагийн цувааны шинжилгээ, сонгодог параметрийн болон параметрийн бус тест, Байезийн статистик, кластерийн шинжилгээ, тэгшитгэх аргууд. Дүрслэх хүчирхэг хэрэгслүүдийн тусламжтайгаар шинжилгээний үр дүнг янз бүрийн график, график хэлбэрээр нэгтгэн дүгнэж болно. Уламжлалт статистик мэдээллээс гадна боловсруулсан функцэд тоон математик, оновчлолын арга, дифференциал тэгшитгэлийг шийдвэрлэх, хэв маягийг таних гэх мэт олон тооны алгоритмуудыг багтаасан болно. Генетик ба социологич, хэл шинжлэлийн болон сэтгэл судлаач, химич, эмч, ГМС, вэб технологийн мэргэжилтнүүд.

R дээрх "өмчлөлийн" баримт бичиг нь маш том бөгөөд үргэлж ухаалаг бичигддэггүй (Англи хэл дээрх уран зохиолын хачирхалтай уламжлалын дагуу өчүүхэн үнэнийг тайлбарлахад хэтэрхий олон үг зарцуулдаг, харин чухал цэгүүдийг хэлээр мушгиж бичдэг). Гэсэн хэдий ч үүнээс гадна дэлхийн тэргүүлэгч хэвлэн нийтлэгчид (Springer, Cambridge University Press ба Chapman & Hall / CRC) эсвэл зүгээр л сонирхогчдын бие даасан багууд R-д өгөгдлийн шинжилгээний янз бүрийн талыг тодорхойлсон асар олон тооны ном гаргасан (жишээлбэл, үзнэ үү). , "Психодиагностикийн нэвтэрхий толь" вэбсайт дахь лавлагааны жагсаалт, http://psylab.info/R: Уран зохиол). Нэмж дурдахад, олон улсын болон Оросын R хэрэглэгчийн хэд хэдэн идэвхтэй форумууд байдаг бөгөөд хэн ч асуудлаа шийдвэрлэхэд тусламж хүсч болно. Лавлагааны жагсаалтад бид танд лавлахыг зөвлөж буй хэдэн зуун ном, интернет холбоосыг өгдөг. Онцгой анхааралсурч байхдаа Р.

шууд суралцах практик ажил R хэл нь a) R хэлний бүтцийг эзэмших, өгөгдлийн шинжилгээ хийдэг функцуудыг дуудах онцлогтой танилцах, б) өгөгдөлд дүн шинжилгээ хийх, дүрслэх тусгай аргуудыг хэрэгжүүлдэг програмуудтай ажиллах ур чадвар эзэмшихээс бүрдэнэ.

R хэрэглэгчийн интерфейсийн хэрэгслүүдийн сонголт нь хоёрдмол утгатай бөгөөд хэрэглэгчдийн амтаас ихээхэн хамаардаг. Эрх мэдэл бүхий мэргэжилтнүүдийн дунд ч зөвшилцөлд хүрээгүй байна.

Зарим нь R консолын стандарт интерфэйсээс илүү сайн зүйл байхгүй гэж үздэг бол зарим нь хялбар ажиллахын тулд товчлуурын цэсийн баялаг багц бүхий боломжтой нэгдсэн хөгжүүлэлтийн орчны (IDE) аль нэгийг суулгах нь зүйтэй гэж үздэг. Жишээлбэл, үнэгүй RStudio IDE бол маш сайн сонголт юм.

Доор бид консолын хувилбарын тайлбар дээр анхаарлаа төвлөрүүлж, R Commander-тэй хамтран ажиллах болно, гэхдээ Шипунов нар номын хавсралтад үзүүлсэн IDE-ийн янз бүрийн хувилбаруудын тойм нь уншигчдын цаашдын хайлтанд туслах болно. (2014).

R-шинжээчдийн нэг Жозеф Рикерт R сурах үйл явцыг дараах үе шатуудад хувааж болно гэж үзэж байна (дэлгэрэнгүй мэдээллийг үзнэ үү.

inside-r.org дээр түүний нийтлэл):

1. R нийгэмлэгийн соёлын ерөнхий зарчмууд болон R хэлийг хөгжүүлж, ажиллуулж байсан програмчлалын орчинтой танилцах.Үндсэн болон туслах эх сурвалжуудаар зочилж, сайн танилцуулах сурах бичгийг эзэмших. Хэрэглэгчийн компьютер дээр R суулгаж, эхний туршилтын скриптүүдийг ажиллуулж байна.

2. Үйлдлийн системийн стандарт файлуудаас өгөгдлийг уншиж, R функцуудыг итгэлтэйгээр гүйцэтгэх хязгаарлагдмал багцхэрэглэгчдэд танил болсон статистикийн шинжилгээний журам.

3. R ​​хэлний үндсэн бүтцийг ашиглан энгийн программ бичих.

Өөрийнхөө функцуудыг бичих. R-ийн ажиллах боломжтой өгөгдлийн бүтэц болон хэлний илүү дэвшилтэт боломжуудтай танилцаарай. Өгөгдлийн сан, вэб хуудас, гадаад мэдээллийн эх сурвалжтай ажиллах.

4. Нарийн төвөгтэй программуудыг R хэлээр бичих S3, S4 анги гэж нэрлэгддэг объектын бүтцийг бие даан хөгжүүлэх, гүнзгий ойлгох.

5. Хөгжил мэргэжлийн хөтөлбөрүүд R хэл дээр.R-д зориулсан номын сангийн нэмэлт модулиудыг бие даан бүтээх.

Ихэнх энгийн R хэрэглэгчид 3-р шатанд зогсдог, учир нь

Энэ хугацаанд олж авсан мэдлэг нь тэдний үндсэн мэргэжлийн үйл ажиллагааны чиглэлээр статистикийн ажлыг гүйцэтгэхэд хангалттай юм.

Энэ боть талаар бид энэхүү гарын авлагын хүрээнд R хэлний тайлбарыг өгдөг.

Үндсэн R статистик орчныг суулгах, тохируулах нь маш хялбар. 2014 оны 7-р сарын байдлаар одоогийн хувилбар нь 32 ба 64 битийн Windows-д зориулсан R 3.1.1 (бусад бүх нийтлэг үйлдлийн системд зориулсан түгээлтийн иж бүрдэл бас байдаг). Та системийн түгээлтийн иж бүрдлийг 29 багц (54 мегабайт) үндсэн багцын хамт төслийн үндсэн сайт http://cran.r-project.org эсвэл Оросын "толин тусгал" http:/ сайтаас бүрэн үнэ төлбөргүй татаж авах боломжтой. /cran.gis-lab.info. Татаж авсан түгээлтээс системийг суулгах үйл явц нь ямар ч хүндрэл учруулахгүй бөгөөд тусгай тайлбар шаарддаггүй.

Скрипт, анхны өгөгдөл, тооцооллын үр дүнг хадгалахад хялбар байхын тулд хэрэглэгчийн компьютер дээр тусгай ажлын лавлахыг хуваарилах нь зүйтэй. Ажлын лавлахын нэрэнд кирилл үсгийг ашиглах нь туйлын зохисгүй юм.

Ажлын лавлах руу очих зам болон бусад тохиргооны сонголтыг дурын текст засварлагчаар өөрчлөх замаар байрлуулахыг зөвлөж байна. системийн файл C:\Program Files\R\Retc\Rprofile.site (энэ нь таны компьютер дээр өөр байршилтай байж болно). Доорх жишээнд өөрчлөгдсөн мөрүүдийг ногооноор тэмдэглэсэн байна.

Эдгээр мөрүүд нь ажлын лавлахыг зааж өгөхөөс гадна R багцуудыг татаж авах, R Commander-ийг автоматаар эхлүүлэхийн тулд орос эх сурвалжтай холбох холбоосыг тодорхойлдог.

Rprofile.site файлын жагсаалт # "#" тайлбар тэмдэгтийн дараа орсон бүх зүйлийг орчин үл тоомсорлодог # options(papersize="a4") # options(editor="notepad") # options(pager="дотоод") # тохиргоотой дэлгэц төрөл суурь мэдээлэл# сонголтууд(тусламжийн_төрөл="текст") сонголтууд(help_type="html") # орон нутгийн номын сангийн байршлыг тохируулах #.Library.site - file.path(chartr("\\", "/", R.home()) , "site-library") # Орчноо ачаалах үед R Commander цэсийг эхлүүлнэ үү # Хэрэв Rcmdr шаардлагагүй бол "#" тэмдэг тавина уу локал(( old - getOption("defaultPackages") сонголтууд(defaultPackages = c(old, "Rcmdr") ) )) # CRAN толин тусгалыг тодорхойлох локал((r - getOption("repos") r["CRAN"] - "http://cran.gis-lab" сонголтууд(repos=r))) # Ажлын лавлах руу очих замыг тодорхойлох (таны компьютер дээрх бусад бүх зүйл) setwd("D:/R/Process/Resampling") "Сайн танилцуулах заавар"-ын хувьд бидний зөвлөмжүүдийн аль нэг нь субъектив байх болно. Гэсэн хэдий ч В.Венаблс, Д.Смит нарын албан ёсоор хүлээн зөвшөөрөгдсөн R-ийн танилцуулга (Venables, Smith, 2014) болон Р.Кабаковын (Кабако, 2011) номыг дурдах хэрэгтэй, учир нь тэдгээрийн орос хэл дээрх орчуулга байдаг. Голландын атаархлыг төрүүлэхүйц байдлаар бичсэн уламжлалт "даммигийн заавар" (Meys, Vries, 2012) болон гарын авлагыг (Лам, 2010) тэмдэглэх нь зүйтэй. Орос хэлний анхан шатны хичээлүүдээс хамгийн бүрэн гүйцэд нь И.Зарядов (2010а), А.Шипунов нарын номууд юм. (2014).

1.2. R интерфэйсийн бүрхүүлтэй ажиллах R статик орчин нь скрипт файлд агуулагдах эсвэл консолоос өгөгдсөн командуудын дараалалаар илэрхийлэгдсэн ямар ч утга учиртай R зааварчилгааг гүйцэтгэдэг. Товчлуурын цэсэнд дассан орчин үеийн хэрэглэгчдэд консолтой ажиллах нь хэцүү байдаг, учир нь та тус тусын командуудын синтаксийг цээжлэх хэрэгтэй. Гэсэн хэдий ч зарим ур чадвар эзэмшсэний дараа олон өгөгдөл боловсруулах процедурыг ижил Statistica багцаас илүү хурдан бөгөөд хүндрэл багатай гүйцэтгэх боломжтой болж байна.

R консол нь хэрэглэгч команд оруулж, тэдгээрийн гүйцэтгэлийн үр дүнг хардаг харилцах цонх юм. Энэ цонх нь орчин ажиллаж эхлэхэд шууд гарч ирнэ (жишээлбэл, ширээний компьютер дээрх R товчлол дээр дарсны дараа). Үүнээс гадна стандарт график Хэрэглэгчийн интерфэйс R (RGui) нь скрипт засварлах цонх, график мэдээлэл (зураг, диаграм гэх мэт) бүхий гарч ирэх цонхнуудыг агуулдаг.

AT тушаалын горимЖишээлбэл, R нь ердийн тооны машин шиг ажиллах боломжтой.

Сануулах тэмдэгтийн баруун талд хэрэглэгч дурын арифметик илэрхийлэл оруулаад Enter товчийг дараад үр дүнг шууд авах боломжтой.

Жишээлбэл, дээрх зурган дээрх хоёрдахь тушаалд бид хүчин зүйлийн болон синус функцууд, түүнчлэн суурилуулсан p тоог ашигласан. Текст хэлбэрээр олж авсан үр дүнг хулганаар сонгож, санах ойноос үйлдлийн системийн дурын текст файл руу хуулж болно (жишээлбэл, Word баримт).

RGui-тэй ажиллахдаа бид бүх тохиолдолд скрипт (өөрөөр хэлбэл тодорхой үйлдлийг гүйцэтгэдэг R командын дараалал) бүхий файл үүсгэхийг зөвлөж байна. Дүрмээр бол энэ нь ямар ч нэртэй энгийн текст файл юм (гэхдээ тодорхой болгохын тулд *.r өргөтгөлтэй байх нь дээр) бөгөөд үүнийг Notepad гэх мэт ердийн засварлагчаар үүсгэж, засах боломжтой. Хэрэв энэ файл байгаа бол түүнийг ажлын санд байрлуулах нь зүйтэй бөгөөд R-г эхлүүлж, "Файл нээх скрипт" цэсийн зүйлийг сонгосны дараа энэ файлын агуулга "R Editor" цонхонд гарч ирнэ. Та "Бүгдийг ажиллуулах" цэсийн зүйлээс скрипт командуудын дарааллыг гүйцэтгэж болно.

Мөн та хулганаар бэлтгэсэн скриптийн аль ч газраас утга учиртай фрагментийг (нэг хувьсагчийн нэрээс бүхэлд нь агуулга хүртэл) сонгож, энэ блокыг ажиллуулах боломжтой. Үүнийг дөрөвтэй хамт хийж болно боломжит арга замууд: үндсэн болон контекст цэс, Ctrl+R товчлуурын хослол эсвэл хэрэгслийн мөр дээрх товчлуур.

Зураг дээр дараахь үйлдлүүдийг гүйцэтгэсэн.

° R-объект gadm-ийг Бүгд Найрамдах Беларусь улсын нутаг дэвсгэрийн хуваагдлын талаархи мэдээлэл бүхий Global Administrative Areas (GADM) үнэгүй интернет эх сурвалжаас татаж авсан;

° Хотуудын латинаар бичсэн нэрсийг түгээмэл хэрэглэгддэг адилтгах нэрээр сольсон;

° sp багцын spplot() функцийг ашиглан бүгд найрамдах улсын засаг захиргааны газрын зургийг график цонхонд харуулсан бөгөөд үүнийг цэсийг ашиглан санах ойд хуулж эсвэл стандарт мета эсвэл растер график файл болгон хадгалах боломжтой.

Дараах хэсгүүдэд бид бие даасан операторуудын утгыг илүү нарийвчлан авч үзэх болно, гэхдээ энд бид скриптээс сонгож, тэмдэгтүүдийг хослуулан ажиллуулахад анхаарлаа хандуулах болно. [имэйлээр хамгаалагдсан], бид консолын цонхонд тухайн объектын бүх өгөгдлийн багц болон сонгосон gadm тэмдэгтүүдээс бүрдсэн командыг хүлээн авах болно. [имэйлээр хамгаалагдсан]$NAME_1 нь админ төвийн нэрсийн жагсаалтыг өөрчлөхөөс өмнө болон дараа нь бидэнд өгөх болно.

Иймээс R Editor нь скриптээр аялах, командын дурын хослолыг засварлах, гүйцэтгэх, кодын зарим хэсгийг хайх, солих зэрэгт хялбар болгодог. Дээр дурдсан RStudio нэмэлт нь танд кодын синтакс тодотгол хийх боломжийг олгодог. автоматаар дуусгах, дараа нь ашиглах, Sweave эсвэл TeX баримт бичигтэй ажиллах, ахисан түвшний хэрэглэгчдэд хэрэг болох бусад үйлдлүүдийг функц болгон "саавлах".

R нь RGui-ээс шууд хандах боломжтой өргөн хүрээний тусламжийн материалуудтай.

Хэрэв та консолоос help.start() командыг өгвөл таны интернет хөтөч дээр үндсэн гарын авлага, зохиогчийн материал, болзошгүй асуултын хариулт, өөрчлөлтийн жагсаалт, туслах холбоос зэрэг бүх тусламжийн эх сурвалжид хандах боломжтой хуудас нээгдэнэ. бусад R объект гэх мэт. .d.:

Дараах тушаалуудыг ашиглан бие даасан функцүүдийн тусламжийг авч болно.

° тусламж("foo") эсвэл? foo - foo функц дээр тусламж (ишлэл нь сонголттой);

° help.search("foo") эсвэл ?? foo - foo агуулсан бүх тусламжийн файлуудыг хайх;

° жишээ("foo") – foo функцийг ашиглах жишээ;

° RSiteSearch("foo") – онлайн гарын авлага болон захидлын жагсаалтын архиваас холбоос хайх;

° apropos("foo", mode="function") – foo хослолтой бүх функцуудын жагсаалт;

° vignette("foo") - foo сэдвийн гарын авлагын жагсаалт.

1.3. R Commander багц цэстэй ажиллах Шинэхэн хэрэглэгчдэд R тооцоолол сурахад тохиромжтой хэрэгсэл бол Rcmdr багцад хэрэгжсэн товчлуурын цэсний хэв маягт платформоос хамааралгүй график интерфэйс болох R Commander юм. Энэ нь командын хэл дээрх функцуудыг урьдчилан сурахгүйгээр статистикийн шинжилгээний томоохон процедурыг хийх боломжийг олгодог боловч гүйцэтгэсэн бүх зааврыг тусгай цонхонд харуулдаг тул үүнд өөрийн мэдэлгүй хувь нэмэр оруулдаг.

Та Rcmdr-ийг бусад өргөтгөлүүдийн нэгэн адил R консолын "Багцуудыг суулгах" цэснээс суулгаж болно, гэхдээ дараах тушаалыг ажиллуулснаар илүү дээр юм.

install.packages("Rcmdr", dependencies=ҮНЭН) нь хамаарлын сонголтыг идэвхжүүлснээр Rcmdr цэсээр өгөгдөл боловсруулахад шаардлагатай байж болох бусад багцын бүрэн багцыг баталгаатай суулгана.

R Commander нь Rcmdr багцыг "Багцуудыг багтаасан багц" цэс эсвэл номын сангийн (Rcmdr) командаар ачаалах үед эхлүүлнэ. Хэрэв ямар нэг шалтгаанаар зөвхөн R Commander ашиглан өгөгдөлд дүн шинжилгээ хийхээр шийдсэн бол автомат татаж авахЭнэ график бүрхүүл, та R-г эхлүүлэх үед 1.1-р хэсэгт үзүүлсэн шиг Rprofile.site файлыг засах хэрэгтэй.

Бид R Commander дахь ажлыг Беларусийн гурван нуурт хоёр хавхлагт нялцгай биет Dreissena polymorpha-ийн Conchophthirus acuminatus цилиаттай халдварын түвшний талаархи мэдээллийн корреляцийн шинжилгээний жишээн дээр авч үзэх болно (Mastitsky S.E. // BioInvasions Records.

2012. V. 1. P 161–169). Figshare вэбсайтаас татаж авсан анхны өгөгдөл бүхий хүснэгтэд бид хоёр хувьсагчийг сонирхох болно: нялцгай биетний бүрхүүлийн урт (ZMlength, мм) болон нялцгай биет дэх цилиатуудын тоо (CAnumber). Энэ жишээг 4, 5-р бүлэгт дэлгэрэнгүй авч үзэх тул энд дүн шинжилгээ хийх утгын талаар дэлгэрэнгүй ярихгүй, харин Rcmdr-тэй ажиллах техник дээр анхаарлаа хандуулах болно.

Дараа нь бид өгөгдөл ачаалах горим болон интернет дэх холбоосын хаягийг гарч ирэх цонхон дээр тодорхойлно. Бид дотоодоос ижил өгөгдлийг хялбархан ачаалж болохыг харахад хялбар байдаг текст файл, Excel ажлын ном эсвэл мэдээллийн сангийн хүснэгт. Манай өгөгдөл зөв ачаалагдсан эсэхийг шалгахын тулд (эсвэл шаардлагатай бол засах) "Өгөгдлийг харах" товчийг дарна уу.

Өгөгдлийн зохион байгуулалтыг тодорхойлох цонх Ачаалагдсан хүснэгтийн фрагмент

Хоёрдахь шатанд "Статистик" цэснээс "Хорреляцийн тест" -ийг сонгоно уу.

Бид хос хамааралтай хувьсагчдыг сонгож, Гаралтын цонхонд Пирсон корреляцийн коэффициент (R = 0.467), хүрсэн статистикийн ач холбогдлын түвшин (p-утга 2.2e-16) болон 95% итгэлийн хязгаарыг олж авдаг.

–  –  –

Хүлээн авсан үр дүнг санах ойгоор дамжуулан гаралтын цонхноос хялбархан хуулж болно.

Одоо бид авлаа график дүрскорреляцийн хамаарал. CAnumber болон ZMlength-ийн тархалтын графикийг сонгоод ирмэгийн графикууд, хамгийн бага квадратуудын шугаман чиг хандлагын шугам (ногооноор), орон нутгийн регрессийн тэгшитгэсэн шугам (улаан өнгөөр), итгэлийн муж (тасархай шугам)-аар хангана. Гурван нуурын хувьд (Нуурын хувьсах хэмжигдэхүүн) туршилтын цэгүүдийг өөр өөр тэмдгээр илэрхийлнэ.

–  –  –

R Commander график цонхноос хуулсан график Бүх R Commander цэсийн товчлууртай дүйцэхүйц товчлуур дарахад скрипт цонхонд R заавар гарч ирнэ.

Манай тохиолдолд тэд дараах байдлаар харагдаж байна.

Clams read.table("http://figshare.com/media/download/98923/97987", толгой=ҮНЭН, sep="\t", na.strings="NA", dec=".", зурвас. цагаан=ҮНЭН) cor.test(Clam$CAnumber, Clam$ZMlength, alternative="хоёр.талт", арга="pearson") тархалтын график(CAnumber ~ ZMlength | Нуур, reg.line=lm, гөлгөр=ҮНЭН, тархалт= ҮНЭН, boxplots="xy", span=0.5, ylab="Ciliates-ийн тоо", xlab="Shell length", by.groups=FALSE, data=Mollusks) Скрипт өөрөө эсвэл гаралтын үр дүнг (эсвэл хоёуланг нь) хадгалах боломжтой файлууд болон хүссэн үедээ давтагдана. R Commander-ийг ажиллуулахгүйгээр хадгалсан файлыг R консолоор ачаалснаар ижил үр дүнд хүрч болно.

Ерөнхийдөө R хэлний бүтцийг мэдэхгүй (эсвэл зүгээр л санах ойд ачаалал өгөхийг хүсэхгүй) Rcmdr ашиглан та бараг бүх статистикийн үндсэн аргуудыг ашиглан өгөгдөл боловсруулах боломжтой. Энэ нь параметрийн болон параметрийн бус тестүүд, янз бүрийн тасралтгүй ба салангид тархалтыг тохируулах аргууд, олон хувьсагчийн болзошгүй байдлын хүснэгтүүдийн шинжилгээ, дисперсийн нэг хэмжээст ба олон хувьсагчийн шинжилгээ, үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ ба кластерчлал, ерөнхий регрессийн загваруудын янз бүрийн хэлбэрүүд гэх мэтийг танилцуулж байна. Үүссэн загварт дүн шинжилгээ хийх, турших төхөөрөмжийг сайтар судлах нь зүйтэй.

R Commander-тэй ажиллах техник, түүнчлэн өгөгдөл боловсруулах алгоритмын хэрэгжилтийн дэлгэрэнгүй тайлбарыг гарын авлагаас олж болно (Ларсон-Холл, 2009; Карп, 2014).

Гэсэн хэдий ч дохионы хэл нь хүний ​​​​байгалийн хэлээр харилцах харилцааг орлож чадахгүйтэй адил R хэлний мэдлэг нь хэрэглэгчийн чадамжийн хил хязгаарыг ихээхэн өргөжүүлж, R орчинтой харилцах харилцааг тааламжтай, сэтгэл хөдөлгөм болгодог. Энд R Commander дахь скриптүүдийг автоматаар үүсгэх нь уншигчдад R хэлний операторуудтай танилцах, бие даасан функцуудыг дуудах онцлогийг сурах маш сайн хэрэгсэл болж чадна. Бид гарын авлагын дараах бүлгүүдийг зөвхөн хэлний бүтцийн түвшинд өгөгдөл боловсруулах журмыг хэлэлцэхэд зориулах болно.

1.4. Объект, багц, функц, төхөөрөмж R хэл нь өндөр түвшний объект хандалтат програмчлалын хэл гэж нэрлэгддэг гэр бүлд хамаарна. Мэргэжилтэн бус хүний ​​хувьд "объект" гэсэн ойлголтын хатуу тодорхойлолт нь хийсвэр юм. Гэсэн хэдий ч хялбар болгох үүднээс R-тэй ажиллах явцад үүссэн бүх зүйлийг объект гэж нэрлэж болно.

Хоёр үндсэн төрлийн объект байдаг:

1. Өгөгдөл хадгалах зориулалттай объектууд ("өгөгдлийн объектууд") нь бие даасан хувьсагч, вектор, матриц ба массив, жагсаалт, хүчин зүйл, өгөгдлийн хүснэгт;

2. Функцууд ("функцийн объектууд") нь шинэ объект үүсгэх эсвэл тэдгээр дээр тодорхой үйлдлийг гүйцэтгэхэд зориулагдсан программууд юм.

Хамтын болон үнэ төлбөргүй ашиглахад зориулагдсан R орчны объектуудыг ижил төстэй сэдвүүд эсвэл өгөгдөл боловсруулах аргуудаар нэгтгэсэн багцад савладаг. "Багц" болон "номын сан" гэсэн нэр томъёоны хооронд зарим ялгаа бий. "Номын сан" гэсэн нэр томъёо нь нэг буюу хэд хэдэн багц агуулсан лавлахыг тодорхойлдог. "Багц" гэсэн нэр томьёо нь тест, суралцахад зориулагдсан функц, HTML гарын авлагын хуудас, түүвэр өгөгдлийн объектуудын цуглуулгыг хэлнэ.

Багцуудыг үйлдлийн системийн тодорхой лавлах санд суулгасан эсвэл устгасан хэлбэрээр архивласан * файлд хадгалж, тарааж болно. zip файлууд Windows (багцын хувилбар нь таны R-ийн тодорхой хувилбартай тохирч байх ёстой).

Багцын талаарх бүрэн мэдээллийг (хувилбар, үндсэн сэдэв, зохиогчид, өөрчлөгдсөн огноо, лиценз, бусад функциональ холбоотой багцууд, тэдгээрийн зорилгыг харуулсан функцүүдийн бүрэн жагсаалт гэх мэт) тушаалаар авах боломжтой.

номын сан(тусламж=багцын_нэр), жишээ нь:

library(help=Matrix) Бүх R багцууд нь үндсэн ("суурь"), санал болгож буй ("санал болгосон") болон бусад хэрэглэгчийн суулгасан гурван ангиллын аль нэгэнд багтдаг.

Та номын сангийн() командыг өгөх замаар тэдгээрийн жагсаалтыг тодорхой компьютер дээр авах боломжтой.

суулгасан.багцууд(тэргүүлэх = "суурь") суулгасан.багцууд(тэргүүлэх байдал = "санал болгосон") # Авах бүрэн жагсаалт packlist packlist - rownames(installed.packages()) # Excel форматаар санах ойд мэдээллийг гаргах write.table(packlist,"clipboard",sep="\t", col.names=NA) Үндсэн болон санал болгосон багцуудыг ихэвчлэн оруулдаг. R суулгалтын файл руу.

Мэдээжийн хэрэг, олон төрлийн багцуудыг "нөөцөд" нэн даруй суулгах шаардлагагүй.

Багцыг суулгахын тулд R Console командын цонхноос "Багцуудыг суулгах багц(ууд)" цэсийг сонгох эсвэл жишээлбэл дараах тушаалыг оруулахад хангалттай.

install.packages(c("веган", "xlsReadWrite", "машин"))

Багцуудыг жишээ нь Оросын "толин тусгал" http://cran.gis-lab.info сайтаас татаж авах боломжтой бөгөөд үүний тулд Rprofile.site файлын хувилбарыг 1.1-р хэсэгт үзүүлсэн шиг ашиглахад тохиромжтой.

Багцуудыг суулгах өөр нэг сонголт бол http://cran.gis-lab.info/web/packages сайт руу орж, zip файл хэлбэрээр хүссэн багцаа сонгоод компьютер дээрээ сонгосон хавтас руу татаж авах явдал юм.

Энэ тохиолдолд та багц дээрх бүх мэдээлэл, тухайлбал түүнд багтсан функцүүдийн тайлбарыг урьдчилан харж, танд хэр их хэрэгтэйг шийдэх боломжтой. Дараа нь та "Багцууд Орон нутгийн зип файлуудаас багц суулгах" гэсэн командын цэсийг гүйцэтгэх хэрэгтэй.

RGui консолыг эхлүүлэх үед зөвхөн зарим үндсэн багцууд ачаалагддаг. Функцийг нь шууд ашиглахаасаа өмнө бусад багцыг эхлүүлэхийн тулд та тушаалын санд (багцын_нэр) оруулах шаардлагатай.

Та дараах тушаалыг өгснөөр үргэлжилж буй сессийн мөч бүрт ямар багц ачаалагдаж байгааг тодорхойлж болно.

sessionInfo() R хувилбар 2.13.2 (2011-09-30) Платформ: i386-pc-mingw32/i386 (32 бит)

–  –  –

бусад хавсаргасан багцууд:

Vegan_2.0-2 permute_0.6-3

нэрийн орон зайгаар ачаалагдсан (мөн хавсаргаагүй):

Grid_2.13.2 lattice_0.19-33 tools_2.13.2 Дараах хүснэгтэд энэ номонд танилцуулсан скриптүүдэд ашигласан багцуудыг жагсаасан (магадгүй бүрэн биш байж болно).

R багцууд Зорилго "Үндсэн" багцууд Үндсэн бүтэц R суурь Багц хөрвүүлэгч R хөрвүүлэгч Функцуудыг турших, харуулах өгөгдөл бүхий хүснэгтүүдийн багц өгөгдлийн багц Графикийн үндсэн функцүүдийн график График төхөөрөмжийн драйверууд, өнгөт палитр, фонтууд grDevices График давхарга үүсгэх функцууд Объект хандалтат програмчлал бүрэлдэхүүн хэсгүүд (ангиуд, аргуудын аргууд) Төрөл бүрийн сплайнуудын регрессийн сплайнуудтай ажиллах функцууд Статистикийн шинжилгээний статистикийн үндсэн функцууд S4 ангиллын статистик функцүүдийн аргууд stats4 Хэрэглэгчийн интерфейсийн бүрэлдэхүүн хэсгүүд (цэс, сонгох хайрцаг гэх мэт) tcltk Мэдээллийн дэмжлэг, удирдлага болон баримт бичгийн хэрэгслүүд Төрөл бүрийн дибаг хийх, оруулах хэрэгслүүд гаралт, архивлах гэх мэт.

"Зөвлөмж болгож буй" багцууд Төрөл бүрийн ачаалах ба "jackknife" горимуудын функцууд Ачаалах янз бүрийн шаталсан бус ангилал, таних алгоритмуудын ангилал Хагалах ба шаталсан кластерын алгоритмуудын кластер Кодын шинжилгээ ба баталгаажуулалт R codetools (Янз бүрийн форматаар файл унших, бичих, DDBFTA, SP, DSS) Stata) гадаад Цөмийг жигд болгох оновчлолд үйлчлэх функцууд KernSmooth Өргөтгөсөн график функцууд (Sarkar, 2008) сүлжээ Өгөгдлийн багц ба статистик функцууд (Venables, Ripley, 2002) MASS матриц ба вектор үйлдлүүд Матриц Ерөнхий нэмэлт ба холимог эффектийн загварууд ба шугаман бус загварууд. эффектүүд nlme Урагш дамжуулах мэдрэлийн сүлжээ nnet Ангилал ба регрессийн модыг байгуулах rpart Цэгүүдийн орон зайн хуваарилалтын криг хийх, дүн шинжилгээ хийх функцууд Орон зайн амьд үлдэх шинжилгээ (Кокс загвар гэх мэт) Ашиглалтын явцад суулгасан багцууд adegenet Генетикийн шинжилгээний алгоритмууд зайны гар Регрессийн загваруудын дүн шинжилгээ – номын хавсралт (Гелман, Хилл, 2007) машин Хэрэглээний регрессийн шинжилгээ corrplot-тай холбоотой процедурууд Корреляцийн матрицын график дүрслэл fitdistrplus Статистикийн тархалтыг тохируулах FWDselect, Регрессийн загварт мэдээллийн хувьсагчийн багцыг сонгох. Геосферийн нэмэлт загваруудыг турших өгөгдлийн багц Газарзүйн зайны тооцоолол ggplot2 Өндөр функц бүхий DAAG дэвшилтэт график багц Номонд зориулсан өгөгдлийн шинжилгээ ба график функцууд (Maindonald, Braun, 2010) Hmisc Harrell функцийн багц HSAUR2 Номын хавсралт (Everitt, Hothorn10) ISwR R jpeg дээрх анхдагч статистик шинжилгээ Графиктай ажиллах jpegs lars Регрессийн тусгай төрлүүд (LARS, Lasso гэх мэт) lavaan Баталгаажуулах шинжилгээ ба бүтцийн тэгшитгэлийн загварууд lmodel2 I ба II төрлийн регрессийн загваруудыг хэрэгжүүлэх (MA, SMA, RMA) maptools Газрын зургийн хэрэгсэл хулгана Шинжилгээ ба дутуу утгыг бөглөх процедурын мөчүүд Тооцооллын функцүүдийн дээж. moments nortest Хэвийн тархалтын хэтийн таамаглалыг шалгах шалгуур Пастек дахь хэтийн үзүүлэлтүүдийн шинжилгээ Экологи дахь орон зайн болон хугацааны цувааны өгөгдлийн шинжилгээ pls Үндсэн бүрэлдэхүүн хэсгийн регресс pwr Таамаглалын статистик хүчийг дахин хэлбэржүүлэх тооцоолол Өгөгдлийн хүснэгтийг уян хатан хувиргах robustbase Регрессийн загвар бүтээх найдвартай аргууд rootSolve Хэд хэдэн хувьсагчтай функцийн үндсийг олох шкала Өнгөний хуваарь сонгох сем Бүтцийн тэгшитгэлийн загварууд semPlot Бүтцийн харилцааны дүрслэл sm Тархалтын нягтрал ба тэгшитгэх аргуудын тооцоо sp Орон зайн өгөгдөлд хандах анги ба арга Spatstat Орон зайн статистикийн аргууд, дэд spdep загвар засварлагч Орон зайн хамаарал: геостатистикийн аргууд ба оддын загварчлал Статистикийн загваруудын талаарх мэдээллийг янз бүрийн vcd форматаар харуулах Категорийн өгөгдлийг дүрслэн харуулах Нийгэмлэгийн экологийн тооцоог (ижил төстэй байдал, олон янз байдал, веган үүрлэх арга хэмжээ, томилолт ба олон талт шинжилгээ) R-д суулгасан эсвэл бид ашиглахыг оролдох ачаалагдаагүй байгаа багцын функцүүдийн талаар бид системийн мессежийг хүлээн авах болно:

sem(model, data=PoliticalDemocracy) Алдаа: "sem" library(lavaan) функцийг олж чадсангүй. Номын санд алдаа(lavaan) : "lavaan" багцын хэрэглэгч гэж нэрлэгдсэн багц байхгүй бөгөөд аль нь татаж авах, аль нь өмнө нь байх ёстойг тэр ойлгож байна. -суулгасан. Скрипт хэрхэн ажилладагийг ойлгохын тулд дараагийн хэсэгт тайлбарласан R хэлний бүтцийг мэдэх шаардлагатай боловч сонирхсон уншигч эдгээр командууд руу дараа буцаж болно.

instant_pkgs - function(pkgs) ( pkgs_miss - pkgs)] # Татаж авахад бэлтгэгдээгүй багцуудыг суулгана уу:

if (length(pkgs_miss) 0) (install.packages(pkgs_miss) ) # Татаж аваагүй багцуудыг татаж авах:

Хавсаргасан - хайх() хавсаргасан_pkgs - хавсаргасан_хэрэгцээтэй_хэрэгцээ - хэрвээ (урт(хавсаргах_шаардлагатай) 0) ( for (i in 1:length(need_to_tax)) require(need_to_tatach[i], character.only = TRUE) ) ) # Дуудлага хийх жишээ

шуурхай_pkgs(c("суурь", "jpeg", "веган"))

Та багц тус бүрийн функцуудын жагсаалтыг авах боломжтой, жишээлбэл, тушаал өгөх замаар:

ls(pos = "package:vegan") Тайлбар: ls() нь тухайн орчинд объектуудыг жагсаахад зориулагдсан ерөнхий зориулалтын функц юм. Дээрх тушаал нь веган багцыг ийм орчин болгон тохируулдаг. Хэрэв энэ тушаалыг параметргүйгээр гаргасан бол бид одоогийн сессийн үеэр үүсгэсэн объектуудын жагсаалтыг авах болно.

Та args() командыг өгснөөр ачаалагдсан багцын дурын функцын орж ирж буй параметрүүдийн аргументуудын жагсаалтыг авах боломжтой.

Жишээлбэл, бидний хожим өргөнөөр ашиглах lm() шугаман загварын үүсмэл функцийг эхлүүлэх үед дараах параметрүүдийг тохируулна.

Args(lm) функц (томьёо, өгөгдөл, дэд олонлог, жин, na. үйлдэл, арга = "qr", загвар = ҮНЭН, x = ХУДАЛ, y = ХУДАЛ, qr = ҮНЭН, singular.ok = ҮНЭН, ялгаатай = NULL, офсет,...) Хэрэв та зөвхөн функцийн товчлолоос бүрдсэн командыг оруулбал (жишээлбэл, IQR-ийн дөрөвний хоорондын мужийг тооцоолох) функцийн эх текстийг R кодоор авах боломжтой:

IQR функц (x, na.rm = FALSE) diff(quantile(as.numeric(x), c(0.25, 0.75), na.rm = na.rm, names = FALSE)) Дэвшилтэт хэрэглэгч энэ кодыг өөрчлөх ба дуудлагыг "дахин чиглүүлэх" стандарт функцтаны хувилбарт.

Гэсэн хэдий ч, хэрэв бид шугаман загварын таамагласан утгуудыг тооцоолоход ашигладаг таамаглах () функцийн кодыг ижил аргаар харахыг хүсвэл дараахь зүйлийг авна.

таамаглах функц (объект,...) UseMethod("урьдчилан таамаглах") Энэ тохиолдолд таамаглах() нь "бүх нийтийн" функц юм: түүний оролтод ямар загварын объект орж байгаагаас хамаарна (шугаман регрессийн хувьд lm, Пуассон эсвэл логистикийн хувьд glm) регресс, холимог эффектийн загварт зориулсан lme гэх мэт), урьдчилан таамаглах утгыг олж авах холбогдох аргыг шинэчилсэн.

Ялангуяа энэ функцийг дараахь аргуудыг хэрэгжүүлэхэд ашигладаг.

аргууд("урьдчилан таамаглах") урьдчилан таамаглах.ar* таамаглах.Арима* таамаглах.arima0* таамаглах.glm таамаглах.HoltWinters* таамаглах.lm таамаглах. tahmin.princomp* таамаг.smooth.spline* таамаг.smooth.spline.fit* таамаглах.StructTS* Үл үзэгдэх функцууд нь одоор тэмдэглэгдсэн байдаг S3 загварын хувьд арга нь үнэндээ print( гэх мэт өөр ерөнхий функцээр дуудагддаг функц юм. ), plot() , эсвэл хураангуй() , оролт болгон нийлүүлсэн объектын ангиллаас хамаарна. Үүний зэрэгцээ ангийн шинж чанар нь "объектийн чиг баримжаа" -ыг хариуцдаг бөгөөд энэ нь зөв илгээх, шаардлагатай аргыг дуудах боломжийг олгодог. энэ объект. Тиймээс ерөнхий шугаман загварын таамагласан утгыг олж авах "функцийн арга" нь splines-ээр тэгшитгэх үед урьдчилан таамаглах.glm() гэсэн дуудлагатай байх болно - predict.smooth.spline() гэх мэт. S3 OOP загварын талаарх дэлгэрэнгүй мэдээллийг S3Methods тусламжийн хэсгээс, харин илүү дэвшилтэт S4 OOP загварын хувьд Methods хэсгээс авах боломжтой.

Эцэст нь R сессийн үеэр хүлээн авсан ажлын үр дүнг хадгалах хэд хэдэн энгийн заль мэхийг харцгаая.

° sink(файл= файлын нэр) - дараагийн командуудын гүйцэтгэлийн үр дүнг бодит цаг хугацаанд өгөгдсөн нэртэй файл руу гаргана; энэ тушаалыг зогсоохын тулд та sink () командыг параметргүйгээр гүйцэтгэх ёстой;

° хадгалах(файл=файлын нэр, хадгалах объектын жагсаалт) - заасан объектуудыг дурын файлд ашиглаж болох хоёртын XDR форматтай файлд хадгална. үйлдлийн систем;

° ачаалал(файл= файлын нэр) - одоогийн орчинд хадгалагдсан объектуудыг сэргээдэг;

° save.image(file= filename) - ажлын явцад үүсгэсэн бүх объектыг R-тусгай rda файл хэлбэрээр хадгалдаг.

Үүсгэсэн хүснэгтийг Excel хуудасны бүтцэд тохирсон форматаар санах ой руу өгөгдөл дамжуулах жишээг энэ хэсэгт дээр өгөв. 6-р бүлэгт шугаман загварын объектоос Word файл руу өгөгдөл дамжуулах жишээг үзүүлнэ.

R орчин нь бараг ямар ч дэлгэцийн нягтрал, хэвлэх төхөөрөмжид шаардлагатай чанарын пикселийн дүрсийг үүсгэхээс гадна үүссэн график цонхыг янз бүрийн форматтай файлд хадгалах боломжтой. График гаралтын төхөөрөмж бүрт драйверын функц байдаг: та драйверуудын бүрэн жагсаалтыг авахын тулд help(Devices) гэж бичиж болно.

Хамгийн түгээмэл хэрэглэгддэг график төхөөрөмжүүд нь:

° windows() нь Windows график цонх (дэлгэц, принтер эсвэл метафайл) юм.

° png(), jpeg(), bmp(), tiff() - харгалзах форматын битмап файл руу гаргах;

° pdf(),postscript() - гаралт график мэдээлэл PDF эсвэл PostScript файл руу.

Гаралтын төхөөрөмжтэй ажиллаж дууссаны дараа түүний драйверийг dev.off() тушаалаар идэвхгүй болгоно. Хэд хэдэн график гаралтын төхөөрөмжийг нэгэн зэрэг идэвхжүүлж, тэдгээрийн хооронд шилжих боломжтой: жишээлбэл, Шипунов нар номын харгалзах хэсгийг үзнэ үү. (2012, хуудас 278).

1. R ХЭЛНИЙ ТОДОРХОЙЛОЛТ

2.1. R өгөгдлийн төрлүүд R дахь бүх өгөгдлийн объектуудыг (мөн хувьсагчдыг) дараах ангилалд (жишээ нь объектын төрлүүдэд) хувааж болно.

° тоон - бүхэл тоо (бүхэл тоо) ба бодит тоо (давхар) агуулсан объектууд;

° логик - зөвхөн хоёр утгыг авдаг логик объектууд: FALSE (F гэж товчилсон) ба ҮНЭН (T);

° тэмдэгт - тэмдэгтийн объектууд (хувьсагчийн утгыг давхар эсвэл дан хашилтаар зааж өгсөн болно).

R хэл дээр та янз бүрийн объектын нэр (функц эсвэл хувьсагч) латин болон кирилл үсгээр үүсгэж болно, гэхдээ a (кирилл) болон a (латин) нь хоёр өөр объект гэдгийг санаарай. Үүнээс гадна R орчин нь том жижиг үсгийн мэдрэмжтэй, i.e. жижиг, том үсэг нь ялгаатай. R хэл дээрх хувьсагчийн нэр (танигч) үсгээр (эсвэл цэгээр) эхэлж, үсэг, цифр, цэг, доогуур зураасаас бүрдэх ёстой.

Багийн тусламжтайгаар уу? name нь өгөгдсөн нэртэй хувьсагч эсвэл функц байгаа эсэхийг шалгах боломжтой.

Хувьсагч нь тодорхой ангилалд хамаарах эсэхийг is.numeric(object_name), is.integer(name), is.logical(name), is.character(name) функцуудаар шалгаж, объектыг өөр төрөл рүү хөрвүүлдэг. , та as.тоон функц (нэр), as.integer(нэр), as.logical(нэр), as.character(нэр) функцуудыг ашиглаж болно.

R-д хэд хэдэн тусгай объектууд байдаг:

° Inf - эерэг буюу сөрөг хязгааргүй байдал (ихэвчлэн бодит тоог 0-д хуваах үр дүн);

° NA - "дутуу утга" (Байхгүй);

° NaN - "тоо биш" (Тоо биш).

Хувьсагч эдгээрийн аль нэгэнд хамаарах эсэхийг шалгана уу тусгай төрөл, та is.nite(нэр), is.na(нэр) болон is.nan(нэр) функцуудыг тус тус ашиглаж болно.

R илэрхийлэл нь хуваарилалтын оператор, арифметик эсвэл логик оператор, объектын нэр, функцийн нэр зэрэг элементүүдийн нэгдэл юм. Илэрхийллийн гүйцэтгэлийн үр дүн нь дүрмээр бол тушаал эсвэл график цонхонд шууд харагдана. Гэхдээ даалгавар гүйцэтгэх үед үр дүн нь харгалзах объектод хадгалагдах бөгөөд дэлгэц дээр харагдахгүй.

R хэл дээрх оноох операторын хувьд та "=" тэмдэг эсвэл хос тэмдэгт "-" (зүүн талд байгаа объектод тодорхой утга оноох) эсвэл "-" (зүүн талд байгаа объектод утга оноох) ашиглаж болно. баруун). "-"-г ашиглах нь сайн програмчлалын хэв маяг гэж тооцогддог.

R илэрхийлэлийг скрипт дээр мөрөөр зохион байгуулдаг. Та хэд хэдэн командыг нэг мөрөнд ";" тэмдгээр тусгаарлаж болно. Нэг тушаалыг хоёр (эсвэл түүнээс дээш) мөрөнд байрлуулж болно.

Тоон төрлийн объектууд нь уламжлалт арифметик үйлдлүүдийг ашиглан илэрхийлэл үүсгэж болно + (нэмэх), - (хасах), * (үржүүлэх), / (хуваах), ^ (дэмжих), %/% (бүхэл тоо хуваах), %% (үлдэгдэл) хэлтэсээс). Үйлдлүүд нь ердийн давуу эрхтэй, i.e. Эхлээд экспонентаци, дараа нь үржүүлэх эсвэл хуваах, дараа нь нэмэх эсвэл хасах үйлдлийг гүйцэтгэдэг. Илэрхийлэлд хаалт хэрэглэж болох ба тэдгээрийн операторууд хамгийн их давуу эрхтэй байна.

Логик илэрхийллийг дараах логик операторуудыг ашиглан үүсгэж болно.

° "Тэгш" == ° "Тэнцүү биш" != ° "Бага" ° "Их" ° "Бага эсвэл тэнцүү" = ° "Их эсвэл тэнцүү" = ° "Логик БА" & ° "Логик OR" | ° "Логик ҮГҮЙ"!

ДЭМЖЛЭГ, АУТСОРСИНГ, САНГИЙН УДИРДЛАГА 2 АМИКОРП ГРУПП ӨНГӨӨС ТОГТООХ w w w.am icor p. c om AMICORP ГРУПП КОМПАНИЙН ҮЙЛ АЖИЛЛАГААНЫ ХАЛБАНГУУД КОМПАНИЙН ТУХАЙ ҮЙЛЧИЛГЭЭ МАНАЙ ҮЙЛЧИЛГЭЭ Байгууллагын үйлчлүүлэгчдэд үзүүлэх үйлчилгээ Байгууллагын борлуулалтын үйлчилгээ Байгууллагын борлуулалтыг бий болгох, удирдах...»

“ОХУ-ын Засгийн газрын дэргэдэх Санхүүгийн их сургууль” дээд мэргэжлийн боловсролын Холбооны Улсын боловсролын төсвийн байгууллага “Маркетинг” тэнхимийн “Маркетинг” МАРКЕТИНГИЙН ОРЧИН ҮЕИЙН ЧИГЛЭЛ: ОНОЛ, АРГА ЗҮЙ, ПРАКТИК НЭГДСЭН МОНГРАФ С.В. Карпова Москва 2011 Шүүмжлэгчид: Н.С. Перекалина - Эдийн засгийн ухааны доктор, профессор, дарга. "Маркетингийн" тэнхим "МАТИ" - Оросын Улсын Технологийн Их Сургууль. К.Е.Циолковский С.С. Соловьев ... "

“КАФЕ, ЦАЙН БОЛОВСРОЛЫН МАЛКО дижитал мессенжер: Ч. Редактор: Vesela Dabova Br. 4 Decemvri, 2011 Редактор: Теодор Василевын цайгаар тайвшир. Гергана Иванов Хэвлэн нийтлэгч: АББ Бие махбодид эсвэл цай уух үед хэр олон тохиолдол гардаг, бүх тохиолдлууд нэг аяга цайны хэрэглээг хэрхэн сулруулдаг. Таси онолын найдвартай байдлын талаар янз бүрийн санал бодол байдаг боловч нэг аяга цайг тогтоосон дэглэмээс тооцдог гэсэн нотолгоо бага байна ... "

«Олон улсын интервалтай, Сахилга баттай replys Condice Condice Condice Colide-ийн READICE CODICADS COMICES COMINES COMPATION: Романа Бокови Бокови Бокови Слейье : 978-86-7892-733-1 Leyout: Мажа Момиров Хавтасны дизайн: Стефан Вужи Техникийн шинжлэх ухааны факультетийн Архитектур, хот байгуулалтын тэнхимээс хэвлүүлсэн,...»

"САНКТ-ПЕТЕРБУРГИЙН УЛСЫН ИХ СУРГУУЛИЙН Газарзүй, геоэкологийн факультет" Геоморфологийн тэнхимийн "Арктикийн нууруудын геоморфологийн онцлог ба палеоклимат (Оросын Арктикийн төв хэсгийн нууруудын жишээн дээр)" сэдвээр ДИПЛОМЫН ЭРДЭМ (эцсийн мэргэшлийн ажил)" Гүйцэтгэсэн: оройн тэнхимийн оюутан Морозова Елена Александровна Эрдэм шинжилгээний удирдагчид: д.г.д., проф. Большиянов Дмитрий Юрьевич Лектор Савельева Лариса Анатольевна Тоймч: Геологийн шинжлэх ухааны нэр дэвшигч, дарга....»

“Apacer M811 хулгана – лазер мини SUV иж бүрдэл. http://news.kosht.com/computer/mouse/2009/11/26/mysh_apacer_m811. KOSHT.com өдрийн үнийн хайлтын залгаас Firefox хөтөч. Нэг товшилтоор суулгана уу. Нэг килобайт. Нүүр хуудас Мэдээ Үнэ Зарууд Ажлын байр форум Компаниуд Моби Мэдээгээ олоорой KOSHTA-ийн бүх мэдээ Компьютер ба дагалдах хэрэгсэл Хулгана Компьютер ба дагалдах хэрэгсэл Хулгана Бүх KOSHTA мэдээ Шилдэг тоглоомын компьютерууд UltraPrice.by дээр онлайн тооцоолол хийх Apacer M811 хулгана – лазер мини SUV [...»

"ХОЛБООНЫ БОЛОВСРОЛЫН АГЕНТЛАГЫН УЛСЫН БОЛОВСРОЛЫН ДЭЭД МЭРГЭЖЛИЙН БОЛОВСРОЛЫН БАЙГУУЛЛАГА МОСКВА УЛСЫН ҮЙЛДВЭРИЙН ИХ СУРГУУЛЬ (ГОУ МГИУ)" МЭДЭЭЛЛИЙН СИСТЕМ, ТЕХНОЛОГИ" мэдээллийн систем» оюутан Чумакова Татьяна Андревна "Муу зохион байгуулалттай биеийн ард тусгаарлагдсан урсгалын тооцоо" сэдвээр Ажлын удирдагч: проф., доктор. n. Алексин Владимир Адамович ... "

“Р WIPO A/45/3 ЭХ: Англи огноо: 2008 оны 8-р сарын 15 ДЭЛХИЙН Оюуны Өмчийн Байгууллага ДОӨБ-ын ГИШҮҮН УЛСЫН ЖЕНЕВИЙН ЧУУЛГАН Дөчин тав дахь цуврал уулзалт Женев, 2008 оны 9-р сарын 22-30-ны өдөр. Ерөнхий захирал I. ОЛОН УЛСЫН ТӨРИЙН БУС БАЙГУУЛЛАГЫГ АЖИЛЛАГААЧААР ЭЛСЭЛТ ОРУУЛАХ 1. Ассамблейд өмнөх чуулгануудаараа олон улсын төрийн бус байгууллагуудад илгээхдээ баримтлах зарчмуудыг баталсан...” гэжээ.

“1 Олег Санаев. ДЭЛХИЙ ДӨРВӨН ЖИЛД, ЗУУН долларын өртөгтэй. Гарчиг дээр дурдсан Евгений Александрович Гвоздевын Лена дарвуулт онгоцоор аялах нөхцлийн дагуу бүх зүйл эмх цэгцтэй байна - дөрвөн жил, хоёр долоо хоног: 1992 оны 7-р сарын 7-нд тэрээр Махачкала боомтоос гарч, 1996 оны 7-р сарын 19-нд буцаж ирэв. Гэхдээ мөнгөөр ​​бол хэтрүүлэг, эс тэгвээс дутуу хэлсэн үг: мэдээжийн хэрэг та зуун доллараар дөрвөн жил амьдрах боломжгүй - та хөлөө сунгах болно. Гэхдээ аялалаа эхлэхэд Гвоздевт яг ийм хэмжээний мөнгө байсан. Мөн ядаж хөл ... "

« Удирдлагын хүрээлэн, Судалгааны Их сургууль Белгород Улсын Үндэсний Судалгааны Их Сургууль ТӨРИЙН БОЛОН ХОРТ, НИТХЫН АЛБАНЫ АЛБАНД НЭР ДЭВШИГЧИЙН УЛС УЛСЫН БҮРДЭЛИЙГ ХАМГААЛАХ АЮУЛГҮЙ БАЙДЛЫГ БҮРДҮҮЛЭХ ТЕХНОЛОГИ Тэмдэглэл: Дүгнэлт: Нийтлэлд...»

“Лидия ЯНОВСКАЯ МИХАИЛ БУЛГАКОВЫН ТУХАЙ ТАЙЛБАР МОСКВА “ТЕКСТ” UDC 821.161.1 BBK 84 (2Ros-Rus)6-44 Y64 ISBN 978-5-7516-0660-2 ISBN 978-9329 (Харын 978-985) ) "Текст", 2007 "BRAVO, BIS, ломбард!" "БРАВО, БИС, ломбард!" Өнөөдөр Москвад “Юность” сэтгүүлийн редакц хаана байдгийг мэдэхгүй. Ийм сэтгүүл байсаар байна уу? 70-аад оны дундуур Москвагийн хамгийн залуу, үзэсгэлэнтэй редакц нь Маяковскийн талбайн хажууд Садовая-Триумфальная дээр жижиг боловч маш тохь тухтай газар байрладаг байв ... "

“2013 ОНЫ УРАЛДААНЫ МЭДЭЭЛЛИЙН МАЯГТ “Т” маягтын 1 дүгээр хавсралт. RHF-д зориулсан өргөдлийн гарчгийн хуудас Төслийн нэр Төслийн дугаар Төслийн төрөл (a, c, d, e, f) Мэдлэгийн талбар (код) RHF ангилагч код GRNTI код (http://www.grnti.ru/) Тэргүүлэх чиглэл. шинжлэх ухаан, технологийн хөгжил, технологийн Оросын Холбооны Улс, чухал технологи1 Даргын овог, нэр, овог нэр холбогдох дугаартөслийн төслийн менежер Байгууллагын бүтэн ба товч нэр...” гэж бичжээ.

«FNI Report 8/2014 Польш улсад ЕХ-ны цаг уур, эрчим хүчний бодлогыг хэрэгжүүлэх нь: Европчлолоос полончлол руу шилжих үү? Жон Биргер Скжрсет ЕХ-ны уур амьсгал, эрчим хүчний бодлогыг Польш улсад хэрэгжүүлж байна: Европчлолоос полоничлол руу юу? Жон Биргер Скжрсет [имэйлээр хамгаалагдсан] 2014 оны 12-р сар Зохиогчийн эрх © Fridtjof Nansen Institute 2014 Гарчиг Польш дахь ЕХ-ны цаг уур, эрчим хүчний бодлогыг хэрэгжүүлэх нь: Европчлолоос полоничлол руу? Нийтлэлийн төрөл ба дугаар Хуудас FNI тайлан 8/2014 57 Зохиогч ISBN 978-82-7613-683-8 Жон...”

""Scientific Notes TOGU" Volume 6, No. 4, 2015 ISSN 2079-8490 Цахим шинжлэх ухааны хэвлэл "Scientific Notes TOGU" 2015, Volt 6, No. 4, S. 173 - 178 Certificate El No. FS9077 da-FS907. .2010 http://pnu.edu.ru/ru/ejournal/about/ [имэйлээр хамгаалагдсан] UDC 316.33 © 2015 I. А.Гареева, социологийн ухааны доктор. Шинжлэх ухааны доктор, А.Г.Киселева (Номхон Далайн Улсын Их Сургууль, Хабаровск) НИЙГМИЙН ДААТГАЛЫН ТОГТОЛЦООНЫ БҮРДЭЛ Энэхүү нийтлэлд нийгмийн даатгалын тогтолцоо бүрэлдэж, өнөөгийн байдалд дүн шинжилгээ хийсэн...»

Чуулганы хөтөлбөр Чианг Май, Тайланд, 2015 оны 11-р сар APCBSS Ази - Номхон далайн бизнес, нийгмийн шинжлэх ухааны бага хурал ICEI Боловсролын инновацийн олон улсын хурал APCLSE Ази, Номхон далайн Амьдралын шинжлэх ухаан, инженерчлэлийн бага хурал APCBSS Ази - Номхон далайн бизнес, нийгмийн шинжлэх ухааны бага хурал ISBN978-986- 9023 -0-7 ICEI International Conference on Education Innovation ISBN 978-986-5654-33-7 APCLSE Ази Номхон далайн Амьдралын шинжлэх ухаан, инженерчлэлийн бага хурал ISBN 978-986-90052-9-6 Агуулгын агуулга..."

Өнгөрсөн удаад (2014 оны 11-р сард; үргэлжлэлийг маш их удсандаа би маш их ичиж байна!) R хэлний үндсэн шинж чанаруудын талаар ярьсан. Хэдийгээр гогцоо, нөхцөлт блок гэх мэт ердийн удирдлагын бүх бүтэц байгаа хэдий ч -аас хол давталт дээр суурилсан өгөгдөл боловсруулах сонгодог арга хамгийн сайн шийдэл, R дахь циклүүдээс хойш ер бусынудаан. Тооцооллын процесс нь үр дүнг хүлээж хэт олон аяга кофе уухыг албадуулахгүйн тулд та яг үнэндээ өгөгдөлтэй хэрхэн ажиллах хэрэгтэйг одоо би танд хэлэх болно. Үүнээс гадна, би хэрхэн ашиглах талаар ярилцах болно орчин үеийн хэрэгсэлөгөгдлийн дүрслэл R. Учир нь практикт өгөгдөл боловсруулах үр дүнг танилцуулах тав тухтай байдал нь үр дүнгээс дутуугүй чухал юм. Энгийнээр эхэлцгээе.

Вектор үйлдлүүд

Бидний санаж байгаагаар R-ийн үндсэн төрөл нь тоо биш, харин вектор бөгөөд үндсэн арифметик үйлдлүүд нь векторын элемент дээр ажилладаг:

> x<- 1:6; y <- 11:17 >X + Y 12 16 16 16 16 20 22 18 18> 2 FALSE FALSE TRUE TRUE TRUE True> x * y 11 24 39 56 75 96 17> x / y 0.09090909 0.16666666666666660.28571429 0.33333333 0.37500000 0.0588235353

Энд бүх зүйл маш энгийн, гэхдээ векторуудын урт таарахгүй бол юу болох вэ гэсэн асуултыг тавих нь логик юм. Хэрэв бид к гэж бичвэл<- 2, то будет ли x * k соответствовать умножению вектора на число в математическом смысле? Короткий ответ - да. В более общем случае, когда длина векторов не совпадает, меньший вектор просто продолжается повторением:

>z<- c(1, 0.5) >x * z 1 1 3 2 5 3

Матрицын хувьд ч мөн адил.

> x<- matrix(1:4, 2, 2); y <- matrix(rep(2,4), 2, 2) >x * y [,1] [,2] 2 6 4 8 > x / y [,1] [,2] 0,5 1,5 1,0 2,0

Энэ тохиолдолд матрицын үржүүлэх үйл явц битээр бус "хэвийн" нь дараах байдалтай байна.

> x %*% y [,1] [,2] 8 8 12 12

Энэ бүхэн нь мэдээжийн хэрэг маш сайн, гэхдээ бид вектор эсвэл матрицын элементүүдэд өөрсдийн функцийг ашиглах шаардлагатай үед юу хийх вэ, өөрөөр хэлбэл үүнийг гогцоогүйгээр яаж хийх вэ? R-ийн энэ асуудлыг шийдэхийн тулд ашигладаг арга нь бидний функциональ хэл дээр ашигладагтай маш төстэй бөгөөд энэ нь Python эсвэл Haskell дээрх газрын зургийн функцийг санагдуулдаг.

Ашигтай функц lapply болон түүний найзууд

Энэ гэр бүлийн эхний үүрэг бол лаппли юм. Энэ нь жагсаалт эсвэл векторын элемент бүрт өгөгдсөн функцийг ашиглах боломжийг олгодог. Түүнээс гадна үр дүн нь аргументийн төрлөөс үл хамааран яг жагсаалт байх болно. Ламбда функцийг ашиглах хамгийн энгийн жишээ:

> q<- lapply(c(1,2,4), function(x) x^2) >q 1 4 16

Жагсаалт эсвэл векторт хэрэглэгдэх функцэд нэгээс олон аргумент шаардлагатай бол тэдгээр аргументуудыг lapply -ээр дамжуулж болно.

> q<- lapply(c(1,2,4), function(x, y) x^2 + y, 3)

Жагсаалтын тусламжтайгаар функц нь ижил төстэй байдлаар ажилладаг:

> x<- list(a=rnorm(10), b=1:10) >хэрэглэх (x, дундаж)

Энд rnorm функц нь хэвийн тархалтыг (энэ тохиолдолд 0-ээс 1-ийн хооронд хэвийн тархсан арван тоо) зааж, дундаж нь дундаж утгыг тооцдог. Sapply функц нь lapply функцтэй яг адилхан бөгөөд зөвхөн үр дүнг хялбарчлахыг оролддог. Жишээлбэл, жагсаалтын элемент бүр 1 урттай бол жагсаалтын оронд векторыг буцаана:

> sapply(c(1,2,4), функц(x) x^2) 1 4 16

Хэрэв үр дүн нь ижил урттай векторуудын жагсаалт байвал функц нь матрицыг буцаана, хэрэв юу ч тодорхойгүй бол lapply гэх мэт жагсаалт гарна.

> x<- list(1:4, 5:8) >sapply(x, function(x) x^2) [,1] [,2] 1 25 4 36 9 49 16 64

Матрицтай ажиллахын тулд хэрэглэх функцийг ашиглахад тохиромжтой:

> x<- matrix(rnorm(50), 5, 10) >хэрэглэх(x, 2, дундаж) > хэрэглэх(x, 1, нийлбэр)

Энд бид эхлээд таван мөр, арван баганын матриц үүсгэж, дараа нь эхлээд баганын дундажийг, дараа нь мөрүүдийн нийлбэрийг тооцоолно. Зургийг дуусгахын тулд мөр хоорондын дундаж болон нийлбэрийг тооцоолох асуудал маш түгээмэл тул R нь энэ зорилгоор rowSums, rowMeans, colSums, colMeans гэсэн тусгай функцуудыг өгдөг гэдгийг тэмдэглэх нь зүйтэй.
Хэрэглэх функцийг мөн олон хэмжээст массивуудад ашиглаж болно:

> арр<- array(rnorm(2 * 2 * 10), c(2, 2, 10)) >хэрэглэх(arr, c(1,2), дундаж)

Сүүлийн дуудлагыг илүү унших боломжтой хувилбараар сольж болно:

> rowMeans(arr, бүдэг = 2)

lapply-ийн олон хэмжээст аналог болох mapply функц руу шилжье. Стандарт R баримтаас олж болох энгийн жишээнээс эхэлцгээе:

> mapply(rep, 1:4, 4:1) 1 1 1 1 2 2 2 3 3 4

Таны харж байгаагаар rep функц нь хоёр дарааллаар үүсгэгдсэн параметрүүдийн багцад хэрэглэгдэх болно. Rep функц нь өөрөө эхний аргументыг хоёр дахь аргумент гэж заасан хэдэн удаа давтдаг. Тиймээс өмнөх код нь дараахтай тэнцүү байна:

> жагсаалт(rep(1,4), rep(2,3), rep(3,2), rep(4,1))

Заримдаа массивын аль нэг хэсэгт функц хэрэглэх шаардлагатай болдог. Үүнийг tapply функцийг ашиглан хийж болно. Дараах жишээг авч үзье.

> x<- c(rnorm(10, 1), runif(10), rnorm(10,2)) >е<- gl(3,10) >цохих(x,f,дундаж)

Эхлээд бид хэсгүүд нь үүссэн векторыг үүсгэдэг санамсаргүй хэмжигдэхүүнөөр тархалттай бол бид хүчин зүйлийн векторыг үүсгэдэг бөгөөд энэ нь арав, дараа нь арван хоёр, ижил тооны гурваас хэтрэхгүй. Дараа нь бид харгалзах бүлгүүдийн дундажийг тооцоолно. Анхдагч tapply функц нь үр дүнг хялбарчлахыг оролддог. Simplify=FALSE-г параметр болгон зааж өгснөөр энэ сонголтыг унтрааж болно.

> tapply(x, f, муж, хялбаршуулах=ХУДАЛ)

Хэрэглэх функцүүдийн тухай ярихдаа ихэвчлэн tapply -тэй төстэй векторыг хэсэг болгон хуваах функцийн тухай ярьдаг. Хэрэв бид split(x, f) гэж дуудвал гурван векторын жагсаалт гарч ирнэ. Тиймээс lapply / split хос нь хялбаршуулахыг FALSE болгож тохируулсан tapply шиг ажилладаг:

> laply(хуваах(x, f), дундаж)

Хуваах функц нь векторуудтай ажиллахаас гадна бас ашигтай: үүнийг өгөгдлийн хүрээтэй ажиллахад бас ашиглаж болно. Дараах жишээг авч үзье (би үүнийг Coursera-ийн R програмчлалын курсээс авсан):

> номын сан(өгөгдлийн багц) > толгой(агаарын чанар) Ozone Solar.R Салхины хэм Сар 1-р өдөр 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 314 NA536. 56 5 5 6 28 НА 14.9 66 5 6 > с<- split(airquality, airquality$Month) >lapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")]))

Энд бид агаарын төлөв байдлын (озон, нарны цацраг, салхи, Фаренгейтийн температур, сар, өдөр) талаарх мэдээллийг агуулсан мэдээллийн багцтай ажиллаж байна. Бид кодод үзүүлсэн шиг хуваах, ашиглах аргыг ашиглан сарын дундаж дүнг хялбархан тайлагнаж болно. Гэсэн хэдий ч sapply ашиглах нь бидэнд илүү тохиромжтой үр дүнг өгөх болно:

> sapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")])) 5 6 7 8 9 Озон NA NA NA NA NA Solar.R NA 190.16667 216.483871 НА 167.4333 Салхи 11.62258 10.26667 8.941935 8.793548 10.1800

Таны харж байгаагаар хэмжигдэхүүний зарим утгууд тодорхойлогдоогүй байна (мөн NA нөөцлөгдсөн утгыг үүнд ашигладаг). Энэ нь Ozone болон Solar.R баганын зарим (дор хаяж нэг) утгыг мөн тодорхойлоогүй гэсэн үг юм. Энэ утгаараа colMeans функц нь маш зөв ажилладаг: хэрэв тодорхойгүй утга байгаа бол дундаж нь тодорхойгүй байна. Асуудлыг na.rm=TRUE параметрээр NA утгыг үл тоомсорлох функцийг хүчээр шийдэж болно.

>sapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")], na.rm=TRUE)) 5 6 7 8 9 Озон 23.61538 29.44444 59.115385 59.9384. Solar.R 181.29630 190.16667 216.483871 171.857143 167.43333 Салхи 11.62258 10.26667 8.941935 8.793548 10.

Бидэнд ижил төстэй ажлуудыг шийдвэрлэхийн тулд яагаад ийм олон функц хэрэгтэй байна вэ? Энэ бүхнийг уншсан хоёр дахь хүн бүр ийм асуулт асуух байх гэж бодож байна. Эдгээр бүх функцууд нь гогцоо ашиглахгүйгээр вектор өгөгдлийг боловсруулах асуудлыг шийдэхийг оролдож байна. Гэхдээ боловсруулалтын өндөр хурдыг олж авах нь нэг хэрэг, гогцоо, нөхцөлт мэдэгдлүүд гэх мэт хяналтын бүтцийн уян хатан байдал, хяналтыг авах нь огт өөр зүйл юм.

Өгөгдлийн дүрслэл

R систем нь өгөгдлийг дүрслэх хэрэглүүрээр ер бусын баялаг юм. Энд би хэцүү сонголттой тулгараад байна - хэрвээ энэ талбай маш том бол юу ярих вэ. Хэрэв програмчлалын хувьд ямар нэгэн үндсэн функц байгаа бөгөөд үүнгүйгээр юу ч хийх боломжгүй бол дүрслэлд асар олон тооны өөр өөр даалгавар байдаг бөгөөд тэдгээр нь тус бүрийг (дүрмээр) хэд хэдэн аргаар шийдэж болно. Энэ нь давуу болон сул талуудтай. Түүнээс гадна эдгээр асуудлыг янз бүрийн аргаар шийдвэрлэх боломжийг олгодог олон сонголт, багцууд үргэлж байдаг.
Pro стандарт гэсэн үг R хэл дээр визуалчлалын талаар маш их зүйл бичсэн тул энд би илүү сонирхолтой зүйлийн талаар ярихыг хүсч байна. AT өнгөрсөн жилбагц нь улам бүр түгээмэл болж байна ggplot2, түүний тухай ярилцъя.

Ggplot2-г эхлүүлэхийн тулд install.package("ggplot2") командыг ашиглан номын санг суулгах хэрэгтэй. Дараа нь бид үүнийг ашиглахаар холбоно:

> library("ggplot2") > head(алмаз) каратын зүсэлт өнгөний тунгалаг байдлын гүн хүснэгт үнэ x y z 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43 2 0.21 Premium E SI1 59.8 61.21 Premium E SI1 59.8 61.21 59.8 61.336.8 V.136.5 Сайн. 4.07 2.31 4 0.29 Premium i vs2 62.4 58 334 4.20 4.23 2.63 5 0.31 Good J Si2 63.3 58 335 4.34 4.35 2.75 6 0.24 Very GOOD J VVS2 62.8 3.94 3.96 2.48> HeAD (MTCARS) MPG CYPG CYPG CYPG CYLD HEAD (MTCAR) Am Gear Carb mazda Rx4 21.0 6 16.9 2,9.0.9 21.8 4-ийн 01.8 4-ийн 01.8 4-ийн 01.8 4-ийн 4,6 4-ийн 4,6 4 1 4,61 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1

Алмаз болон mtcars өгөгдөл нь ggplot2 багцын нэг хэсэг бөгөөд одоо бидний ажиллах болно. Эхнийх нь бүх зүйл тодорхой байна - энэ бол алмазны тухай мэдээлэл (цэвэр байдал, өнгө, өртөг гэх мэт), хоёр дахь багц нь автомашины замын туршилтын мэдээлэл (галлон тутамд миль, цилиндрийн тоо ...) юм. 1973-1974 онуудад Америкийн Motor Trends сэтгүүлээс . Илүү дэлгэрэнгүй мэдээлэлмэдээллийг (хэмжээ гэх мэт) ?diamonds эсвэл ?mtcars гэж бичээд авч болно.

Дүрслэхийн тулд багц нь олон функцийг хангадаг бөгөөд эдгээрээс qplot нь одоо бидний хувьд хамгийн чухал байх болно. Ggplot функц нь танд үйл явцыг илүү хянах боломжийг олгоно. Qplot-ээр хийж болох бүх зүйлийг ggplot-оор ч хийж болно. Үүнийг энгийн жишээгээр харцгаая:

> qplot(тодорхой байдал, өгөгдөл=очир алмааз, дүүргэх=таслах, geom="bar")

Ижил нөлөөг ggplot функцээр хийж болно:

> ggplot(алмаз, aes(тодорхой байдал, дүүргэх=зүсэх)) + geom_bar()

Гэсэн хэдий ч qplot руу залгах нь илүү хялбар харагдаж байна. Зураг дээр. 1-ээс та янз бүрийн зүсэлтийн чанар (тайрах) бүхий алмаазын тоо нь тод байдал (тодорхой байдал) -аас хэрхэн хамааралтай болохыг харж болно.

Одоо автомашины түлшний нэгжид ногдох миль нь тэдний массаас хамаарах хамаарлыг бий болгоё. Үүссэн тархалтын график (эсвэл тараах тараах талбай) төлөөлдөг
Зураг дээр. 2.

> qplot(wt, mpg, data=mtcars)

Та мөн дөрөвний нэг милийн хурдатгалын цаг (qsec)-ийн өнгөт дэлгэц нэмж болно:

> qplot(wt, mpg, data=mtcars, color=qsec)

Дүрслэхдээ та өгөгдлийг хувиргаж болно:

> qplot(лог(wt), mpg - 10, өгөгдөл=mtcars)

Зарим тохиолдолд салангид өнгөний хуваагдал нь тасралтгүй гэхээсээ илүү төлөөлөлтэй харагддаг. Жишээлбэл, хэрэв бид хурдатгалын хугацааны оронд цилиндрийн тооны тухай мэдээллийг өнгөөр ​​харуулахыг хүсвэл утгыг салангид гэж зааж өгөх хэрэгтэй (Зураг 3).

> qplot(wt, mpg, data=mtcars, color=factor(cyl))

Та мөн жишээ нь size=3 ашиглан цэгийн хэмжээг өөрчилж болно. Хэрэв та хар, цагаан принтер дээр график хэвлэх гэж байгаа бол өнгө хэрэглэхгүй, харин тухайн хүчин зүйлээс хамааран тэмдэглэгээний хэлбэрийг өөрчлөх нь дээр. Үүнийг өнгө=фактор(цил)-ийг shape=factor(cyl) гэж солих замаар хийж болно.
Графикийн төрлийг геом параметрийг ашиглан тодорхойлсон бөгөөд тараах графикийн хувьд энэ параметрийн утга нь "цэг" байна.

Одоо бид цилиндрийн тохирох утгатай машины тооны гистограммыг бүтээхийг хүсч байна гэж бодъё.

> qplot(фактор(цил), өгөгдөл=mtcars, geom="bar") > qplot(factor(cyl), data=mtcars, geom="bar", color=factor(cyl)) > qplot(factor(cyl) , өгөгдөл=mtcars, geom="bar", дүүргэх=фактор(цил))

Эхний дуудлага нь цилиндрийн янз бүрийн утгын гурван гистограммыг зурдаг. Гистограммд өнгө өгөх анхны оролдлого нь хүлээгдэж буй үр дүнд хүргэхгүй гэдгийг би хэлэх ёстой - хар баар нь хар хэвээр байх болно, тэд зөвхөн өнгөт тоймыг авах болно. Гэхдээ qplot руу хийсэн сүүлчийн дуудлага нь зурагт үзүүлсэн шиг сайхан гистограмм үүсгэх болно. дөрөв.

Энд тодорхой зүйл байх ёстой. Баримт нь бидний барьж буй одоогийн объект нь үгийн хатуу утгаараа гистограм биш юм. Ихэвчлэн гистограммыг тасралтгүй өгөгдөлд зориулсан ижил төстэй дэлгэц гэж ойлгодог. Англи хэлэнд баганат график(энэ бол бидний дөнгөж сая хийсэн зүйл) ба гистограмнь хоёр өөр ойлголт юм (Википедиагийн холбогдох нийтлэлүүдийг үзнэ үү). Энд би өгөгдлийн мөн чанар нь өөрөө ярьж байна гэж үзэн "гистограм" гэдэг үгийг хоёр ойлголтын хувьд ашиглах болно.

Хэрэв бид зураг руу буцаж ирвэл. 1, ggplot2 нь графикийн байршлыг тогтоох хэд хэдэн ашигтай сонголтыг өгдөг (өгөгдмөл утга нь position="stack"):

> qplot(тодорхой байдал, өгөгдөл=алмаз, геом="бар", дүүргэх=таслах, байрлал="бултах") > qplot(тодорхой байдал, өгөгдөл=алмаз, геом="бар", дүүргэх=таслах, байрлал="бөглөх") > qplot(тодорхой байдал, өгөгдөл=очир алмааз, геом = "бар", дүүргэх = таслах, байрлал = "баримтлал")

Санал болгож буй хувилбаруудын эхнийх нь зурагт үзүүлсэн шиг диаграммуудыг зэрэгцүүлэн бүтээдэг. 5, хоёр дахь нь өгөгдсөн тунгалаг алмазын нийт тоонд өөр өөр зүсэгдсэн чанарын алмаазын эзлэх хувийг харуулж байна (Зураг 6).

Одоо бодит гистограмын жишээг авч үзье.

> qplot(карат, өгөгдөл=алмаз, геом="гистограм", зурвасын өргөн=0.1) > qplot(карат, өгөгдөл=алмаз, геом="гистограм", зурвасын өргөн=0.05)

Энд зурвасын өргөний параметр нь гистограммд хэр өргөн зурвас байгааг харуулж байна. Гистограм нь аль мужид хэр их өгөгдөл байгааг харуулдаг. Үр дүнг зурагт үзүүлэв. 7 ба 8.

Заримдаа загвар (шугаман эсвэл олон гишүүнт гэх мэт) бүтээх шаардлагатай үед бид үүнийг qplot дээр хийж, үр дүнг нь харж болно. Жишээлбэл, бид mpg-ийг массын жингийн эсрэг шууд тархалтын график дээр зурж болно.

> qplot(wt, mpg, data=mtcars, geom=c("цэг", "гөлгөр"))

Анхдагч байдлаар, орон нутгийн олон гишүүнт регрессийг (арга = "loess") загвар болгон ашиглах болно. Ажлын үр дүн Зураг дээр үзүүлсэн шиг харагдах болно. 9, хар саарал баар нь стандарт алдаа юм. Энэ нь анхдагч байдлаар харагдана, та se=FALSE гэж бичээд дэлгэцийг нь унтрааж болно.

Хэрэв бид энэ өгөгдөл дээр шугаман загварыг сунгахыг хүсвэл method=lm гэж зааж өгснөөр үүнийг хийж болно (Зураг 10).

Эцэст нь, мэдээжийн хэрэг та дугуй диаграмыг хэрхэн бүтээхийг харуулах хэрэгтэй.

>т<- ggplot(mtcars, aes(x=factor(1), fill=factor(cyl))) + geom_bar(width=1) >t + коордын_туйлт(тета="y")

Энд бид илүү уян хатан ggplot функцийг ашиглах болно. Энэ нь дараах байдлаар ажилладаг: эхлээд бид нийт масс дахь янз бүрийн тооны цилиндр бүхий машинуудын эзлэх хувийг харуулсан графикийг бүтээдэг (Зураг 11), дараа нь бид графикийг туйлын координат болгон хөрвүүлдэг (Зураг 12).

Дүгнэлтийн оронд

Одоо бид R-г ашиглахад бэлэн боллоо. Дараа нь яах вэ? Энд ggplot2-ын хамгийн үндсэн шинж чанаруудыг өгсөн бөгөөд векторжуулалттай холбоотой асуудлуудыг авч үзсэн нь ойлгомжтой. R-ийн талаар дурдах хэрэгтэй хэд хэдэн сайн ном байдаг бөгөөд тэдгээр нь маш их догдолдог сайн сайхны корпорацийн үйлчилгээнээс илүү зөвлөгөө өгөх нь зүйтэй юм. Нэгдүгээрт, Норман Матлоффын R програмчлалын урлаг. Хэрэв та R хэл дээр программчлах туршлагатай бол Патрик Бернсийн бичсэн The R Inferno ном танд хэрэг болно. Жон Чемберсийн бичсэн "Өгөгдлийн шинжилгээнд зориулсан програм хангамж" хэмээх сонгодог ном бас тохиромжтой.

Хэрэв бид R хэл дээрх дүрслэлийн талаар ярих юм бол W. Chang (Winston Chang) -ийн R Graphics Cookbook сайн ном байдаг. Энэ нийтлэл дэх ggplot2-ийн жишээг зааварчилгаанаас авсан болно: ggplot2. Дараагийн "Өгөгдлийн шинжилгээ ба R хэл дээрх машин сургалт" нийтлэлээр уулзацгаая!

R: Өгөгдлийн шинжилгээ ба дүрслэл блог нь гурван жил хагасын өмнөөс бий болсон. Хэдэн сарын өмнө энэ бүх хугацаанд энд нийтлэгдсэн арга зүйн мэдээг нэгтгэн дүгнэх санаа төрсөн юм. цахим ном. Уг санааг зохиогч, дараа нь номын хамтран зохиогч нь биологийн шинжлэх ухааны доктор Владимир Кириллович Шитиков () байв. Бид та бүхэндээ шинэ жилийн бэлэг болгон үр дүнг нь толилуулж байгаадаа таатай байна.


Хэрэгслийн хэрэгсэл "Статистикийн шинжилгээ, мэдээллийн дүрслэл Р" голчлон оюутнууд, аспирантууд, залуу, нэр хүндтэй эрдэмтэд, түүнчлэн Р-тэй ажиллаж байсан туршлагагүй мэргэжлийн шинжээчдэд зориулагдсан болно. Блогын уламжлалын дагуу бид боломжтой бол урвуулан ашиглахгүйгээр хийхийг хичээсэн " "Зан үйл" гэсэн үгийн хослолууд нь хэрэглээний статистикийн олон тооны гарын авлагын онцлог шинж чанартай, сайн мэддэг теоремуудыг иш татсан, олон түвшний тооцооллын томъёог авчирсан. Уншигч уншсан зүйлээ удирдан чиглүүлэхийн тулд юуны түрүүнд практик хэрэглээнд анхаарлаа хандуулсан. , өөрийн өгөгдөлд дүн шинжилгээ хийж, үр дүнг хамтран ажиллагсаддаа танилцуулах боломжтой. Уг ном нь дараах сэдвүүдийг хамарсан 9 бүлгийг багтаасан болно.

  • 1-р бүлэг: R статистикийн орчны үндсэн бүрэлдэхүүн хэсгүүд
  • 2-р бүлэг: R хэлийг тайлбарлах
  • 3-р бүлэг: R графикийн үндсэн шинж чанарууд
  • Бүлэг 4: Тайлбарласан статистик ба тохируулгын хуваарилалт
  • 5-р бүлэг: Статистикийн сонгодог арга, шалгуур
  • 6-р бүлэг: Шугаман загварууддисперсийн шинжилгээнд
  • Бүлэг 7: Хуваарийн хувьсагчдын хоорондын харилцааны регрессийн загварууд
  • 8-р бүлэг: Ерөнхий, бүтцийн болон бусад регрессийн загварууд
  • Бүлэг 9: Орон зайн шинжилгээ ба зураглал
Нэмж дурдахад өргөн хүрээний ном зүй, хэрэгцээтэй R онлайн эх сурвалжуудын жагсаалтыг өгсөн болно.

Номын албан ёсны одоогийн хувилбарыг PDF форматаар (~11 MB) авах боломжтой үнэгүй татах хоёр сайтаас:

  • GitHub репозитор: https://github.com/ranalytics/r-tutorials
  • Волга мөрний сав газрын RAS экологийн хүрээлэнгийн вэбсайт: http://www.ievbras.ru/ecostat/Kiril/R/

Ижил хоёр эх сурвалжаас та номонд тусгагдсан жишээнүүдийг хуулбарлахад шаардлагатай R-кодын скриптүүд болон өгөгдлийн багцуудыг олох боломжтой.

Энэ ажлын талаархи таны санал хүсэлтэд бид талархах болно - rtutorialsbook["dog"]gmail.com цахим шуудангаар илгээнэ үү.

Дээр дурдсанчлан номыг үнэ төлбөргүй тарааж байна. Гэсэн хэдий ч, хэрэв энэ нь танд ашигтай гэж үзвэл зохиогчдод тэдний ажилд талархал илэрхийлэх нь зүйтэй гэж үзвэл та хүссэн дүнг ашиглан шилжүүлж болно. дараагийн товчлуур(бүх гүйлгээ нь аюулгүйн горимцахим төлбөрийн системээр дамжуулан

Курсын хөтөлбөр

R хэл дээрх програмчлалын элементүүд

  • Дүрслэх статистик ба дүрслэл
  • Жишээлбэл, аль нь илүү чухал вэ: дундаж чек эсвэл ердийн чек үү?

кластерийн шинжилгээ

  • Ямар асуудал шийдэгдэж байна. Бүлэг объектыг дэд бүлгүүдэд хуваа.
  • Даалгаврын жишээ. Сайтуудыг сегментлэх, ижил төстэй сайтуудыг тодорхойлох.
  • Судалсан аргууд. Шаталсан кластерийн шинжилгээ, k-means арга, k-medoid арга.

Статистикийн таамаглалыг шалгах

  • Ямар асуудал шийдэгдэж байна. Хоёр бүлэг объектыг харьцуул.
  • Даалгаврын жишээ. A/B тестийн хэрэглэгчийн зан төлөв асаалттай янз бүрийн хувилбаруудсайтын хуудсууд.
  • Судалсан аргууд. Пропорциональ тест, Студентийн t тест, Левин t тест, Вилкоксон-Манн-Уитни тест

Шугаман регрессийн шинжилгээ.

  • Даалгаврын жишээ. Гаалийн татвар нэмсний дараа хуучин автомашины үнэ хэдэн төгрөгөөр унасныг тооцоол.
  • Судалсан аргууд. Хувьсах сонголт, коллинеар байдал, нөлөө бүхий ажиглалт, үлдэгдэл шинжилгээ. Параметрийн бус регресс (цөмийг жигд болгох). Шугаман регресс ашиглан улирлын бүрэлдэхүүнтэй богино цувралуудыг таамаглах

Урьдчилан мэдээлэх

  • Ямар асуудал шийдэгдэж байна. Цагийн цувралын урьдчилсан мэдээг бүтээх
  • Даалгаврын жишээ. Сайтын урсгалыг 6 сарын өмнөөс урьдчилан таамаглах.
  • судалсан арга. Экспоненциал гөлгөр болгох

Машины сургалт (загвар таних)

  • Даалгаврын жишээ. Сайтын зочлогч бүрийн хүйс, насыг таних
  • Судалсан аргууд. k-хамгийн ойрын хөршийн арга Ангилах мод (CART). Санамсаргүй ой. градиентийг нэмэгдүүлэх машин

Хичээлийн үнэлгээ

Оюутнуудад 14 оноо өгнө лабораторийн ажил. Хичээлийн үнэлгээг дараах дүрмийн дагуу тогтооно.

  • Маш сайн - бүх ажлыг кредитэд тооцно;
  • Сайн байна - нэгээс бусад бүх бүтээлийг тооцсон уу?;
  • Хангалттай - хоёроос бусад бүх ажлыг кредитэд тооцсон;
  • Хангалтгүй - бусад тохиолдолд.

Лабораторийн ажил

  • сонсогчдод өгөгдлийн багц, асуулт өгдөг;
  • сонсогч асуултанд хариулж, өөрийн мэдэгдлийг хүснэгт, график, R хэлээр бичсэн скриптээр дэмжинэ;
  • сонсогч нэмэлт асуултуудад хариулдаг.

Асуултын жишээ. Химийн шинжилгээний үр дүнд үндэслэн дарсны брэндийг танихдаа Random Forest алгоритмын оновчтой ажиллагааг хангах параметрүүдийг санал болго.

Сургалтанд хамрагдахын тулд юу мэдэх хэрэгтэй вэ

Курсын оролцогчид магадлалын онолын курст аль хэдийн суралцсан гэж таамаглаж байна.

Уран зохиол

  • Шипунов, Балдин, Волкова, Коробейников, Назарова, Петров, Суфиянов Харааны статистик. R ашиглаж байна
  • Мастицкий, Шитиков Статистикийн шинжилгээ ба мэдээллийн дүрслэл Р
  • Бишопын хэв маягийг таних ба машин сурах.
  • Жеймс, Виттен, Хасти, Тибширани. Статистикийн сургалтын танилцуулга. R хэл дээрх програмуудтай.
  • Хасти, Тибширани, Фридман. Статистикийн сургалтын элементүүд_Өгөгдлийн олборлолт, дүгнэлт, таамаглал 2+ed
  • Кроули. R ном.
  • Kabacoff R ажиллаж байна. Өгөгдлийн шинжилгээ ба график Р.

багш нар

Лекцийн жагсаалт

R-ийн танилцуулга: үндсэн командууд. Медиан, квантил ба квартил. Баганат график. Баганат график. Дугуй диаграм. Тархалтын диаграм. Тархалтын матриц. График дахь өнгөний хэрэглээ. Сахалтай хайрцагнууд (хайрцагны диаграм). Ердийн түүврийн ажиглалт: арифметик дундаж, медиан эсвэл таслагдсан дундаж. Шинжилсэн өгөгдөлд тохирсон ердийн утгыг тодорхойлох аргыг сонгох. Логнормаль тархалт. Ялгарал ба хэт их ажиглалт.

Шаталсан кластерын шинжилгээ. Кластер, объект хоорондын зай, кластер хоорондын зай. Дендрограмм байгуулах алгоритм. Тохой/тохой. Өгөгдлийн стандартчилал. Мэдээлэл бэлтгэхэд гардаг ердийн алдаа. Үр дүнгийн тайлбар.

k- гэсэн утгатай арга. Санамсаргүй тоо мэдрэгч, мэдрэгч үр тариа. k-means алгоритмын дүрслэл. Кластерын тоог тодорхойлох арга. NbClust номын сан. Тохой/тохой. Кластеруудыг дүрслэн харуулах олон хэмжээст масштаб.

Статистикийн таамаглалыг шалгах. Зөвшилцлийн таамаглал, нэгэн төрлийн, бие даасан байдал, тархалтын параметрүүдийн талаархи таамаглал.

Статистикийн таамаглалыг шалгах. Эхний болон хоёр дахь төрлийн алдаа, p-утга ба ач холбогдлын түвшин, статистик таамаглалыг шалгах алгоритм, үр дүнгийн тайлбар. Хэвийн тархалтын таамаглал. Шапиро-Вилк, Колмогоров-Смирнов нарын шалгуур. Хэвийн байдлаас бага зэргийн хазайлт. Дээжийн харьцуулалт. Бие даасан болон хосолсон дээж. Оюутны t-тест, Манн-Уитни-Вилкоксон тест, Моодын тестийн хоорондох сонголт. Оюутны t-тестийн сортууд ба дисперсийн харьцуулалт. Харьцуулалт дахь дүрслэл. Нэг талын болон хоёр талын туршилтууд.

Статистикийн таамаглалыг шалгах. Дээжийн харьцуулалт. Бие даасан болон хосолсон дээж. Оюутны t-тест, Манн-Уитни-Вилкоксон тест, Моодын тестийн хоорондох сонголт. Оюутны t-тестийн сортууд ба дисперсийн харьцуулалт. Харьцуулалт дахь дүрслэл. Нэг талын болон хоёр талын туршилтууд. Тусгаар тогтнол. Пирсон, Кендалл, Спирман корреляцийн коэффициентүүд, хоёр үзэгдлийн хоорондын хамаарлыг судлах ердийн алдаа. Дүгнэлтийг нүдээр шалгах.

Шугаман регрессийн шинжилгээ Загвар, коэффициентийн үнэлгээний тайлбар, детерминацийн олон коэффициент. Тодорхойлолтын олон коэффициентийн тайлбар, түүний хэрэглээний хамрах хүрээг хязгаарлах. Хамгийн чухал таамаглагчдыг тодорхойлох, урьдчилан таамаглагч бүрийн оруулсан хувь нэмрийг үнэлэх. Баригдсан загваруудыг засах алгоритмууд. Хамтарсан байдал.

Шугаман регрессийн шинжилгээ: Богино хугацааны цувралыг урьдчилан таамаглах.

Улирлын үзүүлэлт (дамми, бүтцийн) хувьсагчтай регрессийн загварт суурилсан таамаглал. Тренд, улирлын бүрэлдэхүүн хэсэг, цувралын өөрчлөлт, хэт давсан үзүүлэлт. Логарифм нь үржүүлгийн улирлын шинж чанарыг нэмэлт болгон хувиргах арга юм. үзүүлэлт хувьсагч. Дахин сургах.

Шугаман регресс - үлдэгдэл шинжилгээ. Гаусс-Марковын теоремын загварын хязгаарлалтын зөрчил. Үлдэгдэл шинжилгээ. Тодорхойлолтын алдаа. Multicollinearity, Tolerance ба VIF. Үлдэгдэлийн хэлбэлзлийн тогтмол байдлыг шалгах. Хэвийн байдлаас үлдэгдэл хуваарилалтад хазайлт байгаа тохиолдолд загварыг засах. Хоол хийх зай ба хөшүүрэг. Дурбин-Уотсоны статистик. Улирлын тохируулгын тоог багасгах.

Экспоненциал тэгшитгэх Холтын "a-Winters" арга. Орон нутгийн чиг хандлага, орон нутгийн улирлын шинж чанар.

Нэр томьёо: Машины сургалт, хиймэл оюун ухаан, өгөгдөл олборлолт ба хэв маягийг таних.

k-хамгийн ойрын хөршийн арга. Аргын тууштай байдал. Залхуу суралцах (залхуу суралцах). Онцлог сонголт. Хөндлөнгийн баталгаажуулалт. k-fold cross-validation. Хэт таарах (хэт таарах). Сургалт ба тестийн багц.

k-хамгийн ойрын хөршийн арга Жишээ. Хамгийн ойрын хөршүүдийн тоог тодорхойлох. Аргын чанарыг тодорхойлох эрсдэлийн хүснэгт.

CART ангиллын мод. Геометрийн дүрслэл. Логик дүрмийн багц хэлбэрээр дүрслэх. Модны төлөөлөл. Зангилаа, эцэг эх, хүүхдүүд, төгсгөлийн зангилаа. Босго. rpart номын сан. Зангилааны хольцын арга хэмжээ. Цэвэр байдлыг хэмжих арга: Жини, энтропи, ангиллын алдаа. Сурах модыг зогсоох дүрэм. rpart.plot номын сан.



Ачааж байна...
Топ