"R ашиглан өгөгдлийг статистик дүн шинжилгээ хийх, дүрслэх" арга зүйн гарын авлага. Арга зүйн гарын авлага "Статистикийн шинжилгээ ба өгөгдлийг R-ээр дүрслэх" Хичээлийг сонсохын тулд юу мэдэх хэрэгтэй

Курсын хөтөлбөр

R хэл дээрх програмчлалын элементүүд

  • Дүрслэх статистик ба дүрслэл
  • Жишээ нь, юу нь илүү чухал вэ: дундаж чек эсвэл ердийн чек үү?

кластерийн шинжилгээ

  • Ямар асуудал шийдэгдэж байна. Бүлэг объектыг дэд бүлгүүдэд хуваа.
  • Даалгаврын жишээ. Сайтуудыг сегментлэх, ижил төстэй сайтуудыг тодорхойлох.
  • Судалсан аргууд. Шаталсан кластерийн шинжилгээ, k-means арга, k-medoid арга.

Статистикийн таамаглалыг шалгах

  • Ямар асуудал шийдэгдэж байна. Хоёр бүлэг объектыг харьцуул.
  • Даалгаврын жишээ. A/B тестийн хэрэглэгчийн зан төлөв асаалттай өөр өөр хувилбаруудсайтын хуудсууд.
  • Судалсан аргууд. Пропорциональ тест, Студентийн t тест, Левин t тест, Вилкоксон-Манн-Уитни тест

Шугаман регрессийн шинжилгээ.

  • Даалгаврын жишээ. Гаалийн татвар нэмсний дараа хуучин автомашины үнэ хэдэн төгрөгөөр унасныг тооцоол.
  • Судалсан аргууд. Хувьсах сонголт, коллинеар байдал, нөлөө бүхий ажиглалт, үлдэгдэл шинжилгээ. Параметрийн бус регресс (цөмийг жигд болгох). Шугаман регресс ашиглан улирлын бүрэлдэхүүнтэй богино цувралуудыг таамаглах

Урьдчилан мэдээлэх

  • Ямар асуудал шийдэгдэж байна. Цагийн цувралын урьдчилсан мэдээг бүтээх
  • Даалгаврын жишээ. Сайтын урсгалыг 6 сарын өмнөөс урьдчилан таамаглах.
  • судалсан арга. Экспоненциал гөлгөр болгох

Машины сургалт (загвар таних)

  • Даалгаврын жишээ. Сайтын зочлогч бүрийн хүйс, насыг таних
  • Судалсан аргууд. k-хамгийн ойрын хөршийн арга Ангилах мод (CART). Санамсаргүй ой. градиентийг нэмэгдүүлэх машин

Хичээлийн үнэлгээ

Оюутнуудад 14 оноо өгнө лабораторийн ажил. Хичээлийн үнэлгээг дараах дүрмийн дагуу тогтооно.

  • Маш сайн - бүх ажлыг кредитэд тооцдог;
  • Сайн байна - нэгээс бусад бүх бүтээлийг тооцсон уу?;
  • Хангалттай - хоёроос бусад бүх ажлыг кредитэд тооцсон;
  • Хангалтгүй - бусад тохиолдолд.

Лабораторийн ажил

  • сонсогчдод өгөгдлийн багц, асуулт өгдөг;
  • сонсогч асуултанд хариулж, өөрийн мэдэгдлийг хүснэгт, график, R хэлээр бичсэн скриптээр дэмжинэ;
  • сонсогч нэмэлт асуултуудад хариулдаг.

Асуултын жишээ. Химийн шинжилгээний үр дүнд үндэслэн дарсны брэндийг танихдаа Random Forest алгоритмын оновчтой гүйцэтгэлийг хангах параметрүүдийг санал болго.

Сургалтанд хамрагдахын тулд юу мэдэх хэрэгтэй

Курсын оролцогчид магадлалын онолын курст аль хэдийн суралцсан гэж таамаглаж байна.

Уран зохиол

  • Шипунов, Балдин, Волкова, Коробейников, Назарова, Петров, Суфиянов Харааны статистик. R ашиглаж байна
  • Мастицкий, Шитиков Статистикийн дүн шинжилгээболон өгөгдөл дүрслэл R
  • Бишопын хэв маягийг таних ба машин сурах.
  • Жеймс, Виттен, Хасти, Тибширани. Статистикийн сургалтын танилцуулга. R хэл дээрх програмуудтай.
  • Хасти, Тибширани, Фридман. Статистикийн сургалтын элементүүд_ өгөгдөл олборлолт, Дүгнэлт, таамаглал 2+ed
  • Кроули. R ном.
  • Kabacoff R ажиллаж байна. Өгөгдлийн шинжилгээ ба график Р.

багш нар

Лекцийн жагсаалт

R-ийн танилцуулга: үндсэн командууд. Медиан, квантил ба квартил. Баганат график. Баганат график. Дугуй диаграм. Тархалтын диаграм. Тархалтын матриц. График дахь өнгөний хэрэглээ. Сахалтай хайрцагнууд (хайрцагны диаграм). Ердийн түүврийн ажиглалт: арифметик дундаж, медиан эсвэл таслагдсан дундаж. Шинжилсэн өгөгдөлд тохирсон ердийн утгыг тодорхойлох аргыг сонгох. Логнормаль тархалт. Ялгарал ба хэт их ажиглалт.

Шаталсан кластерын шинжилгээ. Кластер, объект хоорондын зай, кластер хоорондын зай. Дендрограмм байгуулах алгоритм. Тохой/тохой. Өгөгдлийн стандартчилал. Мэдээлэл бэлтгэхэд гардаг ердийн алдаа. Үр дүнгийн тайлбар.

k- гэсэн утгатай арга. Санамсаргүй тоо мэдрэгч, мэдрэгч тариа. k-means алгоритмын дүрслэл. Кластерын тоог тодорхойлох арга. NbClust номын сан. Тохой/тохой. Кластеруудыг дүрслэн харуулах олон хэмжээст масштаб.

Статистикийн таамаглалыг шалгах. Зөвшилцлийн таамаглал, нэгэн төрлийн байдал, бие даасан байдал, тархалтын параметрүүдийн талаархи таамаглал.

Статистикийн таамаглалыг шалгах. Эхний болон хоёр дахь төрлийн алдаа, p-утга ба ач холбогдлын түвшин, статистик таамаглалыг шалгах алгоритм, үр дүнгийн тайлбар. Хэвийн тархалтын таамаглал. Шапиро-Вилк, Колмогоров-Смирнов нарын шалгуур. Хэвийн байдлаас бага зэргийн хазайлт. Дээжийн харьцуулалт. Бие даасан болон хосолсон дээж. Оюутны t-тест, Манн-Уитни-Вилкоксон тест, Моодын тест хоёрын сонголт. Студентийн t-тестийн сортууд ба дисперсийн харьцуулалт. Харьцуулалт дахь дүрслэл. Нэг талын болон хоёр талын туршилтууд.

Статистикийн таамаглалыг шалгах. Дээжийн харьцуулалт. Бие даасан болон хосолсон дээж. Оюутны t-тест, Манн-Уитни-Вилкоксон тест, Моодын тест хоёрын сонголт. Студентийн t-тестийн сортууд ба дисперсийн харьцуулалт. Харьцуулалт дахь дүрслэл. Нэг талын болон хоёр талын туршилтууд. Тусгаар тогтнол. Пирсон, Кендалл, Спирман корреляцийн коэффициентүүд, хоёр үзэгдлийн хоорондын хамаарлыг судлах ердийн алдаа. Дүгнэлтийг нүдээр шалгах.

Шугаман регрессийн шинжилгээ Загвар, коэффициентийн үнэлгээний тайлбар, детерминацын олон коэффициент. Тодорхойлох олон коэффициентийн тайлбар, түүний хэрэглээний хамрах хүрээг хязгаарлах. Хамгийн чухал таамаглагчдыг тодорхойлох, урьдчилан таамаглагч бүрийн оруулсан хувь нэмрийг үнэлэх. Баригдсан загваруудыг засах алгоритмууд. Хамтарсан байдал.

Шугаман регрессийн шинжилгээ: Богино хугацааны цувралыг урьдчилан таамаглах.

Улирлын үзүүлэлт (дамми, бүтцийн) хувьсагчтай регрессийн загварт суурилсан таамаглал. Тренд, улирлын бүрэлдэхүүн хэсэг, цувралын өөрчлөлт, хэт давсан үзүүлэлт. Логарифм бол үржүүлэх улирлын шинж чанарыг нэмэлт болгон хувиргах арга юм. үзүүлэлт хувьсагч. Дахин сургах.

Шугаман регресс - үлдэгдэл шинжилгээ. Гаусс-Марковын теоремын загварын хязгаарлалтын зөрчил. Үлдэгдэл шинжилгээ. Тодорхойлолтын алдаа. Multicollinearity, Tolerance ба VIF. Үлдэгдэлийн хэлбэлзлийн тогтмол байдлыг шалгах. Хэвийн байдлаас үлдэгдэл хуваарилалтад хазайлт байгаа тохиолдолд загварыг засах. Хоол хийх зай ба хөшүүрэг. Дурбин-Уотсоны статистик. Улирлын тохируулгын тоог багасгах.

Экспоненциал тэгшитгэх Холтын "a-Winters" арга. Орон нутгийн чиг хандлага, орон нутгийн улирлын шинж чанар.

Нэр томьёо: Машины сургалт, хиймэл оюун ухаан, өгөгдөл олборлолт ба хэв маягийг таних.

k-хамгийн ойрын хөршийн арга. Аргын тууштай байдал. Залхуу суралцах (залхуу суралцах). Онцлог сонголт. Хөндлөнгийн баталгаажуулалт. k-fold cross-validation. Хэт таарах (хэт таарах). Сургалт ба тестийн багц.

k-хамгийн ойрын хөршийн арга Жишээ. Хамгийн ойрын хөршүүдийн тоог тодорхойлох. Аргын чанарыг тодорхойлох эрсдэлийн хүснэгт.

CART ангиллын мод. Геометрийн дүрслэл. Логик дүрмийн багц хэлбэрээр дүрслэх. Модны төлөөлөл. Зангилаа, эцэг эх, хүүхдүүд, төгсгөлийн зангилаа. Босго. rpart номын сан. Зангилааны хольцын арга хэмжээ. Цэвэр байдлыг хэмжих арга: Жини, энтропи, ангиллын алдаа. Сурах модыг зогсоох дүрэм. rpart.plot номын сан.

Өнгөрсөн удаад (2014 оны 11-р сард; үргэлжлэлийг маш их удсандаа би маш их ичиж байна!) R хэлний үндсэн шинж чанаруудын талаар ярьсан. Хэдийгээр гогцоо, нөхцөлт блок гэх мэт ердийн бүх удирдлагын бүтэц байгаа ч -аас хол давталт дээр суурилсан өгөгдөл боловсруулах сонгодог арга Хамгийн зөв шийдвэр, R дахь циклүүдээс хойш ер бусынудаан. Тооцооллын процесс нь үр дүнг хүлээж хэт олон аяга кофе уухыг албадахгүйн тулд одоо би өгөгдөлтэй хэрхэн ажиллахыг танд хэлэх болно. Нэмж дурдахад би R хэл дээр орчин үеийн өгөгдөл дүрслэх хэрэгслүүдийг хэрхэн ашиглах талаар ярилцах болно. Учир нь практикт өгөгдөл боловсруулах үр дүнг танилцуулах тав тухтай байдал нь үр дүнгээс дутуугүй чухал юм. Энгийнээр эхэлцгээе.

Вектор үйлдлүүд

Бидний санаж байгаагаар R-ийн үндсэн төрөл нь тоо биш, харин вектор бөгөөд үндсэн арифметик үйлдлүүд нь векторын элемент дээр ажилладаг:

> x<- 1:6; y <- 11:17 >x + y 12 14 16 16 18 20 22 18 18> x> 2 false false true true true> x * y 11 24 39 56 75 96 17> x / y 0.09090909 0.166666666660.28571429 0.33333333 0.37500000 0.0588235353

Энд бүх зүйл маш энгийн, гэхдээ векторуудын урт таарахгүй бол юу болох вэ гэсэн асуултыг тавих нь логик юм. Хэрэв бид к гэж бичвэл<- 2, то будет ли x * k соответствовать умножению вектора на число в математическом смысле? Короткий ответ - да. В более общем случае, когда длина векторов не совпадает, меньший вектор просто продолжается повторением:

>z<- c(1, 0.5) >x * z 1 1 3 2 5 3

Матрицын хувьд ч мөн адил.

> x<- matrix(1:4, 2, 2); y <- matrix(rep(2,4), 2, 2) >x * y [,1] [,2] 2 6 4 8 > x / y [,1] [,2] 0,5 1,5 1,0 2,0

Энэ тохиолдолд матрицын үржүүлэг нь битээр бус "хэвийн" нь иймэрхүү харагдах болно.

> x %*% y [,1] [,2] 8 8 12 12

Энэ бүхэн нь мэдээжийн хэрэг маш сайн, гэхдээ бид вектор эсвэл матрицын элементүүдэд өөрсдийн функцийг ашиглах шаардлагатай үед юу хийх вэ, өөрөөр хэлбэл үүнийг гогцоогүйгээр яаж хийх вэ? R-ийн энэ асуудлыг шийдэхийн тулд ашигладаг арга нь бидний функциональ хэл дээр ашигладагтай маш төстэй бөгөөд энэ нь Python эсвэл Haskell дээрх газрын зургийн функцийг санагдуулдаг.

Ашигтай функц lapply болон түүний найзууд

Энэ гэр бүлийн эхний үүрэг бол лаппли юм. Энэ нь жагсаалт эсвэл векторын элемент бүрт өгөгдсөн функцийг ашиглах боломжийг олгодог. Түүнээс гадна үр дүн нь аргументийн төрлөөс үл хамааран яг жагсаалт байх болно. Ламбда функцийг ашиглах хамгийн энгийн жишээ:

> q<- lapply(c(1,2,4), function(x) x^2) >q 1 4 16

Жагсаалт эсвэл векторт хэрэглэгдэх функцэд нэгээс олон аргумент шаардлагатай бол тэдгээр аргументуудыг lapply -ээр дамжуулж болно.

> q<- lapply(c(1,2,4), function(x, y) x^2 + y, 3)

Жагсаалттай бол функц нь ижил төстэй байдлаар ажилладаг:

> x<- list(a=rnorm(10), b=1:10) >хэрэглэх (x, дундаж)

Энд rnorm функц нь хэвийн тархалтыг (энэ тохиолдолд 0-ээс 1-ийн хооронд хэвийн тархсан арван тоо) зааж, дундаж нь дундаж утгыг тооцдог. Sapply функц нь lapply функцтэй яг адилхан бөгөөд зөвхөн үр дүнг хялбарчлахыг оролддог. Жишээлбэл, жагсаалтын элемент бүр 1 урттай бол жагсаалтын оронд векторыг буцаана:

> sapply(c(1,2,4), функц(x) x^2) 1 4 16

Хэрэв үр дүн нь ижил урттай векторуудын жагсаалт байвал функц нь матрицыг буцаана, хэрэв юу ч тодорхойгүй бол lapply гэх мэт жагсаалт гарна.

> x<- list(1:4, 5:8) >sapply(x, function(x) x^2) [,1] [,2] 1 25 4 36 9 49 16 64

Матрицтай ажиллахын тулд хэрэглэх функцийг ашиглахад тохиромжтой:

> x<- matrix(rnorm(50), 5, 10) >хэрэглэх(x, 2, дундаж) > хэрэглэх(x, 1, нийлбэр)

Энд бид эхлээд таван мөр, арван баганын матриц үүсгэж, дараа нь эхлээд баганын дундаж, дараа нь мөрүүдийн нийлбэрийг тооцоолно. Зургийг дуусгахын тулд мөр хоорондын дундаж болон нийлбэрийг тооцоолох даалгаврууд нь маш нийтлэг байдаг тул R нь энэ зорилгоор rowSums , rowMeans , colSums болон colMeans гэсэн тусгай функцуудыг өгдөг гэдгийг тэмдэглэх нь зүйтэй.
Хэрэглэх функцийг мөн олон хэмжээст массивуудад ашиглаж болно:

> арр<- array(rnorm(2 * 2 * 10), c(2, 2, 10)) >хэрэглэх(arr, c(1,2), дундаж)

Сүүлийн дуудлагыг илүү унших боломжтой хувилбараар сольж болно:

> rowMeans(arr, бүдэг = 2)

lapply-ийн олон хэмжээст аналог болох mapply функц руу шилжье. Стандарт R баримтаас олж болох энгийн жишээнээс эхэлцгээе:

> mapply(rep, 1:4, 4:1) 1 1 1 1 2 2 2 3 3 4

Таны харж байгаагаар бид хоёр дарааллаар үүсгэгдсэн параметрүүдийн багцад rep функцийг ашиглаж байна. Rep функц нь өөрөө эхний аргументыг хоёр дахь аргументын тоогоор давтдаг. Тиймээс өмнөх код нь дараахтай тэнцүү байна:

> жагсаалт(rep(1,4), rep(2,3), rep(3,2), rep(4,1))

Заримдаа массивын зарим хэсэгт функц хэрэглэх шаардлагатай болдог. Үүнийг tapply функцийг ашиглан хийж болно. Дараах жишээг авч үзье.

> x<- c(rnorm(10, 1), runif(10), rnorm(10,2)) >е<- gl(3,10) >цохих(x,f,дундаж)

Эхлээд бид хэсгүүд нь үүссэн векторыг үүсгэдэг санамсаргүй хэмжигдэхүүнөөр тархалттай бол бид хүчин зүйлийн векторыг үүсгэдэг бөгөөд энэ нь арав, дараа нь арван хоёр, ижил тооны гурваас хэтрэхгүй. Дараа нь бид харгалзах бүлгүүдийн дундажийг тооцоолно. Анхдагч tapply функц нь үр дүнг хялбарчлахыг оролддог. Simplify=FALSE-г параметр болгон зааж өгснөөр энэ сонголтыг унтрааж болно.

> tapply(x, f, муж, хялбаршуулах=ХУДАЛ)

Хэрэглэх функцүүдийн тухай ярихдаа ихэвчлэн tapply -тэй төстэй векторыг хэсэг болгон хуваах функцийн тухай ярьдаг. Хэрэв бид split(x, f) гэж дуудвал гурван векторын жагсаалт гарч ирнэ. Тиймээс lapply / split хос нь хялбаршуулахыг FALSE болгож тохируулсан tapply шиг ажилладаг:

> laply(хуваах(x, f), дундаж)

Хуваах функц нь векторуудтай ажиллахаас гадна бас ашигтай: үүнийг өгөгдлийн хүрээтэй ажиллахад бас ашиглаж болно. Дараах жишээг авч үзье (би үүнийг Coursera-ийн R програмчлалын курсээс авсан):

> номын сан(өгөгдлийн багц) > толгой(агаарын чанар) Ozone Solar.R Салхины температур Сар 1-р өдөр 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 314 NA536. 56 5 5 6 28 НА 14.9 66 5 6 > с<- split(airquality, airquality$Month) >lapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")]))

Энд бид агаарын төлөв байдлын (озон, нарны цацраг, салхи, Фаренгейтийн температур, сар, өдөр) талаарх мэдээллийг агуулсан мэдээллийн багцтай ажиллаж байна. Бид кодод үзүүлсэн шиг хуваах, ашиглах аргыг ашиглан сарын дундажийг хялбархан мэдээлэх боломжтой. Гэсэн хэдий ч sapply ашиглах нь бидэнд илүү тохиромжтой үр дүнг өгөх болно:

> sapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")])) 5 6 7 8 9 Озон NA NA NA NA NA Solar.R NA 190.16667 216.483871 НА 167.4333 Салхи 11.62258 10.26667 8.941935 8.793548 10.1800

Таны харж байгаагаар хэмжигдэхүүний зарим утгууд тодорхойлогдоогүй байна (мөн NA нөөцлөгдсөн утгыг үүнд ашигладаг). Энэ нь Ozone болон Solar.R баганын зарим (дор хаяж нэг) утгыг мөн тодорхойлоогүй гэсэн үг юм. Энэ утгаараа colMeans функц нь маш зөв ажилладаг: хэрэв тодорхойгүй утга байгаа бол дундаж нь тодорхойгүй байна. Асуудлыг na.rm=TRUE параметрээр NA утгыг үл тоомсорлох функцийг хүчээр шийдэж болно.

>sapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")], na.rm=TRUE)) 5 6 7 8 9 Озон 23.61538 29.44444 59.115385 59.9384. Solar.R 181.29630 190.16667 216.483871 171.857143 167.43333 Салхи 11.62258 10.26667 8.941935 8.793548 10.

Бидэнд маш төстэй ажлуудыг шийдвэрлэхийн тулд яагаад ийм олон функц хэрэгтэй байна вэ? Энэ бүхнийг уншсан хоёр дахь хүн бүр ийм асуулт асуух байх гэж бодож байна. Эдгээр бүх функцууд нь гогцоо ашиглахгүйгээр вектор өгөгдлийг боловсруулах асуудлыг шийдэхийг оролдож байна. Гэхдээ боловсруулалтын өндөр хурдыг олж авах нь нэг хэрэг, гогцоо, нөхцөлт мэдэгдлүүд гэх мэт хяналтын бүтээцэд олгодог уян хатан байдал, хяналтыг олж авах нь өөр хэрэг юм.

Өгөгдлийн дүрслэл

R систем нь өгөгдлийг дүрслэх хэрэглүүрээр ер бусын баялаг юм. Тэгээд энд би хэцүү сонголттой тулгараад байна - хэрвээ энэ талбай маш том бол юу ярих вэ. Хэрэв програмчлалын хувьд ямар нэгэн үндсэн функц байгаа бөгөөд үүнгүйгээр юу ч хийх боломжгүй бол дүрслэлд асар олон тооны өөр өөр даалгавар байдаг бөгөөд тэдгээр нь тус бүрийг (дүрмээр) хэд хэдэн аргаар шийдэж болно. Энэ нь давуу болон сул талуудтай. Түүнээс гадна эдгээр асуудлыг янз бүрийн аргаар шийдвэрлэх боломжийг олгодог олон сонголт, багцууд үргэлж байдаг.
R хэл дээрх стандарт рендерийн талаар маш их бичсэн байгаа тул энд би илүү сонирхолтой зүйлийн талаар ярихыг хүсч байна. Сүүлийн жилүүдэд багц нь улам бүр түгээмэл болж байна. ggplot2, түүний тухай ярилцъя.

Ggplot2-г эхлүүлэхийн тулд install.package("ggplot2") командыг ашиглан номын санг суулгах хэрэгтэй. Дараа нь бид үүнийг ашиглахаар холбоно:

> library("ggplot2") > head(алмаз) каратын зүсэлт өнгөний тунгалаг байдлын гүн хүснэгт үнэ x y z 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43 2 0.21 Premium E SI1 59.8 61.21 Premium E SI1 59.8 61.21 E. SI1 59.8 61.432.8.136.8 сайн. 4.07 2.31 4 0.29 Premium i vs2 62.4 58 334 4.20 4.23 2.63 5 0.31 Good J Si2 63.3 58 335 4.34 4.35 2.75 6 0.24 Very GOOD J VVS2 62.8 3.94 3.96 2.48> HEAD (MTCARS) MPG cla. Am Gear Carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 WAG 21.0 6 160 110 3.9 2.875 17.02 0 1 4 DATSUN 710 22.8 4 108 93 3.85 2.320 18.61 1 4 1 Hornet 4 Drive 68 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1

Алмаз болон mtcars өгөгдөл нь ggplot2 багцын нэг хэсэг бөгөөд бидний одоо ажиллах болно. Эхнийх нь бүх зүйл тодорхой байна - эдгээр нь алмазын тухай мэдээлэл (цэвэр байдал, өнгө, өртөг гэх мэт), хоёр дахь багц нь автомашины замын туршилтын өгөгдөл (галлон тутамд миль, цилиндрийн тоо ...) юм. 1973-1974 онуудад Америкийн Motor Trends сэтгүүлээс . Өгөгдлийн талаарх дэлгэрэнгүй мэдээллийг (хэмжээ гэх мэт) diamonds эсвэл?mtcars гэж бичээд авах боломжтой.

Дүрслэхийн тулд багц нь олон функцийг хангадаг бөгөөд эдгээрээс qplot нь одоо бидний хувьд хамгийн чухал байх болно. Ggplot функц нь танд үйл явцыг илүү хянах боломжийг олгоно. Qplot-ээр хийж болох бүх зүйлийг ggplot-оор бас хийж болно. Үүнийг анхаарч үзээрэй энгийн жишээ:

> qplot(тодорхой байдал, өгөгдөл=очир алмааз, дүүргэх=таслах, geom="bar")

Ижил нөлөөг ggplot функцээр хийж болно:

> ggplot(алмаз, aes(тодорхой байдал, дүүргэх=зүсэх)) + geom_bar()

Гэсэн хэдий ч qplot руу залгах нь илүү хялбар харагдаж байна. Зураг дээр. 1-ээс та янз бүрийн зүсэлтийн чанар (тайрах) бүхий алмаазын тоо нь тод байдал (тодорхой байдал) -аас хэрхэн хамааралтай болохыг харж болно.

Одоо автомашины түлшний нэгжид ногдох миль, тэдгээрийн массаас хамаарах хамаарлыг бий болгоё. Үүссэн тархалтын график (эсвэл тараах тараах талбай) төлөөлдөг
Зураг дээр. 2.

> qplot(wt, mpg, data=mtcars)

Та мөн дөрөвний нэг милийн хурдатгалын цаг (qsec)-ийн өнгөт дэлгэц нэмж болно:

> qplot(wt, mpg, data=mtcars, color=qsec)

Дүрслэхдээ та өгөгдлийг хувиргаж болно:

> qplot(лог(wt), mpg - 10, өгөгдөл=mtcars)

Зарим тохиолдолд салангид өнгөний хуваагдал нь тасралтгүй гэхээсээ илүү төлөөлөлтэй харагддаг. Жишээлбэл, хэрэв бид хурдатгалын хугацааны оронд цилиндрийн тооны тухай мэдээллийг өнгөөр ​​харуулахыг хүсвэл утгыг салангид гэдгийг зааж өгөх хэрэгтэй (Зураг 3).

> qplot(wt, mpg, data=mtcars, color=factor(cyl))

Та мөн жишээ нь size=3 ашиглан цэгийн хэмжээг өөрчилж болно. Хэрэв та хар цагаан принтер дээр график хэвлэх гэж байгаа бол өнгө хэрэглэхгүй, харин тухайн хүчин зүйлээс хамааран тэмдэглэгээний хэлбэрийг өөрчлөх нь дээр. Үүнийг өнгө=фактор(цил)-ийг shape=factor(cyl) гэж солих замаар хийж болно.
Графикийн төрлийг геом параметрийг ашиглан тодорхойлсон бөгөөд тараах графикийн хувьд энэ параметрийн утга нь "цэг" байна.

Одоо бид цилиндрийн тохирох утгатай машины тооны гистограммыг бүтээхийг хүсч байна гэж бодъё.

> qplot(фактор(цил), өгөгдөл=mtcars, geom="bar") > qplot(factor(cyl), data=mtcars, geom="bar", color=factor(cyl)) > qplot(factor(cyl)) , өгөгдөл=mtcars, geom="bar", дүүргэх=фактор(цил))

Эхний дуудлага нь цилиндрийн янз бүрийн утгын гурван гистограммыг зурдаг. Гистограммд өнгө өгөх анхны оролдлого нь хүлээгдэж буй үр дүнд хүргэхгүй гэж би хэлэх ёстой - хар баар нь хар хэвээр байх болно, тэд зөвхөн өнгөт тоймыг авах болно. Гэхдээ qplot руу хийсэн сүүлчийн дуудлага нь зурагт үзүүлсэн шиг сайхан гистограмм үүсгэх болно. 4.

Энд тодорхой зүйл байх ёстой. Баримт нь бидний барьж буй одоогийн объект нь үгийн хатуу утгаараа гистограм биш юм. Ихэвчлэн гистограммыг тасралтгүй өгөгдөлд зориулсан ижил төстэй дэлгэц гэж ойлгодог. Англи хэлэнд баганат график(энэ бол бидний дөнгөж сая хийсэн зүйл) ба гистограмнь хоёр өөр ойлголт юм (Википедиагийн холбогдох нийтлэлүүдийг үзнэ үү). Энд би "гистограмм" гэсэн үгийг хоёр ойлголтын хувьд ашиглах болно, мөн өгөгдлийн мөн чанар нь өөрөө ярьдаг гэж үзэж байна.

Хэрэв бид зураг руу буцаж ирвэл. 1, ggplot2 нь графикийн байршлыг тогтоох хэд хэдэн ашигтай сонголтыг өгдөг (өгөгдмөл утга нь position="stack"):

> qplot(тодорхой байдал, өгөгдөл=алмаз, геом="бар", дүүргэх=таслах, байрлал="бултах") > qplot(тодорхой байдал, өгөгдөл=алмаз, геом="бар", дүүргэх=таслах, байрлал="бөглөх") > qplot(тодорхой байдал, өгөгдөл=очир алмааз, геом = "бар", дүүргэх = таслах, байрлал = "баримтлал")

Санал болгож буй хувилбаруудын эхнийх нь зурагт үзүүлсэн шиг диаграммуудыг зэрэгцүүлэн бүтээдэг. 5, хоёр дахь нь өгөгдсөн тунгалаг алмазын нийт тоонд өөр өөр зүссэн чанарын алмаазын эзлэх хувийг харуулав (Зураг 6).

Одоо бодит гистограмын жишээг авч үзье.

> qplot(карат, өгөгдөл=алмаз, геом="гистограм", зурвасын өргөн=0.1) > qplot(карат, өгөгдөл=алмаз, геом="гистограм", зурвасын өргөн=0.05)

Энд зурвасын өргөний параметр нь гистограммд хэр өргөн зурвас байгааг харуулж байна. Гистограм нь аль мужид хэр их өгөгдөл байгааг харуулдаг. Үр дүнг зурагт үзүүлэв. 7 ба 8.

Заримдаа загвар (шугаман эсвэл олон гишүүнт гэх мэт) бүтээх шаардлагатай үед бид үүнийг qplot дээр хийж, үр дүнг нь харж болно. Жишээлбэл, бид mpg-ийг массын жингийн эсрэг шууд тархалтын график дээр зурж болно.

> qplot(wt, mpg, data=mtcars, geom=c("цэг", "гөлгөр"))

Өгөгдмөл байдлаар, орон нутгийн олон гишүүнт регрессийг (method="loess") загвар болгон ашиглах болно. Ажлын үр дүн нь зурагт үзүүлсэн шиг харагдах болно. 9, хар саарал баар нь стандарт алдаа юм. Энэ нь анхдагч байдлаар харагдана, та se=FALSE гэж бичээд дэлгэцийг нь унтрааж болно.

Хэрэв бид энэ өгөгдөл дээр шугаман загварыг сунгахыг хүсвэл method=lm гэж зааж өгснөөр үүнийг хийж болно (Зураг 10).

Эцэст нь, мэдээжийн хэрэг та дугуй диаграмыг хэрхэн бүтээхийг харуулах хэрэгтэй.

>т<- ggplot(mtcars, aes(x=factor(1), fill=factor(cyl))) + geom_bar(width=1) >t + коордын_туйлт(тета="y")

Энд бид илүү уян хатан ggplot функцийг ашиглах болно. Энэ нь дараах байдлаар ажилладаг: эхлээд бид нийт масс дахь янз бүрийн тооны цилиндртэй машинуудын эзлэх хувийг харуулсан графикийг бүтээдэг (Зураг 11), дараа нь бид графикийг туйлын координат болгон хөрвүүлдэг (Зураг 12).

Дүгнэлтийн оронд

Одоо бид R-г ашиглахад бэлэн боллоо. Дараа нь юу вэ? Энд ggplot2-ын хамгийн үндсэн шинж чанаруудыг өгсөн бөгөөд векторжуулалттай холбоотой асуудлуудыг авч үзсэн нь ойлгомжтой. R-ийн талаар дурдах нь зүйтэй хэд хэдэн сайн ном байдаг бөгөөд тэдгээр нь үнэхээр сэтгэл хөдлөм сайхан сэтгэлтэй корпорацийн үйлчилгээнээс илүү зөвлөгөө өгөх нь зүйтэй юм. Нэгдүгээрт, Норман Матлоффын R програмчлалын урлаг. Хэрэв та R хэл дээр программчлах туршлагатай бол Патрик Бернсийн бичсэн The R Inferno танд хэрэг болно. Жон Чемберсийн бичсэн "Өгөгдлийн шинжилгээнд зориулсан програм хангамж" хэмээх сонгодог ном нь бас тохиромжтой.

Хэрэв бид R хэлээр дүрслэх талаар ярих юм бол W. Chang (Winston Chang) -ийн R Graphics Cookbook сайн ном байдаг. Энэ нийтлэл дэх ggplot2-ийн жишээг зааварчилгаанаас авсан болно: ggplot2. Дараагийн "Өгөгдлийн шинжилгээ ба R хэл дээрх машин сургалт" нийтлэлээр уулзацгаая!

"R өвсний үндэс жимсний навчийг АШИГЛАСАН СТАТИСТИК ШИНЖИЛГЭЭ, ӨГӨГДӨЛИЙГ ДҮРСҮҮЛЭХ ХИЙДЭЛберг - Лондон - Тольятти 2014,..."

-- [ Хуудас 1 ] --

С.Э. Мастицкий, В.К. Шитиков

СТАТИСТИК ШИНЖИЛГЭЭ БА

Р

өвсний үндэс жимсний навч

Хайдельберг - Лондон - Тольятти

2014 он, Сергей Эдуардович Мастицкий, Владимир Кириллович Шитиков

Вэбсайт: http://r-analytics.blogspot.com

Энэ ажлыг лицензийн дагуу түгээдэг

Creative Commons "Атрибут - Арилжааны бус

ашиглах – Дэлхий даяар ижил нэр томъёо 4.0”. Энэхүү лицензийн дагуу та зохиогчид болон эх сурвалжийг тодорхой зааж өгсөн тохиолдолд энэ бүтээлийг чөлөөтэй хуулж, тарааж, өөрчилж болно. Хэрэв та энэ ажлыг өөрчлөх эсвэл ажилдаа ашиглах юм бол үр дүнг зөвхөн ижил эсвэл ижил төстэй лицензийн дагуу тарааж болно. Энэхүү бүтээлийг зохиогчийн зөвшөөрөлгүйгээр арилжааны зорилгоор ашиглахыг хориглоно. Лицензийн талаарх дэлгэрэнгүй мэдээллийг www.creativecommons.com сайтаас авна уу

Энэ номыг дараах байдлаар харна уу.

Мастицкий С.Е., Шитиков В.К. (2014) Статистикийн шинжилгээ ба өгөгдлийн дүрслэл Р.

Цахим ном, хандалтын хаяг:

http://r-analytics.blogspot.com

ӨМНӨХ ҮГ 5

1. СТАТИСТИКИЙН ОРЧНЫ ҮНДСЭН БҮРДЭЛТ R 8


1.1. Үүссэн түүх, зохион байгуулалтын үндсэн зарчим 8 R орчин

1.2. R 11 командын консолын интерфейстэй ажиллах

1.3. R Commander 13 багц цэстэй ажиллах

1.4. Объект, багц, функц, төхөөрөмж 17

2. ХЭЛНИЙ ТОДОРХОЙЛОЛТ R 23

2.1. R 23 Өгөгдлийн төрлүүд

2.2. Вектор ба матриц 24

2.3. Хүчин зүйл 29

2.4. Жагсаалт ба хүснэгт 31

2.5. R 37 руу өгөгдөл импортлох

2.6. Огноо, цагийг дүрслэх; цаг хугацааны цуврал 40

2.7. Тооцооллын зохион байгуулалт: функц, салбар, гогцоо 46

2.8. Application-50 функцийг ашиглан R хэл дээрх векторжуулсан тооцоолол

3. ГРАФИКИЙН ҮНДСЭН ОНЦЛОГ R 58

3.1. plot() 58 функцын график болон графикийн параметрүүд

3.2. Гистограмм, цөмийн нягтын функц, 66 cdplot() функц

3.3. Спан диаграм 74

3.4. Дугуй ба баганан график 77

3.5. Кливленд ба 1D тархалтын график 84

4. ТОДОРХОЙЛОЛТЫН СТАТИСТИК, ХЭРЭГСЭЛ 97

ТАРХИАЛТ

–  –  –

ӨМНӨХ ҮГ

Дэлхий ертөнцийг танин мэдэх гол хэрэгслүүдийн нэг бол янз бүрийн эх сурвалжаас хүний ​​хүлээн авсан өгөгдлийг боловсруулах явдал юм. Орчин үеийн статистик шинжилгээний мөн чанар нь ирж буй мэдээллийн урсгалыг судлах, дүрслэх, тайлбарлахаас бүрдэх интерактив үйл явц юм.

Сүүлийн 50 жилийн түүх бол өгөгдөлд дүн шинжилгээ хийх технологийн хөгжлийн түүх мөн.

Зохиогчдын нэг нь 1960-аад оны сүүлч, 200 гаруй кг жинтэй "Промин-2" хувийн компьютерийн 150 нүднээс "үйл ажиллагааны талбар" дээр металл тээглүүрээр шивсэн анхны хос корреляцийн тооцооны программыг дурсан санаж байна.

Өнөө үед өндөр хүчин чадалтай, боломжийн үнэтэй компьютерууд програм хангамжМэдээллийн технологийн үйл явцын бүрэн мөчлөгийг хэрэгжүүлэх боломжийг олгодог бөгөөд энэ нь ерөнхийдөө дараах үе шатуудаас бүрддэг.

° боловсруулсан өгөгдөлд хандах (тэдгээрийг өөр өөр эх сурвалжаас ачаалах, хоорондоо холбогдсон эх сурвалжийн хүснэгтүүдийг бөглөх);

° ачаалагдсан үзүүлэлтүүдийг засварлах (дутуулагдсан утгыг солих, устгах, функцуудыг илүү тохиромжтой хэлбэрт хөрвүүлэх);

° өгөгдлийн тайлбар (өгөгдлийн хэсэг бүр юу болохыг санах);

° хүлээн авах ерөнхий мэдээлэлөгөгдлийн бүтцийн тухай (шинжилсэн үзүүлэлтүүдийг тодорхойлохын тулд тайлбарлах статистикийг тооцоолох);

° өгөгдөл, тооцооллын график дүрслэл нь ойлгомжтой мэдээллийн хэлбэрийг бий болгодог (нэг зураг үнэндээ заримдаа мянган үгтэй байдаг);

° өгөгдлийн загварчлал (хамаарал олох, статистик таамаглалыг шалгах);

° үр дүнг танилцуулах (хүснэгт, хэвлэн нийтлэх чанарын хүснэгтийг бэлтгэх).

Хэрэглэгчийн үйлчилгээний олон арван багц байгаа нөхцөлд хэрэглээний программууд, сонголтын асуудал хамааралтай (хэрэв бид "буридан илжиг" -ийг эргэн санавал заримдаа эмгэнэлтэй байдаг): практик ажилд ямар өгөгдөл шинжилгээний програм хангамжийг илүүд үзэх ёстой вэ? Энэ нь ихэвчлэн шийдэгдэж буй асуудлын онцлог, боловсруулах алгоритмын үр ашиг, програм худалдаж авах зардал, мөн шинжээчийн амт, хувийн сонголт зэргийг харгалзан үздэг. Үүний зэрэгцээ, жишээ нь, Statistica загвар нь цэсийн товчлууруудын механик багц нь тооцоолох үйл явцын явцыг бие даан хянахыг илүүд үздэг бүтээлч судлаачдын сэтгэлд нийцэхгүй. нэгтгэх Төрөл бүрийн төрөлдүн шинжилгээ хийх, завсрын үр дүнд хандах, өгөгдлийн дэлгэцийн хэв маягийг хянах, өөрийн өргөтгөлүүдийг нэмэх програм хангамжийн модулиудэцсийн тайлангуудыг Matlab, SPSS гэх мэт өндөр түвшний командын хэлний хэрэгслүүдийг багтаасан арилжааны тооцооллын системүүд шаардлагатай хэлбэрээр бэлтгэж болно. Тэдгээрийн маш сайн хувилбар бол орчин үеийн, байнга хөгжиж буй ерөнхий програм болох үнэгүй R програм хангамжийн орчин юм. -зорилготой статистик платформ.



Өнөөдөр R нь чөлөөтэй тархсан статистикийн шинжилгээний системүүдийн дунд маргаангүй тэргүүлэгч болж байгаа нь жишээ нь 2010 онд R систем жил бүр болдог Bossie Awards нээлттэй эхийн программ хангамжийн уралдаанд хэд хэдэн төрөлд ялагч болсон нь нотлогддог. Дэлхийн тэргүүлэгч их сургуулиуд, томоохон компаниудын шинжээчид, судалгааны төвүүд шинжлэх ухаан, техникийн тооцоолол хийх, мэдээллийн томоохон төслүүдийг бий болгохдоо R-г байнга ашигладаг. Энэхүү хүрээлэн буй орчны багцад суурилсан статистикийг өргөнөөр сургаж, шинжлэх ухааны нийгэмлэгийн бүх талын дэмжлэгтэйгээр R скриптийг авчрах нь аажмаар сэтгүүлийн нийтлэл, эрдэмтдийн хоорондын албан бус харилцааны аль алинд нь нийтээр хүлээн зөвшөөрөгдсөн "стандарт" болж байгааг харуулж байна. ертөнц.

Орос хэлээр ярьдаг хэрэглэгчдэд R-ийг эзэмшихэд тулгарч буй гол бэрхшээл нь мэдээжийн хэрэг, энэ орчны бараг бүх баримт бичиг англи хэл дээр байдаг. Зөвхөн 2008 оноос хойш А.В. Шипунова, Е.М. Балдина, С.В. Петрова, И.С. Зарядова, А.Г. Буховец болон бусад сонирхогчид, арга зүйн гарын авлага, номууд орос хэл дээр гарч ирэв (тэдгээрийн холбоосыг энэ номын төгсгөлд байгаа лавлагааны жагсаалтаас олж болно; холбоосууд боловсролын нөөц, зохиогчид нь орос хэлээр ярьдаг хэрэглэгчдийн дунд R-ийг сурталчлахад бодит хувь нэмэр оруулдаг).

Энэхүү гарын авлагад 2011 оноос хойш "R: Өгөгдлийн шинжилгээ ба дүрслэл" блогт зохиогчдын нэгний нийтэлсэн арга зүйн нийтлэлүүдийг нэгтгэн харуулав.

(http://r-analytics.blogspot.com). Уншигчдын тав тухыг хангах үүднээс энэ бүх хэсэгчилсэн материалыг төвлөрсөн хэлбэрээр толилуулж, бүрэн гүйцэд болгохын тулд зарим хэсгийг өргөжүүлэх нь зүйтэй болов уу.

Эхний гурван бүлэгт R-ийн интерактив бүрэлдэхүүн хэсгүүдтэй ажиллах дэлгэрэнгүй заавар, хэлний дэлгэрэнгүй тайлбар, орчны үндсэн график шинж чанарууд багтсан болно.

Номын энэ хэсэг нь програмчлалын чиглэлээр анхлан суралцаж буй хүмүүст ойлгомжтой боловч R хэлийг мэддэг уншигч тэндээс сонирхолтой кодын хэсгүүдийг олох эсвэл график параметрүүдийн тайлбарыг лавлагаа болгон ашиглаж болно.

Дараах бүлгүүдэд (4-8) өгөгдөл боловсруулах, статистик загвар бүтээх нийтлэг журмыг тайлбарласан бөгөөд үүнийг хэдэн арван жишээгээр дүрсэлсэн болно. Үүнд: Товч тодорхойлолтшинжилгээний алгоритмууд, олж авсан үндсэн үр дүн, тэдгээрийн боломжит тайлбар. Бид аль болох хэрэглээний статистикийн олон тооны гарын авлагын онцлог шинж чанартай "зан үйлийн" үг хэллэгийг буруугаар ашиглахгүйгээр хийхийг хичээсэн, сайн мэддэг теоремуудыг иш татсан, олон түвшний тооцооллын томъёог авчирсан. Үүнд юун түрүүнд онцолсон практик хэрэглээ- ингэснээр уншигч уншсан зүйлдээ хөтлөгдөн мэдээлэлдээ дүн шинжилгээ хийж, үр дүнг хамтран ажиллагсаддаа танилцуулах боломжтой болно.

Энэ хэсгийн хэсгүүдийг танилцуулсан материалын нарийн төвөгтэй байдал болгон барьсан болно.

4, 5-р бүлгүүд нь зөвхөн их сургуулийн анхан шатны сургалтын хүрээнд статистикийг сонирхдог уншигчдад зориулагдсан болно. 6, 7-р бүлэгт ерөнхий шугаман загваруудын нэгдсэн онолын хүрээнд дисперс ба регрессийн шинжилгээг танилцуулж, загваруудыг судлах, бүтцийн хувьд тодорхойлох янз бүрийн алгоритмуудыг үзүүлэв. 8-р бүлэг зарим хүмүүст зориулагдсан орчин үеийн аргуудерөнхий регрессийн загвар бүтээх, дүн шинжилгээ хийх.

Судлаач орон зайн дүн шинжилгээ хийх, үр дүнг газарзүйн газрын зураг, диаграмм дээр харуулахыг байнга сонирхож байдаг тул 9-р бүлэгт ийм дүрслэх аргуудын зарим жишээг үзүүлэв.

Бид арга зүйн гарын авлагыг оюутнууд, аспирантууд, түүнчлэн R орчинг ашиглан өгөгдөлд дүн шинжилгээ хийж, дүрслэн харуулахыг сурах хүсэлтэй залуу, нэр хүндтэй эрдэмтэдэд зориулж байна. Энэхүү гарын авлагыг уншсаны эцэст та хэрхэн ажиллах талаар тодорхой ойлголттой болно гэж найдаж байна. R ажилладаг бөгөөд эндээс нэмэлт мэдээлэл авах боломжтой, мөн энгийн бөгөөд нэлээд төвөгтэй өгөгдөлд дүн шинжилгээ хийх даалгавруудыг хэрхэн шийдвэрлэх талаар.

Номын бүх бүлгүүдийн R кодын скрипт бүхий файлууд, мөн тэдгээрийг гүйцэтгэхэд шаардлагатай анхны өгөгдлийн хүснэгтүүдийг GitHub репозитороос https://github.com/ranalytics/r-tutorials-аас үнэгүй татаж авах боломжтой. ОХУ-ын ШУА-ийн Волга мөрний сав газрын экологийн хүрээлэнгийн вэбсайтаас http://www.ievbras.ru/ecostat/Kiril/R/Scripts.zip линкээс авна уу.

Энэхүү гарын авлагын текстийг зохиогчийн хэвлэлд танилцуулсан тул бидний бүх хүчин чармайлтыг үл харгалзан үсгийн алдаа, дүрмийн алдаа, бүтэлгүй хэллэг байх магадлалтай гэдгийг тэмдэглэх нь зүйтэй. Эдгээр болон бусад илэрсэн дутагдлуудыг цахим шуудангаар мэдээлсэн уншигч танд бид талархах болно. [имэйлээр хамгаалагдсан]Мөн энэ ажлын талаар та бүхний санал хүсэлт, санал хүсэлт байвал бид талархах болно.

–  –  –

1. СТАТИСТИКИЙН ОРЧНЫ ҮНДСЭН БҮРДЭЛТҮҮД Р

1.1. R орчин үүссэн түүх ба зохион байгуулалтын үндсэн зарчмууд Статистикийн дүн шинжилгээ ба өгөгдлийг дүрслэх R систем нь дараахь үндсэн хэсгүүдээс бүрдэнэ.

° өндөр түвшний програмчлалын хэл R бөгөөд энэ нь нэг мөрөнд объект, вектор, матриц, жагсаалт гэх мэт янз бүрийн үйлдлийг хэрэгжүүлэх боломжийг олгодог;

° тусдаа багц (багц) -д цуглуулсан өгөгдөл боловсруулах олон тооны функц;

° Орчны бүрэлдэхүүн хэсгүүдийн шинэчлэлтүүд, онлайн тусламж, R-ийн анхан шатны сургалт болон шинээр гарч ирж буй бэрхшээлүүдийн талаар дараагийн зөвлөгөө өгөхөд зориулагдсан төрөл бүрийн боловсролын нөөцүүдийг багтаасан дэвшилтэт дэмжлэгийн систем.

Аяллын эхлэл нь 1993 онд Шинэ Зеландын хоёр залуу эрдэмтэн Росс Ихака, Роберт Жентельман нар шинэ бүтээн байгуулалтаа зарлаж, R гэж нэрлэснээс хойш эхэлсэн. Тэд арилжааны статистик мэдээлэл боловсруулах дэвшилтэт системийн програмчлалын хэлийг үндэс болгон авчээ. - PLUS болон нээлттэй эхийн үнэгүй хэрэгжилтийг бий болгосон бөгөөд энэ нь амархан өргөтгөх боломжтой модульчлагдсан архитектураараа өвөг дээдсээсээ ялгаатай. Удалгүй "CRAN" (Цогц R архивын сүлжээ - http://cran.r-project.org) гэсэн товчлолоор алдартай R-д багцуудыг хадгалах, түгээх тархсан систем бий болсон нь зохион байгуулах гол санаа юм. Энэ нь өгөгдөл боловсруулах хэрэглүүрийг байнга өргөжүүлэх, хамтын туршилт, үйл ажиллагааны тархалт юм.

Олон мянган амин хувиа хичээсэн оюуны хөгжүүлэгчдийн хүчирхэг "хамтын оюун ухаан" -ын тасралтгүй, сайн уялдаатай хүчин чармайлтын ийм бүтээгдэхүүн нь лицензийн өртөг нь хэдэн мянган доллар байж болох арилжааны статистикийн хөтөлбөрүүдээс хамаагүй илүү үр дүнтэй болох нь тогтоогджээ. . R бол мэргэжлийн статистикчдын дуртай хэл учраас хүн бүр сүүлийн үеийн ололт амжилтСтатистикийн шинжлэх ухаан нь дэлхий даяарх R хэрэглэгчдэд нэмэлт номын сан хэлбэрээр маш хурдан нэвтэрч байна. Өнөөдөр ямар ч арилжааны статистикийн шинжилгээний систем ийм хурдацтай хөгжиж чадахгүй байна. R нь нэмэлт номын сангийн зохиогчид болон R системд алдааны талаар мэдээлдэг олон тооны хэрэглэгчдийн армитай бөгөөд тэдгээрийг цаг алдалгүй засдаг.

R тооцооллын хэл нь хэдийгээр үүнийг эзэмшихийн тулд бага зэрэг хүчин чармайлт, гайхалтай хайлтын ур чадвар, нэвтэрхий толь бичгийн санах ой шаардагддаг ч олон янзаараа бараг "атом шиг шавхагдашгүй" тооцооллыг хурдан гүйцэтгэх боломжийг олгодог. 2014 оны 7-р сарын байдлаар дэлхийн өнцөг булан бүрт байгаа сонирхогчид R-д зориулж 6,739 нэмэлт номын сан бичсэн бөгөөд үүнд 137,506 функц (доороос харна уу).

http://www.rdocumentation.org), энэ нь системийн үндсэн боломжуудыг ихээхэн өргөжүүлдэг. Өнөөдөр R багц хэлбэрээр хэрэгжээгүй байгаа статистикийн аргуудын аль нэгийг төсөөлөхөд маш хэцүү байдаг, үүнд мэдээжийн хэрэг бүхэл бүтэн "ноёнтны багц": шугаман болон ерөнхий шугаман загварууд, шугаман бус регрессийн загварууд, туршилтууд орно. дизайн, цагийн цувааны шинжилгээ, сонгодог параметрийн болон параметрийн бус тест, Байесийн статистик, кластерийн шинжилгээ, тэгшитгэх аргууд. Дүрслэх хүчирхэг хэрэгслүүдийн тусламжтайгаар шинжилгээний үр дүнг янз бүрийн график, график хэлбэрээр нэгтгэн дүгнэж болно. Уламжлалт статистик мэдээллээс гадна боловсруулсан функц нь тоон математик, оновчлолын арга, дифференциал тэгшитгэлийг шийдвэрлэх, хэв маягийг таних гэх мэт олон тооны алгоритмуудыг агуулдаг. Генетик ба социологич, хэл шинжлэлийн болон сэтгэл судлаачид, химич ба эмч нар, ГМС, вэб технологийн мэргэжилтнүүд.

R дээрх "өмчлөлийн" баримт бичиг нь маш том бөгөөд үргэлж ухаалаг бичигдээгүй байдаг (Англи хэл дээрх уран зохиолын хачирхалтай уламжлалын дагуу өчүүхэн үнэнийг тайлбарлахад хэтэрхий олон үг зарцуулдаг, харин чухал цэгүүдийг хэлээр мушгиж бичдэг). Гэсэн хэдий ч үүнээс гадна дэлхийн тэргүүлэгч хэвлэн нийтлэгчид (Springer, Cambridge University Press ба Chapman & Hall / CRC) эсвэл зүгээр л сонирхогчдын бүлгүүд R хэл дээрх мэдээллийн шинжилгээний янз бүрийн талыг тодорхойлсон асар олон тооны ном хэвлүүлсэн (жишээлбэл, үзнэ үү). , "Психодиагностикийн нэвтэрхий толь" вэбсайт дахь лавлагааны жагсаалт, http://psylab.info/R: Уран зохиол). Нэмж дурдахад, олон улсын болон Оросын R хэрэглэгчийн хэд хэдэн идэвхтэй форумууд байдаг бөгөөд хэн ч асуудалтай холбоотой тусламж хүсч болно. Лавлагааны жагсаалтад бид танд лавлахыг зөвлөж буй хэдэн зуун ном, интернет холбоосыг өгдөг. Онцгой анхааралсурч байхдаа Р.

шууд суралцах практик ажил R хэл нь a) R хэлний бүтцийг эзэмших, өгөгдлийн шинжилгээ хийдэг функцуудыг дуудах онцлогтой танилцах, б) өгөгдөлд дүн шинжилгээ хийх, дүрслэх тусгай аргуудыг хэрэгжүүлдэг програмуудтай ажиллах ур чадвар эзэмшихээс бүрдэнэ.

R хэрэглэгчийн интерфейсийн хэрэгслүүдийн сонголт нь хоёрдмол утгатай бөгөөд хэрэглэгчдийн амтаас ихээхэн хамаардаг. Эрх мэдэлтэй мэргэжилтнүүдийн дунд ч зөвшилцөлд хүрээгүй байна.

Зарим нь стандарт R консол интерфэйсээс илүү сайн зүйл байхгүй гэж үздэг бол зарим нь хялбар ажиллахын тулд товчлуурын цэсийн баялаг багц бүхий боломжтой нэгдсэн хөгжүүлэлтийн орчны (IDE) аль нэгийг суулгах нь зүйтэй гэж үздэг. Жишээлбэл, гайхалтай сонголтнь RStudio-ийн үнэгүй хөгжүүлэлтийн нэгдсэн орчин юм.

Доор бид консолын хувилбарын тайлбар дээр анхаарлаа төвлөрүүлж, R Commander-тэй хамтран ажиллах болно, гэхдээ Шипунов нар номын хавсралтад үзүүлсэн IDE-ийн янз бүрийн хувилбаруудын тойм нь уншигчдын цаашдын хайлтанд туслах болно. (2014).

R-шинжээчдийн нэг Жозеф Рикерт R сурах үйл явцыг дараах үе шатуудад хувааж болно гэж үзэж байна (дэлгэрэнгүй мэдээллийг үзнэ үү.

inside-r.org дээр түүний нийтлэл):

1. R нийгэмлэгийн нийтлэг соёл, R хэлийг хөгжүүлж, ажиллуулж байсан програмчлалын орчинтой танилцах.Үндсэн болон туслах эх сурвалжуудаар зочилж, танилцуулга сурах бичгийг сайн эзэмшсэн байх. Хэрэглэгчийн компьютер дээр R суулгаж, эхний туршилтын скриптүүдийг ажиллуулж байна.

2. Үйлдлийн системийн стандарт файлуудаас өгөгдлийг уншиж, хэрэглэгчдэд танил болсон хязгаарлагдмал статистик шинжилгээний процедурыг гүйцэтгэхийн тулд R-функцуудыг итгэлтэйгээр ашиглах.

3. R ​​хэлний үндсэн бүтцийг ашиглан энгийн программ бичих.

Өөрийнхөө функцуудыг бичих. R-ийн ажиллах боломжтой өгөгдлийн бүтэц болон хэлний илүү дэвшилтэт боломжуудтай танилцаарай. Өгөгдлийн сан, вэб хуудас, гадаад мэдээллийн эх сурвалжтай ажиллах.

4. Нарийн төвөгтэй программуудыг R хэлээр бичих S3, S4 анги гэж нэрлэгддэг объектын бүтцийг бие даан хөгжүүлэх, гүнзгий ойлгох.

5. Хөгжил мэргэжлийн хөтөлбөрүүд R хэл дээр R-д зориулсан номын сангийн нэмэлт модулийг өөрөө бий болгох.

Ихэнх энгийн R хэрэглэгчид 3-р шатанд зогсдог, учир нь

Энэ хугацаанд олж авсан мэдлэг нь тэдний үндсэн мэргэжлийн үйл ажиллагааны чиглэлээр статистикийн ажлыг гүйцэтгэхэд хангалттай юм.

Энэ боть талаар бид энэхүү гарын авлагын хүрээнд R хэлний тайлбарыг өгдөг.

Үндсэн R статистик орчныг суулгах, тохируулах нь маш хялбар. 2014 оны 7-р сарын байдлаар одоогийн хувилбар нь 32 ба 64 битийн Windows-д зориулсан R 3.1.1 (бусад бүх нийтлэг үйлдлийн системд зориулсан түгээлтийн иж бүрдэл бас байдаг). Та системийн түгээлтийн иж бүрдлийг 29 багц (54 мегабайт) үндсэн багцын хамт төслийн үндсэн сайт http://cran.r-project.org эсвэл Оросын "толин тусгал" http:/-аас бүрэн үнэ төлбөргүй татаж авах боломжтой. /cran.gis-lab.info. Татаж авсан түгээлтээс системийг суулгах үйл явц нь ямар ч хүндрэл учруулахгүй бөгөөд тусгай тайлбар шаарддаггүй.

Скрипт, анхны өгөгдөл, тооцооллын үр дүнг хадгалахад тохиромжтой байхын тулд хэрэглэгчийн компьютер дээр тусгай ажлын лавлахыг хуваарилах нь зүйтэй. Ажлын лавлахын нэрэнд кирилл үсгийг ашиглах нь туйлын зохисгүй юм.

Ажлын лавлах руу очих зам болон бусад тохиргооны сонголтыг дурын текст засварлагчаар өөрчлөх замаар байрлуулахыг зөвлөж байна. системийн файл C:\Program Files\R\Retc\Rprofile.site (энэ нь таны компьютер дээр өөр байршилтай байж болно). Доорх жишээнд өөрчлөгдсөн мөрүүдийг ногооноор тэмдэглэсэн байна.

Эдгээр мөрүүд нь ажлын лавлахыг зааж өгөхөөс гадна R багцуудыг татаж авах Оросын эх сурвалжийн холбоосыг тодорхойлдог. автомат эхлүүлэх R командлагч.

Rprofile.site файлын жагсаалт # "#" тайлбар тэмдэгтийн дараа орсон бүх зүйлийг орчин үл тоомсорлодог # options(papersize="a4") # options(editor="notepad") # options(pager="дотоод") # set display төрөл суурь мэдээлэл# сонголтууд(тусламжийн_төрөл="текст") сонголтууд(help_type="html") # орон нутгийн номын сангийн байршлыг тохируулах #.Library.site - file.path(chartr("\\", "/", R.home()) , "site-library") # Орчноо ачаалах үед R Commander цэсийг ажиллуулна уу # Хэрэв Rcmdr шаардлагагүй бол "#" тэмдэг тавина уу локал(( хуучин - getOption("defaultPackages") сонголтууд(defaultPackages = c(хуучин, "Rcmdr") ) )) # CRAN толин тусгалыг тодорхойлох локал((r - getOption("repos") r["CRAN"] - "http://cran.gis-lab" сонголтууд(repos=r))) # Ажлын лавлах руу очих замыг тодорхойлох (таны компьютер дээрх бусад дурын) setwd("D:/R/Process/Resampling") "Сайн танилцуулах заавар"-ын хувьд бидний зөвлөмжүүдийн аль нэг нь субъектив байх болно. Гэсэн хэдий ч В.Венаблс, Д.Смит нарын албан ёсоор хүлээн зөвшөөрөгдсөн R-ийн танилцуулга (Venables, Smith, 2014) болон Р.Кабаковын (Кабако, 2011) номыг дурдах хэрэгтэй, учир нь тэдгээрийн орос орчуулга байдаг. Голландын атаархлыг төрүүлэхүйц байдлаар бичсэн уламжлалт "даммигийн заавар" (Meys, Vries, 2012) болон гарын авлагыг (Лам, 2010) тэмдэглэх нь зүйтэй. Орос хэлний анхан шатны сургалтуудаас хамгийн бүрэн гүйцэд нь И.Зарядов (2010а), А.Шипунов нарын номууд юм. (2014).

1.2. R интерфэйсийн бүрхүүлтэй ажиллах R статик орчин нь скрипт файлд агуулагдах эсвэл консолоос өгөгдсөн командуудын дараалалаар илэрхийлэгдсэн R хэлний ямар ч утга учиртай заавруудыг гүйцэтгэдэг. Товчлуур цэсэнд дассан орчин үеийн хэрэглэгчдэд консолтой ажиллах нь хэцүү байдаг, учир нь та тус тусын командын синтаксийг цээжлэх хэрэгтэй. Гэсэн хэдий ч зарим ур чадвар эзэмшсэний дараа өгөгдөл боловсруулах олон процедурыг ижил Statistica багцаас илүү хурдан бөгөөд хүндрэл багатай гүйцэтгэх боломжтой болж байна.

R консол нь хэрэглэгч команд оруулж, тэдгээрийн гүйцэтгэлийн үр дүнг хардаг харилцах цонх юм. Энэ цонх нь орчин ажиллаж эхлэхэд шууд гарч ирнэ (жишээлбэл, ширээний компьютер дээрх R товчлол дээр дарсны дараа). Нэмж дурдахад стандарт R график хэрэглэгчийн интерфэйс (RGui) нь скрипт засварлах цонх, график мэдээлэл (зураг, диаграмм гэх мэт) бүхий гарч ирэх цонхнуудыг агуулдаг.

Тушаалын горимд R нь ердийн тооны машин шиг ажиллах боломжтой.

Сануулах тэмдэгтийн баруун талд хэрэглэгч дурын арифметик илэрхийлэл оруулаад Enter товчийг дараад үр дүнг шууд авах боломжтой.

Жишээлбэл, дээрх зурган дээрх хоёрдахь тушаалд бид хүчин зүйлийн болон синус функцууд, түүнчлэн суурилуулсан p тоог ашигласан. Текст хэлбэрээр олж авсан үр дүнг хулганаар сонгож, санах ойгоор үйлдлийн системийн дурын текст файл руу хуулж болно (жишээлбэл, Word баримт).

RGui-тэй ажиллахдаа бид бүх тохиолдолд скрипт (өөрөөр хэлбэл тодорхой үйлдлийг гүйцэтгэдэг R командын дараалал) бүхий файл үүсгэхийг зөвлөж байна. Дүрмээр бол энэ нь ямар ч нэртэй энгийн текст файл юм (гэхдээ тодорхой болгохын тулд *.r өргөтгөлтэй байх нь дээр) бөгөөд үүнийг Notepad гэх мэт ердийн засварлагчаар үүсгэж, засах боломжтой. Хэрэв энэ файл байгаа бол түүнийг ажлын санд байрлуулах нь зүйтэй бөгөөд R-г эхлүүлж, "Файл нээх скрипт" цэсийн зүйлийг сонгосны дараа энэ файлын агуулга "R Editor" цонхонд гарч ирнэ. Та "Бүгдийг нь ажиллуулах" цэсийн зүйлээс скрипт командуудын дарааллыг гүйцэтгэж болно.

Мөн та хулганаар бэлтгэсэн скриптийн аль ч газраас утга учиртай фрагментийг (нэг хувьсагчийн нэрээс бүхэлд нь агуулга хүртэл) сонгож, энэ блокыг ажиллуулах боломжтой. Үүнийг үндсэн болон дөрвөн аргаар хийж болно контекст цэс, Ctrl+R товчлуурын хослол эсвэл хэрэгслийн самбар дээрх товчлуур.

Зураг дээр дараахь үйлдлүүдийг гүйцэтгэсэн.

° R-object gadm-ийг Бүгд Найрамдах Беларусь улсын нутаг дэвсгэрийн хуваарийн талаархи мэдээлэл бүхий Global Administrative Areas (GADM) үнэгүй интернет эх сурвалжаас татаж авсан;

° Хотуудын латинчилсан нэрийг түгээмэл хэрэглэгддэг дүйцэхүйц нэрээр сольсон;

° sp багцын spplot() функцийг ашиглан график цонхонд бүгд найрамдах улсын захиргааны газрын зургийг харуулсан бөгөөд үүнийг цэсийг ашиглан санах ойд хуулж эсвэл стандарт мета эсвэл растер график файл болгон хадгалах боломжтой.

Дараах хэсгүүдэд бид бие даасан операторуудын утгыг илүү нарийвчлан авч үзэх болно, гэхдээ энд бид скриптээс сонгож, тэмдэгтүүдийг хослуулан ажиллуулахад анхаарлаа хандуулах болно. [имэйлээр хамгаалагдсан], бид консолын цонхонд тухайн объектын бүх өгөгдлийн багц болон сонгосон gadm тэмдэгтүүдээс бүрдэх командыг хүлээн авах болно. [имэйлээр хамгаалагдсан]$NAME_1 нь админ төвийн нэрсийн жагсаалтыг өөрчлөхөөс өмнө болон дараа нь бидэнд өгөх болно.

Иймээс R Editor нь скриптээр аялах, командын дурын хослолыг засварлах, гүйцэтгэх, кодын зарим хэсгийг хайх, солих зэрэгт хялбар болгодог. Дээр дурдсан RStudio нэмэлт нь кодын синтаксийг тодруулах, автоматаар бөглөх, тушаалын дарааллыг дараа нь ашиглах функц болгон "баглах", Sweave эсвэл TeX баримт бичигтэй ажиллах болон бусад үйлдлүүдийг гүйцэтгэх боломжийг олгодог. дэвшилтэт хэрэглэгч.

R нь RGui-ээс шууд хандах боломжтой өргөн хүрээний тусламжийн материалуудтай.

Консолоос help.start() командыг гаргаснаар таны интернет хөтөч дээр бүх тусламжийн эх сурвалжид хандах боломжтой хуудас нээгдэнэ: үндсэн гарын авлага, зохиогчийн материал, болзошгүй асуултын хариулт, өөрчлөлтийн жагсаалт, бусад R объектуудын тусламжийн холбоос гэх мэт. .d.:

Дараах командуудыг ашиглан бие даасан функцүүдийн тусламжийг авч болно.

° тусламж("foo") эсвэл? foo - foo функц дээр тусламж (ишлэл нь нэмэлт);

° help.search("foo") эсвэл ?? foo - foo агуулсан бүх тусламжийн файлуудыг хайх;

° жишээ("foo") – foo функцийг ашиглах жишээ;

° RSiteSearch("foo") – онлайн гарын авлага болон захидлын жагсаалтын архиваас холбоос хайх;

° apropos("foo", mode="function") – foo хослолтой бүх функцуудын жагсаалт;

° vignette("foo") - foo сэдвийн гарын авлагын жагсаалт.

1.3. R Commander багц цэстэй ажиллах Шинэхэн хэрэглэгчдэд R Commander дээр тооцоолол хийх тохиромжтой хэрэгсэл бол платформоос хамааралгүй R Commander юм. GUI Rcmdr багцад хэрэгжсэн товчлуурын цэсний хэв маягаар. Энэ нь танд командын хэл дээрх функцуудыг урьдчилан сурахгүйгээр статистикийн шинжилгээний томоохон процедурыг хийх боломжийг олгодог боловч гүйцэтгэсэн бүх зааврыг тусгай цонхонд харуулдаг тул үүнд өөрийн мэдэлгүй хувь нэмэр оруулдаг.

Та Rcmdr-ийг бусад өргөтгөлүүдийн нэгэн адил R консолын "Багцуудыг суулгах" цэснээс суулгаж болно, гэхдээ дараах тушаалыг ажиллуулснаар илүү дээр юм.

install.packages("Rcmdr", dependencies=ҮНЭН) нь хамаарлын сонголтыг идэвхжүүлснээр Rcmdr цэсээр өгөгдөл боловсруулахад шаардлагатай байж болох бусад багцын бүрэн багцыг баталгаатай суулгана.

R Commander нь Rcmdr багцыг "Багцуудыг багтаасан багц" цэс эсвэл номын сангийн (Rcmdr) командаар ачаалагдах үед эхлүүлнэ. Хэрэв ямар нэг шалтгаанаар зөвхөн R Commander ашиглан өгөгдөлд дүн шинжилгээ хийхээр шийдсэн бол автомат татаж авахЭнэ график бүрхүүл, та R-г эхлүүлэх үед 1.1-р хэсэгт үзүүлсэн шиг Rprofile.site файлыг засах хэрэгтэй.

Бид жишээн дээр R Commander дээрх ажлыг авч үзэх болно корреляцийн шинжилгээБеларусийн гурван нуур дахь Conchophthirus acuminatus-ийн хоёр хавхлагт нялцгай биет Dreissena polymorpha-ийн халдварын түвшний талаарх мэдээлэл (Mastitsky S.E. // BioInvasions Records.

2012. V. 1. P 161–169). Figshare вэбсайтаас татаж авсан анхны өгөгдөл бүхий хүснэгтэд бид хоёр хувьсагчийг сонирхож байна: нялцгай биетний бүрхүүлийн урт (ZMlength, мм) болон нялцгай биетээс олдсон цилиатуудын тоо (CAnumber). Энэ жишээг 4, 5-р бүлэгт нарийвчлан авч үзэх тул энд дүн шинжилгээ хийх утгын талаар дэлгэрэнгүй ярихгүй, харин Rcmdr-тэй ажиллах техник дээр анхаарлаа хандуулах болно.

Дараа нь бид өгөгдөл ачаалах горим болон интернет дэх холбоосын хаягийг гарч ирэх цонхон дээр тодорхойлно. Бид дотоодоос ижил өгөгдлийг хялбархан ачаалж болохыг харахад хялбар байдаг текст файл, Excel ажлын ном эсвэл мэдээллийн сангийн хүснэгт. Манай өгөгдөл зөв ачаалагдсан эсэхийг шалгахын тулд (эсвэл шаардлагатай бол засах) "Өгөгдлийг харах" товчийг дарна уу.

Өгөгдлийн зохион байгуулалтыг тодорхойлох цонх Ачаалагдсан хүснэгтийн фрагмент

Хоёрдахь шатанд "Статистик" цэснээс "Харилцааны тест" -ийг сонгоно уу.

Бид хос хамааралтай хувьсагчдыг сонгож, Гаралтын цонхонд Пирсон корреляцийн коэффициент (R = 0.467), хүрсэн статистик ач холбогдлын түвшин (p-утга 2.2e-16) болон 95% итгэлийн хязгаарыг олж авдаг.

–  –  –

Хүлээн авсан үр дүнг санах ойгоор дамжуулан гаралтын цонхноос хялбархан хуулж болно.

Одоо бид авлаа график дүрскорреляцийн хамаарал. CAnumber болон ZMlength-ийн тархалтын графикийг сонгоод, мужуудын ирмэгийн графикууд, шугаман хамгийн бага квадратуудын чиг хандлагын шугам (ногоон), орон нутгийн регрессийн аргаар тэгшитгэсэн шугам (улаан өнгөтэй), итгэлцлийн бүсээр (тасархай шугам) төлөөлнө. Гурван нуурын хувьд (Нуурын хувьсах хэмжигдэхүүн) туршилтын цэгүүдийг өөр өөр тэмдгээр илэрхийлнэ.

–  –  –

R Commander график цонхноос хуулсан график Бүх R Commander цэсийн товчлууртай дүйцэхүйц товчлуур дарахад скрипт цонхонд R заавар гарч ирнэ.

Манай тохиолдолд тэд дараах байдлаар харагдаж байна.

Clams read.table("http://figshare.com/media/download/98923/97987", толгой=ҮНЭН, sep="\t", na.strings="NA", dec=".", зурвас. цагаан=ҮНЭН) cor.test(Clam$CAnumber, Clam$ZMlength, alternative="хоёр.талт", арга="pearson") тараах график(CAnumber ~ ZMlength | Нуур, reg.line=lm, гөлгөр=ҮНЭН, тархалт= ҮНЭН, boxplots="xy", span=0.5, ylab="Ciliates-ийн тоо", xlab="Shell length", by.groups=FALSE, data=Mollusks) Скрипт өөрөө эсвэл гаралтын үр дүнг (эсвэл хоёуланг нь) хадгалах боломжтой файлууд болон хүссэн үедээ давтагдана. Хадгалсан файлыг R консолоор ачаалснаар R Commander-ийг ажиллуулахгүйгээр ижил үр дүнд хүрч болно.

Ерөнхийдөө R хэлний бүтцийг мэдэхгүй (эсвэл зүгээр л санах ойд ачаалал өгөхийг хүсэхгүй) Rcmdr ашиглан та бараг бүх статистикийн үндсэн аргуудыг ашиглан өгөгдөл боловсруулах боломжтой. Энэ нь параметрийн болон параметрийн бус тестүүд, янз бүрийн тасралтгүй ба салангид тархалтыг тохируулах аргууд, олон хувьсах тохиолдлын хүснэгтүүдийн шинжилгээ, дисперсийн нэг хэмжээст ба олон хувьсагчийн шинжилгээ, үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ ба кластерчлал, ерөнхий регрессийн загваруудын янз бүрийн хэлбэрүүд гэх мэтийг танилцуулж байна. Үүссэн загварт дүн шинжилгээ хийх, турших төхөөрөмжийг сайтар судлах нь зүйтэй.

R Commander-тэй ажиллах техник, өгөгдөл боловсруулах алгоритмын хэрэгжилтийн нарийвчилсан тайлбарыг гарын авлагаас олж болно (Larson-Hall, 2009; Karp, 2014).

Гэсэн хэдий ч дохионы хэл нь хүний ​​​​байгалийн хэлээр харилцах харилцааг орлож чадахгүйтэй адил R хэлний мэдлэг нь хэрэглэгчийн чадамжийн хил хязгаарыг ихээхэн өргөжүүлж, R орчинтой харилцах харилцааг тааламжтай, сэтгэл хөдөлгөм болгодог. Энд R Commander дахь скриптүүдийг автоматаар үүсгэх нь уншигчдад R хэлний операторуудтай танилцах, бие даасан функцуудыг дуудах онцлогийг сурах маш сайн хэрэгсэл болж чадна. Бид гарын авлагын дараах бүлгүүдийг зөвхөн хэлний бүтцийн түвшинд өгөгдөл боловсруулах журмыг хэлэлцэхэд зориулах болно.

1.4. Объект, багц, функц, төхөөрөмж R хэл нь өндөр түвшний объект хандалтат програмчлалын хэл гэж нэрлэгддэг гэр бүлд хамаарна. Мэргэжилтэн бус хүний ​​хувьд "объект" гэсэн ойлголтын хатуу тодорхойлолт нь хийсвэр юм. Гэсэн хэдий ч хялбар болгох үүднээс R-тэй ажиллах явцад үүссэн бүх зүйлийг объект гэж нэрлэж болно.

Хоёр үндсэн төрлийн объект байдаг:

1. Өгөгдөл хадгалах зориулалттай объектууд ("өгөгдлийн объектууд") нь бие даасан хувьсагч, вектор, матриц ба массив, жагсаалт, хүчин зүйл, өгөгдлийн хүснэгт;

2. Функцууд ("функцийн объектууд") нь шинэ объект үүсгэх эсвэл тэдгээр дээр тодорхой үйлдлийг гүйцэтгэхэд зориулагдсан программууд юм.

Хамтын болон үнэ төлбөргүй ашиглахад зориулагдсан R орчны объектуудыг ижил төстэй сэдвүүд эсвэл өгөгдөл боловсруулах аргуудаар нэгтгэсэн багцад савладаг. "Багц" болон "номын сан" гэсэн нэр томъёоны хооронд зарим ялгаа бий. "Номын сан" гэсэн нэр томъёо нь нэг буюу хэд хэдэн багц агуулсан лавлахыг тодорхойлдог. "Багц" гэсэн нэр томъёо нь тест эсвэл суралцах зориулалттай функц, HTML гарын авлагын хуудас, түүвэр өгөгдлийн объектуудын цуглуулгад хамаарна.

Багцуудыг үйлдлийн системийн тодорхой лавлах санд суулгасан эсвэл устгасан хэлбэрээр архивласан * файлд хадгалж, тарааж болно. zip файлууд Windows (багцын хувилбар нь таны R-ийн тодорхой хувилбартай тохирч байх ёстой).

Багцын талаархи бүрэн мэдээллийг (хувилбар, үндсэн сэдэв, зохиогчид, өөрчлөгдсөн огноо, лиценз, бусад функциональ холбоотой багцууд, тэдгээрийн зорилгыг харуулсан функцүүдийн бүрэн жагсаалт гэх мэт) тушаалаар авах боломжтой.

номын сан(тусламж=багцын_нэр), жишээ нь:

library(help=Matrix) Бүх R багцууд нь үндсэн ("суурь"), санал болгосон ("санал болгосон") болон бусад хэрэглэгчийн суулгасан гурван ангилалын аль нэгэнд багтдаг.

Та номын сангийн() командыг өгөх замаар тэдгээрийн жагсаалтыг тодорхой компьютер дээр авч болно.

суулгасан.багцууд(тэргүүлэх байдал = "суурь") суулгасан.багцууд(тэргүүлэх байдал = "санал болгосон") # Авах бүрэн жагсаалт packlist packlist - rownames(installed.packages()) # Excel форматаар санах ойд мэдээллийг гаргах write.table(packlist,"clipboard",sep="\t", col.names=NA) Үндсэн болон санал болгосон багцуудыг ихэвчлэн оруулдаг. R суулгалтын файл руу.

Мэдээжийн хэрэг, олон төрлийн багцуудыг "нөөцөд" нэн даруй суулгах шаардлагагүй.

Багцыг суулгахын тулд R Console командын цонхноос "Багцуудыг суулгах багц(ууд)" цэсийг сонгох эсвэл жишээлбэл дараах тушаалыг оруулахад хангалттай.

install.packages(c("веган", "xlsReadWrite", "машин"))

Багцуудыг жишээ нь Оросын "толин тусгал" http://cran.gis-lab.info сайтаас татаж авах боломжтой бөгөөд үүний тулд Rprofile.site файлын хувилбарыг 1.1-р хэсэгт үзүүлсэн шиг ашиглахад тохиромжтой.

Багцуудыг суулгах өөр нэг сонголт бол http://cran.gis-lab.info/web/packages сайт руу орж, хүссэн багцаа зип файл хэлбэрээр сонгоод компьютер дээрээ сонгосон хавтас руу татаж авах явдал юм.

Энэ тохиолдолд та багц дээрх бүх мэдээлэл, тухайлбал түүнд багтсан функцүүдийн тайлбарыг урьдчилан харж, танд хэр их хэрэгтэйг шийдэх боломжтой. Дараа нь та "Багцууд Орон нутгийн зип файлуудаас багц суулгах" гэсэн командын цэсийг гүйцэтгэх хэрэгтэй.

RGui консолыг эхлүүлэх үед зөвхөн зарим үндсэн багцууд ачаалагддаг. Функцийг нь шууд ашиглахаасаа өмнө бусад багцыг эхлүүлэхийн тулд та тушаалын санд (багцын_нэр) оруулах шаардлагатай.

Та дараах тушаалыг өгснөөр үргэлжилж буй сессийн мөч бүрт ямар багц ачаалагдаж байгааг тодорхойлж болно.

sessionInfo() R хувилбар 2.13.2 (2011-09-30) Платформ: i386-pc-mingw32/i386 (32 бит)

–  –  –

бусад хавсаргасан багцууд:

Vegan_2.0-2 permute_0.6-3

нэрийн орон зайгаар ачаалагдсан (мөн хавсаргаагүй):

Grid_2.13.2 lattice_0.19-33 tools_2.13.2 Дараах хүснэгтэд энэ номонд үзүүлсэн скриптүүдэд ашигласан багцуудыг жагсаасан (магадгүй бүрэн биш байж болно).

R багцууд Зорилго "Үндсэн" багцууд Үндсэн бүтэц R суурь Багц хөрвүүлэгч R хөрвүүлэгч Функцуудыг турших, харуулах өгөгдөл бүхий хүснэгтүүдийн багц өгөгдлийн багц Графикийн үндсэн функцүүдийн график График төхөөрөмжийн драйверууд, өнгөт палитр, фонтууд grDevices График давхарга үүсгэх функцүүд Объект хандалтат програмчлал бүрэлдэхүүн хэсгүүд (анги, аргууд) Регрессийн сплайнуудтай ажиллах функцууд өөр төрөл splines Статистикийн шинжилгээний үндсэн функцууд статистик арга статистик функцууд class S4 stats4 Хэрэглэгчийн интерфейсийн бүрэлдэхүүн хэсгүүд (цэс, сонголтын хайрцаг гэх мэт) tcltk Мэдээллийн дэмжлэг, удирдлага, баримтжуулалтын хэрэгсэл Дибаг хийх, оролт гаралт, архивлах гэх мэт төрөл бүрийн хэрэгслүүд.

"Зөвлөмж болгож буй" багцууд Төрөл бүрийн ачаалах ба "jackknife" горимуудын функцууд Ачаалах янз бүрийн шаталсан бус ангилал ба таних алгоритмуудын ангилал Хуваалт ба шаталсан кластерийн алгоритмуудын кластер Кодын шинжилгээ ба баталгаажуулалт R codetools Файлуудыг унших, бичих (, янз бүрийн форматтай DDBTA, DSS, SP Stata) KernSmooth цөмийг жигд болгох оновчлолд үйлчилгээ үзүүлдэг гадаад функцууд График функцуудөргөтгөсөн функциональ байдал (Sarkar, 2008) сүлжээ Өгөгдөл ба статистик функцүүдийн багц (Venables, Ripley, 2002) MASS Матриц ба вектор үйлдлүүд Матриц Ерөнхий нэмэлт ба холимог эффектийн загварууд mgcv Шугаман ба шугаман бус холимог эффектийн загварууд nlme Мэдрэлийн сүлжээшууд тархалт nnet Ангилал ба регрессийн модыг бүтээх rpart Криг хийх, цэгийн орон зайн тархалтыг шинжлэх функцууд Орон зайн амьд үлдэх шинжилгээ (Кокс загвар гэх мэт) Ашиглалтын явцад суулгасан багцууд adegenet Генетик зайн шинжилгээний алгоритмууд гар Регрессийн загваруудын шинжилгээ - хавсралт ном (Гелман, Хилл, 2007) машин Хэрэглээний регрессийн шинжилгээтэй холбоотой процедурууд corrplot Корреляцийн матрицын график дүрслэл fitdistrplus Статистикийн тархалтыг тохируулах FWDselect, packfor gamair регрессийн загварт мэдээллийн хувьсагчдыг сонгох Геосферийн зайн үнэлгээг турших өгөгдлийн багц ggplot2 Өндөр функц бүхий DAAG дэвшилтэт график багц. Номонд зориулсан өгөгдлийн шинжилгээ, график функцууд (Maindonald, Braun, 2010) Hmisc Harrell функцийн багц HSAUR2 Номын нэмэлт (Everitt, Hothorn, 2010) ISwR Анхдагч статистик шинжилгээ c to R jpeg-тэй ажиллах график файлууд jpeg lars Регрессийн тусгай төрлүүд (LARS, Lasso гэх мэт) lavaan Баталгаажуулах шинжилгээ ба бүтцийн тэгшитгэлийн загварууд lmodel2 I ба II төрлийн регрессийн загваруудыг хэрэгжүүлэх (MA, SMA, RMA) maptools Газарзүйн зургийн хэрэгсэл хулгана Алга болсон утгыг шинжлэх, бөглөх журам моментууд функцууд түүврийн моментуудын тооцоолол хойд зүгт Хэвийн тархалтын хэтийн таамаглалыг шалгах шалгуур Пастекийн өгөгдөл дэх хэтийн үзүүлэлтүүдийн шинжилгээ Экологи дахь орон зайн болон цаг хугацааны цувааны шинжилгээ pls Үндсэн бүрэлдэхүүн хэсгүүдийн регресс pwr Таамаглалын статистик хүчийг үнэлэх Өгөгдлийн хэлбэрийг уян хатан хувиргах tables robustbase Регрессийн загвар бүтээх найдвартай аргууд rootSolve Хуваарьтай функцийн үндсийг олох Өнгөний хуваарь сонгох sem Бүтцийн тэгшитгэлийн загварууд semPlot Бүтцийн хамаарлыг дүрслэх sm Тархалтын нягтрал ба тэгшитгэх аргуудыг тооцоолох sp Орон зайн өгөгдөлд хандах анги ба аргууд Spatstat арга. орон зайн статистик, fit spdep загварууд Орон зайн хамаарал: геостатистикийн аргууд ба оддын загварчлал Статистикийн загваруудын талаарх мэдээллийг өөр өөр vcd форматаар харуулах Категорийн өгөгдлийг дүрслэн харуулах Нийгэмлэгийн экологийн тооцоолол хийх (ижил төстэй байдал, олон янз байдал, веган үүрлэх арга хэмжээ, томилолт ба олон талт шинжилгээ) Хэрэв бид багцыг татаж авахыг оролдвол, R-д хараахан суулгаагүй байгаа эсвэл ачаалагдаагүй байгаа багцын функцийг ашиглахыг оролдвол бид системийн мессежийг хүлээн авах болно:

sem(model, data=PoliticalDemocracy) Алдаа: "сем" номын сангийн функцийг олж чадсангүй(lavaan) Номын санд(lavaan) алдаа: "lavaan" багцын хэрэглэгч гэж нэрлэгдсэн багц байхгүй бөгөөд аль нь татаж авах, аль нь урьдчилан суулгах шаардлагатайг ойлгож байна. . Скрипт хэрхэн ажилладагийг ойлгохын тулд дараагийн хэсэгт тайлбарласан R хэлний бүтцийг мэдэх шаардлагатай боловч сонирхсон уншигч эдгээр командууд руу дараа буцаж болно.

instant_pkgs - function(pkgs) ( pkgs_miss - pkgs)] # Татаж авахад бэлтгэгдээгүй багцуудыг суулгана уу:

if (length(pkgs_miss) 0) (install.packages(pkgs_miss) ) # Татаж аваагүй багцуудыг татаж авах:

Хавсаргасан - хайлт() хавсаргасан_pkgs - хавсаргасан_хэрэгцээтэй_хэрэгцээ - хэрвээ (урт(хавсаргах_шаардлагатай) 0) ( for (i in 1:length(need_to_tapach)) require(need_to_to_tach[i], character.only = TRUE) ) ) # Дуудлага хийх жишээ

шуурхай_pkgs(c("суурь", "jpeg", "веган"))

Та багц тус бүрийн функцүүдийн жагсаалтыг авах боломжтой, жишээлбэл, тушаал өгөх замаар:

ls(pos = "package:vegan") Тайлбар: ls() нь тухайн орчинд объектуудыг жагсаахад зориулагдсан ерөнхий зориулалтын функц юм. Дээрх тушаал нь веган багцыг ийм орчин болгон тохируулдаг. Хэрэв энэ командыг параметргүйгээр гаргасан бол бид одоогийн сессийн үеэр үүсгэсэн объектуудын жагсаалтыг авах болно.

Та args() командыг өгснөөр ачаалагдсан багцын дурын функцын орж ирж буй параметрүүдийн аргументуудын жагсаалтыг авах боломжтой.

Жишээлбэл, бидний хожим өргөнөөр ашиглах lm() шугаман загварын үүсмэл функцийг эхлүүлэх үед дараах параметрүүдийг тохируулна.

Args(lm) функц (томьёо, өгөгдөл, дэд олонлог, жин, na.action, арга = "qr", загвар = ҮНЭН, x = ХУДАЛ, y = ХУДАЛ, qr = ҮНЭН, ганцаарчилсан.ok = ҮНЭН, ялгаатай = NULL, offset,...) Хэрэв та зөвхөн функцийн товчлолоос бүрдсэн командыг оруулбал (жишээлбэл, IQR-ийн дөрөвний хоорондын мужийг тооцоолох) функцийн эх текстийг R кодоор авах боломжтой.

IQR функц (x, na.rm = FALSE) diff(quantile(as.numeric(x), c(0.25, 0.75), na.rm = na.rm, names = FALSE)) Дэвшилтэт хэрэглэгч энэ кодыг өөрчлөх ба Стандарт функцийн дуудлагыг өөрийн хувилбар руу "дахин чиглүүлэх".

Гэсэн хэдий ч, хэрэв бид шугаман загварын таамагласан утгуудыг тооцоолоход ашигладаг таамагласан () функцийн кодыг ижил аргаар харахыг хүсвэл бид дараахь зүйлийг авна.

таамаглах функц (объект,...) UseMethod("урьдчилан таамаглах") Энэ тохиолдолд таамаглах() нь "бүх нийтийн" функц юм: түүний оролтод ямар загварын объект орж байгаагаас хамаарна (шугаман регрессийн хувьд lm, Пуассон эсвэл логистикийн хувьд glm) регресс, холимог эффектийн загварт зориулсан lme гэх мэт), урьдчилан таамаглах утгыг олж авах холбогдох аргыг шинэчилсэн.

Ялангуяа энэ функцийг дараахь аргуудыг хэрэгжүүлэхэд ашигладаг.

аргууд("урьдчилан таамаглах") урьдчилан таамаглах.ar* таамаглах.Арима* таамаглах.arima0* таамаглах.glm таамаглах.HoltWinters* таамаглах.lm таамаглах. tahmin.princomp* таамаг.smooth.spline* таамаг.smooth.spline.fit* таамаглах.StructTS* Үл үзэгдэх функцууд нь одоор тэмдэглэгдсэн байдаг S3 загварын хувьд арга нь үнэндээ print( гэх мэт өөр ерөнхий функцээр дуудагддаг функц юм. ), plot() , эсвэл хураангуй() , оролт болгон нийлүүлсэн объектын ангиллаас хамаарна. Үүний зэрэгцээ ангийн шинж чанар нь "объектийн чиг баримжаа" -ыг хариуцдаг бөгөөд энэ нь зөв илгээх, шаардлагатай аргыг дуудах боломжийг олгодог. энэ объект. Тиймээс ерөнхий шугаман загварын таамагласан утгыг олж авах "функцийн арга" нь splines-ээр тэгшитгэх үед урьдчилан таамаглах.glm() гэсэн дуудлагатай байх болно - predict.smooth.spline() гэх мэт. Дэлгэрэнгүй мэдээлэл S3 OOP загварыг S3Methods тусламжийн хэсгээс, илүү дэвшилтэт S4 OOP загварыг Арга хэсгээс олж болно.

Эцэст нь R сессийн үеэр хүлээн авсан ажлын үр дүнг хадгалах зарим энгийн заль мэхийг харцгаая.

° sink(файл= файлын нэр) - дараагийн командуудын гүйцэтгэлийн үр дүнг бодит цаг хугацаанд өгөгдсөн нэртэй файл руу гаргана; энэ тушаалыг зогсоохын тулд та sink () командыг параметргүйгээр гүйцэтгэх ёстой;

° хадгалах(файл=файлын нэр, хадгалах объектын жагсаалт) – заасан объектуудыг ямар ч үйлдлийн системд ашиглах боломжтой хоёртын XDR форматтай файлд хадгална;

° ачаалал(файл= файлын нэр) - одоогийн орчинд хадгалагдсан объектуудыг сэргээдэг;

° save.image(file= filename) - ажлын явцад үүсгэсэн бүх объектыг R-тусгай rda файл хэлбэрээр хадгалдаг.

Өгөгдөл бүхий үүсгэсэн хүснэгтийг Excel хуудасны бүтцэд тохирох форматаар санах ой руу шилжүүлэх жишээг энэ хэсэгт дээр өгөв. Зургадугаар бүлэгт шугаман загварын объектоос Word файл руу өгөгдөл дамжуулах жишээг үзүүлнэ.

R орчин нь бараг ямар ч дэлгэцийн нягтрал, хэвлэх төхөөрөмжид шаардлагатай чанарын пикселийн дүрсийг үүсгэхээс гадна үүссэн график цонхыг янз бүрийн форматтай файлд хадгалах боломжтой. График гаралтын төхөөрөмж бүрт драйверын функц байдаг: та драйверуудын бүрэн жагсаалтыг авахын тулд help(Devices) гэж бичиж болно.

Хамгийн түгээмэл хэрэглэгддэг график төхөөрөмжүүд нь:

° windows() - график Windows цонх(дэлгэц, принтер эсвэл метафайл).

° png(), jpeg(), bmp(), tiff() - харгалзах форматтай битмап файл руу гаргах;

° pdf(),postscript() - гаралт график мэдээлэлВ PDF файлэсвэл PostScript.

Гаралтын төхөөрөмжтэй ажиллаж дууссаны дараа түүний драйверийг dev.off() командаар идэвхгүй болгоно. Хэд хэдэн график гаралтын төхөөрөмжийг нэгэн зэрэг идэвхжүүлж, тэдгээрийн хооронд шилжих боломжтой: жишээлбэл, Шипунов нар номын харгалзах хэсгийг үзнэ үү. (2012, хуудас 278).

1. R ХЭЛНИЙ ТОДОРХОЙЛОЛТ

2.1. R өгөгдлийн төрлүүд R доторх бүх өгөгдлийн объектуудыг (мөн хувьсагчдыг) дараах ангилалд (жишээ нь объектын төрлүүдэд) хувааж болно.

° тоон - бүхэл тоо (бүхэл тоо) ба бодит тоо (давхар) агуулсан объектууд;

° логик - зөвхөн хоёр утгыг авдаг логик объектууд: FALSE (F гэж товчилсон) ба ҮНЭН (T);

° тэмдэгт - тэмдэгтийн объектууд (хувьсагчийн утгыг давхар эсвэл дан хашилтаар зааж өгсөн болно).

R хэл дээр та янз бүрийн объектын нэр (функц эсвэл хувьсагч) латин болон кирилл үсгээр үүсгэж болно, гэхдээ a (кирилл) болон a (латин) нь хоёр өөр объект гэдгийг санаарай. Үүнээс гадна R орчин нь том жижиг үсгийн мэдрэмжтэй, i.e. жижиг, том үсэг нь ялгаатай. R хэл дээрх хувьсагчийн нэр (танигч) үсгээр (эсвэл цэг) эхэлж, үсэг, цифр, цэг, доогуур зураасаас бүрдэх ёстой.

Багийн тусламжтайгаар? name нь өгөгдсөн нэртэй хувьсагч эсвэл функц байгаа эсэхийг шалгах боломжтой.

Хувьсагч нь тодорхой ангилалд хамаарах эсэхийг is.numeric(object_name), is.integer(name), is.logical(name), is.character(name) функцуудаар шалгадаг ба объектыг өөр төрөл рүү хөрвүүлдэг. , та as.тоон функц (нэр), as.integer(нэр), as.logical(нэр), as.character(нэр) функцуудыг ашиглаж болно.

R-д хэд хэдэн тусгай объектууд байдаг:

° Inf - эерэг буюу сөрөг хязгааргүй байдал (ихэвчлэн бодит тоог 0-д хуваах үр дүн);

° NA - "дутуу утга" (Байхгүй);

° NaN - "тоо биш" (Тоо биш).

Та хувьсагч нь эдгээр тусгай төрлүүдийн нэг мөн эсэхийг is.nite(нэр), is.na(нэр) болон is.nan(нэр) функцээр шалгаж болно.

R илэрхийлэл нь хуваарилалтын оператор, арифметик эсвэл логик оператор, объектын нэр, функцийн нэр зэрэг элементүүдийн нэгдэл юм. Илэрхийллийг гүйцэтгэх үр дүн нь дүрмээр бол тушаал эсвэл график цонхонд шууд харагдана. Гэсэн хэдий ч даалгавар гүйцэтгэх үед үр дүн нь харгалзах объектод хадгалагдах бөгөөд дэлгэц дээр харагдахгүй.

R хэл дээрх хуваарилалтын операторын хувьд та "=" тэмдэг эсвэл хос тэмдэгт "-" (зүүн талд байгаа объектод тодорхой утга оноох) эсвэл "-" (зүүн талд байгаа объектод утга оноох) ашиглаж болно. баруун). "-"-г ашиглах нь сайн програмчлалын хэв маяг гэж тооцогддог.

R илэрхийлэлийг скрипт дээр мөрөөр зохион байгуулдаг. Та хэд хэдэн командыг нэг мөрөнд ";" тэмдгээр тусгаарлаж болно. Нэг тушаалыг хоёр (эсвэл түүнээс дээш) мөрөнд байрлуулж болно.

Тоон төрлийн объектууд нь уламжлалт арифметик үйлдлүүдийг ашиглан илэрхийлэл үүсгэж болно + (нэмэх), - (хасах), * (үржүүлэх), / (хуваах), ^ (дэмжих), %/% (бүхэл тоо хуваах), %% (үлдэгдэл) хуваалтаас). Үйлдлүүд нь ердийн давуу эрхтэй, i.e. Эхлээд экспонентацийг, дараа нь үржүүлэх эсвэл хуваах, дараа нь нэмэх эсвэл хасах үйлдлийг гүйцэтгэдэг. Илэрхийлэлд хаалт хэрэглэж болох ба тэдгээрийн операторууд хамгийн их давуу эрхтэй байдаг.

Логик илэрхийллийг дараах логик операторуудыг ашиглан үүсгэж болно.

° "Тэгш" == ° "Тэнцүү биш" != ° "Бага" ° "Их" ° "Бага эсвэл тэнцүү" = ° "Их эсвэл тэнцүү" = ° "Логик БА" & ° "Логик OR" | ° "Логик ҮГҮЙ"!

ДЭМЖЛЭГ, АУТСОРСИНГ, САНГИЙН УДИРДЛАГА 2 АМИКОРП ГРУПП ӨНГӨӨС ОНЦЛОХ w w w.am icor p. c om AMICORP ГРУПП КОМПАНИЙН ҮЙЛ АЖИЛЛАГААНЫ ХАЛБАНГУУД КОМПАНИЙН ТУХАЙ АГУУЛГА МАНАЙ ҮЙЛЧИЛГЭЭ Байгууллагын үйлчлүүлэгчдэд үзүүлэх үйлчилгээ Байгууллагын борлуулалтын үйлчилгээ Байгууллагын борлуулалтыг бий болгох, удирдах...»

“ОХУ-ын Засгийн газрын дэргэдэх Санхүүгийн их сургууль” тэнхим “Маркетингийн” ОРЧИН ҮЕИЙН ЧИГЛЭЛ: ОНОЛ, АРГА ЗҮЙ, ПРАКТИК НЭГДСЭН МОНГРАФ С.В. Карпова Москва 2011 Шүүмжлэгч: Н.С. Перекалина - Эдийн засгийн ухааны доктор, профессор, дарга. "Маркетингийн" тэнхим "МАТИ" - Оросын Улсын Технологийн Их Сургууль. К.Е.Циолковский С.С. Соловьев ... "

“КАФЕ, ЦАЙН БОЛОВСРОЛЫН МАЛКО дижитал мессенжер: Ч. Редактор: Vesela Dabova Br. 4 Decemvri, 2011 Редактор: Теодор Василевын цайгаар тайвшир. Гергана Иванов Хэвлэн нийтлэгч: АББ Бие махбодид эсвэл цай уух үед хэр олон тохиолдол гардаг, бүх тохиолдлууд нэг аяга цайны хэрэглээг хэрхэн сулруулдаг. Таси онолын найдвартай байдлын талаар янз бүрийн санал бодол байдаг боловч нэг аяга цайг тогтоосон дэглэмээс тооцдог гэсэн нотолгоо бага байна ... "

«Олон улсын интервалтай, Сахилга баттай replys Condice Condice Condice Colide-ийн READICE CODICADS COMICES CONECTION: Романа Бокови Бокови Бокови Бокови Бокови Милия : 978-86-7892-733-1 Leyout: Мажа Момиров Хавтасны дизайн: Стефан Вужи Техникийн шинжлэх ухааны факультетийн Архитектур, хот байгуулалтын тэнхимээс хэвлүүлсэн,...»

"САНКТ-ПЕТЕРБУРГИЙН УЛСЫН ИХ СУРГУУЛИЙН Газарзүй, геоэкологийн факультет" Геоморфологийн тэнхимийн "Арктикийн нууруудын геоморфологийн онцлог ба палеоклимат (Оросын Арктикийн төв хэсгийн нууруудын жишээн дээр)" сэдвээр дипломын ажил (эцсийн мэргэшлийн ажил) Гүйцэтгэсэн. Зохиогч: оройн тэнхимийн оюутан Морозова Елена Александровна Эрдэм шинжилгээний удирдагчид: д.г.д., проф. Большиянов Дмитрий Юрьевич Лектор Савельева Лариса Анатольевна Тоймч: Геологийн шинжлэх ухааны нэр дэвшигч, дарга....»

“Apacer M811 хулгана – лазер мини SUV хэрэгсэл. http://news.kosht.com/computer/mouse/2009/11/26/mysh_apacer_m811. KOSHT.com өдрийн үнийн хайлтын залгаас Firefox хөтөч. Нэг товшилтоор суулгана уу. Нэг килобайт. Нүүр хуудас Мэдээ Үнэ Зарууд Ажлын байр форум Компаниуд Моби Мэдээгээ олоорой KOSHTA-ийн бүх мэдээ Компьютер ба дагалдах хэрэгсэл Хулгана Компьютер ба дагалдах хэрэгсэл Хулгана Бүх KOSHTA мэдээ Шилдэг тоглоомын компьютерууд UltraPrice.by дээр онлайн тооцоолол хийх Apacer M811 хулгана – лазер мини SUV [...»

"ХОЛБООНЫ БОЛОВСРОЛЫН АГЕНТЛАГЫН УЛСЫН БОЛОВСРОЛЫН ДЭЭД МЭРГЭЖЛИЙН БОЛОВСРОЛЫН БАЙГУУЛЛАГА МОСКВА УЛСЫН ҮЙЛДВЭРИЙН ИХ СУРГУУЛЬ (GO MGIU)" МЭДЭЭЛЛИЙН СИСТЕМ, ТЕХНОЛОГИ мэдээллийн систем» оюутан Чумакова Татьяна Андревна "Муу зохион байгуулалттай биеийн ард тусгаарлагдсан урсгалын тооцоо" сэдвээр Ажлын удирдагч: проф., доктор. n. Алексин Владимир Адамович ... "

“Р WIPO A/45/3 ЭХ: Англи огноо: 2008 оны 8-р сарын 15 ДЭЛХИЙН Оюуны Өмчийн Байгууллага ДОӨБ-ын ГИШҮҮН УЛСЫН ЖЕНЕВИЙН ЧУУЛГАН Дөчин тав дахь цуврал уулзалт Женев, 2008 оны 9-р сарын 22-30-ны өдөр. Ерөнхий захирал I. ОЛОН УЛСЫН ТӨРИЙН БУС БАЙГУУЛЛАГЫГ АЖИЛЛАГААЧААР ЭЛСЭЛТ АВАХ 1. Ассамблейд өмнөх чуулгануудаараа олон улсын төрийн бус байгууллагуудад илгээхдээ баримтлах зарчмуудыг баталсан...” гэжээ.

“1 Олег Санаев. ДЭЛХИЙ ДӨРВӨН ЖИЛД сунаж, нэг зуун долларын өртөгтэй Евгений Александрович Гвоздевын Лена дарвуулт онгоцоор аялах нөхцлийн дагуу бүх зүйл эмх цэгцтэй байна - дөрвөн жил, хоёр долоо хоног: 1992 оны 7-р сарын 7-нд тэр явав. Махачкала боомтод 1996 оны 7-р сарын 19-нд буцаж ирэв. Гэхдээ мөнгөөр ​​бол хэтрүүлэг, эс тэгвээс дутуу хэлсэн үг: та мэдээж дөрвөн жилийн турш зуун доллараар амьдрах боломжгүй - та хөлөө сунгах болно. Гэхдээ аялалаа эхлэхэд Гвоздевт яг ийм хэмжээний мөнгө байсан. Мөн ядаж хөл ... "

« Удирдлагын хүрээлэн, Судалгааны Их Сургууль Белгород Улсын Үндэсний Судалгааны Их Сургууль ТӨРИЙН БОЛОН ХОРТ, НИТХЫН АЛБАНЫ АЛБАНД НЭР ДЭВШИГЧИЙН ЦУС УЛСЫН БҮРДЭЛИЙГ ХАМГААЛАХ АЮУЛГҮЙ БАЙДЛЫГ БҮРДҮҮЛЭХ ТЕХНОЛОГИ.

“Лидия ЯНОВСКАЯ МИХАИЛ БУЛГАКОВЫН ТУХАЙ ТАЙЛБАР МОСКВА “ТЕКСТ” UDC 821.161.1 BBK 84 (2Ros-Rus)6-44 Y64 ISBN 978-5-7516-0660-2 ISBN 978-9329 (Harvest 978-985) ) "Текст", 2007 "BRAVO, BIS, ломбард!" "БРАВО, БИС, ломбард!" Өнөөдөр Москвад “Юность” сэтгүүлийн редакц хаана байдгийг мэдэхгүй. Ийм сэтгүүл байсаар байна уу? 70-аад оны дундуур Москвагийн хамгийн залуу, үзэсгэлэнтэй редакц нь Маяковскийн талбайн хажууд Садовая-Триумфальная дээр жижиг боловч маш тохь тухтай газар байрладаг байв ... "

“2013 оны УРАЛДААНЫ МЭДЭЭЛЛИЙН МАЯГТ “Т” маягтын 1 дүгээр хавсралт. RHF-д зориулсан өргөдлийн гарчгийн хуудас Төслийн нэр Төслийн дугаар Төслийн төрөл (a, c, d, e, f) Мэдлэгийн талбар (код) RHF ангилагч код GRNTI код (http://www.grnti.ru/) Тэргүүлэх чиглэл. ОХУ-ын шинжлэх ухаан, технологийн хөгжил, техникийн ажилтны нэн чухал технологи1 Даргын овог, нэр, овог нэр Төслийн төслийн менежерийн холбоо барих утасны дугаар Байгууллагын бүтэн ба богино нэрээр дамжуулан...” гэж бичжээ.

«FNI Report 8/2014 Польш улсад ЕХ-ны цаг уур, эрчим хүчний бодлогыг хэрэгжүүлэх нь: Европчлолоос полончлол руу шилжих үү? Жон Биргер Скжрсет ЕХ-ны уур амьсгал, эрчим хүчний бодлогыг Польшид хэрэгжүүлж байна: Европчлолоос полоничлол руу юу? Жон Биргер Скжрсет [имэйлээр хамгаалагдсан] 2014 оны 12-р сар Зохиогчийн эрх © Fridtjof Nansen Institute 2014 Гарчиг Польш улсад ЕХ-ны уур амьсгал, эрчим хүчний бодлогыг хэрэгжүүлэх нь: Европчлолоос полончлол руу шилжих үү? Нийтлэлийн төрөл ба дугаар Хуудас FNI тайлан 8/2014 57 Зохиогч ISBN 978-82-7613-683-8 Жон...”

""Scientific Notes TOGU" Volume 6, No. 4, 2015 ISSN 2079-8490 Цахим шинжлэх ухааны хэвлэл "Scientific Notes TOGU" 2015, Volume 6, No. 4, S. 173 - 178 Certificate El No. FS9077 da 3907. .2010 http://pnu.edu.ru/ru/ejournal/about/ [имэйлээр хамгаалагдсан] UDC 316.33 © 2015 I. А.Гареева, социологийн ухааны доктор. Шинжлэх ухааны доктор, А.Г.Киселева (Номхон Далайн Улсын Их Сургууль, Хабаровск) НИЙГМИЙН ДААТГАЛЫН ТОГТОЛЦООНЫ БҮРДЭЛ Энэхүү нийтлэлд нийгмийн даатгалын тогтолцоо бүрэлдэж, өнөөгийн байдалд дүн шинжилгээ хийсэн...»

Чуулганы хөтөлбөр Чианг Май, Тайланд, 2015 оны 11-р сар APCBSS Ази -Номхон далайн бизнес, нийгмийн шинжлэх ухааны бага хурал ICEI Боловсролын инновацийн олон улсын хурал APCLSE Ази-Номхон далайн Амьдралын шинжлэх ухаан, инженерчлэлийн бага хурал APCBSS Ази - Номхон далайн бизнес, нийгмийн шинжлэх ухааны бага хурал ISBN978-986- 902 -0-7 ICEI International Conference on Education Innovation ISBN 978-986-5654-33-7 APCLSE Ази Номхон далайн Амьдралын шинжлэх ухаан, инженерчлэлийн бага хурал ISBN 978-986-90052-9-6 Агуулгын агуулга..."



Ачааж байна...
Топ