28 февраля 2012

Расчет параметров описательной статистики в R




Использование специальных функций

Благодаря наличию специально созданных для этого функций, расчет параметров описательной статистики в R не составляет никакого труда. Ниже я продемонстрирую использование этих функций на примере ранее рассмотренных данных по характеристикам 32 моделей автомобилей (таблица mtcars, входящая в стандартный набор данных R):

data(mtcars)
mtcars
                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
...
...


16 февраля 2012

Интервью с Алексеем Шипуновым – автором книги "Наглядная статистика. Используем R!"



Литература по R на русском языке, к сожалению, пока весьма редка. Однако, дело сдвинуто с мертвой точки. В 2010 году профессором А. Г. Буховцом и коллегами была опубликована первая в России книга, посвященная статистическому анализу в системе R. Менее месяца назад вышла еще одна книга – "Наглядная статистика. Используем R!". Один из инициаторов этого проекта – биолог Алексей Шипунов – любезно согласился дать мне интервью. Наше общение происходило по электронной почте, и все ответы Алексея приведены в его авторской редакции.

07 февраля 2012

Базовые графические возможности R: диаграмма размахов в сочетании с диаграммой рассеяния



В предыдущих сообщениях я показал, как в системе R можно построить т.н. диаграммы размахов и одномерные диаграммы рассеяния. Оба типа диаграмм позволяют весьма наглядно визуализировать свойства анализируемых выборок. Еще более полную картину мы можем получить, совместив оба этих типа на одном графике. Сделать это можно всего несколькоми строками R-кода, используя функции boxplot() и stripchart().