28 января 2012

Вышла новая версия RStudio - v0.95



На днях вышла новая версия IDE для R - RStudio v0.95. В этой версии программы реализован ряд долгожданных опций, в частности:

Projects (Проекты) - новая система управления R-проектами, позволяющая лекго переключаться между рабочими директориями, скриптами, рабочими средами, и списками истории выполненных команд.

Code Navigation (Навигация по Коду) - позволяет быстро находить файл с необходимым скриптом либо переходить к определению функции.

Version Control (Система Управления Версиями) - индексирование версий кода и навигация между ними; встроенная поддержка систем Git и Subversion.

Здесь можно посмотреть видеоролик (англ. яз.), предлагающий быстрое ознакомление с новшествами RStudio v0.95. На сайте DecisionStats можно также прочитаться интервью с JJ Allaire - основателем RStudio, который подробно обсуждает особенности новой версии программы (англ. яз.).


25 января 2012

"Наглядная статистика. Используем R!"



Опубликована новая книга по R на русском языке:

Шипунов А. Б., Балдин E. М., Волкова П. А., Коробейников А. И., Назарова С. А., Петров С. В., Суфиянов В. Г. (2012) Наглядная статистика. Используем R! - М.: ДМК Пресс, 298 с. ISBN 978-5-94074-785-828-1

Авторы книги,  в частности А. Б. Шипунов, Е. М. Балдин, А. И. Коробейников и С. В. Петров, известны своими отличными статьями о R в журнале Linux Format и другими подобными публикациями, что добавляет интереса к их новой работе. Спрашивайте в магазинах и библиотеках вашего города!


22 января 2012

Рейтинг TIOBE 2012: R вошел в список двадцати наиболее популярных языков программирования



Голландская компания TIOBE (от "The Importance of Being Earnest", "Как важно быть серьезным") специализируется на оценке качества программного обеспечения. Ежемесячно специалисты этой компании оценивают популярность существующих языков программирования для составления соответствующего рейтинга. Для включения в анализ язык должен удовлетворять двум основным условиям:
  • В Wikipedia должна существовать статья об этом языке, однозначно утверждающая, что он является языком программирования.
  • Язык является тьюринг-полным.
Список языков программирования, соответствующих этим условиям, находится здесь.

20 января 2012

Базовые графические возможности R: столбиковые диаграммы



Для создания столбиковых (= "столбчатых", реже "линейчатых"; англ. bar plots или bar charts) диаграмм в системе R служит функция barplot(). У этой функции имеется большое количество аргументов, к основным из которых относятся (подробнее см. ?barplot):
  • hight ("высота") - числовой вектор или матрица со значениями, используемыми для построения диаграммы. Если аргумент hight указан в виде вектора, то строится график из последовательно расположенных столбцов, высоты которых соответствовуют значениям этого вектора. Если hight указан в виде матрицы и аргумент beside = FALSE, то будет построена столбчая диаграмма с накоплением. Если же hight указан в виде матрицы и аргумент beside = TRUE, то столбцы диаграммы будут сгруппированы в соответствии со столбцами матрицы.
  • width ("ширина") - необязательный параметр, позволяющий регулировать ширину столбцов на диаграмме. Указывается в виде числового вектора, значения которого соотвествуют ширине столбцов.
  • space ("пространство") - величина зазора между столбцами (пропорционально их средней ширине). Может быть указан либо виде одного числа, либо в виде вектора из чисел, соотвествующих каждому столбцу диаграммы.
  • names.arg - текстовый вектор, содержащий подписи (вдоль оси OX) для каждого столбца или группы столбцов. Если этот аргумент не указан, в качестве подписей автоматически будут использованы имена элементов вектора height (если таковые имеются), либо заголовки столбцов если height представляет собой матрицу.
  • legend.text - вектор, содержащий текстовые элементы легенды графика. Этот аргумент полезен только если height является матрицей. В этом случае метки легенды должны соотвествовать строкам матрицы. Аргументу legend.text можно также присвоить значение TRUE, и тогда имена строк матрицы (если таковые имеются) будут использованы в качестве меток легенды автоматически.
  • beside - принимает логическое значение и имеет смысл только, если height является матрицей. Значение FALSE приведет к построению диаграммы с накоплением. При значении TRUE столбцы будут сгруппированы.
  • horiz - принимает логическое значение: TRUE для горизонтального расположения столбцов и FALSE - для вертикального.
  • density - числовой вектор, задающий плотность заштриховки столбцов.
  • angle - угол наклона штрихов (в градусах).
  • col - вектор цветовых кодов для столбцов или их элементов. По умолчанию столбцы закрашиваются серым цветом если height - вектор, и разными градациями серого если height - матрица.
  • border - код цвета для обводки столбцов. Если границу столбцов обводить не предполагается, можно указать border = NA.
  • ... - другие графические параметры (см., например, ?plot и ?par).

05 января 2012

Базовые графические возможности R: круговые диаграммы



Круговые диаграммы (англ. pie charts), мягко говоря, не в почете у профессиональных статистиков. Информация, представляемая при помощи круговой диаграммы, плохо вопринимается визуально и практически всегда лучшей альтернативой этому способу визуализации данных будет точечная диаграмма или, в крайнем случае, столбиковая диаграмма (подробнее см. Cleveland W.S. (1985) The Elements of Graphing Data. Wadsworth. Monterey, CA, USA). Не удивительно поэтому, что в первых версиях R даже не было отдельной функции для построения круговых диаграмм. Позднее такая функция появилась, поскольку в ряде случаев этот вид диаграмм все же может оказаться полезным. Не сложно догадаться, что соответствующая функция называется pie().