29 декабря 2011

Где найти данные для анализа в системе R?



Один из постоянных участников R-сообщества inside-R.org Джо Рикерт (Joe Rickert) опубликовал интересный список сайтов, на которых можно найти данные, пригодные для анализа в системе R. Составление этого списка было обусловлено, прежде всего, желанием облегчить поиск надежных и бесплатных данных для тестирования новых методов анализа (подробнее см. здесь). Очевидно, что такой список будет полезен и для других целей - например, при разработке новых алгоритмов анализа, в преподавании статистики, изучении трендов развития экономики, написании научных работ, и т.п. Ниже приведен несколько дополненный мною список из оригинальной статьи Джо. Значок (R) напротив того или иного источника указывает на возможность загрузки данных либо непосредственно в формате R, либо в формате, который может быть легко преобразован в таковой непосредственно из R консоли (см. примеры здесь). В остальных случаях данные относительно просто могут быть конвертированы в формат csv при помощи сторонних приложений и затем загружены в R (об импортировании csv-файлов в R см. здесь).

27 декабря 2011

Анализ данных клинических испытаний при помощи R



Спешу поделиться своими впечатлениями от онлайн-курса по анализу данных клинических испытаний при помощи R (Biostatistics with R: Clinical Trial Applications). Курс был организован американским институтом статистического образования "statistics.com". Компания statistics.com предлагает около 100 курсов по статистическому анализу, более 10 из которых посвящены использованию системы R.

08 декабря 2011

Библиотека русскоязычных материалов по R



В попытке организовать единую точку доступа к материалам по R, опубликованным на русском языке, я завел новый раздел у себя в блоге - "Библиотека". Под "материалами" понимаются файлы книг, методических пособий и журнальных публикаций, имеющиеся в сети Internet в открытом доступе. Буду признателен, если Вы сообщите мне о свободно доступных работах, которые отсутствуют в этой "библиотеке"

02 декабря 2011

Создание пользовательских карт Google при помощи R



Ранее я уже писал о пакете googleVis, в состав которого входит ряд функций, обеспечивающих взаимодействие R с интерфейсом программирования приложений Google Visualization API. Функции из этого пакета генерируют html код, который можно легко вставить на страницу веб-сайта. Среди прочих, имеется и функция для создания известных всем карт Google. В общем виде синтаксис этой функции выглядит следующим образом:
gvisMap(data, locationvar=" ", tipvar=" ", options = list(), chartid) ,
где
  • data - таблица данных (data.frame), которая должна содержать как минимум два столбца - c географическими координатами точек (locationvar) и с текстом всплывающих подсказок для каждой из этих точек.
  • locationvar - имя столбца, содержащего географические координаты точек. Координаты задаются в формате "широта:долгота" (см. пример ниже). Вместо географических координат можно также указывать [максимально полный] почтовый адрес, однако авторы пакета googleVis рекомендуют этот способ не применять.
  • tipvar - имя столбца, содержащего текст всплывающих подсказок для каждой точки.
  • options - список опций, определяющих внешний вид карты.
  • chartid - текстовая переменная, при помощи которой карте можно присвоить пользовательское имя. По умолчанию данная настройка отключена (в этом случае ID карты генерируется случайным образом автоматически).