28 февраля 2016

Интересное из мира R (15-28 февраля 2016 г.)



  • Компания Mango Solutions объявила о проведении очередной, 3-й конференции "Эффективные применения языка R" (EARL). Конференция будет проходить в Лондоне 13-15 сентября 2016 г. Уже сейчас можно пройти регистрацию и приобрести пропуск со скидкой. На YouTube можно посмотреть некоторые доклады, сделанные участниками конференции в прошлом году.
  • Дерек Нортон (Derek Norton) из Microsoft недавно провел вебинар, посвященный использованию функционала R в SQL Server 2016 посредством Microsoft R Server. Здесь можно посмотреть видео с этого вебинара.
  • Если вы пишете приложения на основе Shiny и запускаете их с AWS, то вам стоит почитать статью Кристофа Глура (Christoph Glur) о создании формы авторизации для таких приложений.
  • Если вам нужно построить нелинейную регрессионную модель вроде модели Михаэлиса-Ментен и вы хотите узнать, как это сделать в R, то начните с этой вводной статьи на сайте DataScience+.
  • 4 марта на платформе Stepic начнется новый курс "Основы программирования на R". В ходе курса будут рассмотрены основные этапы статистического анализа, считывание данных, предобработка данных, применение основных статистических методов и визуализация результатов.

20 февраля 2016

Как послать электронное письмо из R



Представьте, что мы выполняем ресурсоемкие вычисления в R, которые длятся несколько часов (например, обучение той или иной модели на большом объеме данных и одновременное оценивание качества ее предсказаний путем перекрестной проверки). Сидеть перед монитором и ждать, когда эти вычисления завершатся - не очень хороший способ провести время с пользой. Вместо этого можно "попросить" R послать нам по электронной почте автоматическое уведомление о завершении вычислений. Есть как минимум четыре пакета для R, которые позволяют организовать автоматические уведомления посредством электронной почты - sendmailR, mailRgmailR и gmailr, несколько различающихся по своему функционалу и легкости процесса настройки отправки сообщений. В качестве примера рассмотрим, как работает mailR - один наиболее "продвинутых" пакетов.




14 февраля 2016

Интересное из мира R (1 - 14 февраля 2016 г.)



  • Полку книг по R на русском языке прибыло! Владимир Кириллович Шитиков, мой соавтор по работе "Статистический анализ и визуализация данных с помощью R", опубликовал книгу "Экотоксикология и статистическое моделирование эффекта с использованием R". Как сообщается на сайте Владимира Кирилловича, в этой книге "...представлено описание статистических методов, как широко используемых, так и не нашедших пока должного применения при обработке данных экотоксикологического мониторинга. В центре внимания - построение и последующий анализ различных зависимостей "доза-время-эффект" для отклика, представленного в альтернативной, категориальной и метрической шкалах наблюдений. Сюда вошли пробит- и логит-анализ, модели выживания, методы построения различных нелинейных зависимостей, модели сглаживания и т.д. Подробно представлена методика работы с пакетом drс статистической среды R. Отдельная глава посвящена сравнительной оценке чувствительности видов к токсикантам и оценке экологического риска для биоценоза. Методы статистического анализа неизменно иллюстрированы примерами биологического характера. Представлены тексты несложных скриптов в кодах R, дающие возможность читателям легко воспроизвести самим технику выполнения расчетов... Книга может быть использована в качестве учебного пособия по статистическим методам для студентов и аспирантов высших учебных заведений медицинского и биологического профиля."
  • 9 февраля вышла новая версия RStudio. Одна из интересных новых опций - это возможность создавать пользовательские расширения (add-ins) для RStudio, которые могут делать практически все, что может делать R. Для создания такого расширения необходимо будет написать R-пакет с соответствующими функциями и зарегистрировать его в качестве расширения. Если вы не знакомы с процессом создания пакетов для R, то рекомендую прочесть статью Хилари Паркер (Hilary Parker) "Writing an R package from scratch", а также книгу Хэдли Уикхэма (Hadley Wickham) "R Packages". Еще одно полезное нововведение - возможность отделять закладки редактора кода от RStudio и выносить их в самостоятельные окна, что будет очень удобным, например, при работе с несколькими мониторами.
  • Опубликован пакет WHO, позволяющий выполнять запросы к базам данных Всемирной Организации Здравоохранения из среды R. Здесь и здесь можно ознакомиться с примерами работы с этим пакетом.
  • Компания Win-Vector опубликовала на Youtube бесплатный курс по A/B-тестированию, основанному на принципах байесовской статики.
  • The R Foundation, наконец-то, поделились с общественностью новыми логотипами R (изображения в высоком разрешении в форматах PNG и SVG), которые согласуются с принципами "плоского дизайна".