20 сентября 2015

В Лондоне прошла конференция "Эффективные применения языка R - 2015"



На этой неделе в Лондоне прошла 2-я конференция "Effective Applications of the R Language (EARL)" ("Эффективные применения языка R"), организованная консалтинговой компанией Mango Solutions (первая конференция состоялась в прошлом году). EARL представляет собой форум, участники которого обмениваются опытом внедрения аналитических решений на основе R в бизнес-процессы.

Конференция началась с нескольких проводившихся параллельно практических семинаров: 1) "Integrating R and Python - an introduction to using both in a data analysis pipeline" ("Интегрирование R и Python - введение в использование обоих языков в анализе данных"); 2) "Current best practices in formal package development" ("Современный передовые методы формальной разработки пакетов"); "Introduction to Rcpp" ("Введение в Rcpp") и "Interactive reporting with R" ("Создание интерактивных отчетов при помощи R").


09 сентября 2015

Опубликована новая книга на русском языке по практическому применению методов машинного обучения



В издательстве ДМК Пресс вышла новая переводная книга по машинному обучению - "Построение систем машинного обучения на языке Python" (оригинал - "Building Machine Learning Systems with Python"). Как следует из названия, все примеры в книге построены на Python - одном из главных конкурентов R в области "науки о данных" в настоящее время. Тем не менее, для понимания описанных примеров знание Python не обязательно - читателю достаточно иметь опыт программирования на любом другом языке и некоторую подготовку в статистике.

На мой взгляд, основным достоинством этой книги является ее практическая ориентация - все примеры представляют собой конкретные прикладные проблемы. Необходимая теоретическая часть также описана простым и понятным языком. Таким образом, книга будет интересна всем, кто интересуется методами машинного обучения и их практическим применением, вне зависимости от программного обеспечения, которое используется для реализации этих методов.


06 сентября 2015

Интересное из мира R (10 августа - 6 сентября 2015 г.)



  • Экосистема R продолжает расти с захватывающим дух темпом. 12 августа 2015 г. количество пакетов, опубликованных в хранилище CRAN, превысило 7000. Увеличение с 6000 до 7000 произошло за 286 дней - это значит, что в настоящее время ежедневно "рождается" примерно 3.5 новых пакета в день. Следует отметить, что эти данные касаются только CRAN. Существуют и другие хранилища с большим числом дополнительных пакетов для R - Bioconductor, R-Forge, Github т.д.
  • В блоге компании Revolution Analytics была сообщено о том, что платформа Revolution R Enterprise стала доступной на Azure Marketplace. Пользователи имеют возможность работать с данными размером до 1 ТБ, запрашивая от 4 до 32 виртуальных процессоров. Минимальная стоимость за пользование сервисом составляет 1.5$ за час работы на машине с 4 процессорами.
  • Максвелл Джозеф (Maxwell Joseph), аспирант из университета Колорадо, разместил в своем блоге более 20 видео-уроков, охватывающих наиболее распространенные проблемы, с которыми сталкиваются новые пользователи R.
  • Роб Рудис (Rob Rudis) привел у себя в блоге пример работы с пакетом docxtractr, который позволяет извлекать табличные данные из документов Word и формировать из них стандартные таблицы данных R.
  • Андрей Огурцов (автор блога "Биостатистика и язык R") сообщил о завершении работы над русскоязычным переводом документации по пакету dplyr. Все переведенные статьи можно найти на соответствующей Github-странице.