30 ноября 2014

Интересное из мира R (24-30 ноября 2014)



  • 18-19 ноября компанией Oxdata в Калифорнии (Mountain View) была проведена конференция H2O World, главной целью которой было продвижение разработанных Oxdata многочисленных Java-библиотек, реализующих алгоритмы машинного обучения (набор этих библиотек известен как H2O - отсюда название конференции). Значительное внимание также было уделено использованию этих библиотек из среды R посредством пакета одноименного пакета - h2o. На сайте компании, в частности, можно ознакомиться с материалами семинаров, на которых обсуждались такие темы, как разведочный анализ данных, регрессионный анализ, глубокое обучение, кластерный анализ и методы снижения размерности. Более подробный отчет о конференции можно найти в статье Джозефа Рикерта (Joseph Rickert) в блоге компании Revolution Analytics.

27 ноября 2014

Делимся опытом: особенности подготовки русскоязычных текстовых документов к анализу в среде R



Сегодня я запускаю еще одну новую рубрику – «Делимся опытом», идея которой состоит в публикации гостевых сообщений, написанных читателями блога. Как следует из названия, в этих сообщениях будут публиковаться небольшие «рецепты» решения конкретных задач и проблем, возникающих при работе с R. Если у вас информация, которой, как вам кажется, стоит поделиться с другими – пожалуйста, свяжитесь со мной по электронной почте (адрес можно найти в разделе «Обо мне»). Я с удовольствием рассмотрю любое предложение. Главным критерием при отборе потенциальных публикаций является их оригинальность - в том смысле, что они предлагают описание нетривиальных проблем, решение которых не удается найти путем быстрого Google-поиска или на Q&A-форумах вроде StackOverflow и CrossValidated (т.е. включая запросы на английском языке). Дисклеймер: я оставляю за собой право отклонить любое предложение без объяснения причин. 

С радостью представляю первое гостевое сообщение, автором которого является Михаил Сидоренко (Украина). Михаил – психолог по образованию. Он использовал R в последние два года при работе над проектами, имеющими отношение к психологическим и маркетинговым исследованиям, а с недавних пор – также к исследованиям социальных медиа.

23 ноября 2014

Интересное из мира R (17-23 ноября 2014)



  • Стало известно, что 19 января 2015 г. проф. Тревор Хасти (Trevor Hastie; Стэнфордский Университет) и проф. Роберт Тибширани (Robert Tibshirany; Стэнфордский Университет) начнут очередной цикл своего бесплатного онлайн-курса "Статистическое обучение" (Statistical Learning). Это вводный курс с упором на регрессионные модели и алгоритмы классификации, основанный на книге "An introduction to statistical modeling" (настоятельно рекомендую ее всем, кто интересуется современными методами статистики и машинного обучения!). Все рассматриваемые в ходе курса примеры реализованы в R. Зарегистрироваться можно уже сайчас.

16 ноября 2014

Интересное из мира R (10-16 ноября 2014)



Этим сообщением я начинаю новую рубрику "Интересное из мира R" (вдохновил меня на это еженедельный "обзор наиболее интересных материалов по анализу данных и машинному обучению", публикуемый на Хабрахабре). По мере возможностей, каждую неделю я планирую публиковать краткий обзор пяти событий и/или публикаций, имеющих отношение к R, которые, по моему субъективному мнению, заслуживают внимания. Вот список за эту неделю:

11 ноября 2014

Рейтинг TIOBE за ноябрь 2014 г.: R на пути в список топ-10 языков программирования



Согласно рейтингу языков программирования, ежемесячно составляемому голландской компанией TIOBE, в этом году R имеет шансы попасть в список топ-10 языков. Об этом свидетельствует неуклонный рост популярности R, о чем говорит, в частности, перемещение этого языка в рейтинге TIOBE с 15 позиции в октябре на 12 в ноябре (для сравнения, два года назад R находился примерно на 25-м месте). Важно отметить, что данный рейтинг отражает лишь популярность того или иного языка программирования и не ставит своей целью выяснить, какой из них является лучшим. Подробнее о критериях, используемых TIOBE для составления рейтинга, можно узнать здесь.

Ниже приведена оригинальная таблица с сайта TIOBE, в которой отражены данные по 20 верхним позициям за ноябрь 2014 г.