24 февраля 2015

И снова об авторизации при работе с Twitter API



В одном из предыдущих сообщений я описал простой пример использования возможностей пакетов twitteR и tm для анализа Twitter-сообщений. Сервис Twitter постоянно изменяется, что приводит к соответствующим изменениям и в той большой "экосистеме" программного обеспечения, которая выросла вокруг этого сервиса. Так, в 2013 г. в Twitter API были внесены существенные изменения касательно процедуры авторизации приложений, что усложнило работу с пакетом twitteR. Однако в последнее время процесс авторизации стал проще - об этом и будет данное сообщение.



21 февраля 2015

Русскоязычные ресурсы по статистике, машинному обучению, R



Вместо еженедельного обзора "Интересное из мира R" сегодня я хотел бы представить вашему вниманию список наиболее интересных (с моей субъективной точки зрения) русскоязычных ресурсов по теории статистики, машинному обучению и R. Его можно найти на специально созданной по этому случаю новой странице - "Ресурсы". Учитывая глобальный рост интереса к анализу данных в целом и к R в частности (см. Google-тренд), я уверен, что количество сайтов соответствующей тематики будет также расти и список будет пополняться новыми интересным ссылками.


15 февраля 2015

Интересное из мира R (9-15 февраля 2015 г.)



  • Каждые три месяца сайт githut.info обобщает информацию с GitHub.com по интенсивности использования разных языков программирования. По результатам последнего квартала 2014 г., R оказался на 12 месте. Первые три места приходятся на JavaScript, Java и Python.
  • Согласно объявлению, сделанному Хэдли Уикхэмом в официальном блоге RStudio, компания Epoch.com (система онлайн-платежей) окажет финансовую поддержку для дальнейшей разработки пакета RMySQL.
  • Тарак Ша (Tarak Shah) из Калифорнийского университета в Беркли создал пакет rcrunchbase, который позволяет делать запросы к CrunchBase - самой крупной базе данных, содержащей профили стартап-компаний со всего мира.
  • Илья Кипнис в своем блоге QuantStrat TradeR привел подробный пример использования алгоритма PELT, предназначенного для обнаружения "точек перелома" во временных рядах.
  • В Сети появилось видео презентации по Shiny, которую Джо Ченг (Joe Cheng) из RStudio сделал в январе на одном из воркшопов сообщества  DataScience.LA:



08 февраля 2015

Интересное из мира R (2-8 февраля 2015 г.)



  • Опубликован новый номер журнала The R Journal. Все вошедшие в него статьи можно скачать в виде одного PDF файла по этой ссылке.
  • Объявлено начало регистрации на 3-ю конференцию R in Insurance (Использование R в индустрии страхования), которая пройдет 29 июня 2015 г. в  университете Амстердама. На конференции будут обсуждаться такие темы, как управление рисками, ценообразование, моделирование потерь и др. с использованием R в качестве основного инструмента.
  • Дэвид Робинсон (David Robinson) сообщил в своем блоге о создании пакета stackr, который позволяет делать запросы к API Q&A-сайтов Stack Exchange и собирать информацию по заданным там вопросам, ответам, тэгам сообщений, пользователям и т.п. Результаты таких запросов сохраняются в виде стандартных таблиц данных R, что значительно облегчает их дальнейший анализ и визуализацию.
  • Ричард Паф (Richard Pugh) из Mango Solutions описал способ встраивания html-кода интерактивных страниц, созданных при помощи R (например, графики googleVis или приложения Shiny), в презентации PowerPoint.
  • На сайте profitraders.com в рамках рубрики "Язык R для трейдера" опубликован пример использования R для создания простой торговой стратегии на основе пары скользящих средних.

01 февраля 2015

Интересное из мира R (26 января - 1 февраля 2015 г.)



  • Рисунок заимствован с сайта www.infoworld.com
    Интегрированная среда разработки RStudio вошла в список из 32 высокотехнологичных IT-продуктов, которые получили награду "Технология года 2015" от группы экспертов InfoWorld.
  • Маркус Гесман (Markus Gesmann) объявил о выходе новой версии (v0.5.8) своего пакета googleVis, который обеспечивает R-интерфейс для Google Charts API. Подробные примеры создания разнотипных диаграмм с использованием googleVis можно найти здесь.
  • Вышла новая версия пакета matrixStats (v0.13.1), предназначенного для организации высокоэффективных вычислений сводных статистик по столбцам и строкам матриц большого размера. В блоге автора этого пакета (Henrik Bengtsson) можно найти сравнение быстродействия функций matrixStats с соответствующими базовыми функциями R.
  • Новая версия пакета stringdist (v0.9), предназначенного для нахождения частично совпадающих символьных выражений и расчета мер сходства между символьными выражениями, позволяет выполнять параллельные вычисления на основе протокола OpenMP.
  • Интернет-издание Market Lab:Financial Innovations запускает 8-недельный онлайн-курс "Изучаем язык R". Все уроки будут представлены в видеоформате. По итогам каждого урока выдается домашнее задание, выполнение которого контролируется преподавателем (Илья Мартыненко). В процессе обучения поддерживается обратная связь между преподавателем и слушателями через сайт Market Lab. Стоимость курса составляет 14500 руб. Первые 6 уроков первой темы (из 6) бесплатны.