Автор: Сергей Мастицкий

Перед тем как привести обзор новых (и обновленных) R-пакетов за январь, стоит сказать о важном событии: в этом месяце общее количество пакетов в хранилище CRAN перевалило за 10000 (эта цифра не включает в себя примерно 1300 пакетов, опубликованных в хранилище BioConductor, а также сотни пакетов, доступных только в репозиториях GitHub). Наличие такого разнообразия пакетов в распоряжении пользователей R - дело, несомненно, хорошее. Однако со временем пользователям становится все сложнее ориентироваться в этом разнообразии и находить нужные пакеты. В этой связи, возможно, стоит напомнить о некоторых инструментах, которые могут оказаться полезными при выполнении соответствующего поиска:


  • Обзор пакетов для решения ряда распространенных задач, приведенный на сайте CRAN - CRAN Task Views;
  • Список популярных пакетов на сайте RDocumentation.org;
  • Список популярных пакетов, опубликованных на плафторме GitHub;
  • CRANberries - обновляющийся в реальном времени список пакетов, добавляемых в хранилище CRAN;
  • Инструмент для поиска по хранилищу CRAN, доступный на сайте MRAN (Microsoft R Application Network);
  • Shiny-приложение для поиска пакетов по категориям CRAN Task Views, созданное Михаилом Поповым;
  • Функция findFn() из пакета sos.

А теперь, собственно, сам список новых/обновленных пакетов, показавшихся мне особенно интересными:
  • fst - пакет для выполнения (сверх-)быстрой сериализации и десериализации таблиц данных R.
  • intrval - набор утилит, облегчающих разбиение количественных переменных на интервалы.
  • newsflash - R-интерфейс к GDELT Television Explorer API, с помощью которого можно выяснить, сколько раз то и или иное ключевое слово встречалось в новостях телевизионных каналов США за определенное время.
  • roxygen2 - вышла новая версия этого популярного пакета, предназначенного для написания документации в ходе разработки R-пакетов. Теперь такую документацию можно писать и в формате Markdown.
  • RPushbullet - новая версия пакета, представляющего собой R-интерфейс к Pushbullet API - сервису для обмена сообщениями между устройствами.
  • RQGIS - новая версия пакета, представляющего собой R-интерфейс к QGIS API. QGIS - это геоинформационная система с открытым кодом, в которой реализовано более 1000 различных алгоритмов обработки геоданных.
  • sparklyr - новая версия пакета, предназначенного для работы со Spark-кластерами из среды R.
  • superheat - новый пакет для построения диаграмм типа "тепловая карта" (heatmap). Имеется возмжность создавать составные рисунки (например, путем добавления к тепловой карте диаграмм рассеяния, диаграмм размахов и т.п.) и выполнять тонкую настройку их элементов.
  • tensorflow - R-интерфейс к TensorFlow - известной библиотеке от Google для создания предсказательных моделей.
  • xml2 - новая версия пакета от RStudio для работы с данными в формате XML.

1 Комментарии

Анонимный написал(а)…
А как же rseek.org для поиска пакетов?
Новые Старые