26 марта 2016

Опрос: в каком виде печатать книгу "Введение в статистическое обучение (с примерами на языке R)"?



Друзья, в продолжение предыдущего сообщения я хотел бы посоветоваться с вами по поводу того, в каком виде следует печатать книгу "Введение в статистическое обучение (с примерами на R)". Сейчас с "ДМК Пресс" обсуждаются два варианта - либо черное-белое, либо цветное издание. 

В оригинале многое завязано на цвет, и, конечно, хотелось бы эту особенность сохранить также в переводном издании. Однако стоимость цветной книги, естественно, будет выше. (Здесь следует еще отметить, что цветная печать будет выполнена при помощи струйного принтера на обычной офсетной (офисной) 80-граммовой бумаге - о глянце и лоске оригинала речь, к сожалению, не идет.). Поэтому хотелось бы знать ваше мнение - мнение потенциальных покупателей и читателей этой книги. Я был бы благодарен, если бы вы проголосовали за приемлемый для вас вариант, используя приведенную ниже форму.

P.S.: Заметьте, что если вы уже выполнили предварительный заказ, и если окончательный выбор будет сделан в пользу цветного издания, то вы получите свою цветную книгу по действующей в настоящий момент сниженной стоимости (т.е. 959 руб. вместо 1500 руб.)

16 марта 2016

Открыт предварительный заказ на книгу "Введение в статистическое обучение (с примерами на языке R)"



Друзья, перевод книги "An Introduction to Statistical Learning, with Applications in R", над которым я работал в течение последнего года, завершен. Полученный результат - "Введение в статистическое обучение (с примерами на языке R)" - выйдет из печати примерно через 1.5 месяца, но уже сейчас на сайте издательства ДМК Пресс можно сделать предварительный заказ на эту книгу.

Книга представляет собой доступно изложенное введение в статистическое обучение – незаменимый набор инструментов, позволяющих извлечь полезную информацию из больших и сложных наборов данных, которые начали возникать в последние 20 лет в таких областях, как биология, экономика, маркетинг, физика и др. В этой книге описаны одни из наиболее важных методов моделирования и прогнозирования, а также примеры их практического применения. Рассмотренные темы включают линейную регрессию, классификацию, создание повторных выборок, регуляризацию, деревья решений, машины опорных векторов, кластеризацию и др. Описание этих методов сопровождается многочисленными иллюстрациями и практическими примерами. Поскольку цель этого учебника заключается в продвижении методов статистического обучения среди практикующих академических исследователей и промышленных аналитиков, каждая глава включает примеры практической реализации соответствующих методов с помощью R – чрезвычайно популярной среды статистических вычислений с открытым кодом.

Издание рассчитано на неспециалистов, которые хотели бы применять современные методы статистического обучения для анализа своих данных. Предполагается, что читатели ранее прослушали лишь курс по линейной регрессии и не обладают знаниями матричной алгебры.


13 марта 2016

Интересное из мира R (29 февраля - 13 марта 2016 г.)



  • 10 марта состоялся релиз новой версии R - v3.2.4 (кодовое название "Very Secure Dishes"), которая завершает серию "3.2.x". Для безболезненного обновления текущей версии R, установленной на Вашем компьютере, можно воспользоваться пакетом installr. Подробеные примеры работы с этим пакетом можно найти здесь.
  • 27-30 июня на кампусе Стэнфордского университета пройдет очередная конференция UseR! Организаторы проводят конкурс стипендий для покрытия расходов, связанных с участием в конференции.
  • Хэдли Уикхэм объявил о выходе новой версии пакета ggplot2 - v2.1.0.
  • Проекты, имеющие отношение к языку R, в этом году снова войдут в программу Google Summer of Code. Заявку на свой проект могут подать студенты со всего мира. Принятые проекты получат финансирование в размере 5000$. С примерами проектов, реализованных в предыдущие годы, можно ознакомиться здесь.
  • 7 марта Американская Статистическая Ассоциация (ASA) опубликовала статью, которая, безусловно, войдет в историю статистики (см. также здесь). После примерно 150 лет повсеместного употребления р-значений для проверки статистических гипотез, ASA сделала следующее утверждение: "Well-reasoned statistical arguments contain much more than the value of a single number and whether that number exceeds an arbitrary threshold. The ASA statement is intended to steer research into a ‘post p<0.05 era." Иными словами,  ASA утверждает, что хорошо обоснованная аргументация включает в себя намного больше, чем значение вероятности, превышающее некоторое произвольно выборанное пороговое значение. Это заявление ставит своей целью начать новую эру в исследовательской работе, где клише 'p<0.05' утратит свои позиции.
    Публикация статьи вызвала волну реакций со стороны как защитников, так и противников р-значений. Ссылки на соответствующие публикации, а также список пакетов для R, которые помогают решить распространенные проблемы с использованием и интерпретацией p-значений, можно найти в этой статье проф. И. Беньямини.