book-open 1 test
UX-исследования, Growth-эксперименты, Data Science

60 книг по Data Science, которые помогут начать, глубже разобраться в предмете, взяться за первые коммерческие проекты, сформировать серьезный подход и вкус к делу

В подборке книги как про гайки и болты повседневного прикладного анализа данных, машинного обучения и глубокого обучения (в том числе и в проектном формате), так и книги по тренировке математического, критического и бизнес-мышления от сильных специалистов со всего мира.
Иллюстрация Jack Daly: https://dribbble.com/shots/2282022-Deloitte-Uni-Press-Illustration

Автору списка ответы по классическим поисковым запросам «ТОП 10 книг по data science» и аналогичные подборки в соцсетях не помогли в полном объеме справиться с барьерами на проектах, так как содержат укороченные списки и не ориентируют в полном объеме по важным темам для старта в области Data Science.

Среди авторов инженеры Stripe, Google, Gartner, BRCK, основатели институтов влиятельные и цитируемые на международном рынке инженеры, исследователи, основатели кафедр и институтов в области анализа данных, машинного обучения и data science.

Если в деле повышения качества продуктов и услуг с помощью данных вы впервые, то начните с формата обучения мастер-ученик, найдите того, кому важен личный бренд. Например оперативно (за 1 месяц) получить практику в развитии продукта и коммуникации вы можете на платформе thisisdata.ru и https://nagornyy.me/. После сочетайте чтение книг из списка с движением по simulator.gopractice.ru (1-3 месяца), datacamp.com (1-3 месяца) и с другими программами от корпораций (от 4-х месяцев до 1 года), возникающими на пути совершенствования подходов к делу.

Содержание:

  1. Обзор профессии
  2. Аналитическая культура
  3. Разминка в проектном формате (ML и нейронные сети) с целью прочувствовать контекст
  4. Аналитика в бизнесе, продукте и маркетинге
  5. Математическая статистика и визуализация данных
  6. Проектная практика, советы и инструменты Data science
  7. Практика SQL
  8. Глубокое обучение: знакомство и первая практика (Deep learning)
  9. Системное мышление
  10. Математическое мышление
  11. Практика математического мышления
  12. Критическое мышление
  13. Методы и практика исследований
  14. Выводы и рекомендации

По Deep Learning подборка затрагивает только первые шаги (хоть и на топовом уровне, например в книгах с fastai и PyTorch). О глубоком обучении нужна отдельная подобная подборка.

Где подробное описание пользы книг? На страницах книг в сети – в ТОП-5 выдачи поисковых машин – есть подробное описание, оно соответствует действительности (проверено на барьерах в проектах). Читать важно с учетом раздела, в который помещена книга.

Обзор профессии (AI/ML/DL)

  1. Роман с Data Science. Как монетизировать большие данные | Роман Зыков
  2. Работа с данными в любой сфере. Как выйти на новый уровень, используя аналитику | Еременко Кирилл
  3. Data Science для карьериста | Нолис Ж., Робинсон Э.
  4. Надежность нейронных сетей (Neural Nets). Укрепляем устойчивость ИИ к обману | Кэти Уорр
  5. Наука о данных. Базовый курс | Келлехер Джон Д.
  6. Глубокое обучение (Deep Learning). Самый краткий и понятный курс | Джон Келлехер

Автор первой книги Роман Зыков – занимается анализом данных почти двадцать лет. В послужном списке Романа — создал с нуля собственную компанию с офисами в Европе и Южной Америке, ставшей лидером по применению искусственного интеллекта (AI) на российском рынке. Кроме того, автор книги создал с нуля аналитику в Ozon.ru.

Интересуетесь свежими статьями по продуктовому дизайну (UX/UI)? 🚀

Подписывайтесь на канал в Telegram | ВКонтакте, Instagram, Facebook

Автор второй книги Кирилл Еременкопрактик в области данных, консультант, основатель и генеральный директор SuperDataScience, образовательного онлайн-портала для аналитиков данных. Еременко специализируется на использовании больших данных для управления бизнес-стратегиями, улучшения качества обслуживания клиентов и преобразования бизнес-процессов. Также он ведет более 20 онлайн-курсов, которые посещают около 100 000 студентов со всего мира.

Джон Келлехер – лектор в Дублинском технологическом институте и член-учредитель Исследовательского центра прикладного анализа DIT.

Аналитическая культура

  1. Искусство статистики. Как находить ответы в данных, Дэвид Шпигельхалтер
  2. Математическое невежество и его последствия, Паулос Дж.
  3. Аналитическая культура, От сбора данных до бизнес-результатов, Карл Андерсон
  4. Наука о данных. Учебный курс, Скиена Стивен С.

Автор первой книги сэр Дэвид Шпигельхалтер — британский статистик, председатель Винтоновского центра исследований риска и доказательных коммуникаций в Статистической лаборатории Кембриджского университета. Шпигельхалтер — один из самых цитируемых и влиятельных исследователей в своей области. В 2017-2018 годах избирался президентом Королевского статистического общества.

Скиена Стивен С.профессор кафедры вычислительной техники университета Стоуни - Брук, известный исследователь алгоритмов, лауреат премии института IEEE, автор популярной книги "Programming Challenges: The Programming Contest Training Manual" ("Олимпиадные задачи по программированию: Руководство по подготовке к соревнованиям").

Разминка в проектном формате (ML и нейронные сети) с целью прочувствовать контекст

  1. Создание приложений машинного обучения: от идеи к продукту | Амейзен Эммануэль
  2. Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности
  3. Теоретический минимум по Big Data. Всё что нужно знать о больших данных | Су Кеннет, Анналин Ын
  4. Прикладное машинное обучение с помощью Scikit-Learn, Keras и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем , 2-е издание | Орельен Жерон

Амейзен Эммануэль — работает инженером по машинному обучению в Stripe. До этого возвглял отдел AI в Data Insights, где курировал более 150 проектов по машинному обучению.

Орельен Жерон – консультант по машинному обучению. Бывший сотрудник Google, он руководил командой классификации видеороликов YouTube с 2013 по 2016 год. С 2002 по 2012 год он также был основателем и руководителем технического отдела в компании Wifirst, ведущего поставщика услуг беспроводного доступа к Интернету во Франции, а в 2001 году – основателем и руководителем технического отдела в фирме Polyconseil, которая сейчас управляет сервисом совместного пользования электромобилями Autolib’.

Аналитика в бизнесе, продукте и маркетинге

  1. Визуальное мышление, Как «продавать» свои идеи при помощи визуальных образов, Дэн Роэм
  2. Игра в цифры. Как аналитика позволяет видеоиграм жить лучше
  3. Потребительская лояльность. Механизмы повторной покупки, Михаил Дымшиц
  4. Сигнал и Шум. Почему одни прогнозы сбываются, а другие - нет | Сильвер Нейт
  5. Рисуем дерево | Мунари Бруно
  6. Брендинг : учебник для бакалавров / А. М. Чернышева, Т. Н. Якубова. — Москва: Издательство Юрайт, 2019. — 504 с. — (Бакалавр. Академический курс).

Дэн Роэм — обладатель ученой степени в области изобразительного искусства и биологии, автор двух мировых бестселлеров «Визуальное мышление. Как “продавать” свои идеи при помощи визуальных образов» и «Практика визуального мышления. Оригинальный метод решения сложных проблем». Первый признан лучшей инновационной книгой года и занимает 5-е место в топе продаж Амазона в категории бизнес-литературы. Дэн – основатель консалтинговой компании Digital Roam Inc и помогает руководителям и топ-менеджерам решать сложные задачи, используя визуальное мышление. В числе его клиентов значатся такие компании, как Google, eBay, Microsoft, Boeing, Intel, Cisco, IBM. Дэн Роэм оказывал консультационные услуги даже Военно-морским силам США. После блестяще подготовленной им презентации по системе здравоохранения в Штатах был приглашен агентством по коммуникациям Белого Дома — участвовать в дискуссии по визуальному мышлению.

Михаил Дымшиц – один из крупнейших в России теоретиков и практиков маркетинга и массовых коммуникаций. Окончил 1-ый Московский Медицинский институт. С 1991 года занимается изучением вопросов, связанных с психологией потребителя, маркетинговыми исследованиями и массовой коммуникации.

Математическая статистика и визуализация данных

  1. Статистика. Краткий курс в комиксах, Гоник Л., Смит В.
  2. Статистика. Базовый курс в комиксах, Грейди Клейн и Алан Дебни
  3. Данные: визуализируй, расскажи, используй. Сторителлинг в аналитике, Коул Нафлик
  4. Статистика и котики | Савельев Владимир
  5. Практическая статистика для специалистов Data Science | Брюс Эндрю, Брюс Питер
  6. Анализ данных в Tableau на практике. 100 советов, уроков и стратегий от мастера дзен в Tableau, Слипер Райан
  7. «Принцип пирамиды Минто», Б. Минто

Гоник Л. – математик по образованию и карикатурист по призванию, более 40 лет выступает в роли популяризатора науки. Самостоятельно либо в соавторстве со специалистами из разных областей знания он готовит материал, а затем рисует комик­сы, которые могут сравниться по информативности с иным университетским учебником. Занимательные по форме и имеющие солидную научную основу, его работы заслужили популярность во всем мире. Они переведены на многие иностранные языки, а их тираж превысил полмиллиона экземпляров.

Питер Брюсоснователь Института статистического образования Statistics.com, в программе которого около 100 курсов в области статистики, и примерно половина из них предназначена для аналитиков данных. Эндрю Брюс имеет более чем 30-летний стаж работы в области статистики и науки о данных в академической сфере, правительстве и бизнесе. Он обладает степенью доктора философии в области статистики Вашингтонского университета и опубликовал несколько работ в рецензируемых журналах

Барбара Минто – В 1963 году Барбара Минто стала первой женщиной-консультантом известной компании McKinsey. Именно сотрудники и клиенты McKinsey были первыми учениками Минто. В 1966 году руководство направило ее в Лондон с целью развития письменных навыков среди работников компании. В конечном итоге это и послужило базой для развития теории, представленной в данной книге. С 1973 Барбара управляет собственной компанией Minto International Inc. Она с успехом преподает в бизнес-школах Гарварда, Стэнфорда, Чикаго, а также в крупнейших компаниях США и Европы. Она специализируется на преподавании золотых правил как новичкам в бизнесе, так и профессионалам, в чьи обязанности входит составление сложных отчетов, анализов, служебных записок и презентаций.

Проектная практика, советы и инструменты Data science

  1. «Рекомендательные системы на практике» (Фальк Ким), ДМК Пресс.
  2. Машинное обучение без лишних слов, Бурков А.
  3. Data Science. Наука о данных с нуля Грас Джоэл | Грас Джоэл
  4. Машинное обучение с использованием Python. Сборник рецептов Элбон Крис | Элбон Крис
  5. Python для сложных задач. Наука о данных и машинное обучение, Вандер Плас Дж.
  6. Машинное обучение с участием человека, Роберт (Манро) Монарх
  7. Инженерия машинного обучения, Бурков А.

Джоэл Грас работает инженером-программистом в компании Google. До этого занимался аналитической работой в нескольких стартапах. Активно участвует в неформальных мероприятиях специалистов в области науки о данных.

Элбон Крисаналитик данных и политолог с десятилетним опы­том применения статистического обучения, искусственного интеллекта и разработ­ки программного обеспечения для политических, социальных и гуманитарных про­ектов — от мониторинга выборов до оказания помощи в случае стихийных бедст­вий. В настоящее время Крис является ведущим аналитиком данных в BRCK — кенийском стартапе, создающем прочную сеть для пользователей Интернета на формирующемся рынке.

Андрей Бурков — обладает степенью доктора по ИИ и возглавляет группу машинного обучения в компании Gartner. Книга основана на собственном 15-летнем опыте Андрея в решении задач с помощью ИИ, а также на опубликованных работах лидеров индустрии.

«Фундаментальная работа о практическом построении моделей машинного обучения и их развертывании в производственной среде. Подоспела как раз в тот момент, когда компании начали прозревать и осознавать, что для того, чтобы решение, основанное на машинном обучении, заработало, необходимы осознанные усилия инженеров и знакомство с передовыми практиками. Еще одна замечательная книга от Андрея!»

Каролис Урбонас, начальник отдела машинного обучения в Amazon

Практика SQL

  1. Изучаем SQL. Генерация, выборка и обработка данных| Алан Болье

Алан Болье (Alan Beaulieu, на русском языке также издавался, как Алан Бьюли) — более 25 лет проектировал и создавал приложения для работы с базами данных. Он — один из авторов книги Mastering Oracle SQL и автор онлайн-курса по SQL Калифорнийского университета.
Алан создал собственную консалтинговую компанию, которая специализируется на проектировании и разработке баз данных в области финансов и телекоммуникаций.

Глубокое обучение (Deep learning, DL): знакомство и практика

  1. Глубокое обучение на Python | Шолле Франсуа
  2. Грокаем глубокое обучение | Траск Эндрю
  3. Глубокое обучение. Готовые решения, Осинга Д.

Франсуа Шолле создатель Keras – самой известной библиотеки глубокого обучения, принимает активное участие в разработке фреймворка машинного обучения TensorFlow. Занимается проблематикой глубокого обучения в Google, в городе Маунтин-Вью, штат Калифорния.

Давид Осинга — опытный инженер-программист, ранее работавший в Google, основатель трех стартапов. Ведет популярный сайт программных проектов, посвященный в том числе машинному обучению.

Системное мышление

  1. Искусство системного мышления. Необходимые знания о системах и творческом подходе к решению проблем, Авторы:Джозеф О'Коннор, Иан Макдермотт
  2. Бизнес-процессы: как их описать, отладить и внедрить. Практикум. Рыбаков М.Ю. | Рыбаков Михаил Юрьевич
  3. Маршрут построен! Применение карт путешествия потребителя для повышения продаж и лояльности, Илья Балахнин

Математическое мышление

  1. Математическая составляющая, Андреев Н., Коновалов С., Панюнин Н. (ред.-сост.)
  2. Виноградов, Кузьмин: Логика. Учебник для средней школы (1954)
  3. Математическое мышление | Книга для родителей и учителей, Джо Боулер
  4. Думай как математик. Как решать любые задачи быстрее и эффективнее | Оакли Барбара
  5. Укрощение бесконечности. История математики от первых чисел до теории хаоса | Стюарт Иан
  6. Математика в огне. Нескучный неучебник | Уилкс Джейсон
  7. Что такое математика? Элементарный очерк идей и методов, Р. Курант, Г. Роббинс
  8. Модельное мышление. Как анализировать сложные явления с помощью математических моделей

Математическое мышление подразумевает активный подход к познанию, при котором ученики видят свою задачу в понимании и осмыслении материала. Чувство числа отражает глубокое понимание математики, и оно формируется при применении математического мышления, суть которого — в наполнении чисел и количества смыслом.

Практика математического мышления

  1. Анне Юнсен: Как понять математику. Решение проще, чем вы думаете
  2. Как объяснить ребенку математику, Иллюстрированный справочник для родителей
  3. Алгебра. Естественная наука в комиксах | Гоник Ларри
  4. Матан. Краткий курс в комиксах | Гоник Ларри
  5. Математика с дурацкими рисунками: Идеи, которые формируют нашу реальность, Орлин Б.
  6. Время переменных: Математический анализ в безумном мире, Орлин Б.
  7. Математическая смекалка. Лучшие логические задачи, головоломки и упражнения, Кордемский Б.
  8. Элементарный курс теории вероятностей. Стохастические процессы и финансовая математика от Чжун, К. Л.
  9. Теория вероятностей и математическая статистика. Учебник для прикладного бакалавриата, Гурман
  10. Руководство к решению задач по теории вероятностей и математической статистике. Учебное пособие для прикладного бакалавриата, Гурман
  11. Дискретная математика для программистов, Р. Хаггарти
  12. Байесовская статистика: Star Wars, LEGO, резиновые уточки и многое другое, Курт У.

Анне Лене Юнсен – консультирует по вопросам обучения и психического здоровья, работает с детьми и взрослыми, которым требуется особый подход в обучении. Получила экономическое и психологическое образование, степень доктора в области когнитивной и социальной психологии.

Борис Анастасьевич Кордемский (23 мая 1907, Кикнур, Вятская губерния — 29 марта 1999) — российский и советский математик, методист, популяризатор математики, автор популярных книг и учебников. Известен как автор книги «Математическая смекалка», рассчитанной на школьников младших классов. Первое издание вышло в 1954 году; к моменту выхода в 1972 году перевода на английский язык книга выдержала восемь изданий на русском языке и была переведена на украинский, эстонский, латышский, литовский языки; за пределами СССР книга была опубликована в Болгарии, Румынии, Венгрии, Чехословакии, Польше, Германии, Франции, Китае, Японии, Корее.

Владимир Ефимович Гмурман — советский математик, кандидат наук, педагог. Автор популярных учебников и задачников по теории вероятностей, в том числе переведенных на английский, польский, испанский, японский языки.

Критическое мышление

  1. Методы проектирования | Джонс Джон Кристофер J. Christofer Jones
  2. Как быть стоиком. Античная философия и современная жизнь | Пильюччи Массимо
  3. Найти идею: Введение в ТРИЗ - теорию решения изобретательских задач | Альтшуллер Г.

Критическое мышле́ние (англ. critical thinking) — система суждений, которая используется для анализа вещей и событий с формулированием обоснованных выводов и позволяет выносить обоснованные оценки, интерпретации, а также применять полученные результаты к ситуациям и проблемам. В общем значении под критическим мышлением подразумевается мышление более высокого уровня, чем мышление докритическое.

Критическое мышление — способность человека ставить под сомнение поступающую информацию, включая собственные убеждения.

Методы и практика исследований

  1. Осмысление. Сила гуманитарного мышления в эпоху алгоритмов, Кристиан Мадсбьерг
  2. Методология и методы научного исследования. Учебное пособие для бакалавриата и магистратуры, Байбородова Л.В., Чернявская А.П.
  3. Исследование трендов. Практическое руководство | Реймонд Мартин
  4. Придумай. Сделай. Сломай. Повтори. Настольная книга приемов и инструментов дизайн-мышления, Мартин Томич, Кара Ригли, Мадлен Бортвик, Насим Ахмадпур, Джессика Фроули, А. Баки Кокабалли, Клаудия Нуньес-Пачеко, Карла Стракер, Лиан Лок

Выводы и рекомендации

Изучайте материалы параллельно с работой или проектной практикой на курсах – деятельность поможет закрепить материал. Обратите внимание на блоки про мышление. Общий подход в том, что каждая книга – контакт с концентрированным виртуальным носителем мышления и возможность учиться у увлеченных делом специалистов, посвятивших несколько десятков лет исследованиям, экспериментам и практике в Data Science, а также создавших массовые и социально значимые методы и продукты.