Автору списка ответы по классическим поисковым запросам «ТОП 10 книг по data science» и аналогичные подборки в соцсетях не помогли в полном объеме справиться с барьерами на проектах, так как содержат укороченные списки и не ориентируют в полном объеме по важным темам для старта в области Data Science.
Среди авторов инженеры Stripe, Google, Gartner, BRCK, основатели институтов влиятельные и цитируемые на международном рынке инженеры, исследователи, основатели кафедр и институтов в области анализа данных, машинного обучения и data science.
Если в деле повышения качества продуктов и услуг с помощью данных вы впервые, то начните с формата обучения мастер-ученик, найдите того, кому важен личный бренд. Например оперативно (за 1 месяц) получить практику в развитии продукта и коммуникации вы можете на платформе thisisdata.ru и https://nagornyy.me/. После сочетайте чтение книг из списка с движением по simulator.gopractice.ru (1-3 месяца), datacamp.com (1-3 месяца) и с другими программами от корпораций (от 4-х месяцев до 1 года), возникающими на пути совершенствования подходов к делу.
Содержание:
- Обзор профессии
- Аналитическая культура
- Разминка в проектном формате (ML и нейронные сети) с целью прочувствовать контекст
- Аналитика в бизнесе, продукте и маркетинге
- Математическая статистика и визуализация данных
- Проектная практика, советы и инструменты Data science
- Практика SQL
- Глубокое обучение: знакомство и первая практика (Deep learning)
- Системное мышление
- Математическое мышление
- Практика математического мышления
- Критическое мышление
- Методы и практика исследований
- Выводы и рекомендации
По Deep Learning подборка затрагивает только первые шаги (хоть и на топовом уровне, например в книгах с fastai и PyTorch). О глубоком обучении нужна отдельная подобная подборка.
Где подробное описание пользы книг? На страницах книг в сети – в ТОП-5 выдачи поисковых машин – есть подробное описание, оно соответствует действительности (проверено на барьерах в проектах). Читать важно с учетом раздела, в который помещена книга.
Обзор профессии (AI/ML/DL)
- Роман с Data Science. Как монетизировать большие данные | Роман Зыков
- Работа с данными в любой сфере. Как выйти на новый уровень, используя аналитику | Еременко Кирилл
- Data Science для карьериста | Нолис Ж., Робинсон Э.
- Надежность нейронных сетей (Neural Nets). Укрепляем устойчивость ИИ к обману | Кэти Уорр
- Наука о данных. Базовый курс | Келлехер Джон Д.
- Глубокое обучение (Deep Learning). Самый краткий и понятный курс | Джон Келлехер
Автор первой книги Роман Зыков – занимается анализом данных почти двадцать лет. В послужном списке Романа — создал с нуля собственную компанию с офисами в Европе и Южной Америке, ставшей лидером по применению искусственного интеллекта (AI) на российском рынке. Кроме того, автор книги создал с нуля аналитику в Ozon.ru.
Автор второй книги Кирилл Еременко – практик в области данных, консультант, основатель и генеральный директор SuperDataScience, образовательного онлайн-портала для аналитиков данных. Еременко специализируется на использовании больших данных для управления бизнес-стратегиями, улучшения качества обслуживания клиентов и преобразования бизнес-процессов. Также он ведет более 20 онлайн-курсов, которые посещают около 100 000 студентов со всего мира.
Джон Келлехер – лектор в Дублинском технологическом институте и член-учредитель Исследовательского центра прикладного анализа DIT.
Аналитическая культура
- Искусство статистики. Как находить ответы в данных, Дэвид Шпигельхалтер
- Математическое невежество и его последствия, Паулос Дж.
- Аналитическая культура, От сбора данных до бизнес-результатов, Карл Андерсон
- Наука о данных. Учебный курс, Скиена Стивен С.
Автор первой книги сэр Дэвид Шпигельхалтер — британский статистик, председатель Винтоновского центра исследований риска и доказательных коммуникаций в Статистической лаборатории Кембриджского университета. Шпигельхалтер — один из самых цитируемых и влиятельных исследователей в своей области. В 2017-2018 годах избирался президентом Королевского статистического общества.
Скиена Стивен С. – профессор кафедры вычислительной техники университета Стоуни - Брук, известный исследователь алгоритмов, лауреат премии института IEEE, автор популярной книги "Programming Challenges: The Programming Contest Training Manual" ("Олимпиадные задачи по программированию: Руководство по подготовке к соревнованиям").
Разминка в проектном формате (ML и нейронные сети) с целью прочувствовать контекст
- Создание приложений машинного обучения: от идеи к продукту | Амейзен Эммануэль
- Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности
- Теоретический минимум по Big Data. Всё что нужно знать о больших данных | Су Кеннет, Анналин Ын
- Прикладное машинное обучение с помощью Scikit-Learn, Keras и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем , 2-е издание | Орельен Жерон
Амейзен Эммануэль — работает инженером по машинному обучению в Stripe. До этого возвглял отдел AI в Data Insights, где курировал более 150 проектов по машинному обучению.
Орельен Жерон – консультант по машинному обучению. Бывший сотрудник Google, он руководил командой классификации видеороликов YouTube с 2013 по 2016 год. С 2002 по 2012 год он также был основателем и руководителем технического отдела в компании Wifirst, ведущего поставщика услуг беспроводного доступа к Интернету во Франции, а в 2001 году – основателем и руководителем технического отдела в фирме Polyconseil, которая сейчас управляет сервисом совместного пользования электромобилями Autolib’.
Аналитика в бизнесе, продукте и маркетинге
- Визуальное мышление, Как «продавать» свои идеи при помощи визуальных образов, Дэн Роэм
- Игра в цифры. Как аналитика позволяет видеоиграм жить лучше
- Потребительская лояльность. Механизмы повторной покупки, Михаил Дымшиц
- Сигнал и Шум. Почему одни прогнозы сбываются, а другие - нет | Сильвер Нейт
- Рисуем дерево | Мунари Бруно
- Брендинг : учебник для бакалавров / А. М. Чернышева, Т. Н. Якубова. — Москва: Издательство Юрайт, 2019. — 504 с. — (Бакалавр. Академический курс).
Дэн Роэм — обладатель ученой степени в области изобразительного искусства и биологии, автор двух мировых бестселлеров «Визуальное мышление. Как “продавать” свои идеи при помощи визуальных образов» и «Практика визуального мышления. Оригинальный метод решения сложных проблем». Первый признан лучшей инновационной книгой года и занимает 5-е место в топе продаж Амазона в категории бизнес-литературы. Дэн – основатель консалтинговой компании Digital Roam Inc и помогает руководителям и топ-менеджерам решать сложные задачи, используя визуальное мышление. В числе его клиентов значатся такие компании, как Google, eBay, Microsoft, Boeing, Intel, Cisco, IBM. Дэн Роэм оказывал консультационные услуги даже Военно-морским силам США. После блестяще подготовленной им презентации по системе здравоохранения в Штатах был приглашен агентством по коммуникациям Белого Дома — участвовать в дискуссии по визуальному мышлению.
Михаил Дымшиц – один из крупнейших в России теоретиков и практиков маркетинга и массовых коммуникаций. Окончил 1-ый Московский Медицинский институт. С 1991 года занимается изучением вопросов, связанных с психологией потребителя, маркетинговыми исследованиями и массовой коммуникации.
Математическая статистика и визуализация данных
- Статистика. Краткий курс в комиксах, Гоник Л., Смит В.
- Статистика. Базовый курс в комиксах, Грейди Клейн и Алан Дебни
- Данные: визуализируй, расскажи, используй. Сторителлинг в аналитике, Коул Нафлик
- Статистика и котики | Савельев Владимир
- Практическая статистика для специалистов Data Science | Брюс Эндрю, Брюс Питер
- Анализ данных в Tableau на практике. 100 советов, уроков и стратегий от мастера дзен в Tableau, Слипер Райан
- «Принцип пирамиды Минто», Б. Минто
Гоник Л. – математик по образованию и карикатурист по призванию, более 40 лет выступает в роли популяризатора науки. Самостоятельно либо в соавторстве со специалистами из разных областей знания он готовит материал, а затем рисует комиксы, которые могут сравниться по информативности с иным университетским учебником. Занимательные по форме и имеющие солидную научную основу, его работы заслужили популярность во всем мире. Они переведены на многие иностранные языки, а их тираж превысил полмиллиона экземпляров.
Питер Брюс – основатель Института статистического образования Statistics.com, в программе которого около 100 курсов в области статистики, и примерно половина из них предназначена для аналитиков данных. Эндрю Брюс имеет более чем 30-летний стаж работы в области статистики и науки о данных в академической сфере, правительстве и бизнесе. Он обладает степенью доктора философии в области статистики Вашингтонского университета и опубликовал несколько работ в рецензируемых журналах
Барбара Минто – В 1963 году Барбара Минто стала первой женщиной-консультантом известной компании McKinsey. Именно сотрудники и клиенты McKinsey были первыми учениками Минто. В 1966 году руководство направило ее в Лондон с целью развития письменных навыков среди работников компании. В конечном итоге это и послужило базой для развития теории, представленной в данной книге. С 1973 Барбара управляет собственной компанией Minto International Inc. Она с успехом преподает в бизнес-школах Гарварда, Стэнфорда, Чикаго, а также в крупнейших компаниях США и Европы. Она специализируется на преподавании золотых правил как новичкам в бизнесе, так и профессионалам, в чьи обязанности входит составление сложных отчетов, анализов, служебных записок и презентаций.
Проектная практика, советы и инструменты Data science
- «Рекомендательные системы на практике» (Фальк Ким), ДМК Пресс.
- Машинное обучение без лишних слов, Бурков А.
- Data Science. Наука о данных с нуля Грас Джоэл | Грас Джоэл
- Машинное обучение с использованием Python. Сборник рецептов Элбон Крис | Элбон Крис
- Python для сложных задач. Наука о данных и машинное обучение, Вандер Плас Дж.
- Машинное обучение с участием человека, Роберт (Манро) Монарх
- Инженерия машинного обучения, Бурков А.
Джоэл Грас – работает инженером-программистом в компании Google. До этого занимался аналитической работой в нескольких стартапах. Активно участвует в неформальных мероприятиях специалистов в области науки о данных.
Элбон Крис – аналитик данных и политолог с десятилетним опытом применения статистического обучения, искусственного интеллекта и разработки программного обеспечения для политических, социальных и гуманитарных проектов — от мониторинга выборов до оказания помощи в случае стихийных бедствий. В настоящее время Крис является ведущим аналитиком данных в BRCK — кенийском стартапе, создающем прочную сеть для пользователей Интернета на формирующемся рынке.
Андрей Бурков — обладает степенью доктора по ИИ и возглавляет группу машинного обучения в компании Gartner. Книга основана на собственном 15-летнем опыте Андрея в решении задач с помощью ИИ, а также на опубликованных работах лидеров индустрии.
«Фундаментальная работа о практическом построении моделей машинного обучения и их развертывании в производственной среде. Подоспела как раз в тот момент, когда компании начали прозревать и осознавать, что для того, чтобы решение, основанное на машинном обучении, заработало, необходимы осознанные усилия инженеров и знакомство с передовыми практиками. Еще одна замечательная книга от Андрея!»
Каролис Урбонас, начальник отдела машинного обучения в Amazon
Практика SQL
- Изучаем SQL. Генерация, выборка и обработка данных| Алан Болье
Алан Болье (Alan Beaulieu, на русском языке также издавался, как Алан Бьюли) — более 25 лет проектировал и создавал приложения для работы с базами данных. Он — один из авторов книги Mastering Oracle SQL и автор онлайн-курса по SQL Калифорнийского университета.
Алан создал собственную консалтинговую компанию, которая специализируется на проектировании и разработке баз данных в области финансов и телекоммуникаций.
Глубокое обучение (Deep learning, DL): знакомство и практика
- Глубокое обучение на Python | Шолле Франсуа
- Грокаем глубокое обучение | Траск Эндрю
- Глубокое обучение. Готовые решения, Осинга Д.
Франсуа Шолле — создатель Keras – самой известной библиотеки глубокого обучения, принимает активное участие в разработке фреймворка машинного обучения TensorFlow. Занимается проблематикой глубокого обучения в Google, в городе Маунтин-Вью, штат Калифорния.
Давид Осинга — опытный инженер-программист, ранее работавший в Google, основатель трех стартапов. Ведет популярный сайт программных проектов, посвященный в том числе машинному обучению.
Системное мышление
- Искусство системного мышления. Необходимые знания о системах и творческом подходе к решению проблем, Авторы:Джозеф О'Коннор, Иан Макдермотт
- Бизнес-процессы: как их описать, отладить и внедрить. Практикум. Рыбаков М.Ю. | Рыбаков Михаил Юрьевич
- Маршрут построен! Применение карт путешествия потребителя для повышения продаж и лояльности, Илья Балахнин
Математическое мышление
- Математическая составляющая, Андреев Н., Коновалов С., Панюнин Н. (ред.-сост.)
- Виноградов, Кузьмин: Логика. Учебник для средней школы (1954)
- Математическое мышление | Книга для родителей и учителей, Джо Боулер
- Думай как математик. Как решать любые задачи быстрее и эффективнее | Оакли Барбара
- Укрощение бесконечности. История математики от первых чисел до теории хаоса | Стюарт Иан
- Математика в огне. Нескучный неучебник | Уилкс Джейсон
- Что такое математика? Элементарный очерк идей и методов, Р. Курант, Г. Роббинс
- Модельное мышление. Как анализировать сложные явления с помощью математических моделей
Математическое мышление подразумевает активный подход к познанию, при котором ученики видят свою задачу в понимании и осмыслении материала. Чувство числа отражает глубокое понимание математики, и оно формируется при применении математического мышления, суть которого — в наполнении чисел и количества смыслом.
Практика математического мышления
- Анне Юнсен: Как понять математику. Решение проще, чем вы думаете
- Как объяснить ребенку математику, Иллюстрированный справочник для родителей
- Алгебра. Естественная наука в комиксах | Гоник Ларри
- Матан. Краткий курс в комиксах | Гоник Ларри
- Математика с дурацкими рисунками: Идеи, которые формируют нашу реальность, Орлин Б.
- Время переменных: Математический анализ в безумном мире, Орлин Б.
- Математическая смекалка. Лучшие логические задачи, головоломки и упражнения, Кордемский Б.
- Элементарный курс теории вероятностей. Стохастические процессы и финансовая математика от Чжун, К. Л.
- Теория вероятностей и математическая статистика. Учебник для прикладного бакалавриата, Гурман
- Руководство к решению задач по теории вероятностей и математической статистике. Учебное пособие для прикладного бакалавриата, Гурман
- Дискретная математика для программистов, Р. Хаггарти
- Байесовская статистика: Star Wars, LEGO, резиновые уточки и многое другое, Курт У.
Анне Лене Юнсен – консультирует по вопросам обучения и психического здоровья, работает с детьми и взрослыми, которым требуется особый подход в обучении. Получила экономическое и психологическое образование, степень доктора в области когнитивной и социальной психологии.
Борис Анастасьевич Кордемский (23 мая 1907, Кикнур, Вятская губерния — 29 марта 1999) — российский и советский математик, методист, популяризатор математики, автор популярных книг и учебников. Известен как автор книги «Математическая смекалка», рассчитанной на школьников младших классов. Первое издание вышло в 1954 году; к моменту выхода в 1972 году перевода на английский язык книга выдержала восемь изданий на русском языке и была переведена на украинский, эстонский, латышский, литовский языки; за пределами СССР книга была опубликована в Болгарии, Румынии, Венгрии, Чехословакии, Польше, Германии, Франции, Китае, Японии, Корее.
Владимир Ефимович Гмурман — советский математик, кандидат наук, педагог. Автор популярных учебников и задачников по теории вероятностей, в том числе переведенных на английский, польский, испанский, японский языки.
Критическое мышление
- Методы проектирования | Джонс Джон Кристофер J. Christofer Jones
- Как быть стоиком. Античная философия и современная жизнь | Пильюччи Массимо
- Найти идею: Введение в ТРИЗ - теорию решения изобретательских задач | Альтшуллер Г.
Критическое мышле́ние (англ. critical thinking) — система суждений, которая используется для анализа вещей и событий с формулированием обоснованных выводов и позволяет выносить обоснованные оценки, интерпретации, а также применять полученные результаты к ситуациям и проблемам. В общем значении под критическим мышлением подразумевается мышление более высокого уровня, чем мышление докритическое.
Критическое мышление — способность человека ставить под сомнение поступающую информацию, включая собственные убеждения.
Методы и практика исследований
- Осмысление. Сила гуманитарного мышления в эпоху алгоритмов, Кристиан Мадсбьерг
- Методология и методы научного исследования. Учебное пособие для бакалавриата и магистратуры, Байбородова Л.В., Чернявская А.П.
- Исследование трендов. Практическое руководство | Реймонд Мартин
- Придумай. Сделай. Сломай. Повтори. Настольная книга приемов и инструментов дизайн-мышления, Мартин Томич, Кара Ригли, Мадлен Бортвик, Насим Ахмадпур, Джессика Фроули, А. Баки Кокабалли, Клаудия Нуньес-Пачеко, Карла Стракер, Лиан Лок
Выводы и рекомендации
Изучайте материалы параллельно с работой или проектной практикой на курсах – деятельность поможет закрепить материал. Обратите внимание на блоки про мышление. Общий подход в том, что каждая книга – контакт с концентрированным виртуальным носителем мышления и возможность учиться у увлеченных делом специалистов, посвятивших несколько десятков лет исследованиям, экспериментам и практике в Data Science, а также создавших массовые и социально значимые методы и продукты.