Список материалов по машинному обучению
Источник https://github.com/demidovakatya/vvedenie-mashinnoe-obuchenie
Оглавление
- Библиотека ML-специалиста + выбор редакции:
- Дополнительные материалы к курсу «Введение в машинное обучение»
- Рекомендации от преподавателей специализации «Машинное обучение и анализ данных»
- Литература для поступления в ШАД
- Подборка научпоп-книг
- По темам:
- Онлайн-курсы (MOOC)
- Чаты/паблики/каналы про ML
- Календарь соревнований по анализу данных
- Машинное обучение: вводная лекция – К. В. Воронцов
- Lecture notes and code for Machine Learning practical course on CMC MSU
- 100+ Free Data Science Books – более 100 бесплатных книг по Data Science
- 16 Free Machine Learning Books — ещё 16 бесплатных книг по ML
- Free O’Reilly data science ebooks
- 100 репозиториев по машинному обучению
- awesome-machine-learning — A curated list of awesome Machine Learning frameworks, libraries and software
- Open Source Society University’s Data Science course – this is a solid path for those of you who want to complete a Data Science course on your own time, for free, with courses from the best universities in the World
- Доска по data science в Trello — проверенные материалы, организованные по темам (expertise tracks, языки программирования, различные инструменты)
- Machine Learning Resource Guide
- 17 ресурсов по машинному обучению от Типичного Программиста
- 51 toy data problem in Data Science
- Dive into Machine Learning
- Data Science Interview Questions — огромный список вопросов для подготовки к интервью на позицию data scientist’а
- Много книг по Natural Language Processing
- Список открытых источников данных, на которых можно найти бесплатные датасеты
- What should I learn in data science in 100 hours?
- machine-learning-for-software-engineers – A complete daily plan for studying to become a machine learning engineer
- Tutorials on topics in machine learning
- Постоянно обновляющаяся подборка ссылок по датасаенсу
- Teach yourself Machine Learning the hard way!
- An article a week – list of good articles on ML/AI/DL
- The most popular programming books ever mentioned on StackOverflow
- Cookiecutter Data Science – A logical, reasonably standardized, but flexible project structure for doing and sharing data science work
- awesome-datascience-ideas – A list of awesome and proven data science use cases and applications
- machine-learning-surveys – A curated list of Machine Learning Surveys, Tutorials and Books
- A hands-on data science crash course in Python by Bart De Vylder and Pieter Buteneers from CoScale
Библиотека ML-специалиста
- A Course in Machine Learning – Hal Daumé III
- A Probabilistic Theory of Pattern Recognition – Devroye, Gyorfi, Lugosi (pdf)
- Applied Predictive Modeling – M. Kuhn, K. Johnson (2013)
- Bayesian Reasoning and Machine Learning – D.Barber (2015) (pdf)
- Core Concepts in Data Analysis: Summarization, Correlation and Visualization – Boris Mirkin
- Data Mining and Analysis. Fundamental Concepts and Algorithms – M.J.Zaki, W.Meira Jr (2014) (pdf)
- Data Mining: Concepts and Techniques – Jiawei Han et. al.
- Data Science For Dummies – Lillian Pierson (2015)
- Doing Data Science
- Elements of Statistical Learning – Hastie, Tibshirani, Friedman (pdf)
- Foundations of Machine Learning – Mehryar Mohri, Afshin Rostamizadeh, and Ameet Talwalkar (2012)
- Frequent Pattern Mining – Charu C Aggarwal, Jiawei Han (eds.) (pdf)
- Gaussian Processes for Machine Learning – Carl E. Rasmugit lssen, Christopher K. I. Williams (pdf)
- Inductive Logic Programming: Techniques and Applications – Nada Lavrac, Saso Dzeroski
- Information Theory, Inference and Learning Algorithms – David MacKay
- Introduction to Information Retrieval – Manning, Rhagavan, Shutze (pdf)
- Introduction To Machine Learning – Nils J Nilsson (1997)
- Introduction to Machine Learning – Smola and Vishwanathan (pdf)
- Machine learning cheat sheet – soulmachine (2015) (pdf)
- Machine Learning in Action – Peter Harrington
- Machine Learning, Neural and Statistical Classification – D. Michie, D. J. Spiegelhalter
- Machine Learning. The Art of Science of Algorithms that Make Sense of Data – P. Flach (2012)
- Machine Learning – Tom Mitchell
- Machine Learning – Andrew Ng
- Mining Massive Datasets – Jure Leskovec, Anand Rajaraman, Jeff Ullman
- Pattern Recognition and Machine Learning – C.M.Bishop (2006)
- Probabilistic Programming and Bayesian Methods for Hackers (free)
- A Programmer’s Guide to Data Mining – Ron Zacharski (pdf)
- R in Action
- Reinforcement Learning: An Introduction – Richard S. Sutton, Andrew G. Barto
- The LION Way Machine Learning plus Intelligent Optimization (pdf)
- Understanding Machine Learning: From Theory to Algorithms
- Анализ больших наборов данных – перевод Mining Massive Datasets
- Математические методы обучения по прецедентам (теория обучения машин) – К. В. Воронцов (pdf)
- Машинное обучение — Петер Флах (pdf)
- Методы ансамблирования обучающихся алгоритмов — диссертация А. Гущина (pdf)
- Построение систем машинного обучения — Л. П. Коэльо, В. Ричарт (2016)
Онлайн-курсы (MOOC)
- Перечень лучших курсов по практически любым областям математики
- Тонна разнообразных курсов по программированию, алгоритмам, в том числе 14 курсов по ML
- Coursera:
- CS229: Machine Learning (Andrew Ng, Stanford University) – самый популярный курс по машинному обучению (осторожно, вместо стандартных Питона или R – Matlab/Octave)
- Специализация Машинное обучение и Анализ данных (Яндекс + МФТИ/MIPT)
- Machine Learning Foundations: A Case Study Approach (University of Washington)
- Data Science at Scale Specialization (University of Washington)
- Calculus: Single Variable Part 1 (University of Pennsylvania)
- Calculus One (The Ohio State University)
- Современная комбинаторика (А.М. Райгородский, МФТИ/MIPT)
- Теория вероятностей для начинающих (А.М. Райгородский, МФТИ/MIPT)
- Линейная алгебра (ВШЭ/HSE) — курс линейной алгебры для нематематических факультетов, подходит «для быстрого старта»
- Эконометрика (ВШЭ/HSE) (Econometrics)
- Business Analytics Specialization (University of Pennsylvania) – специализация о практическом применении статистики и анализа данных. Для людей, разочаровавшихся в DS и не понимающих, на кой это всё
- Social Network Analysis (University of Michigan)
- Social and Economic Networks: Models and Analysis (Stanford University)
- Recommender Systems Specialization (University of Minnesota)
- Build Intelligent Applications Specialization (University of Washington).
- Udacity:
- Edx:
- Learning from Data (Caltech) – введение в машинное обучение (основная теория, алгоритмы и области практического применения)
- Видеозаписи лекций Школы Анализа Данных (ШАД)
- Data Mining in Action course materials (МФТИ/MIPT)
- Открытый курс OpenDataScience по машинному обучению
- Intro to Python for Data Science – основы Python и немного про NumPy
- Основы статистики — качественное введение в статистику, целиком на русском языке
- Data Science and Machine Learning Essentials (Microsoft)
- CS231n: Convolutional Neural Networks for Visual Recognition (Stanford University) — отличный десятинедельный курс по нейросетям и компьютерному зрению
- Mining Massive Datasets (Stanford University) – курс, основанный на книге Mining of Massive Datasets авторов Jure Leskovec, Anand Rajaraman, and Jeff Ullman (они же являются инструкторами этого курса)
- CS109: Data Science (Harvard University)
Social
Обсуждение машинного обучения в мессенджерах (группы, каналы, чаты, сообщества).
- Open Data Science
- Посвященная московским ML-тренировкам группа в facebook
- и группа вконтакте про тренировки по машинному обучению
- Томская группа по машинному обучению
- Slack Томской группы по ML
- Паблики/группы вконтакте:
- В телеграме:
- Канал сообщества DeepLearning
- Канал сообщества modeloverfit
- Первый новостной канал про data science
- Чат по большим данным, обработке и машинному обучению — Big Data & Machine Learning
- Чат по теме Data Science — Data Science Chat
- Канал py_digest
- Чат ru_python
- Spark in me: Internet, statistics, data science, philosophy
- Чат канала Spark in me
- Канал с горячими постами с Reddit на DS тематику
- Сабреддиты по машинному обучению и смежным темам (рекомендую посмотреть как минимум топ за всё время + sidebar):
- /r/analyzit
- /r/bigdata
- /r/bigdatajobs
- /r/computervision
- /r/datacleaning
- /r/datagangsta
- /r/dataisbeautiful
- /r/dataisugly
- /r/datascience
- /r/datasets
- /r/dataviz
- /r/JupyterNotebooks
- /r/LanguageTechnology
- /r/learnmachinelearning
- /r/learnpython
- /r/MachineLearning
- /r/opendata
- /r/rstats
- /r/probabilitytheory
- /r/pystats
- /r/SampleSize
- /r/semanticweb
- /r/statistics
- /r/textdatamining
- People tweeting about ML and AI
- Блоги по датасаенс-тематике + список:
смотрите раздел Математика