Skip to content

Latest commit

 

History

History
27 lines (21 loc) · 1.86 KB

File metadata and controls

27 lines (21 loc) · 1.86 KB

Машинное обучение (Введение в анализ данных)

В этом курсе были изучены линейные модели и решающие деревья — два наиболее распространенных вида моделей в анализе данных. Значительное влияние было уделено тому, как правильно применять данные методы к различным видам данных, как измерять и оценивать их качество. На семинарах и в домашних заданиях были решены реальные задачи — фильтрация спама, оценивание стоимости жилья или распознавание рукописных цифр.

Исходный репозиторий

Страница курса

Основные библиотеки:

  • numpy
  • pandas
  • matplotlib.pyplot
  • sklearn (scikit-learn)
  • statsmodel
  • ntlk
  • pymystem3
  • pymorphy2
  • re
  • seaborn
  • collections