Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Moscow Institute of Physics and Technology

Прикладные задачи анализа данных

Moscow Institute of Physics and Technology via Coursera

This course may be unavailable.

Overview

Save Big on Coursera Plus. 7,000+ courses at $160 off. Limited Time Only!
Методы машинного обучения — будь то алгоритмы классификации или регрессии, методы кластеризации или алгоритмы понижения размерности — применяются к подготовленным данным с вычисленными признаками для решения уже сформулированной задачи. Однако специалисты по анализу данных редко оказываются в такой идеальной ситуации. Обычно перед ними ставят задачи, которые нуждаются в уточнении формулировки, выборе метрики качества и протокола тестирования итоговой модели. Данные, с которыми нужно работать, часто представлены в непригодном виде: они зашумлены, содержат ошибки и выбросы, хранятся в неудобном формате и т. д.

В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На их примере вы узнаете, как извлекать признаки из разнородных данных, какие при этом возникают проблемы и как их решать. Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения.

Прослушав этот курс, вы познакомитесь с распространенными типами прикладных задач и будете понимать схемы их решения.

Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

Syllabus

  • Бизнес-задачи
    • На этой неделе мы разберём две крупные задачи, часто возникающие в бизнес-аналитике. Первая связана с прогнозированием временных рядов; задачи такого типа часто возникают, когда необходимо оценить значение показателя в будущем, основываясь на истории его изменения в прошлом. Такими показателями могут быть спрос на товар, аудитория рекламного баннера, цена акций и т.д. Вторя задача — это анализ поведения пользователей. Класс задач, связанных с анализом пользовательских данных, неизбежно появляется практически в любой сфере бизнеса, подразумевающей работу с клиентами. Как правило, это такие задачи, как привлечение пользователей, работа с аудиторией, прогнозирование оттока и удержание клиентов.
  • Анализ медиа
    • Вторая неделя посвящена вопросам компьютерного зрения. Мы обсудим базовые методы обработки изображений и поговорим про такие задачи, как классификация изображений, распознавание лиц, детекция объектов и семантическая сегментация. Благодаря развитию глубоких нейронных сетей, за последние несколько лет во всех этих задачах достигнут огромный прогресс. Вы узнаете, как на практике пользоваться нейросетевыми библиотеками, и научитесь быстро собирать и размечать большие коллекции изображений.
  • Анализ текстов
    • Данная неделя посвящена работе с особым видом данных — текстами. Тексты встречаются во многих задачах, и при этом свести их к стандартной матрице с объектами и признаками не так просто. В этом модуле мы изучим основы работы с текстовыми данными, способы генерации признаков на их основе, поговорим о нейросетевых подходах (в частности, word2vec и рекуррентные сети). Также мы обсудим несколько конкретных прикладных задач анализа текстов, среди которых будут анализ тональности и аннотирование.
  • Рекомендации и ранжирование
    • На этой неделе вы познакомитесь с задачами, в которых нужно оценивать "интересность" различных объектов для пользователя - задачей ранжирования, актуальной при построении поиска, и задачей построения рекомендательных систем, возникающей при необходимости посоветовать пользователю некоторый контент (фильмы, музыку, статьи) или товары в интернет-магазине.

Taught by

Вадим Стрижов, Виктор Кантор, Евгений Рябенко, Евгений Соколов and Эмели Драль

Reviews

3.0 rating, based on 1 Class Central review

Start your review of Прикладные задачи анализа данных

  • Profile image for Alex Ivanov
    Alex Ivanov

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.