Курсы
Аналитика

Профессия Data Scientist

Формат
Онлайн
Длительность
11 месяцев
Трудоустройство
Да
Уровень
Начальный
Результат
Диплом

Описание

Комплексный курс для получения профессии Data Scientist от онлайн-университета Нетология. Университет предоставляет помощь в написании дипломной работы и развернутый комментарий по результатам ее выполнения. Обучение проходит в формате онлайн или очно. Курсы можно оформить в рассрочку или в кредит на выгодных условиях с возможностью вернуть часть денег через налоговый вычет. Каждому студенту предоставляется помощь с трудоустройством после окончания обучения.

Программа курса

SQL и получение данных

В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.

Python, статистика и математика для анализа данных

Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.

  • Архитектура и структура баз данных (БД)
  • Простые запросы, join`ы, агрегаты
  • Базовые команды в SQL и встроеные аналитические функции
  • Импорт и экспорт данных посредством SQL и ETL программ
  • Принципы работы с разными конкретными БД
  • Основные библиотеки для подключения к БД из Python
  • Функции SQL и их аналоги в pandas
  • Подготовка и сдача итогового проекта

Feature engineering и предобработка данных

Когда данные получены, нужно изучить их, выявить закономерности, а также подготовить для создания модели. Вы научитесь визуализировать данные, проверять их на целостность, валидность, полноту, очищать от шумов, пропущенных значений, работать с размерностью, а также создавать фичи для моделей.

  • Основы Python и Git (арифметика)
  • Базовые типы данных и циклы
  • Функции и классы
  • Продвинутые типы данных: массивы, множества, словари
  • Python для анализа данных: numpy и scipy
  • Python для анализа данных: pandas
  • Лабораторная работа по Python
  • Основы линейной алгебры и теории множеств + реализация в Python
  • Методы математической оптимизации + реализация в Python
  • Основы описательной статистики + реализация в Python
  • Статистический анализ данных + реализация в Python
  • Лабораторная работа по матстатистике
  • Подготовка и сдача итогового проекта

Математика для анализа данных

Чтобы увидеть в больших объёмах данных закономерности, аналитик опирается на линейную алгебру, математический анализ и теорию вероятности. Если специалист не разбирается в этих направлениях — гипотезы и выводы будут неточными.

  • Выбор способа визуализации под задачу
  • Инструменты matplotlib, seaborn для визуализации
  • Проверка и очищение данных с помощью pandas и numpy
  • Проведение одномерного и рекурсивного Feature Selection и Feature Selection на базе моделей
  • Методы оценки значимости и отбора признаков и их использование
  • «Проклятие размерности», основные алгоритмы и принципы их работы
  • Использование алгоритмов sklearn

Построение модели

Вы научитесь строить основные модели обучения с учителем и без, а также ансамбли моделей. Кроме этого, сможете подбирать метрики, чтобы оценивать качество модели, итерационно повышать его и бороться с переобучением.

  • Линейная алгебра
  • Математический анализ
  • Теория вероятности

Менеджмент data-проектов

Вы научитесь планировать разработку data science-проектов, а также грамотно рассказывать заказчикам о результатах исследований.

  • Линейные методы, логистическая регрессия и SVM
  • Деревья решений
  • Линейная и полиноминальная регрессия
  • Алгоритмы кластеризации
  • Способы повышения качества модели
  • Функции потерь и оптимизация
  • Оценка точности модели, борьба с переобучением, регуляризация
  • Улучшение качества модели

Рекомендательные системы

В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.

  • Организация проекта
  • Составление отчётов по исследованиям

Распознавание изображений, машинное зрение

Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов — а также научитесь строить нейросети.

  • Неперсонализированные рекомендательные системы
  • Сontent-based-рекомендации
  • Collaborative Filtering
  • Гибридные алгоритмы

Обработка естественного языка (NLP)

Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.

  • Поиск по картинкам
  • Сегментация изображений, детекция объектов
  • Применение свёрточных нейронных сетей для задач сегментации и детекции
  • Применение рекуррентных сетей в задачах обработки изображений
  • Генеративные конкурирующие сети (GAN)

Итоговый хакатон

Завершим обучение состязанием с товарищами по курсу: в составе мини-команды, за ограниченное время и на основе датасетов крупных игроков рынка, вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.

  • Морфологический и синтаксический анализ
  • Методы снижения размерности в векторной модели. Информационный поиск
  • Тематическое моделирование (LSA, LDA, HDP)
  • Дистрибутивная семантика (word2vec, GloVe, AdaGram)
  • Счётные языковые модели и вероятностные языковые модели. LSTM. Машинный перевод
  • Генерация текстов (Natural Language Generation)
  • Задача классификации в АОТ

Дипломная работа

В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если в моменте у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.

Как записаться на курс

  • 1

    Нажмите на кнопку Записаться на курс

  • 2

    Ознакомьтесь подробнее с материалом курса и программой обучения на странице школы или университета

  • 3

    Оставьте свои данные в форме заявки и после подтверждения оплатите учебный курс (полностью или в рассрочку)

  • 4

    Получите доступ к учебным материалам

Отзывов пока нет.

Текущая цена

130 000 ₽

Рассрочка

5 417 ₽/мес.

Старая цена

200 000 ₽
Записаться на курс

Автор курса

Нетология

Рейтинг курса

0
0 отзывов

Поделиться курсом

Авторизуйтесь через одну из социальных сетей