Специалист по Data Science
Онлайн-курс Специалист по Data Science от онлайн-школы Яндекс Практикум. Образовательные услуги оказываются АНО ДПО «ШАД». Это Школа анализа данных, основанная Яндексом. Оказывает услуги на основании Лицензии № 036031 от 24 марта 2015 года. Документ о прохождении обучения по программе дополнительного профессионального образования также выдается АНО ДПО «ШАД».
Программа курса
Основы Python и анализа данных: бесплатный вводный курс
- Познакомитесь с языком программирования Python, библиотекой Pandas, а также средой программирования Jupyter. Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики и специалисты по Data Science.
Предобработка данных
- Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.
Исследовательский анализ данных
- Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Познакомитесь с библиотеками SciPy и Matplotlib. Отрисуете диаграммы, поупражняетесь в анализе графиков.
Статистический анализ данных
- Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.
Сборный проект -1
Введение в машинное обучение
- Освоите основные концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.
Обучение с учителем (классификация и регрессия)
- Углубитесь в самую востребованную область машинного обучения — обучение с учителем. Узнаете, как обращаться с несбалансированными данными.
Машинное обучение в бизнесе
- Примените свои знания о машинном обучении к задачам бизнеса. Узнаете, что такое бизнес-метрики, KPI и A/B-тестирование.
Сборный проект -2
Линейная алгебра
- Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите с нуля главные концепции линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.
Численные методы
- Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Разберётесь, как обучаются нейронные сети. Для этого вы освоите приближённые вычисления, оценку сложности алгоритма, градиентный спуск и бустинг.
Временные ряды
- Проанализируете временные ряды. Создадите из них табличные данные и решите задачу регрессии.
Машинное обучение для текстов
- Представите тексты на естественном языке в качестве таблиц с данными. Примените к ним методы классификации и регрессии. Познакомитесь с алгоритмом TF-IDF, языковыми представлениями word2vec и BERT.
Извлечение данных
- Познакомитесь с основными системами хранения данных — реляционными базами и распределёнными хранилищами. Научитесь извлекать эти данные запросами на языке SQL и методами библиотеки PySpark.
There are no reviews yet.