Data_analyst
Data_analyst copied to clipboard
Проекты курса Аналитик данных (Яндекс.Практикум)
Data analyst
Описание:
В репозитории представлены проекты курса Аналитик данных (Яндекс.Практикум).
Основные инструменты и навыки, полученные при обучении:
- Языки: Python, SQL
- Анализ данных: библиотеки Pandas, NumPy, SciPy, Statsmodels
- Визуализация: Matplotlib, Plotly, Seaborn
- Построение дашбордов: Tableau
- Метрики юнит-экономики, когортный анализ
- А/В-тестирование
- Работа с гипотезами
- Машинное обучение: библиотеки Scikit-learn, XGBoost
Программа обучения:
Проекты:
| № | Название и ссылка | О чем проект | Навыки и инструменты |
|---|---|---|---|
| 1 | Вводный проект. Музыка больших городов | Сравниваем данные пользователей Яндекс.Музыки по городам и дням недели | Python Pandas |
| 2 | Исследование надежности заемщиков | Разбираемся, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. Анализируем данные о клиентах банка и определяем долю кредитоспособных | предобработка данных Python Pandas |
| 3 | Исследование объявлений о продаже квартир | Исследуем архив объявлений о продаже объектов недвижимости в Санкт-Петербурге и Ленинградской области (основные свойства данных, поиск закономерностей, распределений и аномалий) | Python Pandas Matplotlib предобработка данных исследовательский анализ данных визуализация данных |
| 4 | Определение перспективного тарифа для телеком-компании | Делаем предварительный анализ тарифов на небольшой выборке клиентов. Анализируем поведение клиентов и делаем вывод, какой тариф лучше | Python Pandas Matplotlib NumPy SciPy проверка статистических гипотез описательная статистика |
| 5 | Сборный проект 1. Анализ рынка продаж компьютерных игр | Ищем закономерности в данных о продаже игры и выявляем те, которые определяют их успешность. Это позволият сделать ставку на потенциально популярный продукт и спланировать рекламные кампании | Python Pandas NumPy Matplotlib предобработка данных исследовательский анализ данных описательная статистика проверка статистических гипотез |
| 6 | Базовый SQL | Пишем ряд запросов разной сложности к базе данных, в которой хранятся данные по венчурным инвесторам, стартапам и инвестициям в них | SQL PostgreSQL |
| 7 | Анализ бизнес-показателей развлекательного приложения | На основе данных изучаем поведение пользователей, а также анализируем доходность клиентов и окупаемость рекламы, чтобы предложить рекомендации для отдела маркетинга | Python Pandas Matplotlib когортный анализ юнит-экономика продуктовые метрики Seaborn |
| 8 | Продвинутый SQL | С помощью Python и SQL подключаемся к базе данных, считаем и визуализируем ключевые метрики сервис-системы вопросов и ответов о программировании | SQL PostgreSQL |
| 9 | Принятие решений в бизнесе | Анализируем результаты A/B-тестирования в крупном интернет-магазине, приоритизируем гипотезы | Python Pandas Matplotlib SciPy A/B-тестирование проверка статистических гипотез |
| 10 | Сборный проект 2. Анализ поведения пользователей мобильного приложения | Исследуем воронку продаж и анализируем результаты A/A/B-тестирования в мобильном приложении | Python Pandas Matplotlib SciPy A/B-тестирование проверка статистических гипотез Seaborn событийная аналитика продуктовые метрики Plotly визуализация данных |
| 11 | Исследование рынка общественного питания | Исследование рынка на основе открытых данных о заведениях общественного питания Москвы | Python Pandas Matplotlib Seaborn Plotly визуализация данных |
| 12 | Дашборд для Яндекс.Дзена и Презентация | Разрабатываем и презентуем дашборд для анализа пользовательского взаимодействия в сервисе Яндекс.Дзен (Tableau Public) | Python PostgreSQL Tableau продуктовые метрики построение дашбордов |
| 13 | Прогнозирование оттока клиентов сети фитнес-центров | Разрабатываем модель машинного обучения для прогнозирования оттока клиентов в фитнес-центре. Наша задача — провести анализ, составить портреты клиентов и подготовить план действий по их удержанию | Python Pandas Scikit-learn Matplotlib Seaborn машинное обучение классификация кластеризация |
| 14 | Выпускной проект. Банки — cегментация пользователей по потреблению продуктов, Презентация и Дашборд; А/B тестирование, SQL | Анализируем заемщиков банка (результат оформляем в виде Презентации), проверяем результаты А/B тестирования и подтверждаем гипотезы, разрабатываем дашборд в Tableau Public. изучаем мобильное приложение посредством SQL-запросов. | SQL PostgreSQL Python Pandas Scikit-learn Matplotlib Seaborn машинное обучение классификация кластеризация Tableau продуктовые метрики построение дашбордов A/B-тестирование проверка статистических гипотез |