- Сообщения
- 9,001
- Реакции
- 172

Автор: Simulative
Название: Симулятор «SQL для анализа данных» (2022)
Описание:
Это не курс. Это симулятор службы специалиста предоставленных в реалистичной бражки с элементами обучения. Вы будете вычислять retention и LTV, записывать высотные CTE и мастерить остальные здоровые ради бизнеса прихоти посредством SQL.
Миссии симулятора
Выдрессировать не простым «SQL-запросам», а полезным фишкам, экосистеме и продакшен-левел коду
Порекомендовать записывать запросы, необходимые бизнесу. Вы не будете штудировать котиков — вы будете вычислять LTV, мастерить сложноватые агрегации и ad-hoc
Опустить в среду. Вы будете действовать с высококлассными приборами — PostgreSQL, DBeaver, MySQL, Power BI и шедулерами
Чем предстоит упражняться
Записывать множественные ad-hoc SQL запросы: альманах и легализация email-адресов, ставок статистик пользовательской предприимчивости и многое иное
Коллекционировать когорты, рассматривать retention, LTV, CR и прочие продуктовые метрики посредством high-level SQL-запросов
Автоматизировать импорт/экспорт предоставленных для Windows/Linux сервере посредством SQL + Python + psycopg2 + cron
Кода преподавания
Симулятор складывается из 13 глав.
Всякая главнокомандующий — такое концепция + утилитарные задачки + проработка навыков для бизнесовых кейсах.
Вы будете рассматривать общепользовательский эксперимент платформы IT Resume, действовать с продакшен-левел приборами и решать реалистичные кейсы с интересным сюжетом.
Вы познакомитесь с базами данных, осмыслите распознавание БД от СУБД, обсудите авторитетность нормализации для определенных кейсах и иже с ними «основы основ».
Напоследок - испытаний для испытания знаний.
Вы научитесь подсаживаться к вытащенной складу 4 многообразными способами, разберете образа предоставленных и поймете распознавание DCL от DML.
Для закрепления познаний - тест.
В этой верхушке вы выучитесь записывать базисные SQL-запросы — однако не самые простые. Да вы акклиматизируете функции отделки текста, даты, времени, кастинга, отвесные функции COALESCE/NULLIF, закономерные операторы, CASE и многое другое. Сортировка, горизонтальная фильтрация, розыск не оригинально, регулярки — это все в этой главе.
Для закрепления — семейнее задание.
Хотя вы исключительно активизировали путь, вы уже будете разгадывать реалистичные продуктовые задачи.
Сконцентрируете и создадите основу для email-рассылок
Проследите для юзеров в разрезе дат и погрузитесь в обработку даты-времени
Произведете валидацию номеров телефонов
Расклассифицируете задачки на платформе по группам в соотношении от определенного признака
В этой верхушке мы поведаем ради генеральные продуктовые метрики, какие понадобятся вам безотносительно в всяком плане — будь то мобильное использование сиречь офлайн-магазин. Например, в последующих верхушках вы воспользуетесь данными познаниями для аналитики платформы.
Для отработки и закрепления итогов — испытаний + расчётные задания.
Вы научитесь сгруппировывать таблицу по определенным признакам и утилизировать агрегатные функции: от простейших AVG и MIN пред диковинных mode WITHIN GROUP.
Для отработки навыков — семейнее задание.
После чего вы снова отработаете приобретенные сведения для реалистичных кейсах.
Оцените расположение предприимчивости юзеров по часам/дням
Сколько в посредственном читатель осуществляет попыток для решения 1 задачи? А сколько людей постановляют задачки с первой попытки? А каково свойство моды?
Оцените MAU/WAU/DAU
Сочтете действительность реферальной програмки
Проследите для то, будто юзеры платформы издерживают и накапливают CodeCoins
Исключительно умея LEFT/RIGHT/FULL/SELF/CROSS/INNER JOIN, нам предоставляется возможность унаследовать положительно отчего-то пользительное и осмысленное. Собственно данные установки вы и освоите в данной главе.
Для закрепления — семейнее задание.
После чего вы продолжите рассматривать user experience платформы.
Посмотрите, кто не столько постановляет задачи, но также участвует в прочих активностях
Положительно произнесете – через какой-никакой бражки сколько юзеров наступило и как они себя приказывали
Оцените расположение постановленных проблем и тестов по тегам и категориям
Иногда постановление задачки возможно положить в один лапидарный запрос. В этой верхушке вы выучитесь записывать сложноватые приложенные подзапросы и воспитывать всегда это аккуратно в CTE. Вдобавок обсудим код-стайл и смежные вопросы.
Для закрепления — классическая домашка.
После чего зафиксируете всегда на практике.
Сочтете RETENTION/CR и подумаем над тем, как удержать юзеров
Углубитесь в то, будто юзеры постановляют задачки и обманете совершенное свидетельство
Сконцентрируете всю статистику о юзерах в одном месте, дабы представить ее рекрутерам
Разберетесь, в чем мощь window functions, притом тут поголовно оконца и как избегнуть неотвратных погрешностей около употребленье UNBOUNDED FOLLOWING/CURRENT ROW. Да выучитесь вычислять аккумуляционный результат и не столько - используя агрегатные функции, как оконные.
Для отработки — хорошее семейнее задание.
Впоследствии вы сначала возвратитесь к работе над аналитикой платформы.
Сначала осмотрите вопрос retention и LTV, но под свежеиспеченным соусом
Оцените динамику активностей, разыщете филиалы регресса и роста
Сочтете повседневный баланс накопительным результатом после всем юзерам и найдете ненормальности
В этой верхушке вы сами запроектируете основу ради свежеиспеченного проекта, воздвигнете ее схему с связями и нацарапайте всегда DDL-скрипты ради создания. Ну а в конце — раскатаете ее и в облаке, и на локальной машине! А чтобы основу возможно водилось потестить — заполоните ее фейковыми предоставленными (так зачастую осуществляют в продакшене) посредством специфических сервисов.
Будете использовать: io, DBeaver, MySQL + Workbench, сервисы-фейкеры.
В этой верхушке вы выучитесь действовать с psycopg2, mysql. connector, спрашиваете про шаблон проектирования Singleton, выучитесь фиксировать личные образа данных, действовать с базой посредством Python, разберете погрешности типа Authentication plugin ′caching_sha2_password′ cannot be loaded и многое другое.
Для отработки — хорошее семейнее задание.
В конечном итоге вы получите:
порядочно готовых классов ради включения к генеральным СУБД, какие вы применяете после для службе
нацарапанные Python-скрипты для экспорта-импорта предоставленных изо основы
расчет после выгрузке предоставленных из базы и дальнейшей отделке в Pandas
В этой верхушке вы выучитесь автоматизировать стандартные задачи: например, бэкапы и инсерты. Делать по-большому будем с поддержкой cron, шедулера и Python-скриптов. Конец — Airflow.
Статист вы будете располагать скрипты и инструкции для автоматизации проблем с поддержкой cron, и хороший расчет с Python-кодом для ежедневного инсерта предоставленных в БД.
SQL непосредственно объединен с аналитикой и датавизом. В этой верхушке вы будете подсоединять основу к Power BI и Redash, дабы основывать ad-hoc доклады и дашборды. Заденем тему включения после ssh, учения дашбордов и розыска пользительных инсайтов.
В конечном итоге данной верхушки вы решите реалистичное испытательное поручение в большущую Edtech бражку для сделку аналитика.
Напоследок — незначительная ретроспекция всех ваших наработок, и наши миры сравнительно испытательных заданий, best practices и последующего развития. Здоровые материалы, гиперссылки и непрошенные миры — то, что нужно напоследок такового обучения.
Но на самом деле, это не конец, а исключительно возникновение занимательного пути
Скачать: