Бажаєте опанувати Data Science?

Якщо ви – студент, програміст, математик чи аналітик, захоплюєтесь аналізом великих даних, знайомі з основами машинного навчання, маєте навички програмування на Python чи R та прагнете в своїй роботі застосувати технології Big Data, тоді цей курс саме для вас.

Про що ви дізнаєтеся на курсі

Ми познайомимо вас із екосистемою та архітектурою Hadoop, навчимо створювати файли та папки на HDFS, імпортувати дані з RDBMS, писати запити та скрипти в Hive, а також створювати дата фрейми і проводити аналіз в рамках роботи з Spark та Kafka. Звучить захопливо, чи не так?

Де застосовуються технології Big Data

Кожний студент зможе взяти участь у створенні власного продукту, вирішуючи реальну бізнес-задачу. Для її реалізації необхідно зібрати дані, проаналізувати їх, побудувати модель та оцінити її якість. У вас з’явиться унікальна можливість попрацювати з усією базою телеком-оператора, а це – 26,1 млн абонентів

Як отримати сертифікат

Щоб отримати сертифікат про успішне закінчення школи, студент має скласти фінальний іспит та захистити курсовий проект. У складі комісії будуть організатори, ментори та викладачі курсу, а також фахівці в галузі Data Science від Київстар.

Які перспективи?

При успішному закінченні школи ви зможете приєднатись до команди Big Data Київстар. Робота в Київстар дозволяє працювати з великими даними та застосувати отриманні знання на реальних кейсах. Найкращі слухачі зможуть отримати рекомендації від автора курсу.

Викладачі та ментори курсу

Програма курсу

Заняття будуть проходити щоденно з 27 жовтня по 5 листопада. Презентація курсового проекту та випускний – 11 листопада

Початок навчання
1 етап

Практика Big Data в бізнесі

Ми розберемо реальні приклади та покажемо, як впливає використання технологій обробки великих масивів даних на розвиток компаній.

2 етап

Введення в Hadoop

Студенти зможуть самостійно встановити софт, необхідний для роботи з кластером, а також дізнаються про реляційні й нереляційні способи збереження даних.

3 етап

Імпорт, експорт і збір даних

Студенти опанують інструменти Hive, Sqoop, а також дізнаються про формати файлів, основні концепти Map Reduce та імпорт даних в кластер.

4 етап

Обробка та агрегація даних

Студенти познайомляться з інструментами обробки та агрегації даних Spark та Kafka, навчаться застосовувати RDD-програмування.

5 етап

Машинне навчання

Студенти познайомляться з алгоритмами розв’язку задач машинного навчання, а також на практиці застосують алгоритми Spark MLlib.

6 етап

Аналіз соціальних мереж

Студенти ознайомляться з основними поняттями теорії графів, дізнаються про їх основні властивості, а також застосують графи до розв’язку задач.

7 етап

Екзамен та курсовий проект

Практичний іспит охоплюватиме всю практику, що розглядалася в курсі. У рамках курсового проекту студенти розв’язуватимуть реальну бізнес-задачу.

2 етап

Введення в Hadoop

Студенти зможуть самостійно встановити софт, необхідний для роботи з кластером, а також дізнаються про реляційні й нереляційні способи збереження даних.

4 етап

Обробка та агрегація даних

Студенти познайомляться з інструментами обробки та агрегації даних Spark та Kafka, навчаться застосовувати RDD-програмування.

6 етап

Аналіз соціальних мереж

Студенти ознайомляться з основними поняттями теорії графів, дізнаються про їх основні властивості, а також застосують графи до розв’язку задач.

Випускний

Як це було минулого року

Випускники першого курсу Big Data School діляться враженнями та дають поради своїм наступникам. Дивіться відео.

Відео-презентація

Як взяти участь

Офіційні правила
  • 1. Збір заявок

    13 вересня — 5 жовтня

  • 2. Виконання тестового завдання

    7—8 жовтня

  • 3. Оголошення результатів

    23 жовтня

Партнери школи
  • ІЄ
  • Юніт сіті