
- Курс: 4, 3
Дисципліна «Використання програмних засобів для обробки великих обсягів даних (Big Data)» знайомить студентів із сучасними методами та технологіями роботи з великими даними. У рамках курсу розглядаються основи зберігання, обробки та аналізу даних, використовуються популярні інструменти та платформи, зокрема Hadoop, Spark, NoSQL, Apache Kafka, Power BI та MS Excel.
Студенти навчаться застосовувати алгоритми машинного навчання для аналізу великих масивів даних, працювати з розподіленими обчисленнями та оптимізувати процеси обробки інформації. Особлива увага приділяється візуалізації та аналітиці даних у Power BI та MS Excel, що дозволяє ефективно працювати з бізнес-аналітикою та приймати обґрунтовані рішення.
МОДУЛЬ І
ВСТУП ДО BIG DATA ТА ОСНОВНІ КОНЦЕПЦІЇ
Тема 1. Основні поняття та значення Big Data.
Тема 2. Джерела та типи великих даних.
Тема 3. Виклики та можливості обробки великих даних.
Тема 4. Основні підходи та технології обробки (Hadoop, Spark, NoSQL).
Тема 5. Основи роботи з Apache Spark: структура, обробка потокових даних.
МОДУЛЬ ІІ
АНАЛІЗ ДАНИХ У MS EXEL ТА POWER BI
Тема 6. Робота з великими наборами даних у Excel.
Тема 7. Використання зведених таблиць та функцій для аналізу даних.
Тема 8. Інструменти Power Query для обробки та трансформації даних.
Тема 9. Автоматизація обробки даних (макроси, VBA).
Тема 10. Моделювання даних, використання DAX-функцій.
Для успішного засвоєння матеріалу курсу «Використання програмних засобів для обробки великих обсягів даних (Big Data)» бажано мати базові знання та навички у таких сферах:
Основи інформатики та програмування, Бази даних Робота з MS Excel