Аналіз даних
Даний курс присвячений основам отримання результатів, які ґрунтуються на статистичному виведенні. В якості практичної складової використовується мова R. Це є базовий курс для майбутніх аналітиків.
Будь-яке вивчення науки про дані починається з розуміння чим є насправді дані. Математична статистика та найбільш сучасна і популярна мова програмування R – це базовий інструментарій, яким повинен володіти будь-хто в галузі науки про дані. Даний курс присвячений основам отримання результатів, які ґрунтуються на статистичному виведенні. В якості практичної складової використовується мова R.
Це є базовий курс для майбутніх аналітиків. Завдяки отриманим знанням вони зможуть проводити первинний статистичний аналіз даних, висувати гіпотези та оцінювати їх на основі зібраних даних. Також мовою програмування обрана мова R, яка є найбільш вживаною мовою для статистиків на сьогодні.
План курсу:
Тиждень 1
- Аналіз даних
- Статистика
- Типи даних
- Центральна тенденція
- Візуальний аналіз даних
- Трактування результатів
Тиждень 2
- Коробчата діаграма
- Інтерквартильний розмах
- Приклад використання візуального аналізу для очищення даних
- Дисперсія
- Середньоквадратичне відхилення
- Вступ до R
Тиждень 3
- Теорія ймовірності
- Ймовірність однієї події
- Ймовірність кількох подій
- Умовні ймовірності
- Дерева прийняття рішень
- Теорема Байеса
- Біноміальний розподіл
- Нормальний розподіл
- Z-стандартизація
- Коваріація
- Кореляція
- Регресія
Тиждень 4
- Вивідна статистика
- Вибірка
- Принципи формування репрезентативної вибірки
- Центральна гранична теорема
- Довірчий інтервал для пропорції
- Рівень довіри
- Розмір вибірки
- Довірчий інтервал для середнього значення
- Покроковий план побудови довірчого інтервалу
Тиждень 5
- Тестування гіпотез
- Тестування гіпотез для середнього значення
- p-value
- Статистична значущість
- Тестування гіпотез для пропорції
- Покроковий план тестування гіпотез
Ще немає відгуків.