Zakres tematyczny szkolenia
PROGRAM I ĆWICZENIA
· Wprowadzenie – Wartość informacji. Definicje Big Data (składowe, cechy charakterystyczne wymiary – internetowy, korporacyjny, firmowy). Informatyczny i informacyjny wymiar Big Data –bazy SQL, bazy NoSQL, portale internaetowe, platformy przechowywania danych (Map Reduce, Hadoop), sposoby pozyskiwania informacji z danych (statystyka, eksploracja danych). Cyfryzacja życia w erze Big Data (danetyzacja rzeczywistości – korzyści, zagrożenia, aspekty etyczne, „ciemne strony” Big Data). Specjalista Big Data – badacz danych
· Relacyjne bazy danych, hurtownie danych – Definicja relacyjnego modelu danych, organizacja logiczna, właściwości modelu relacyjnego, zasady konstrukcji Systemy zarządzania relacyjnymi bazami danych, strukturami język zapytań SQL – podstawy składni, przykłady wykorzystania. Hurtownie danych – definicja, rodzaje, możliwości wykorzystania
· Analiza danych, wybrane metody eksploracji danych – Praca z danymi, rodzaje danych. Metody, narzędzia: wizualizacja – przedstawienie pojedynczych zmiennych (histogram, box – plot ), oczyszczanie danych, przekształcanie danych (normalizacja, standaryzacja) narzędzia do przedstawiania zależności pomiędzy wieloma zmiennymi (wykresy rozrzutu), regresja i korelacja, modele regresji (liniowa, logistyczna), analiza wariancji (ANOVA), tablice wielodzielcze, drzewa decyzyjne, problem obserwacji odstających, asocjacje, grupowanie (algorytmy grupowania) , analiza skupień, analiza składowych głównych, analiza czynnikowa
· Narzędzia analizy danych – Charakterystyka wybranych środowisk rachunkowych wykorzystywanych w eksploracji danych: Excel, Minitab, JMP, SPSS, QDA
Ćwiczenia:
· Konstrukcja i wykorzystanie relacyjnej bazy danych (elementy strukturalnego języka zapytań SQL) – Access
· Wizualizacja danych, czyszczenie danych – wykrywania wartości izolowanych, transformacja danych (Excel, Minitab)
· Analiza wariancji (ANOVA) (Minitab)
· Analiza regresji i korelacji – regresja wielokrotna liniowa, wybór najlepszego podzbioru predyktorów (zmiennych objaśniających) – Excel, Minitab
· Analiza regresji – regresja logistyczna (Minitab)
· Projektowanie okresów gwarancyjnych (Minitab)
· Prognozowanie, wygładzanie danych (Excel, Minitab)
· Analiza czynnikowa (Minitab)
· Analiza skupień (Minitab)
· Wykorzystanie techniki kart kontrolnych SPC w analizie danych (Excel, Minitab)
· Analiza danych procesowych z wykorzystaniem możliwości środowiska QDA