Poznaj możliwości bibliotek wykorzystywanych w analizie danych - bibliotekami języka Python.
Zakres szkolenia
- Wprowadzenie
- Istota analizy danych
- Rola Pythona w analizie
- Omówienie środowiska pracy
- Podstawy statystyki
- Podstawowe pojęcia statystyczne
- Podstawowe miary rozkładu
- Python
- Przypomnienie podstawowych typów i struktur danych
- Indeksowanie, slicing
- Funkcje, funkcje anonimowe
- List comprehension
- Wybrane funkcje wbudowane: matematyczne, tekstowe, statystyczne, data i czas
- Kontrola przepływu (while, for, if, elif, else), przydatne rozszerzenia (enumerate, zip)
- Analiza z NumPy i Pandas
- Tablice jedno i dwuwymiarowe w NumPy oraz podstawowe operacje
- Series i DataFrame w Pandas
- Wczytywanie i zapis danych w różnych formatach
- Podstawowe atrybuty DataFrame (shape, indeksy, kolumny, typy danych)
- Przydatne funkcje (describe, info, head, tail, sample)
- Czyszczenie wartości zduplikowanych
- Wartości brakujące – różne podejścia do radzenia sobie z nimi
- Wykrywanie wartości odstających
- Sortowanie danych
- Filtrowanie (loc, iloc, query, where, isin, isnull, notnull)
- Tabele przestawne
- Grupowanie
- Łączenie danych
- Tworzenie nowych atrybutów
- Wizualizacja danych z Maplotlib i Seaborn
- Rodzaje wykresów i wizualizacji – dobór wykresu, elementy storytelling
- Podstawowe typy wykresów (histogram, wykres słupkowy, wykres typu scatter) w Pythonie
Wymagania wstępne
Znajomość podstaw programowania w języku Python. Przydatne będzie doświadczenie w analizie danych w innym narzędziu (np. MS Excel).
Adresaci
Szkolenie skierowane jest do osób chcących zapoznać się z możliwościami przetwarzania, analizy, eksploracji i wizualizacji danych z użyciem języka Python. Zainteresowani tym tematem mogą być analitycy danych, analitycy biznesowi, analitycy ds. raportowania lub Business Intelligence.