Eksploracja danych
Informacje ogólne
Kod przedmiotu: | WP-BGC-N-2-ED |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Eksploracja danych |
Jednostka: | Wydział Prawa i Administracji |
Grupy: | |
Strona przedmiotu: | https://e.uksw.edu.pl/course/view.php?id=16709 |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | polski |
Poziom przedmiotu: | podstawowy |
Symbol/Symbole kierunkowe efektów uczenia się: | Wiedza (W): CwC1_W09, CwC1_W12, CwC1_W13 Umiejętności (U): CwC1_U03, CwC1_U10 Kompetencje społeczne (K): CwC1_K01, CwC1_K02 |
Skrócony opis: |
Rodzaj przedmiotu: obowiązkowy. Wymagania wstępne: Znajomość podstawowych pojęć dotyczących relacyjnych baz danych. Znajomość podstaw logiki matematycznej. Forma i warunki zaliczenia: Przygotowanie sprawozdania dotyczącego zadań wykonywanych podczas zajęć. Założenia i cele przedmiotu: Celem przedmiotu jest zapoznanie studenta z podstawowymi zadaniami i metodami eksploracji danych wielorelacyjnych. Student ma nabyć umiejętność doboru narzędzi do rozwiązania danego problemu z dziedziny eksploracji danych wielorelacyjnych. Metody dydaktyczne: ćwiczebna, pracownia specjalistyczna. |
Pełny opis: |
Wprowadzenie Przebieg procesu eksploracji danych. Reprezentacje danych wejściowych. Atrybuty, instancje. Reprezentacja informacji wyjściowych (tabele, modele liniowe, drzewa, reguły, reprezentacje w postaci zbiorów instancji). Uczenie nadzorowane i nienadzorowane. Przykłady zadań eksploracji danych (opisowych, estymacja, predykcja, klasyfikacja, klasteryzacja i odkrywanie skojarzeń) Wstępne przetwarzanie danych Oczyszczanie danych, brakujące dane, skalowanie, wykrywanie danych odstających, metody graficzne, dyskretyzacja, ekstrakcja i selekcja cech, redukcja wymiarowości. Przegląd algorytmów eksploracji danych • metody Bayesowskie (naiwny model Bayesowski i sieci Bayesowskie) • drzewa decyzyjne (C4.5, random forrest) • odkrywanie reguł • reguły skojarzeniowe • regresja liniowa i logistyczna • metody oparte na instancjach (kNN) • Support Vector Machines • metody klasteryzacji (k-means, mean shift, DBSCAN, Ward) Ocena rezultatów Ocena wydajności, walidacja krzyżowa, porównanie schematów eksploracji danych, ocena prawdopodobieństw predykcji, zasada minimalizacji długości opisu. Przykłady zastosowań • systemy rekomendacji. Metody oparte na sąsiedztwie oraz faktoryzacji macierzy. Konkurs Netflix. • analiza danych w sieci Internet |
Literatura: |
a) podstawowa: 1. Dzeroski S., Lavrac N. (red.): Relational Data Mining. Springer, Berlin, 2001. 2. Knobbe A.: Multi-Relational Data Mining, IOS Press, 2006. 3. Dzeroski S.: Multi-relational data mining: An introduction. SIGKDD Explorations Newsletter 5(1), s. 1 - 16, 2003. b) uzupełniająca: 1. Hand D., Mannila H., Smyth P.: Eksploracja danych, Wydawnictwa Naukowo-Techniczne, 2005. 2. Lavrac N., Dzeroski S.: Inductive Logic Programming: Techniques and Applications. Ellis Horwood, New York, 1994. 3. Cichosz P.: Systemy uczące się. WNT, Warszawa, 2000. |
Efekty kształcenia i opis ECTS: |
absolwent zna i rozumie: podstawy informatyki podstawy konstrukcji oprogramowania podstawy matematyki absolwent potrafi: posługiwać się narzędziami informatycznymi posługiwać się narzędziami informatycznymi w przeprowadzaniu badań absolwent jest gotów do: uczenia się przez całe życie. Potrafi w tym celu wykorzystać narzędzia informatyczne. Rozumie potrzebę ustawicznego pogłębiania wiedzy i umiejętności oraz potrafi samodzielnie wykorzystywać w tym celu dostępne mu źródła. Potrafi czytać ze zrozumieniem teksty ogólne i specjalistyczne współdziałania i pracy w grupie, przyjmując w niej różne role Nakład pracy studenta (bilans punktów ECTS) Udział w zajęciach 15 godz Dodatkowe godziny kontaktowe z nauczycielem 4 godz Samodzielne studiowanie tematyki zajęć 25 godz Udział w ćwiczeniach laboratoryjnych 15 godz Sumaryczne obciążenie pracą studenta 59 godz Punkty ECTS za moduł 2 ECTS |
Metody i kryteria oceniania: |
Dla wszystkich efektów przyjmuje się następujące kryteria oceny we wszystkich formach weryfikacji: ocena 5: osiągnięty w pełni (bez uchwytnych niedociągnięć) ocena 4,5: osiągnięty niemal w pełni i nie są spełnione kryteria przyznania wyższej oceny ocena 4: osiągnięty w znacznym stopniu i nie są spełnione kryteria przyznania wyższej oceny ocena 3,5: osiągnięty w znacznym stopniu – z wyraźną przewagą pozytywów – i nie są spełnione kryteria przyznania wyższej oceny ocena 3: osiągnięty dla większości przypadków objętych weryfikacją i nie są spełnione kryteria przyznania wyższej oceny ocena 2: nie został osiągnięty dla większości przypadków objętych weryfikacją Ocena końcowa x jest wyznaczana na podstawie wartości st(w)= 5, jeśli 4,5 < w; st(w)= 4,5, jeśli 4,25 < w <= 4,5; st(w)= 4, jeśli 3,75 < w <= 4,25; st(w)= 3,5, jeśli 3,25 < w <= 3,75; st(w)= 3, jeśli 2,75 < w <= 3,25; st(w)= 2, jeśli w <= 2,75 oraz na bazie podanej niżej reguły: x wyznacza się ze wzoru x=st(z), gdzie z jest średnią ważoną ocen z przeprowadzonych weryfikacji,w których wagi ocen z egzaminów wynoszą 2, a wagi ocen z innych form weryfikacji są równe 1 |
Właścicielem praw autorskich jest Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie.