Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Eksploracja danych

Informacje ogólne

Kod przedmiotu: WP-BGC-N-2-ED Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Eksploracja danych
Jednostka: Wydział Prawa i Administracji
Grupy:
Strona przedmiotu: https://e.uksw.edu.pl/course/view.php?id=16709
Punkty ECTS i inne: 2.00 (zmienne w czasie)
zobacz reguły punktacji
Język prowadzenia: polski
Poziom przedmiotu:

podstawowy

Symbol/Symbole kierunkowe efektów uczenia się:

Wiedza (W): CwC1_W09, CwC1_W12, CwC1_W13

Umiejętności (U): CwC1_U03, CwC1_U10

Kompetencje społeczne (K): CwC1_K01, CwC1_K02

Skrócony opis:

Rodzaj przedmiotu: obowiązkowy.

Wymagania wstępne: Znajomość podstawowych pojęć dotyczących relacyjnych baz danych. Znajomość podstaw logiki matematycznej.

Forma i warunki zaliczenia: Przygotowanie sprawozdania dotyczącego zadań wykonywanych podczas zajęć.

Założenia i cele przedmiotu: Celem przedmiotu jest zapoznanie studenta z podstawowymi zadaniami i metodami eksploracji danych wielorelacyjnych. Student ma nabyć umiejętność doboru narzędzi do rozwiązania danego problemu z dziedziny eksploracji danych wielorelacyjnych.

Metody dydaktyczne: ćwiczebna, pracownia specjalistyczna.

Pełny opis:

Wprowadzenie

Przebieg procesu eksploracji danych. Reprezentacje danych wejściowych. Atrybuty, instancje.

Reprezentacja informacji wyjściowych (tabele, modele liniowe, drzewa, reguły, reprezentacje w postaci zbiorów instancji). Uczenie nadzorowane i nienadzorowane.

Przykłady zadań eksploracji danych (opisowych, estymacja, predykcja, klasyfikacja, klasteryzacja i odkrywanie skojarzeń)

Wstępne przetwarzanie danych

Oczyszczanie danych, brakujące dane, skalowanie, wykrywanie danych odstających, metody graficzne, dyskretyzacja, ekstrakcja i selekcja cech, redukcja wymiarowości.

Przegląd algorytmów eksploracji danych

• metody Bayesowskie (naiwny model Bayesowski i sieci Bayesowskie)

• drzewa decyzyjne (C4.5, random forrest)

• odkrywanie reguł

• reguły skojarzeniowe

• regresja liniowa i logistyczna

• metody oparte na instancjach (kNN)

• Support Vector Machines

• metody klasteryzacji (k-means, mean shift, DBSCAN, Ward)

Ocena rezultatów

Ocena wydajności, walidacja krzyżowa, porównanie schematów eksploracji danych, ocena prawdopodobieństw predykcji, zasada minimalizacji długości opisu.

Przykłady zastosowań

• systemy rekomendacji. Metody oparte na sąsiedztwie oraz faktoryzacji macierzy. Konkurs Netflix.

• analiza danych w sieci Internet

Literatura:

a) podstawowa:

1. Dzeroski S., Lavrac N. (red.): Relational Data Mining. Springer, Berlin, 2001.

2. Knobbe A.: Multi-Relational Data Mining, IOS Press, 2006.

3. Dzeroski S.: Multi-relational data mining: An introduction. SIGKDD Explorations Newsletter 5(1), s. 1 - 16, 2003.

b) uzupełniająca:

1. Hand D., Mannila H., Smyth P.: Eksploracja danych, Wydawnictwa Naukowo-Techniczne, 2005.

2. Lavrac N., Dzeroski S.: Inductive Logic Programming: Techniques and Applications. Ellis Horwood, New York, 1994.

3. Cichosz P.: Systemy uczące się. WNT, Warszawa, 2000.

Efekty kształcenia i opis ECTS:

absolwent zna i rozumie:

podstawy informatyki

podstawy konstrukcji oprogramowania

podstawy matematyki

absolwent potrafi:

posługiwać się narzędziami informatycznymi

posługiwać się narzędziami informatycznymi w przeprowadzaniu badań

absolwent jest gotów do:

uczenia się przez całe życie. Potrafi w tym celu wykorzystać narzędzia

informatyczne. Rozumie potrzebę ustawicznego pogłębiania wiedzy i

umiejętności oraz potrafi samodzielnie wykorzystywać w tym celu

dostępne mu źródła. Potrafi czytać ze zrozumieniem teksty ogólne i

specjalistyczne

współdziałania i pracy w grupie, przyjmując w niej różne role

Nakład pracy studenta (bilans punktów ECTS)

Udział w zajęciach 15 godz

Dodatkowe godziny kontaktowe z nauczycielem 4 godz

Samodzielne studiowanie tematyki zajęć 25 godz

Udział w ćwiczeniach laboratoryjnych 15 godz

Sumaryczne obciążenie pracą studenta 59 godz

Punkty ECTS za moduł 2 ECTS

Metody i kryteria oceniania:

Dla wszystkich efektów przyjmuje się następujące kryteria oceny we wszystkich formach weryfikacji:

ocena 5: osiągnięty w pełni (bez uchwytnych niedociągnięć)

ocena 4,5: osiągnięty niemal w pełni i nie są spełnione kryteria przyznania wyższej oceny

ocena 4: osiągnięty w znacznym stopniu i nie są spełnione kryteria przyznania wyższej oceny

ocena 3,5: osiągnięty w znacznym stopniu – z wyraźną przewagą pozytywów – i nie są spełnione kryteria przyznania wyższej oceny

ocena 3: osiągnięty dla większości przypadków objętych weryfikacją i nie są spełnione kryteria przyznania wyższej oceny

ocena 2: nie został osiągnięty dla większości przypadków objętych weryfikacją

Ocena końcowa x jest wyznaczana na podstawie wartości

st(w)= 5, jeśli 4,5 < w;

st(w)= 4,5, jeśli 4,25 < w <= 4,5;

st(w)= 4, jeśli 3,75 < w <= 4,25;

st(w)= 3,5, jeśli 3,25 < w <= 3,75;

st(w)= 3, jeśli 2,75 < w <= 3,25;

st(w)= 2, jeśli w <= 2,75

oraz na bazie podanej niżej reguły:

x wyznacza się ze wzoru x=st(z), gdzie z jest średnią ważoną ocen z przeprowadzonych weryfikacji,w których wagi ocen z egzaminów wynoszą 2, a wagi ocen z innych form weryfikacji są równe 1

Zajęcia w cyklu "Semestr zimowy 2019/20" (zakończony)

Okres: 2019-10-01 - 2020-01-31
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Warsztaty, 15 godzin więcej informacji
Koordynatorzy: Jakub Gąsior
Prowadzący grup: Jakub Gąsior
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Warsztaty - Zaliczenie na ocenę
Typ przedmiotu:

obowiązkowy

Grupa przedmiotów ogólnouczenianych:

nie dotyczy

Zajęcia w cyklu "Semestr zimowy 2020/21" (zakończony)

Okres: 2020-10-01 - 2021-01-31
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Warsztaty, 15 godzin więcej informacji
Koordynatorzy: Jakub Gąsior
Prowadzący grup: Jakub Gąsior
Strona przedmiotu: https://e.uksw.edu.pl/course/view.php?id=16709
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Warsztaty - Zaliczenie na ocenę
E-Learning:

E-Learning (pełny kurs) z podziałem na grupy

Typ przedmiotu:

obowiązkowy

Grupa przedmiotów ogólnouczenianych:

nie dotyczy

Literatura:

Materiały zamieszczone na platformie e-learningowej.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie.