Cardinal Stefan Wyszynski University in Warsaw - Central Authentication System
Strona główna

Data Mining

General data

Course ID: WP-BGC-N-2-ED
Erasmus code / ISCED: (unknown) / (unknown)
Course title: Data Mining
Name in Polish: Eksploracja danych
Organizational unit: Faculty of Law and Administration
Course groups:
Course homepage: https://e.uksw.edu.pl/course/view.php?id=16709
ECTS credit allocation (and other scores): (not available) Basic information on ECTS credits allocation principles:
  • the annual hourly workload of the student’s work required to achieve the expected learning outcomes for a given stage is 1500-1800h, corresponding to 60 ECTS;
  • the student’s weekly hourly workload is 45 h;
  • 1 ECTS point corresponds to 25-30 hours of student work needed to achieve the assumed learning outcomes;
  • weekly student workload necessary to achieve the assumed learning outcomes allows to obtain 1.5 ECTS;
  • work required to pass the course, which has been assigned 3 ECTS, constitutes 10% of the semester student load.

view allocation of credits
Language: Polish
Subject level:

elementary

Learning outcome code/codes:

enter learning outcome code/codes

Short description: (in Polish)

Rodzaj przedmiotu: obowiązkowy.

Wymagania wstępne: Znajomość podstawowych pojęć dotyczących relacyjnych baz danych. Znajomość podstaw logiki matematycznej.

Forma i warunki zaliczenia: Przygotowanie sprawozdania dotyczącego zadań wykonywanych podczas zajęć.

Założenia i cele przedmiotu: Celem przedmiotu jest zapoznanie studenta z podstawowymi zadaniami i metodami eksploracji danych wielorelacyjnych. Student ma nabyć umiejętność doboru narzędzi do rozwiązania danego problemu z dziedziny eksploracji danych wielorelacyjnych.

Metody dydaktyczne: ćwiczebna, pracownia specjalistyczna.

Full description: (in Polish)

Wprowadzenie

Przebieg procesu eksploracji danych. Reprezentacje danych wejściowych. Atrybuty, instancje.

Reprezentacja informacji wyjściowych (tabele, modele liniowe, drzewa, reguły, reprezentacje w postaci zbiorów instancji). Uczenie nadzorowane i nienadzorowane.

Przykłady zadań eksploracji danych (opisowych, estymacja, predykcja, klasyfikacja, klasteryzacja i odkrywanie skojarzeń)

Wstępne przetwarzanie danych

Oczyszczanie danych, brakujące dane, skalowanie, wykrywanie danych odstających, metody graficzne, dyskretyzacja, ekstrakcja i selekcja cech, redukcja wymiarowości.

Przegląd algorytmów eksploracji danych

• metody Bayesowskie (naiwny model Bayesowski i sieci Bayesowskie)

• drzewa decyzyjne (C4.5, random forrest)

• odkrywanie reguł

• reguły skojarzeniowe

• regresja liniowa i logistyczna

• metody oparte na instancjach (kNN)

• Support Vector Machines

• metody klasteryzacji (k-means, mean shift, DBSCAN, Ward)

Ocena rezultatów

Ocena wydajności, walidacja krzyżowa, porównanie schematów eksploracji danych, ocena prawdopodobieństw predykcji, zasada minimalizacji długości opisu.

Przykłady zastosowań

• systemy rekomendacji. Metody oparte na sąsiedztwie oraz faktoryzacji macierzy. Konkurs Netflix.

• analiza danych w sieci Internet

Bibliography: (in Polish)

a) podstawowa:

1. Dzeroski S., Lavrac N. (red.): Relational Data Mining. Springer, Berlin, 2001.

2. Knobbe A.: Multi-Relational Data Mining, IOS Press, 2006.

3. Dzeroski S.: Multi-relational data mining: An introduction. SIGKDD Explorations Newsletter 5(1), s. 1 - 16, 2003.

b) uzupełniająca:

1. Hand D., Mannila H., Smyth P.: Eksploracja danych, Wydawnictwa Naukowo-Techniczne, 2005.

2. Lavrac N., Dzeroski S.: Inductive Logic Programming: Techniques and Applications. Ellis Horwood, New York, 1994.

3. Cichosz P.: Systemy uczące się. WNT, Warszawa, 2000.

Efekty kształcenia i opis ECTS: (in Polish)

absolwent zna i rozumie:

podstawy informatyki

podstawy konstrukcji oprogramowania

podstawy matematyki

absolwent potrafi:

posługiwać się narzędziami informatycznymi

posługiwać się narzędziami informatycznymi w przeprowadzaniu badań

absolwent jest gotów do:

uczenia się przez całe życie. Potrafi w tym celu wykorzystać narzędzia

informatyczne. Rozumie potrzebę ustawicznego pogłębiania wiedzy i

umiejętności oraz potrafi samodzielnie wykorzystywać w tym celu

dostępne mu źródła. Potrafi czytać ze zrozumieniem teksty ogólne i

specjalistyczne

współdziałania i pracy w grupie, przyjmując w niej różne role

Nakład pracy studenta (bilans punktów ECTS)

Udział w zajęciach 15 godz

Dodatkowe godziny kontaktowe z nauczycielem 4 godz

Samodzielne studiowanie tematyki zajęć 25 godz

Udział w ćwiczeniach laboratoryjnych 15 godz

Sumaryczne obciążenie pracą studenta 59 godz

Punkty ECTS za moduł 2 ECTS

Assessment methods and assessment criteria: (in Polish)

Dla wszystkich efektów przyjmuje się następujące kryteria oceny we wszystkich formach weryfikacji:

ocena 5: osiągnięty w pełni (bez uchwytnych niedociągnięć)

ocena 4,5: osiągnięty niemal w pełni i nie są spełnione kryteria przyznania wyższej oceny

ocena 4: osiągnięty w znacznym stopniu i nie są spełnione kryteria przyznania wyższej oceny

ocena 3,5: osiągnięty w znacznym stopniu – z wyraźną przewagą pozytywów – i nie są spełnione kryteria przyznania wyższej oceny

ocena 3: osiągnięty dla większości przypadków objętych weryfikacją i nie są spełnione kryteria przyznania wyższej oceny

ocena 2: nie został osiągnięty dla większości przypadków objętych weryfikacją

Ocena końcowa x jest wyznaczana na podstawie wartości

st(w)= 5, jeśli 4,5 < w;

st(w)= 4,5, jeśli 4,25 < w <= 4,5;

st(w)= 4, jeśli 3,75 < w <= 4,25;

st(w)= 3,5, jeśli 3,25 < w <= 3,75;

st(w)= 3, jeśli 2,75 < w <= 3,25;

st(w)= 2, jeśli w <= 2,75

oraz na bazie podanej niżej reguły:

x wyznacza się ze wzoru x=st(z), gdzie z jest średnią ważoną ocen z przeprowadzonych weryfikacji,w których wagi ocen z egzaminów wynoszą 2, a wagi ocen z innych form weryfikacji są równe 1

This course is not currently offered.
Course descriptions are protected by copyright.
Copyright by Cardinal Stefan Wyszynski University in Warsaw.
ul. Dewajtis 5,
01-815 Warszawa
tel: +48 22 561 88 00 https://uksw.edu.pl
contact accessibility statement mapa serwisu USOSweb 7.0.4.0-1 (2024-05-13)