Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie - Centralny System Uwierzytelniania
Strona główna

Seminarium tematyczne: Algorytmy text mining i web crawling

Informacje ogólne

Kod przedmiotu: WF-R-PS-STAS
Kod Erasmus / ISCED: 14.4 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0313) Psychologia Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Seminarium tematyczne: Algorytmy text mining i web crawling
Jednostka: Instytut Psychologii
Grupy: Grupa przedmiotów ogólnouczelnianych - Doktoranci
Przedmioty dla doktorantów psychologii
Seminaria tematyczne z psychologii
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Poziom przedmiotu:

średnio-zaawansowany

Symbol/Symbole kierunkowe efektów uczenia się:

SD_ PS _W01

SD_ PS _W03

SD_ PS _U02

SD_ PS _U03

SD_ PS _K02

Skrócony opis:

Celem kursu jest przybliżenie doktorantom metody posługiwania się algorytmami Text Mining oraz techniką przeczesywania sieci tzw. Web Crawling. Podczas ćwiczeń doktoranci zapoznają się nie tylko z praktycznymi ujęciami wykorzystania tych metod analizy danych (Text Mining) i pozyskiwania danych (Web Crawling) ale także poznają technika łączenia ich z innymi algorytmami.

Pełny opis:

1. Wprowadzenie do algorytmów Text Mining, informacje podstawowe na temat metody.

2. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część pierwsza

3. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część druga

4. Prezentacja wyników przy pomocy Analizy Składowych Głównych.

5. Raportowanie wyników Analizy Składowych Głównych.

6. Przekształcanie bazy danych słownych w dane liczbowe.

7. Rekodowanie danych liczbowych w nowe zmienne liczbowe.

8. Web Crawling – podstawowe informacje

9. Raportowanie wyników dotyczących Web Crawling

10. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: drzewami decyzyjnymi.

11. Raportowanie wyników dotyczących łączenia TM z drzewami decyzyjnymi

12. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: analizą skupień Generalised k-means Cluster Analysis.

13. Raportowanie wyników dotyczących łączenia TM z analizą skupień

14. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: sieci neuronowe.

15. Raportowanie wyników dotyczących łączenia TM z sieciami neuronowymi

Literatura:

Elder, J., Hill, T., Miner, G., Nisbet, B., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Nono-structured Text Data Application. Oxford: Elsevier.

Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of statistical analysis and data mining applications. Burlington, MA: Academic Press (Elsevier).

Szymańska, A. (2017). Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii [Usage of text mining algorithms to analyze textual data in psychology]. Socjolingwistyka, 33, 99–116.

Efekty kształcenia i opis ECTS:

WIEDZA:

- doktoranci poprawnie posługują się terminologią metody Text mining oraz Web Crawling.

UMIEJĘTNOŚCI:

- przeprowadzają analizę z wykorzystaniem algorytmów Text mining oraz analizy składowych głównych a także poszukują danych przy pomocy Web Crawling

KOMPETENCJE:

- poprawnie interpretują wyniki przeprowadzonych analiz

Opis punktów ECTS

Udział w zajęciach: 30 godzin

Przygotowanie do zajęć oraz przygotowanie raportów, czytanie literatury: 30 godzin

Metody i kryteria oceniania:

Podstawą zaliczenia kursu jest oddanie dwóch raportów końcowych prezentujących wyniki opracowane z wykorzystaniem metody Web Crawling i Text Mining.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie.
ul. Dewajtis 5,
01-815 Warszawa
tel: +48 22 561 88 00 https://uksw.edu.pl
kontakt deklaracja dostępności USOSweb 7.0.3.0-1 (2024-04-02)