Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Seminarium tematyczne: Algorytmy text mining i web crawling

Informacje ogólne

Kod przedmiotu: WF-R-PS-STAS Kod Erasmus / ISCED: 14.4 / (0313) Psychologia
Nazwa przedmiotu: Seminarium tematyczne: Algorytmy text mining i web crawling
Jednostka: Instytut Psychologii
Grupy: Grupa przedmiotów ogólnouczelnianych - Doktoranci
Przedmioty dla doktorantów psychologii
Seminaria tematyczne z psychologii
Punkty ECTS i inne: 4.00
Język prowadzenia: polski
Poziom przedmiotu:

średnio-zaawansowany

Symbol/Symbole kierunkowe efektów uczenia się:

SD_ PS _W01

SD_ PS _W03

SD_ PS _U02

SD_ PS _U03

SD_ PS _K02

Skrócony opis:

Celem kursu jest przybliżenie doktorantom metody posługiwania się algorytmami Text Mining oraz techniką przeczesywania sieci tzw. Web Crawling. Podczas ćwiczeń doktoranci zapoznają się nie tylko z praktycznymi ujęciami wykorzystania tych metod analizy danych (Text Mining) i pozyskiwania danych (Web Crawling) ale także poznają technika łączenia ich z innymi algorytmami.

Pełny opis:

1. Wprowadzenie do algorytmów Text Mining, informacje podstawowe na temat metody.

2. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część pierwsza

3. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część druga

4. Prezentacja wyników przy pomocy Analizy Składowych Głównych.

5. Raportowanie wyników Analizy Składowych Głównych.

6. Przekształcanie bazy danych słownych w dane liczbowe.

7. Rekodowanie danych liczbowych w nowe zmienne liczbowe.

8. Web Crawling – podstawowe informacje

9. Raportowanie wyników dotyczących Web Crawling

10. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: drzewami decyzyjnymi.

11. Raportowanie wyników dotyczących łączenia TM z drzewami decyzyjnymi

12. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: analizą skupień Generalised k-means Cluster Analysis.

13. Raportowanie wyników dotyczących łączenia TM z analizą skupień

14. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: sieci neuronowe.

15. Raportowanie wyników dotyczących łączenia TM z sieciami neuronowymi

Literatura:

Elder, J., Hill, T., Miner, G., Nisbet, B., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Nono-structured Text Data Application. Oxford: Elsevier.

Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of statistical analysis and data mining applications. Burlington, MA: Academic Press (Elsevier).

Szymańska, A. (2017). Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii [Usage of text mining algorithms to analyze textual data in psychology]. Socjolingwistyka, 33, 99–116.

Efekty kształcenia i opis ECTS:

WIEDZA:

- doktoranci poprawnie posługują się terminologią metody Text mining oraz Web Crawling.

UMIEJĘTNOŚCI:

- przeprowadzają analizę z wykorzystaniem algorytmów Text mining oraz analizy składowych głównych a także poszukują danych przy pomocy Web Crawling

KOMPETENCJE:

- poprawnie interpretują wyniki przeprowadzonych analiz

Opis punktów ECTS

Udział w zajęciach: 30 godzin

Przygotowanie do zajęć oraz przygotowanie raportów, czytanie literatury: 30 godzin

Metody i kryteria oceniania:

Podstawą zaliczenia kursu jest oddanie dwóch raportów końcowych prezentujących wyniki opracowane z wykorzystaniem metody Web Crawling i Text Mining.

Zajęcia w cyklu "Semestr letni 2019/20" (zakończony)

Okres: 2020-02-01 - 2020-09-20
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Seminarium, 30 godzin, 20 miejsc więcej informacji
Koordynatorzy: Agnieszka Szymańska
Prowadzący grup: Agnieszka Szymańska
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Seminarium - Zaliczenie na ocenę
E-Learning:

E-Learning z podziałem na grupy

Typ przedmiotu:

obowiązkowy

Grupa przedmiotów ogólnouczenianych:

nie dotyczy

Skrócony opis:

Celem kursu jest przybliżenie doktorantom metody posługiwania się algorytmami Text Mining oraz techniką przeczesywania sieci tzw. Web Crawling. Podczas ćwiczeń doktoranci zapoznają się nie tylko z praktycznymi ujęciami wykorzystania tych metod analizy danych (Text Mining) i pozyskiwania danych (Web Crawling) ale także poznają technika łączenia ich z innymi algorytmami.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie.