Seminarium tematyczne: Algorytmy text mining i web crawling
Informacje ogólne
Kod przedmiotu: | WF-R-PS-STAS |
Kod Erasmus / ISCED: |
14.4
|
Nazwa przedmiotu: | Seminarium tematyczne: Algorytmy text mining i web crawling |
Jednostka: | Instytut Psychologii |
Grupy: |
Grupa przedmiotów ogólnouczelnianych - Doktoranci Przedmioty dla doktorantów psychologii Seminaria tematyczne z psychologii |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | polski |
Poziom przedmiotu: | średnio-zaawansowany |
Symbol/Symbole kierunkowe efektów uczenia się: | SD_ PS _W01 SD_ PS _W03 SD_ PS _U02 SD_ PS _U03 SD_ PS _K02 |
Skrócony opis: |
Celem kursu jest przybliżenie doktorantom metody posługiwania się algorytmami Text Mining oraz techniką przeczesywania sieci tzw. Web Crawling. Podczas ćwiczeń doktoranci zapoznają się nie tylko z praktycznymi ujęciami wykorzystania tych metod analizy danych (Text Mining) i pozyskiwania danych (Web Crawling) ale także poznają technika łączenia ich z innymi algorytmami. |
Pełny opis: |
1. Wprowadzenie do algorytmów Text Mining, informacje podstawowe na temat metody. 2. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część pierwsza 3. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część druga 4. Prezentacja wyników przy pomocy Analizy Składowych Głównych. 5. Raportowanie wyników Analizy Składowych Głównych. 6. Przekształcanie bazy danych słownych w dane liczbowe. 7. Rekodowanie danych liczbowych w nowe zmienne liczbowe. 8. Web Crawling – podstawowe informacje 9. Raportowanie wyników dotyczących Web Crawling 10. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: drzewami decyzyjnymi. 11. Raportowanie wyników dotyczących łączenia TM z drzewami decyzyjnymi 12. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: analizą skupień Generalised k-means Cluster Analysis. 13. Raportowanie wyników dotyczących łączenia TM z analizą skupień 14. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: sieci neuronowe. 15. Raportowanie wyników dotyczących łączenia TM z sieciami neuronowymi |
Literatura: |
Elder, J., Hill, T., Miner, G., Nisbet, B., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Nono-structured Text Data Application. Oxford: Elsevier. Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of statistical analysis and data mining applications. Burlington, MA: Academic Press (Elsevier). Szymańska, A. (2017). Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii [Usage of text mining algorithms to analyze textual data in psychology]. Socjolingwistyka, 33, 99–116. |
Efekty kształcenia i opis ECTS: |
WIEDZA: - doktoranci poprawnie posługują się terminologią metody Text mining oraz Web Crawling. UMIEJĘTNOŚCI: - przeprowadzają analizę z wykorzystaniem algorytmów Text mining oraz analizy składowych głównych a także poszukują danych przy pomocy Web Crawling KOMPETENCJE: - poprawnie interpretują wyniki przeprowadzonych analiz Opis punktów ECTS Udział w zajęciach: 30 godzin Przygotowanie do zajęć oraz przygotowanie raportów, czytanie literatury: 30 godzin |
Metody i kryteria oceniania: |
Podstawą zaliczenia kursu jest oddanie dwóch raportów końcowych prezentujących wyniki opracowane z wykorzystaniem metody Web Crawling i Text Mining. |
Właścicielem praw autorskich jest Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie.