Seminarium tematyczne: Algorytmy text mining i web crawling
Informacje ogólne
Kod przedmiotu: | WF-R-PS-STAS | Kod Erasmus / ISCED: |
14.4
![]() ![]() |
Nazwa przedmiotu: | Seminarium tematyczne: Algorytmy text mining i web crawling | ||
Jednostka: | Instytut Psychologii | ||
Grupy: |
Grupa przedmiotów ogólnouczelnianych - Doktoranci Przedmioty dla doktorantów psychologii Seminaria tematyczne z psychologii |
||
Punkty ECTS i inne: |
4.00 ![]() |
||
Język prowadzenia: | polski | ||
Poziom przedmiotu: | średnio-zaawansowany |
||
Symbol/Symbole kierunkowe efektów uczenia się: | SD_ PS _W01 SD_ PS _W03 SD_ PS _U02 SD_ PS _U03 SD_ PS _K02 |
||
Skrócony opis: |
Celem kursu jest przybliżenie doktorantom metody posługiwania się algorytmami Text Mining oraz techniką przeczesywania sieci tzw. Web Crawling. Podczas ćwiczeń doktoranci zapoznają się nie tylko z praktycznymi ujęciami wykorzystania tych metod analizy danych (Text Mining) i pozyskiwania danych (Web Crawling) ale także poznają technika łączenia ich z innymi algorytmami. |
||
Pełny opis: |
1. Wprowadzenie do algorytmów Text Mining, informacje podstawowe na temat metody. 2. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część pierwsza 3. Wykorzystanie algorytmów do zliczania liczby słów w dokumentach oraz nadawania im wag: Raw, Inverce Document Frequency – część druga 4. Prezentacja wyników przy pomocy Analizy Składowych Głównych. 5. Raportowanie wyników Analizy Składowych Głównych. 6. Przekształcanie bazy danych słownych w dane liczbowe. 7. Rekodowanie danych liczbowych w nowe zmienne liczbowe. 8. Web Crawling – podstawowe informacje 9. Raportowanie wyników dotyczących Web Crawling 10. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: drzewami decyzyjnymi. 11. Raportowanie wyników dotyczących łączenia TM z drzewami decyzyjnymi 12. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: analizą skupień Generalised k-means Cluster Analysis. 13. Raportowanie wyników dotyczących łączenia TM z analizą skupień 14. Łączenie metod analizy danych jakościowych przy pomocy algorytmów TM z innymi algorytmami: sieci neuronowe. 15. Raportowanie wyników dotyczących łączenia TM z sieciami neuronowymi |
||
Literatura: |
Elder, J., Hill, T., Miner, G., Nisbet, B., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Nono-structured Text Data Application. Oxford: Elsevier. Nisbet, R., Elder, J., & Miner, G. (2009). Handbook of statistical analysis and data mining applications. Burlington, MA: Academic Press (Elsevier). Szymańska, A. (2017). Wykorzystanie algorytmów Text Mining do analizy danych tekstowych w psychologii [Usage of text mining algorithms to analyze textual data in psychology]. Socjolingwistyka, 33, 99–116. |
||
Efekty kształcenia i opis ECTS: |
WIEDZA: - doktoranci poprawnie posługują się terminologią metody Text mining oraz Web Crawling. UMIEJĘTNOŚCI: - przeprowadzają analizę z wykorzystaniem algorytmów Text mining oraz analizy składowych głównych a także poszukują danych przy pomocy Web Crawling KOMPETENCJE: - poprawnie interpretują wyniki przeprowadzonych analiz Opis punktów ECTS Udział w zajęciach: 30 godzin Przygotowanie do zajęć oraz przygotowanie raportów, czytanie literatury: 30 godzin |
||
Metody i kryteria oceniania: |
Podstawą zaliczenia kursu jest oddanie dwóch raportów końcowych prezentujących wyniki opracowane z wykorzystaniem metody Web Crawling i Text Mining. |
Zajęcia w cyklu "Semestr letni 2019/20" (zakończony)
Okres: | 2020-02-01 - 2020-09-20 |
![]() |
Typ zajęć: |
Seminarium, 30 godzin, 20 miejsc ![]() |
|
Koordynatorzy: | Agnieszka Szymańska | |
Prowadzący grup: | Agnieszka Szymańska | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Seminarium - Zaliczenie na ocenę |
|
E-Learning: | E-Learning z podziałem na grupy |
|
Typ przedmiotu: | obowiązkowy |
|
Grupa przedmiotów ogólnouczenianych: | nie dotyczy |
|
Skrócony opis: |
Celem kursu jest przybliżenie doktorantom metody posługiwania się algorytmami Text Mining oraz techniką przeczesywania sieci tzw. Web Crawling. Podczas ćwiczeń doktoranci zapoznają się nie tylko z praktycznymi ujęciami wykorzystania tych metod analizy danych (Text Mining) i pozyskiwania danych (Web Crawling) ale także poznają technika łączenia ich z innymi algorytmami. |
Właścicielem praw autorskich jest Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie.