Analiza statystyczna ze wspomaganiem IBM SPSS
Informacje ogólne
Kod przedmiotu: | WP-CWC-N-1-ASzw |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Analiza statystyczna ze wspomaganiem IBM SPSS |
Jednostka: | Wydział Prawa i Administracji |
Grupy: |
Przedmioty obowiązkowe dla I roku I stopnia Człowiek w cyberprzestrzeni (plus 2 sem. lektoratu) |
Punkty ECTS i inne: |
0 LUB
1.00
(w zależności od programu)
|
Język prowadzenia: | polski |
Poziom przedmiotu: | podstawowy |
Symbol/Symbole kierunkowe efektów uczenia się: | CwC1_W07 CwC1_U03 CwC1_U07 CwC1_U09 |
Skrócony opis: |
Cele przedmiotu: PASW Statistics to system przeznaczony do analizy i graficznej wizualizacji danych i wyników analiz oferujący szerokie spektrum technik analitycznych. Program posiada budowę modułową i wykorzystuje architekturę klient-serwer. Może również wykorzystywać w działaniu model rozproszonej architektury analitycznej. Moduły umożliwiają rozbudowanie funkcjonalności modułu bazowego PASW Statistics Base, zawierającego podstawowe statystyki i najczęściej wykorzystywane procedury statystyczne.System analityczny PASW Statistics Base udostępnia szereg statystyk i technik analitycznych od podstawowych jak statystyki opisowe (np. średnia, mediana, percentyle) pozwalające na wyczerpujący opis statystyczny i eksplorację danych, poprzez analizę tabelaryczną, testy statystyczne, korelacje, po analizy wielowymiarowe jak analiza regresji, analiza czynnikowa, analiza skupień, conjoint, dyskryminacji, korespondencji i wiele innych. |
Pełny opis: |
1. Oprogramowanie do analiz z graficznym interfejsem użytkownika umożliwiającym wgląd w poszczególne etapy procesu przetwarzania i analizy danych 2. Oprogramowanie ma możliwość układania w ciągi przetwarzania poszczególnych etapów składających się na proces analizy danych (przy pomocy tzw. węzłów) poczynając od wstępnego przetworzenia danych wejściowych, poprzez odpowiednie przekształcenia i transformacje prowadzące do uzyskania właściwej postaci danych analitycznych, odpowiednich dla technik data mining, aż do utworzenia wyjściowych danych możliwych do zapisania w zewnętrznych systemach bazodanowych z zastrzeżeniem, że interfejs nie powinien wprowadzać ograniczeń, w którym miejscu nowego procesu analitycznego mogą być dodawane węzły związane z dodawaniem, wczytywaniem czy przekształcaniem danych 3. Oprogramowanie analityczne umożliwia dokumentowanie i śledzenie pełnego procesu analitycznego od pobrania danych ze źródeł do zapisu scoringu do bazy danych poprzez dodawanie własnych opisów i komentarzy do poszczególnych poleceń reprezentowanych w interfejsie graficznym poprzez węzły 4. Oprogramowanie zapewnia gromadzenie, przechowywanie oraz udostępnianie treści analitycznej oraz procedur 5. Oprogramowanie umożliwia zarządzanie procesem automatycznego wykonywania zadań analitycznych 6. Możliwość importu i eksportu danych z plików tekstowych (.txt, .csv), plików MS Excel, plików danych IBM SPSS Statistics, SAS. Dostęp do danych przechowywanych w systemach bazodanowych Oracle, DB2, MS SQL Server, Teradata w celu pobierania i zapisywania informacji bezpośrednio do bazy danych 7. Możliwość dostępu do wielu formatów danych jednocześnie, w ramach jednego procesu analitycznego 8. Zapewniony bezpośredni dostęp do systemów bazodanowych bez konieczności tworzenia etapu pośredniego w postaci ekstraktu danych lub zapisu danych w własnym formacie narzędzia analitycznego 9. Współpraca z repozytoriami Big Data 10. Możliwość oceny jakości danych m.in. pod względem występujących braków danych, wypełnienia zmiennych ważnymi wartościami, analizy przypadków odstających 11. Możliwość zastępowania braków danych różnymi metodami (losowo, stałą, ze względu na zadane kryterium warunkowe, przy pomocy technik analitycznych) 12. Możliwość wykonywania operacji na danych numerycznych i tekstowych 13. Możliwość losowania rekordów, w tym losowania warstwowego, zespolonego 14. Wyliczanie nowych zmiennych na podstawie funkcji arytmetycznych, matematycznych, warunkowych, daty i czasu oraz przy użyciu funkcji odpowiednich dla zmiennych tekstowych 15. Możliwość przekształcania zmiennych o wielu kategoriach do postaci binarnej, transpozycja zmiennych (zamiana wierszy na kolumny) 16. Agregacja zmiennych 17. Rekodowanie kategorii zmiennych 18. Kategoryzacja zmiennych ilościowych, w tym możliwość kategoryzacji z wykorzystaniem zmiennej przewidywanej w celu optymalizacji sposobu kategoryzacji zmiennej ilościowej 19. Możliwość łączenia zbiorów danych tak pod względem dodawania nowych zmiennych, jak i dodawania nowych rekordów 20. Dostępność algorytmów automatycznie przekształcających dane do celów analitycznych pozwalających na przyspieszenie pracy na etapie przygotowania danych. Dzięki temu mamy możliwość zrealizowania takich celów jak: budowę odpowiedniego zbioru danych, uporządkowania danych pod kątem wymagań stawianych przez konkretne algorytmy lub narzędzia czy zwiększenie skuteczności predykcji dokonywanej przez algorytmy. 21. Możliwość wykonywania przekształceń sekwencyjnych (wynik jednego przekształcenia może być wsadem do kolejnych przekształceń) na każdym etapie wykonywania analizy 22. Możliwość swobodnego kopiowania sekwencji przekształceń i wykorzystywania w innych miejscach danej analizy lub w innych analizach. a. Techniki wyszukiwania wielowymiarowych obserwacji odstających. b. Techniki redukcji opisu (analiza czynnikowa, składowych głównych). c. Technika symulacji Monte Carlo 23. Dostępność dla drzew decyzyjnych metod zwiększający dokładność i stabilność modeli (przynajmniej boosting, bagging). 24. Możliwość eksploracji danych poprzez generowanie statystyk opisowych, korelacji pomiędzy zmiennych oraz wizualizacji danych przy pomocy wykresów i tabel. 25. Możliwość wizualizacji proporcjonalnej ważności predyktorów na wartość zmiennej przewidywanej. |
Literatura: |
- Babbie, Earl, Podstawy badań społecznych, PWN, Warszawa 2008. - Bedyńska, Sylwia; Brzezicka, Aneta (red.), Statystyczny drogowskaz. Praktyczny poradnik analizy danych w naukach społecznych na przykładach z psychologii, SWPS ACADEMICA, Warszawa 2007. - Górniak, Jarosław; Wachnicki, Janusz, Pierwsze kroki w analizie danych, SPSS Polska, Kraków 2008. - Larose, Daniel T., Odkrywanie wiedzy w danych. Wprowadzenie do eksploracji danych, PWN, Warszawa 2008. - Malarska, Anna, Statystyczna analiza danych wspomagana programem SPSS, SPSS Polska, Kraków 2008. - Nawojczyk, Maria, Przewodnik po statystyce dla socjologów, SPSS Polska, Kraków 2006. - Żądło Tomasz; Wywiał, Janusz, Prognozowanie szeregów czasowych za pomocą pakietu SPSS, SPSS Polska, Kraków 2008. - Griffith, Arthur, The Dummy’s Guide to Data Analysis Using SPSS, Wiley Publishing Inc. 2007. - Gupta, Vijay, SPSS for Beginners, VJBooks Inc. 1999. - Landau, Sabine and Everitt, Brian S., A Handbook of Statistical Analyses using SPSS, A CRC Press Company Boca Raton, London New York Washington, D.C. 2004. - The SPSS Video Guide (CD-ROM) Mac & PC CloneCDimage |
Efekty kształcenia i opis ECTS: |
Student zna zasady i metodologię przeprowadzania analiz. Student potrafi posługiwać się narzędziami informatycznymi. Student potrafi wykorzystywać określone metody i narzędzia do dokonywania analiz/badań socjologicznych/innych badań. Student umie administrować bazami danych. Punkty ECTS: 1 Udział w ćwiczeniach 15 godz. 1. Oprogramowanie do analiz z graficznym interfejsem użytkownika umożliwiającym wgląd w poszczególne etapy procesu przetwarzania i analizy danych 2. Oprogramowanie ma możliwość układania w ciągi przetwarzania poszczególnych etapów składających się na proces analizy danych (przy pomocy tzw. węzłów) poczynając od wstępnego przetworzenia danych wejściowych, poprzez odpowiednie przekształcenia i transformacje prowadzące do uzyskania właściwej postaci danych analitycznych, odpowiednich dla technik data mining, aż do utworzenia wyjściowych danych możliwych do zapisania w zewnętrznych systemach bazodanowych z zastrzeżeniem, że interfejs nie powinien wprowadzać ograniczeń, w którym miejscu nowego procesu analitycznego mogą być dodawane węzły związane z dodawaniem, wczytywaniem czy przekształcaniem danych 3. Oprogramowanie analityczne umożliwia dokumentowanie i śledzenie pełnego procesu analitycznego od pobrania danych ze źródeł do zapisu scoringu do bazy danych poprzez dodawanie własnych opisów i komentarzy do poszczególnych poleceń reprezentowanych w interfejsie graficznym poprzez węzły 4. Oprogramowanie zapewnia gromadzenie, przechowywanie oraz udostępnianie treści analitycznej oraz procedur 5. Oprogramowanie umożliwia zarządzanie procesem automatycznego wykonywania zadań analitycznych 6. Możliwość importu i eksportu danych z plików tekstowych (.txt, .csv), plików MS Excel, plików danych IBM SPSS Statistics, SAS. Dostęp do danych przechowywanych w systemach bazodanowych Oracle, DB2, MS SQL Server, Teradata w celu pobierania i zapisywania informacji bezpośrednio do bazy danych 7. Możliwość dostępu do wielu formatów danych jednocześnie, w ramach jednego procesu analitycznego 8. Zapewniony bezpośredni dostęp do systemów bazodanowych bez konieczności tworzenia etapu pośredniego w postaci ekstraktu danych lub zapisu danych w własnym formacie narzędzia analitycznego 9. Współpraca z repozytoriami Big Data 10. Możliwość oceny jakości danych m.in. pod względem występujących braków danych, wypełnienia zmiennych ważnymi wartościami, analizy przypadków odstających 11. Możliwość zastępowania braków danych różnymi metodami (losowo, stałą, ze względu na zadane kryterium warunkowe, przy pomocy technik analitycznych) 12. Możliwość wykonywania operacji na danych numerycznych i tekstowych 13. Możliwość losowania rekordów, w tym losowania warstwowego, zespolonego 14. Wyliczanie nowych zmiennych na podstawie funkcji arytmetycznych, matematycznych, warunkowych, daty i czasu oraz przy użyciu funkcji odpowiednich dla zmiennych tekstowych 15. Możliwość przekształcania zmiennych o wielu kategoriach do postaci binarnej, transpozycja zmiennych (zamiana wierszy na kolumny) 16. Agregacja zmiennych 17. Rekodowanie kategorii zmiennych 18. Kategoryzacja zmiennych ilościowych, w tym możliwość kategoryzacji z wykorzystaniem zmiennej przewidywanej w celu optymalizacji sposobu kategoryzacji zmiennej ilościowej 19. Możliwość łączenia zbiorów danych tak pod względem dodawania nowych zmiennych, jak i dodawania nowych rekordów 20. Dostępność algorytmów automatycznie przekształcających dane do celów analitycznych pozwalających na przyspieszenie pracy na etapie przygotowania danych. Dzięki temu mamy możliwość zrealizowania takich celów jak: budowę odpowiedniego zbioru danych, uporządkowania danych pod kątem wymagań stawianych przez konkretne algorytmy lub narzędzia czy zwiększenie skuteczności predykcji dokonywanej przez algorytmy. 21. Możliwość wykonywania przekształceń sekwencyjnych (wynik jednego przekształcenia może być wsadem do kolejnych przekształceń) na każdym etapie wykonywania analizy 22. Możliwość swobodnego kopiowania sekwencji przekształceń i wykorzystywania w innych miejscach danej analizy lub w innych analizach. a. Techniki wyszukiwania wielowymiarowych obserwacji odstających. b. Techniki redukcji opisu (analiza czynnikowa, składowych głównych). c. Technika symulacji Monte Carlo 23. Dostępność dla drzew decyzyjnych metod zwiększający dokładność i stabilność modeli (przynajmniej boosting, bagging). 24. Możliwość eksploracji danych poprzez generowanie statystyk opisowych, korelacji pomiędzy zmiennych oraz wizualizacji danych przy pomocy wykresów i tabel. 25. Możliwość wizualizacji proporcjonalnej ważności predyktorów na wartość zmiennej przewidywanej. |
Metody i kryteria oceniania: |
Zasady zaliczenia: Test finalny kontrolujący stopień opanowania oprogramowania SPSS/PASW Statistics i analizy statystycznej. ocena 5 - opanowanie materiału na poziomie OBI1 Predictive Solutions ocena 4 - opanowanie materiału na poziomie konstrukcji zbioru danych, rekodowania danych, analiz statystycznych z analizą regresji włącznie. ocena 3 - opanowanie materiału na poziomie interface IBM SPSS bez syntaxu i analizy statystycznej (miary, częstości, tabele kontyngencji). ocena 2 - brak opanowania materiału na poziomie interface IBM SPSS bez syntaxu i analizy statystycznej (miary, częstości, tabele kontyngencji). |
Zajęcia w cyklu "Semestr letni 2021/22" (zakończony)
Okres: | 2022-02-01 - 2022-06-30 |
Przejdź do planu
PN WT ŚR WAR
WAR
WAR
CZ PT |
Typ zajęć: |
Warsztaty, 15 godzin
|
|
Koordynatorzy: | Marcin Zarzecki | |
Prowadzący grup: | Marcin Zarzecki | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Warsztaty - Zaliczenie na ocenę |
|
E-Learning: | E-Learning (pełny kurs) z podziałem na grupy |
|
Typ przedmiotu: | obowiązkowy |
|
Grupa przedmiotów ogólnouczenianych: | nie dotyczy |
Zajęcia w cyklu "Semestr letni 2022/23" (zakończony)
Okres: | 2023-02-01 - 2023-06-30 |
Przejdź do planu
PN WT ŚR WAR
WAR
WAR
CZ PT |
Typ zajęć: |
Warsztaty, 15 godzin
|
|
Koordynatorzy: | Marcin Zarzecki | |
Prowadzący grup: | Marcin Zarzecki | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Warsztaty - Zaliczenie na ocenę |
|
E-Learning: | E-Learning (pełny kurs) z podziałem na grupy |
|
Typ przedmiotu: | obowiązkowy |
Zajęcia w cyklu "Semestr letni 2023/24" (zakończony)
Okres: | 2024-02-15 - 2024-06-30 |
Przejdź do planu
PN WT WAR
WAR
WAR
ŚR CZ PT |
Typ zajęć: |
Warsztaty, 15 godzin
|
|
Koordynatorzy: | Marcin Zarzecki | |
Prowadzący grup: | Marcin Zarzecki | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Warsztaty - Zaliczenie na ocenę |
|
E-Learning: | E-Learning (pełny kurs) z podziałem na grupy |
|
Typ przedmiotu: | obowiązkowy |
|
Grupa przedmiotów ogólnouczenianych: | nie dotyczy |
Zajęcia w cyklu "Semestr letni 2024/25" (w trakcie)
Okres: | 2025-02-15 - 2025-06-30 |
Przejdź do planu
PN WT ŚR WAR
WAR
WAR
CZ PT |
Typ zajęć: |
Warsztaty, 15 godzin
|
|
Koordynatorzy: | Marcin Zarzecki | |
Prowadzący grup: | Marcin Zarzecki | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Warsztaty - Zaliczenie na ocenę |
|
E-Learning: | E-Learning (pełny kurs) z podziałem na grupy |
|
Typ przedmiotu: | obowiązkowy |
|
Grupa przedmiotów ogólnouczenianych: | nie dotyczy |
Właścicielem praw autorskich jest Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie.