Subject description - XP13SAV

Summary of Study | Summary of Branches | All Subject Groups | All Subjects | List of Roles | Explanatory Notes               Instructions
XP13SAV Statistic analysis and technological data evaluation
Roles:S Extent of teaching:2P+2S
Department:13113 Language of teaching:CS
Guarantors:Molhanec M. Completion:Z,ZK
Lecturers:Molhanec M. Credits:4
Tutors:Molhanec M. Semester:L

Anotation:

Studenti se seznámí na úrovni odpovídající doktorskému studiu s formáty používaných při měření a zpracování dat v průmyslu. S jejich předzpracováním (filtrování a transformace), přenosem a jejich ukládáním. Dále získají hlubší znalosti v oblasti statistická analýzy naměřených dat (testování hypotéz, DOE, regrese, korelace, spojité a nespojité distribuce). Také získají znalosti o vytváření simulačních modelů (spojitých a nespojitých). Nakonec získají znalosti o vhodné vizualizaci takto zpracovaných dat.

Course outlines:

1) Formáty měřených dat: csv, fixní data. Další formáty používané pro zpracování a archivaci: xml, json. Strukturovaná a nestrukturovaná data. Data na Internetu a v databázi. Textová data.
2) Nástroje na zpracování csv a dalších typů dat. Dávkové zpracování dat ve Windows a Linuxu. Vhodné skriptovací jazyky ve Windows a Linuxu. Příkazová řádka. Použití pipe a přesměrování ve Windows nebo Linuxu.
3) Manipulace s daty, vyhledávání v datech, změna dat a jejich filtrování. Jazyk SQL (základ). Xpath (základ). Správnost dat. Čištění dat.
4) Statistické zpracovaní dat. Mean, průměr, rozptyl, standardní odchylka a další charakteristické hodnoty. Populace a výběr. Korelace a kovariace. Testování hypotéz. Testy normality. Anova. Výpočet modelu.
5) Vizualizace dat a jejich interpretace. Scatter diagram, boxplot, sloupcový diagram. Histogram. Koláčový diagram. Další 2D a 3D diagramy. Zásady tvorby diagramů pro znázornění technologických dat. Popisy os. Volba barev.
6) Excel a jeho využití pro zpracování dat. Pojmenované oblasti. Array funkce a konstanty. Tabulky. Matice. Kontingenční tabulky. Grafy s ohledem na statistické výstupy. Add-Ins. VBA (zaklad).
7) Matlab pro zpracování naměřených hodnot. Zpracovaní csv dat. Statistický toolbox. Spojení s databází. Vizualizace s ohledem na statistické výstupy.
8) Mathematica pro zpracování naměřených hodnot. Zpracovaní csv dat. Statistické funkce. Spojení s databází. Vizualizace s ohledem na statistické výstupy.
9) Python. Základy Jazyka. Knihovny pro zpracování dat. Použití pro zpracování dat. Data z Internetu a přístup do databáze.
10) Python. Náročnější konstrukce. Práce s maticemi. Funkcionální přístup. Pandoc knihovna. Statistika a grafické výstupy. Knihovna Matplotlib.
11) R systém. Základy jazyka. Práce s daty. Statistika. Grafický výstup.
12) Statistické vyhodnocení dat. Regrese, korelace, optimalizace, predikce. Časové řady. Bayes.
13) Tvorba simulačního modelu. Analogová a diskrétní simulace. Modelovací systém AnyLogic.
14) Prezentace dat. Publikování dat. Open access. Autorská práva.

Exercises outline:

Literature:

[1] Milan Meloun, Jiří Militký.: Statistické zpracování experimentálních dat, ars magna, 1998, Praha
[2] Václav Dupač a Marie Hušková, Pravděpodobnost a matematická statistika, Karolinum, 2009
[3] M. Navara.: Pravděpodobnost a matematická statistika. Skripta FEL ČVUT, 2007

Requirements:

Subject is included into these academic programs:

Program Branch Role Recommended semester
DOKP Common courses S
DOKK Common courses S


Page updated 19.8.2022 17:50:24, semester: Z/2024-5, Z,L/2022-3, L/2021-2, Send comments about the content to the Administrators of the Academic Programs Proposal and Realization: I. Halaška (K336), J. Novák (K336)