Hlavní stránka | Seznam oborů/specializací | Seznam všech skupin předmětů | Seznam všech předmětů | Seznam rolí                Návod

Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2  značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
NI-PDD Předzpracování dat Rozsah kontaktní výuky: 2P+1C
Vyučující: Jiřina M. Způsob zakončení: Z,ZK
Zodpovědná katedra: 18105 ECTS Kredity: 5 Semestr: Z

Anotace:
Studenti se naučí připravit surová data pro další zpracování a analýzu. Získají znalosti algoritmů pro extrakci parametrů z různých datových zdrojů, jako jsou obrázky, texty, časové řady, apod, a získají dovednosti tyto teoretické znalosti aplikovat při řešení daného problému, např. extrakce parametrů z obrazových dat nebo z Internetu. Předmět je ekvivalentní s MI-PDD.16

Osnovy přednášek:
1. Úvod, standardy KDDM, CRISP-DM, DM software.
2. Vizualizace a průzkum dat.
3. Metody určování významnosti příznaků.
4. Problémy v datech: příprava, reprezentace, validace, čištění, chybějící hodnoty, formát datumu, konverze nenumerických dat.
5. Problémy v datech: diskretizace/binning, odlehlé hodnoty/outliers, shluková analýza, falešné prediktory, vyvažování skupin, transformace, vzorkování.
6. Redukce dat: pravidlo nejbližšího souseda, hranice mezi skupinami, CNN, vzdálenostní grafy, Wilsonova editace, multi-edit metoda.
7. Redukce dat: vyvažování tříd, Tomkovy spoje, metoda SMOTE, rozšířené pravidlo nejbližšího souseda.
8. Projekční metody PCA, ICA, LDA.
9. Předzpracování časových řad a extrakce příznaků.
10. Předzpracování textu a extrakce příznaků.
11. Předzpracování obrazu a extrakce příznaků: popis obrazu, filtrace, detekce hran, Fourierova transformace.
12. Předzpracování obrazu a extrakce příznaků: hranová a plošná segmentace, popis objektů v obraze, příznakové a strukturální metody.

Osnovy cvičení:
1. zadání semestrálních projektů
2. konzultace
3. prezentace semestrálních projektů

Literatura:
1. Pyle, D. : Data Preparation for Data Mining. Morgan Kaufmann, 1999. ISBN 1558605290.
2. Guyon, I. - Gunn, S. - Nikravesh, M. - Zadeh, L. A. : Feature Extraction: Foundations and Applications (Studies in Fuzziness and Soft Computing). Springer, 2006. ISBN 3540354875.
3. García , S. - Luengo, J. - Herrera F. : Data Preprocessing in Data Mining (Intelligent Systems Reference Library). Springer, 2015. ISBN 978-3319102467.
4. Blokdyk, G. : Data pre-processing (2nd Edition). CreateSpace Independent Publishing Platform, 2018. ISBN 978-1987493245.

Požadavky:
Základy statistiky, znalost problematiky vytěžování dat. Doporučenou prerekvizitou je předmět BI-VZD.

Předmět je ekvivalentní s MI-PDD.16 // Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-PDD/

Předmět je zahrnut do těchto studijních plánů:
Plán Obor Role Dop. semestr
NI-SPOL.2020 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study VO 1
NI-PB.2020 Počítačová bezpečnost V 1
NI-SP.2020 Systémové programování V 1
NI-SP.2023 Systémové programování V 1
NI-MI.2020 Manažerská informatika V 3
NI-SPOL.2020 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study V 1
NI-PSS.2020 Počítačové systémy a sítě V 1
NI-WI.2020 Webové inženýrství V 1
BI-SPOL.21 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study V Není
BI-PI.21 Počítačové inženýrství 2021 V Není
BI-PG.21 Počítačová grafika 2021 V Není
BI-MI.21 Manažerská informatika 2021 V Není
BI-IB.21 Informační bezpečnost 2021 V Není
BI-PS.21 Počítačové sítě a Internet 2021 V Není
BI-PV.21 Počítačové systémy a virtualizace 2021 V Není
BI-SI.21 Softwarové inženýrství 2021 V Není
BI-TI.21 Teoretická informatika 2021 V Není
BI-UI.21 Umělá inteligence 2021 V Není
BI-WI.21 Webové inženýrství 2021 V Není
NI-TI.2018 Teoretická informatika V 1,3
BI-SPOL.2015 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study V Není
BI-WSI-PG.2015 Webové a softwarové inženýrství V Není
BI-WSI-WI.2015 Webové a softwarové inženýrství V Není
BI-WSI-SI.2015 Webové a softwarové inženýrství V Není
BI-ISM.2015 Informační systémy a management V Není
BI-ZI.2018 Znalostní inženýrství V Není
BI-PI.2015 Počítačové inženýrství V Není
BI-TI.2015 Teoretická informatika V Není
BI-BIT.2015 Bezpečnost a informační technologie V Není
NI-ZI.2020 Znalostní inženýrství PS 1
NI-NPVS.2020 Návrh a programování vestavných systémů V 3
NI-SI.2020 Softwarové inženýrství V 1
NI-TI.2023 Teoretická informatika V 1
NI-TI.2020 Teoretická informatika V 1
NIE-DBE.2023 Digital Business Engineering VO 1


Stránka vytvořena 19. 4. 2024, semestry: Z/2021-2, Z/2023-4, Z/2022-3, Z/2019-20, Z/2024-5, L/2021-2, L/2020-1, L/2022-3, L/2023-4, Z/2020-1, L/2019-20, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: J. Novák, I. Halaška