Hlavní stránka | Seznam oborů/specializací | Seznam všech skupin předmětů | Seznam všech předmětů | Seznam rolí                Návod

Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2  značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
MI-PDD.16 Předzpracování dat Rozsah kontaktní výuky: 2P+1C
Vyučující: Způsob zakončení: Z,ZK
Zodpovědná katedra: 18105 ECTS Kredity: 5 Semestr: Z

Anotace:
Studenti se naučí připravit surová data pro další zpracování a analýzu. Získají znalosti algoritmů pro extrakci parametrů z různých datových zdrojů, jako jsou obrázky, texty, časové řady, apod, a získají dovednosti tyto teoretické znalosti aplikovat při řešení daného problému, např. extrakce parametrů z obrazových dat nebo z Internetu. Od B201 je vypisována nová, ekvivalentní verze předmětu NI-PDD.

Osnovy přednášek:
1. Průzkum dat, techniky exploratorní analýzy, vizualizace surových dat.
2. Deskriptivní statistika.
3. Metody určování významnosti příznaků.
4. Problémy v datech - dimenzionalita, šum, odlehlé hodnoty, nekonzistence, chybějící hodnoty, nenumerická data.
5. Čištění dat, transformace dat, imputing, diskretizace, binning.
6. Redukce dimenzionality dat.
7. Redukce objemu dat, balancování tříd.
8. Extrakce příznaků z textu.
9. Extrakce příznaků z dokumentů, webu, předzpracování strukturovaných dat.
10. Extrakce příznaků z časových řad.
11. Extrakce příznaků z obrazu.
12. Případové studie přípravy dat.
13. Automatizace předzpracování dat.

Osnovy cvičení:
1. zadání semestrálních projektů
2. konzultace
3. prezentace semestrálních projektů

Literatura:
Pyle, D. ''Data Preparation for Data Mining''. Morgan Kaufmann, 1999. ISBN 1558605290. Guyon, I., Gunn, S., Nikravesh, M., Zadeh, L. A. ''Feature Extraction: Foundations and Applications (Studies in Fuzziness and Soft Computing)''. Springer, 2006. ISBN 3540354875.

Požadavky:
Základy statistiky, znalost problematiky vytěžování dat. Doporučenou prerekvizitou je předmět BI-VZD.

Předmět je nahrazen ekvivalentním NI-PDD // Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-PDD/

Předmět je zahrnut do těchto studijních plánů:
Plán Obor Role Dop. semestr
MI-WSI-WI.2016 Webové a softwarové inženýrství V 1
MI-ZI.2018 Znalostní inženýrství PO 1
MI-WSI-ISM.2016 Webové a softwarové inženýrství V 1
MI-PB.2016 Počítačová bezpečnost V 1
MI-WSI-SI.2016 Webové a softwarové inženýrství V 1
MI-SP-SP.2016 Systémové programování V 1
MI-ZI.2016 Znalostní inženýrství PO 1
MI-SPOL.2016 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study VO 1
MI-SP-TI.2016 Systémové programování V 1
MI-NPVS.2016 Návrh a programování vestavných systémů V 1
MI-PSS.2016 Počítačové systémy a sítě V 1


Stránka vytvořena 28. 3. 2024, semestry: Z/2022-3, L/2020-1, L/2019-20, L/2023-4, L/2022-3, Z/2023-4, Z/2019-20, Z/2021-2, Z/2020-1, L/2021-2, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: J. Novák, I. Halaška