Hlavní stránka | Seznam oborů/specializací | Seznam všech skupin předmětů | Seznam všech předmětů | Seznam rolí                Návod

Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2  značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
BI-VZD Vytěžování znalostí z dat Rozsah kontaktní výuky: 2P+2C
Vyučující: Klouda K., Vašata D. Způsob zakončení: Z,ZK
Zodpovědná katedra: 18105 ECTS Kredity: 4 Semestr: L,Z

Anotace:
Studenti se seznámí se základními postupy při vytěžování znalostí z dat zejména pomocí metod strojového učení. Konkrétně se naučí základní techniky předzpracování a vizualizace dat a seznámí se s postupy při tvorbě modelů popisující data. Studenti také získají povědomí o vztahu mezi zaujetím a variancí modelů (bias-variance trade-off) a o vyhodnocení kvality modelů. V předmětu se k práci s daty a modely využívají knihovny pandas a scikit napsané v jazyce Python. Studenti budou schopni kvalifikovaně použít základní postupy data miningu a strojového učení na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Osnovy přednášek:
1. Seznámení s tématem a ukázky použití
2. Rozhodovací stromy, testovací, trénovací a validační množina
3. Ensamble metody (rozhodovací lesy, AdaBoost)
4. Hierarchická shlukování a algoritmus k-means
5. Metoda nejbližších sousedů, křížová validace
6. Naivní Bayesův klasifikátor
7. Lineární regrese
8. Logistická regrese
9. Hřebenová regrese, regularizace lineárního modelu
10. Redukce dimenzionality
11. Neuronové sítě
12. Strojové zpracování přirozeného jazyka

Osnovy cvičení:
1. Jupyter notebooky a základní balíčky
2. Rozhodovací stromy, ladění (hyper)parametrů
3. Stromy, lesy, AdaBoost
4. Shlukování, hierarchické a k-means
5. kNN a křížová validace
6. Naivní Bayesův klasifikátor
7. Lineární regrese
8. Logistická regrese
9. Hřebenová regrese
10. Redukce dimenzionality
11. Neuronové sítě
12. Strojové zpracování přirozeného jazyka

Literatura:
1. Data Mining: Practical Machine Learning Tools and Techniques, I. H. Witten, E. Frank, M. A. Hall, Elsevier, 2011, ISBN 978-0080890364.
2. Deep Learning, I. Goodfellow, Y. Bengio, A. Courville, MIT Press, 2016, ISBN 978-0262035613.
3. Machine Learning: A Probabilistic Perspective, K. P. Murphy, MIT Press, 2012, ISBN 978-0262018029.

Požadavky:
Předpokládá se znalost lineární algebry, matematické analýzy a teorie pravděpodobnosti v rozsahu kurzů vyučovaných na fakultě.

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/BI-VZD/

Předmět je zahrnut do těchto studijních plánů:
Plán Obor Role Dop. semestr
BI-ZI.2018 Znalostní inženýrství PO 5
BI-PI.2015 Počítačové inženýrství V 5
BI-TI.2015 Teoretická informatika PO 5
BI-WSI-WI.2015 Webové a softwarové inženýrství V 5
BI-BIT.2015 Bezpečnost a informační technologie V 5
BI-WSI-PG.2015 Webové a softwarové inženýrství V 5
BI-WSI-SI.2015 Webové a softwarové inženýrství V 5
BI-ISM.2015 Informační systémy a management V 5
BI-SPOL.2015 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study VO 5


Stránka vytvořena 19. 4. 2024, semestry: Z/2021-2, Z/2023-4, Z/2022-3, Z/2019-20, Z/2024-5, L/2021-2, L/2020-1, L/2022-3, L/2023-4, Z/2020-1, L/2019-20, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: J. Novák, I. Halaška