Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2 značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
BI-VZD | Vytěžování znalostí z dat | Rozsah kontaktní výuky: | 2P+2C | ||
---|---|---|---|---|---|
Vyučující: | Klouda K., Vašata D. | Způsob zakončení: | Z,ZK | ||
Zodpovědná katedra: | 18105 | ECTS Kredity: | 4 | Semestr: | L,Z |
Anotace:
Studenti se seznámí se základními postupy při vytěžování znalostí z dat zejména pomocí metod strojového učení. Konkrétně se naučí základní techniky předzpracování a vizualizace dat a seznámí se s postupy při tvorbě modelů popisující data. Studenti také získají povědomí o vztahu mezi zaujetím a variancí modelů (bias-variance trade-off) a o vyhodnocení kvality modelů. V předmětu se k práci s daty a modely využívají knihovny pandas a scikit napsané v jazyce Python. Studenti budou schopni kvalifikovaně použít základní postupy data miningu a strojového učení na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
Osnovy přednášek:
1. | Seznámení s tématem a ukázky použití | |
2. | Rozhodovací stromy, testovací, trénovací a validační množina | |
3. | Ensamble metody (rozhodovací lesy, AdaBoost) | |
4. | Hierarchická shlukování a algoritmus k-means | |
5. | Metoda nejbližších sousedů, křížová validace | |
6. | Naivní Bayesův klasifikátor | |
7. | Lineární regrese | |
8. | Logistická regrese | |
9. | Hřebenová regrese, regularizace lineárního modelu | |
10. | Redukce dimenzionality | |
11. | Neuronové sítě | |
12. | Strojové zpracování přirozeného jazyka |
Osnovy cvičení:
1. | Jupyter notebooky a základní balíčky | |
2. | Rozhodovací stromy, ladění (hyper)parametrů | |
3. | Stromy, lesy, AdaBoost | |
4. | Shlukování, hierarchické a k-means | |
5. | kNN a křížová validace | |
6. | Naivní Bayesův klasifikátor | |
7. | Lineární regrese | |
8. | Logistická regrese | |
9. | Hřebenová regrese | |
10. | Redukce dimenzionality | |
11. | Neuronové sítě | |
12. | Strojové zpracování přirozeného jazyka |
Literatura:
1. | Data Mining: Practical Machine Learning Tools and Techniques, I. H. Witten, E. Frank, M. A. Hall, Elsevier, 2011, ISBN 978-0080890364. | |
2. | Deep Learning, I. Goodfellow, Y. Bengio, A. Courville, MIT Press, 2016, ISBN 978-0262035613. | |
3. | Machine Learning: A Probabilistic Perspective, K. P. Murphy, MIT Press, 2012, ISBN 978-0262018029. |
Požadavky:
Předpokládá se znalost lineární algebry, matematické analýzy a teorie pravděpodobnosti v rozsahu kurzů vyučovaných na fakultě.
|
Předmět je zahrnut do těchto studijních plánů:
Stránka vytvořena 19. 4. 2024, semestry: Z/2021-2, Z/2023-4, Z/2022-3, Z/2019-20, Z/2024-5, L/2021-2, L/2020-1, L/2022-3, L/2023-4, Z/2020-1, L/2019-20, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: J. Novák, I. Halaška |