Hlavní stránka | Seznam oborů/specializací | Seznam všech skupin předmětů | Seznam všech předmětů | Seznam rolí                Návod

Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2  značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
BIE-VZD Data Mining Rozsah kontaktní výuky: 2P+2C
Vyučující: Da Silva Alves R., Vašata D. Způsob zakončení: Z,ZK
Zodpovědná katedra: 18105 ECTS Kredity: 4 Semestr: Z

Anotace:
Students are introduced to the basic methods of discovering knowledge in data. In particular, they learn the basic techniques of data preprocessing, multidimensional data visualization, statistical techniques of data transformation, and fundamental principles of knowledge discovery methods. Students will be aware of the relationships between model bias and variance, and know the fundamentals of assessing model quality. Data mining software is extensively used in the module. Students will be able to apply basic data mining tools to common problems (classification, regression, clustering).

Osnovy přednášek:
1. Introduction to the field and applications
2. Decision trees, test, train, validation set
3. Ensemble methods (random forest, AdaBoost)
4. Hierarchical clustering, k-means algorithm
5. kNN (k-nearest neighbours)
6. Naive Bayes
7. Linear regression
8. Logistic regression
9. Ridge regression and regularisation
10. Dimensionality reduction
11. Neural networks
12. Natural language processing

Osnovy cvičení:
1. Jupyter notebooks and machine learning packages
2. Decision trees, hyperparameters tuning
3. Ensemble methods (random forest, AdaBoost)
4. Hierarchical clustering, k-means algorithm
5. kNN (k-nearest neighbours), cross-validation
6. Naive Bayes classifier
7. Linear regression
8. Logistic regression
9. Ridge regression
10. Dimensionality reduction
11. Neural networks
12. Natural language processing

Literatura:
1. Data Mining: Practical Machine Learning Tools and Techniques, I. H. Witten, E. Frank, M. A. Hall, Elsevier, 2011, ISBN 978-0080890364.
2. Deep Learning, I. Goodfellow, Y. Bengio, A. Courville, MIT Press, 2016, ISBN 978-0262035613.
3. Machine Learning: A Probabilistic Perspective, K. P. Murphy, MIT Press, 2012, ISBN 978-0262018029.

Požadavky:
The knowledge of calculus, linear algebra and probability theory is assumed.

Information about the course and courseware are available at https://courses.fit.cvut.cz/BIE-VZD/

Předmět je zahrnut do těchto studijních plánů:
Plán Obor Role Dop. semestr
BIE-WSI-SI.2015 Software Engineering (Bachelor, in English) V 5
BIE-BIT.2015 Computer Security and Information technology (Bachelor, in English) V 5
BIE-TI.2015_ORIGINAL Computer Science (Bachelor, in English) PO 5
BIE-TI.2015 Computer Science (Bachelor, in English) PO 5


Stránka vytvořena 24. 4. 2024, semestry: L/2020-1, L/2019-20, L/2023-4, Z,L/2022-3, L/2021-2, Z/2019-20, Z/2024-5, Z/2023-4, Z/2020-1, Z/2021-2, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: J. Novák, I. Halaška