Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2 značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
BI-BIG.21 | DB technologie pro Big Data | Rozsah kontaktní výuky: | 2P+2C | ||
---|---|---|---|---|---|
Vyučující: | Borkovcová M. | Způsob zakončení: | KZ | ||
Zodpovědná katedra: | 18102 | ECTS Kredity: | 5 | Semestr: | Z,L |
Anotace:
Studenti budou uvedeni do oboru zpracování velkých dat (Big Data), kde se dnes typicky používají nerelační (NoSQL) databázové stroje. Předmět je zaměřen prakticky, aby studenti po jeho absolvování byli schopni vybrat vhodné nástroje (většinou open source) a postupy, navrhnout a implementovat jednodušší opakovatelný proces zpracování dat (sběr dat, transformace/agregace, prezentace). Studenti budou seznámeni s různými architekturami pro zpracování a uložení velkých dat. Teoretický výklad a prezentace konkrétních technologií budou doplněny konkrétními příklady z praxe.
Osnovy přednášek:
1. | Úvod do předmětu, distribuovaná řešení, základní pojmy (Big Data, cluster, distribuované file systémy, CAP teorém,...) | |
2. | NoSQL databáze klíč-hodnota (Redis) | |
3. | NoSQL databáze dokumentové (MongoDB) | |
4. | NoSQL databáze sloupcové (Apache Cassandra) |
10. | Ekosystém Hadoop (Hadoop,Map Reduce, HDFS, YARN) |
13. | Zápočtový test |
Osnovy cvičení:
1. | Seznámení s prostředím laboratoře | |
2. | Úvod do práce s Cassandra Clusterem | |
3. | Základy Redis | |
4. | Základy MongoDB | |
5. | Základy Apache Cassandra | |
6. | Základy Neo4j | |
7. | Základy Elasticsearch | |
8. | Způsoby a možnosti prezentace dat pomocí ELK Stack | |
9. | Základy práce s Apache Spark, využití jazyku Scala | |
10. | Praktický workshop na vybrané téma | |
11. | Konzultace k semestrální práci | |
12. | Obhajoba semestrální práce - 1. část | |
13. | Obhajoba semestrální práce - 2. část |
Literatura:
1. | Holubová Irena, Minařík Karel, Novák David, Kosek Jiří. Big Data a NoSQL databáze. 2015. ISBN 978-80-247-5466-6. | |
2. | Meier A., Kaufmann M. : SQL & NoSQL Databases. Springer, 2019. ISBN 978-3-658-24549-8. | |
3. | Bradshaw S., Brazil E., Chodorow Ch. : MongoDB: The Defnitive Guide: Powerful and Scalable Data Storage. O'Reilly Media, 2019. ISBN 9781491954461. | |
4. | https://redis.io | |
5. | https://cassandra.apache.org/ | |
6. | https://neo4j.com/ | |
7. | https://www.mongodb.com/ | |
8. | https://www.elastic.co/ |
Požadavky:
Základní znalost relačních databází, práce s příkazovou řádkou, doporučená je znalost technologie Docker.
Předmět je zahrnut do těchto studijních plánů:
Stránka vytvořena 29. 4. 2024, semestry: Z/2023-4, Z/2019-20, L/2021-2, L/2020-1, L/2022-3, Z/2021-2, L/2019-20, Z/2022-3, Z/2020-1, L/2023-4, Z/2024-5, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: J. Novák, I. Halaška |