Hlavní stránka | Seznam oborů/specializací | Seznam všech skupin předmětů | Seznam všech předmětů | Seznam rolí                Návod

Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2  značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
BIE-BIG.21 DB Technologies for Big Data Rozsah kontaktní výuky: 2P+2C
Vyučující: Gattermayer J. Způsob zakončení: KZ
Zodpovědná katedra: 18102 ECTS Kredity: 5 Semestr: L

Anotace:
Students will be introduced into the field of Big Data processing where nonrelational (NoSQL) database engines are typically used today. The course is focused practically so that after finishing the course students were able to choose suitable tools (mostly open source) and techniques,design and implement a simplest reproducible method of data processing (data collection, transformation/aggregation, presentation). Students get acquainted with various architectures for processing and storing big data. A theoretical foundation and presentation of individual technologies will be supplemented with specific case studies.

Osnovy přednášek:
1. Introduction to the Big Data processing, the definition of the Big Data concept, CAP theorem.
2. Case study.
3. [2] Column-oriented database engines (Cassandra).
5. Document-oriented database engines (MongoDB).
6. [2] Platforms for Big Data processing based on maintaining data in a file system (Hadoop).
8. [2] Platforms for Big Data processing based on maintaining data in main memory (Spark).
10. Indexing of unstructured and semistructured data (ElasticSearch, Solr).
11. Tools for data visualization and presentation (Kibana).
12. [2] Case studies.

Osnovy cvičení:
1. Introduction to the laboratory environment
2. Introduction to working with Cassandra Cluster
3. Hadoop MapReduce
4. Cassandra UseCase 1 - Part 1
5. Cassandra UseCase 1 - Part 2
6. Cassandra UseCase 2 - Part 1 (Hive / Pig Use)
7. Cassandra UseCase 2 - Part 1
8. Cassandra UseCase 3 - Part 1 (Use Solr)
9. Cassandra UseCase 3 - Part 2
10. Cassandra UseCase 4 - Part 1 (Complex solution)
11. Cassandra UseCase 4 - Part 2
12. Submission of semester work, credit
13. Reserve

Literatura:
1. Zikopoulos P., Eaton Ch. : Understanding big data: Analytics for enterprise class Hadoop and streaming data. McGraw-Hill Osborne Media, 2011. ISBN 978-0071790536.
2. Hewitt E. : Cassandra: The Definitive Guide. O'Reilly Media, 2010. ISBN 978-1449390419.
3. Meier A., Kaufmann M. : SQL & NoSQL Databases. Springer, 2019. ISBN 978-3-658-24549-8.
4. Bradshaw S., Brazil E., Chodorow Ch. : MongoDB: The Definitive Guide: Powerful and Scalable Data Storage. O'Reilly Media, 2019. ISBN 9781491954461.

Požadavky:
Basic knowledge of relational databases, working with the command line.

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/BI-BIG/

Předmět je zahrnut do těchto studijních plánů:
Plán Obor Role Dop. semestr
BIE-PV.21 Computer Systems and Virtualization 2021 PV 6


Stránka vytvořena 30. 4. 2024, semestry: L/2021-2, Z/2023-4, L/2022-3, L/2019-20, Z,L/2020-1, Z/2024-5, Z/2019-20, Z/2022-3, L/2023-4, Z/2021-2, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: J. Novák, I. Halaška