Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2 značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
BI-BIG | DB technologie pro Big Data | Rozsah kontaktní výuky: | 2P+2C | ||
---|---|---|---|---|---|
Vyučující: | Borkovcová M., Gattermayer J. | Způsob zakončení: | KZ | ||
Zodpovědná katedra: | 18102 | ECTS Kredity: | 4 | Semestr: | Z |
Anotace:
Studenti se seznámí s oborem zpracování velkých dat. Velká data jsou taková data, které již klasické relační databáze nejsou schopné zpracovat, přitom jejich realtime zpracováním vznikne informace, která má rozhodující cenu např. v konkurenčním boji.
Předmět je zaměřen velice prakticky, studenti si osvojí nejpoužívanější průmyslové technologie - Apache Big Data Stack, neboli Apache Cassandra, Apache Hadoop, Apache Solr a další. Teoretický základ z přednášek seznámí studenty s algoritmy používanými v Apache Big Data Stacku.
Prakticky orientovaná cvičení naučí studenty vyvinout nad ním vlastní aplikace.
Osnovy přednášek:
1. | Úvod do předmětu, co jsou to Big Data | |
2. | NoSQL, Apache Cassandra, úvod a clusterování | |
3. | Hadoop a MapReduce | |
4. | Cassandra Data Model (new and legacy) | |
5. | Cassandra Data Modeling | |
6. | Apache Hive a Pig & Solr | |
7. | Case study 1 | |
8. | Cassandra CQL | |
9. | Cassandra JDBC a Thrift client | |
10. | Case study 2 | |
11. | Optimalizace výkonu | |
12. | Case study 3 | |
13. | Rezerva |
Osnovy cvičení:
1. | Seznámení s prostředím laboratoře | |
2. | Úvod do práce s Cassandra Clusterem | |
3. | Hadoop MapReduce | |
4. | Cassandra UseCase 1 - 1. část | |
5. | Cassandra UseCase 1 - 2. část | |
6. | Cassandra UseCase 2 - 1. část (Využití Hive / Pig) | |
7. | Cassandra UseCase 2 - 1. část | |
8. | Cassandra UseCase 3 - 1. část (Využíti Solr) | |
9. | Cassandra UseCase 3 - 2. část | |
10. | Cassandra UseCase 4 - 1. část (Komplexní řešení) | |
11. | Cassandra UseCase 4 - 2. část | |
12. | Odevzdání semestrální práce, zápočet | |
13. | Rezerva |
Literatura:
Zikopoulos, Paul, and Chris Eaton. Understanding big data: Analytics for enterprise class hadoop and streaming data. McGraw-Hill Osborne Media, 2011.
Požadavky:
Základní znalost relačních databází, práce s příkazovou řádkou.
|
Předmět je zahrnut do těchto studijních plánů:
Stránka vytvořena 28. 3. 2024, semestry: Z/2022-3, L/2020-1, L/2019-20, L/2023-4, L/2022-3, Z/2023-4, Z/2019-20, Z/2021-2, Z/2020-1, L/2021-2, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: J. Novák, I. Halaška |