Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2 značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
MI-DDW.16 | Dolování dat z webu | Rozsah kontaktní výuky: | 2P+1C | ||
---|---|---|---|---|---|
Vyučující: | Způsob zakončení: | Z,ZK | |||
Zodpovědná katedra: | 18102 | ECTS Kredity: | 5 | Semestr: | L |
Anotace:
Studenti se v předmětu seznámí s metodami a technologiemi pro získávání dat z webu, jejich zpracování a praktické využití v reálných aplikacích. Získají přehled a znalosti z oblastí analýzy webového obsahu, analýzy chování uživatelů, sociálního webu a doporučovacích systémů.
Osnovy přednášek:
1. | Motivace a úvod do předmětu | |
2. | Metody přístupu k datům a jejich získávání | |
3. | Indexace a vyhledávání dokumentů | |
4. | Dolování z textových dat | |
5. | Využití dolování z textových dat | |
6. | Analýza sociálních sítí | |
7. | PageRank a HITS | |
8. | Dolování dat ze sociálního webu | |
9. | Webová analytika | |
10. | (2) Dolování proudu dat | |
11. | (2) Doporučovací systémy |
Osnovy cvičení:
1. | Základní metody pro získávání dat a jejich zpracování | |
2. | Předzpracování textu, aplikace metod text miningu | |
3. | Prezentace projektů, konzultace | |
4. | Analýza dat generovaných uživateli | |
5. | Základní metody doporučovacích systémů | |
6. | Prezentace projektů a zápočet |
Literatura:
1. | Liu, B. "Web Data Mining", Springer-Verlag Berlin Heidelberg, 2011. ISBN 978-3-642-19459-7. | |
2. | Easley, D., Kleinberg, J. "Networks, Crowds, and Markets: Reasoning About a Highly Connected World", Cambridge University Press, 2010. ISBN 978-0521195331. | |
3. | Ricci, F., Rokach, L., Shapira, B., B. Kantor, P. "Recommender Systems Handbook", Springer, 2010. ISBN 978-0387858197. | |
4. | Kaushik, A. "Web Analytics 2.0: The Art of Online Accountability and Science of Customer Centricity", Sybex, 2009. ISBN 978-0470529393. | |
5. | Marmanis, H., Babenko, D. "Algorithms of the Intelligent Web", Manning Publications, 2009. ISBN 978-1933988665. | |
6. | A. Russel, M. "Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More", O'Reilly Media, 2013. ISBN 978-1449367619. | |
7. | Chakrabarti, S. "Mining the Web: Discovering Knowledge from Hypertext Data", Morgan Kaufmann, 2002. ISBN 1558607544. |
Požadavky:
Znalost architektury webu (HTTP, HTML, URI), znalosti programování (např. Java, JavaScript), teorie grafů a znalosti základních algoritmů.
|
Předmět je zahrnut do těchto studijních plánů:
Stránka vytvořena 20. 4. 2024, semestry: L/2022-3, L/2023-4, L/2021-2, Z/2023-4, Z/2022-3, L/2020-1, Z/2021-2, Z/2019-20, Z/2020-1, Z/2024-5, L/2019-20, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: J. Novák, I. Halaška |