Hlavní stránka | Seznam oborů/specializací | Seznam všech skupin předmětů | Seznam všech předmětů | Seznam rolí                Návod

Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2  značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
NI-DDW Dolování dat z webu Rozsah kontaktní výuky: 2P+1C
Vyučující: Kuchař J. Způsob zakončení: Z,ZK
Zodpovědná katedra: 18102 ECTS Kredity: 5 Semestr: L

Anotace:
Studenti se v předmětu seznámí s metodami a technologiemi pro získávání dat z webu, jejich zpracování a praktické využití v reálných aplikacích. Získají přehled a znalosti z oblastí analýzy webového obsahu, analýzy chování uživatelů, sociálního webu a doporučovacích systémů.

Osnovy přednášek:
1. Základní principy a pojmy dolování dat z webu.
2. Metody přístupu k datům a jejich získávání (formáty, omezení, etické aspekty).
3. Nástroje pro získávání obsahu.
4. Extrakce a přístup ke specifickým informacím webu (textový obsah, hluboký web).
5. Dolování z textových dat.
6. Praktické aplikace dolování z textových dat.
7. Analýza struktury a obsahu sociálních sítí (2).
8. Grafová reprezentace webových dat, web jako graf.
9. Analýza chování uživatelů na webu: sběr informací o uživatelích.
10. Analýza chování uživatelů na webu: analýza dat, webová analytika.
11. Doporučovací systémy a personalizace.
12. Algoritmy pro dolování z proudu dat a jejich aplikace.

Osnovy cvičení:
1. Základní metody pro získávání dat a jejich zpracování
2. Předzpracování textu, aplikace metod text miningu
3. Získávání a analýza dat v grafové podobě
4. Analýza dat generovaných uživateli
5. Základní metody doporučovacích systémů
6. Prezentace projektů a zápočet

Literatura:
1. Liu, B. "Web Data Mining", Springer-Verlag Berlin Heidelberg, 2011. ISBN 978-3-642-19459-7.
2. Charu C. Aggarwal. "Machine Learning for Text", Springer, 2018. ISBN 9783319735313.
3. Easley, D., Kleinberg, J. "Networks, Crowds, and Markets: Reasoning About a Highly Connected World", Cambridge
4. A. Russel, M. "Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More (3rd Edition)", O'Reilly Media, 2019. ISBN 978-1491985045.
5. Charu C. Aggarwal. "Recommender Systems: The Textbook", Springer, 2016. ISBN 9783319296579.

Požadavky:
Znalost architektury webu (HTTP, HTML, URI), znalosti programování (např. Java, JavaScript), teorie grafů a znalosti základních algoritmů.

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/NI-DDW/

Předmět je zahrnut do těchto studijních plánů:
Plán Obor Role Dop. semestr
NIE-DBE.2023 Digital Business Engineering VO 2
NI-SP.2020 Systémové programování V 2
NI-SP.2023 Systémové programování V 2
NI-TI.2023 Teoretická informatika V 2
NI-TI.2020 Teoretická informatika V 2
NI-NPVS.2020 Návrh a programování vestavných systémů V 2
NI-SI.2020 Softwarové inženýrství V 2
NI-PB.2020 Počítačová bezpečnost V 2
NI-ZI.2020 Znalostní inženýrství V 2
NI-WI.2020 Webové inženýrství PS 2
NI-SPOL.2020 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study V 2
NI-SPOL.2020 Nespecifikovaný/á obor/specializace studia - Unspecified Branch/Specialisation of Study VO 2
NI-MI.2020 Manažerská informatika V 2
NI-PSS.2020 Počítačové systémy a sítě V 2


Stránka vytvořena 26. 4. 2024, semestry: Z/2021-2, L/2019-20, Z/2022-3, Z/2023-4, L/2021-2, Z,L/2020-1, L/2022-3, L/2023-4, Z/2024-5, Z/2019-20, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: J. Novák, I. Halaška