Předmět je základní jednotka výuky, jejímž prostřednictvím si student osvojí ucelenou část souboru znalostí a dovedností, potřebnou pro zvládnutí studijního oboru/specializace. Za věcný obsah předmětu zodpovídá garant předmětu. Časovou náročnost předmětu zhruba vyjadřuje atribut předmětu rozsah kontaktní výuky. Například rozsah = 2+2 značí, že předmět bude mít týdně dvě hodiny přednášek a dvě hodiny cvičení týdně. Na závěr semestru musí vyučující provést vyhodnocení, nakolik si ten který student osvojil poznatky a dovednosti, kterých měl během výuky nabýt. Jakým způsobem toto hodnocení vyučující provedou určuje atribut způsob zakončení. U předmětu lze definovat, že předmět je zakončen pouze zápočtem(Z), klasifikovaným zápočtem(KZ), pouze zkouškou(ZK), nebo zápočtem a zkouškou(Z,ZK). Náročnost úspěšného absolvování předmětu je vyjádřena ECTS kreditními body. Výuka předmětu probíhá během semestru. Opakovaně se předmět vyučuje vždy v zimním(Z), nebo v letním(L) semestru každého akademického roku. Výjimečně může předmět být nabízen studentům v obou semestrech(Z,L). Za organizační zajištění výuky zodpovídá přiřazená katedra, která zejména vytvoří časový rozvrh předmětu a zajistí pro předmět vyučující. Někteří přednáší a zkouší, jiní vedou cvičení a udělují zápočty.
Obsahová náplň a další organizační informace, týkající se předmětu je popsána pomocí různých popisných textů(anotace, týdenní osnova, literatura, apod.)
$DODATEK_POPIS
NI-GLR | Games and reinforcement learning | Rozsah kontaktní výuky: | 2P+2C | ||
---|---|---|---|---|---|
Vyučující: | Způsob zakončení: | Z,ZK | |||
Zodpovědná katedra: | 18105 | ECTS Kredity: | 4 | Semestr: | L |
Anotace:
The field of reinforcement learning is very hot recently, because of advances in deep learning, recurrent neural networks and general artificial intelligence. This course is intended to give you both theoretical and practical background so you can participate in related research activities.
Presented in English.
Osnovy přednášek:
Algorithmic game theory
1. | Sealed-bid combinatorial auctions | |
2. | Iterative combinatorial auctions | |
3. | Stable matching | |
4. | Congestion games. Selfish routing and the price of anarchy | |
5. | Potential games. Network cost-sharing games | |
6. | Best response dynamics. No-regret dynamics. |
7. | Multiarmed Bandit Algorithms. | |
8. | Finite Markov Decision Processes | |
9. | Dynamic Programming | |
10. | Montecarlo methods | |
11. | Temporal-Difference learning | |
12. | Multi-step bootstrapping | |
13. | Planning and learning with tabular methods |
Osnovy cvičení:
Algorithmic game theory
1. | Mechanism design basics. Auctions of physical goods. | |
2. | Sponsored search auctions (online advertising). | |
3. | Congestion games. Selfish routing and the price of anarchy | |
4. | Traffic assignment in networks. | |
5. | Best response dynamics. No-regret dynamics. | |
6. | Rock, paper, scissors. |
7. | Multiarmed Bandit Algorithms. | |
8. | Markov chains and MDP's. | |
9. | Algorithms: Q-learning, TD | |
10. | Playing tic-tac-toe, checkers. | |
11. | Tensorflow introduction. | |
12. | Case studies: TD-gammon, Atari games, Go playing. | |
13. | OpenAI Gym. Policy gradient algorithm. |
Literatura:
Reinforcement Learning: An introduction, Sutton and Barto, 2nd edition draft, 2017.
Algorithmic Game Theory, Roughgarden, Tardos, Vazirani and Nisan, 2007.
Požadavky:
BI-ZUM - Introduction to artificial intelligence
|
Předmět je zahrnut do těchto studijních plánů:
Stránka vytvořena 2. 5. 2024, semestry: Z/2020-1, L/2023-4, L/2021-2, L/2019-20, Z/2021-2, Z/2023-4, L/2020-1, Z/2019-20, L/2022-3, Z/2024-5, Z/2022-3, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: J. Novák, I. Halaška |