Robotický kroužek na Studánce

Strojové učení (8)

Školní příklad posilujícího učení. (*)

Posilující učení - Reinforcement learning (RL).

RL je učení co dělat, jak mapovat situace k akcím aby se maximalizovala hodnota odměny. Přičemž není řečeno, které akce mají podniknout, ale místo toho musí zjistit, které akce přinášejí největší odměnu a to tím, že je vyzkouší.

Je celá řada metod a algoritmů pro řešení úloh v oblasti strojového učení využívající posilující učení. Lze je rozdělit do oblastí: metody tabulkového řešení (konečné Markovovy rozhodovací procesy, dynamické programování, metody Monte Carlo, metody s časovým rozdílem jako algoritmus Q- learning, ...), metody aproximačního řešení a metody hlubokého posilujícího učení.

Menu

Jazyky

Robotický kroužek na Studánce

Strojové učení (8)

Aktuální čas

normální:

internetový:

O nás

Spojte se s námi!

Vyhledávání