Jdi na obsah Jdi na menu
 


Strojové učení (8)

Školní příklad posilujícího učení. (*)

article preview

Posilující učení - Reinforcement learning (RL).

 

reinfor-1-1.jpg     

 

RL je učení co dělat, jak mapovat situace k akcím aby se maximalizovala hodnota odměny. Přičemž není řečeno, které akce mají podniknout, ale místo toho musí zjistit, které akce přinášejí největší odměnu a to tím, že je vyzkouší.

 

      Je celá řada metod a algoritmů pro řešení úloh v oblasti strojového učení využívající posilující učení. Lze je rozdělit do oblastí: metody tabulkového řešení (konečné Markovovy rozhodovací procesy, dynamické programování, metody Monte Carlo, metody s časovým rozdílem jako algoritmus Q- learning, ...), metody aproximačního řešení a metody hlubokého posilujícího učení.

 

reinfor-1-9-1.jpg

reinfor-1-10-1.jpg

 
 

Aktuální čas

normální:

internetový:

co to je?

O nás

_____________________________________

Nezávislý zájmový kroužek robotiky na Studánce se zabývá poznatky o technice, jako je elektronika či programování. Věnujeme se různým problémům od nejjednodušších příkladů po složitější týkající se matematiky a fyziky.


Spojte se s námi!


Vyhledávání