Ujava.org reinforcement-learning

1. Reinforcement Learning ujava.org Workshop 2015-06-27 www.idosi.com CEO Shindong KANG ()

2. www.idosi.comujava.org

3. www.idosi.comspaceapi.org

4. www.idosi.comReinforcement Learning for Brick Game

5. www.idosi.comReinforcement Learning for Brick Game

6. www.idosi.comTo Flip Pancake

7. www.idosi.comCrawling Robot on Carpet

8. www.idosi.comPavlov's Dog

9. www.idosi.comPavlov

10. www.idosi.comReinforcement ()

11. www.idosi.comMarkov Chain

12. www.idosi.comMarkov Process

13. www.idosi.comMarkov Decision Process (MDP))

14. www.idosi.comNon-Deterministic Search

15. www.idosi.comGrid World

16. www.idosi.comGoal

17. www.idosi.comAction

18. www.idosi.comMDP

19. www.idosi.comMarkov Property

20. www.idosi.comPolicy

21. www.idosi.comOptimal Policy

22. www.idosi.comRacing's Probability

23. www.idosi.comRacing's Reward

24. www.idosi.comSearch Tree

25. www.idosi.comQ-state

26. www.idosi.comDiscounting

27. www.idosi.comDiscounting

28. www.idosi.comPolicy with Discouting

29. www.idosi.comDiscouting Factor

32. www.idosi.comReinforcement

33. www.idosi.comSum of Rewards

34. www.idosi.comOptimal Quantities

35. www.idosi.comValues of States

44. www.idosi.comReinforcement Learning

45. www.idosi.comMDP of all infos

46. www.idosi.comRL of no infos

47. www.idosi.comMDP vs. RL

48. www.idosi.comModel-Based Learning (RL)

49. www.idosi.comObserved Episodes

50. www.idosi.comLearned Model

51. www.idosi.comDirect Evaluation

52. www.idosi.comProblems with Direct Evaluation

53. www.idosi.comTemporal Difference Learning

56. www.idosi.comExpoential Moving Average

57. www.idosi.comQ-Value Iteration

58. www.idosi.comQ-Learning

59. www.idosi.comQ-Learning Demo

60. Thank you ! () Intelligent City Ltd. Shindong KANG www.idosi.com [email protected]

Ujava.org reinforcement-learning

Data & Analytics

Transcript of Ujava.org reinforcement-learning