• Wyszukiwanie zaawansowane
  • Kategorie
  • Kategorie BISAC
  • Książki na zamówienie
  • Promocje
  • Granty
  • Książka na prezent
  • Opinie
  • Pomoc
  • Załóż konto
  • Zaloguj się

Reinforcement Learning » książka

zaloguj się | załóż konto
Logo Krainaksiazek.pl

koszyk

konto

szukaj
topmenu
Księgarnia internetowa
Szukaj
Książki na zamówienie
Promocje
Granty
Książka na prezent
Moje konto
Pomoc
 
 
Wyszukiwanie zaawansowane
Pusty koszyk
Bezpłatna dostawa dla zamówień powyżej 20 złBezpłatna dostawa dla zamówień powyżej 20 zł

Kategorie główne

• Nauka
 [2950560]
• Literatura piękna
 [1849509]

  więcej...
• Turystyka
 [71097]
• Informatyka
 [151150]
• Komiksy
 [35848]
• Encyklopedie
 [23178]
• Dziecięca
 [617388]
• Hobby
 [139064]
• AudioBooki
 [1657]
• Literatura faktu
 [228597]
• Muzyka CD
 [383]
• Słowniki
 [2855]
• Inne
 [445295]
• Kalendarze
 [1464]
• Podręczniki
 [167547]
• Poradniki
 [480102]
• Religia
 [510749]
• Czasopisma
 [516]
• Sport
 [61293]
• Sztuka
 [243352]
• CD, DVD, Video
 [3414]
• Technologie
 [219456]
• Zdrowie
 [101002]
• Książkowe Klimaty
 [124]
• Zabawki
 [2311]
• Puzzle, gry
 [3459]
• Literatura w języku ukraińskim
 [254]
• Art. papiernicze i szkolne
 [8079]
Kategorie szczegółowe BISAC

Reinforcement Learning

ISBN-13: 9781461366089 / Angielski / Miękka / 2012 / 172 str.

Richard S. Sutton; Richard S. Sutton
Reinforcement Learning Richard S Richard S. Sutton 9781461366089 Springer - książkaWidoczna okładka, to zdjęcie poglądowe, a rzeczywista szata graficzna może różnić się od prezentowanej.

Reinforcement Learning

ISBN-13: 9781461366089 / Angielski / Miękka / 2012 / 172 str.

Richard S. Sutton; Richard S. Sutton
cena 805,10
(netto: 766,76 VAT:  5%)

Najniższa cena z 30 dni: 771,08
Termin realizacji zamówienia:
ok. 22 dni roboczych
Dostawa w 2026 r.

Darmowa dostawa!

Reinforcement learning is the learning of a mapping from situations to actions so as to maximize a scalar reward or reinforcement signal. The learner is not told which action to take, as in most forms of machine learning, but instead must discover which actions yield the highest reward by trying them. In the most interesting and challenging cases, actions may affect not only the immediate reward, but also the next situation, and through that all subsequent rewards. These two characteristics -- trial-and-error search and delayed reward -- are the most important distinguishing features of reinforcement learning.
Reinforcement learning is both a new and a very old topic in AI. The term appears to have been coined by Minsk (1961), and independently in control theory by Walz and Fu (1965). The earliest machine learning research now viewed as directly relevant was Samuel's (1959) checker player, which used temporal-difference learning to manage delayed reward much as it is used today. Of course learning and reinforcement have been studied in psychology for almost a century, and that work has had a very strong impact on the AI/engineering work. One could in fact consider all of reinforcement learning to be simply the reverse engineering of certain psychological learning processes (e.g. operant conditioning and secondary reinforcement).
Reinforcement Learning is an edited volume of original research, comprising seven invited contributions by leading researchers.

Kategorie:
Informatyka, Bazy danych
Kategorie BISAC:
Computers > Artificial Intelligence - General
Gardening > General
Science > Fizyka matematyczna
Wydawca:
Springer
Seria wydawnicza:
Springer International Series in Engineering and Computer Sc
Język:
Angielski
ISBN-13:
9781461366089
Rok wydania:
2012
Wydanie:
Softcover Repri
Numer serii:
000348000
Ilość stron:
172
Waga:
0.26 kg
Wymiary:
23.39 x 15.6 x 0.97
Oprawa:
Miękka
Wolumenów:
01

Introduction; R.Sutton. Simple Statistical Gradient-Following Algorithms for Connectionist Reinforcement Learning; R.J. Wiiliams. Practical Issues in Temporal Difference Learning; G. Teasauro. Technical Note: Q-Learning; C.J.C.H. Watkins, P. Dayan. Self Improving Reactive Agents Based on Reinforcement Learning, Planning and Teaching; L.-J. Lin. Transfer of Learning by Composing Solutions of Elemental Sequential Tasks; S.P. Singh. The Convergence of TD (lambda) for general lambda; P. Dayan. A Reinforcement Connctionist Approach to Robot Path Finding in Non-Maze-Like Environments; J. del R. Millán, C. Torras.

Sutton, Richard S. Richard S. Sutton is Senior Research Scientist, De... więcej >


Udostępnij

Facebook - konto krainaksiazek.pl



Opinie o Krainaksiazek.pl na Opineo.pl

Partner Mybenefit

Krainaksiazek.pl w programie rzetelna firma Krainaksiaze.pl - płatności przez paypal

Czytaj nas na:

Facebook - krainaksiazek.pl
  • książki na zamówienie
  • granty
  • książka na prezent
  • kontakt
  • pomoc
  • opinie
  • regulamin
  • polityka prywatności

Zobacz:

  • Księgarnia czeska

  • Wydawnictwo Książkowe Klimaty

1997-2025 DolnySlask.com Agencja Internetowa

© 1997-2022 krainaksiazek.pl
     
KONTAKT | REGULAMIN | POLITYKA PRYWATNOŚCI | USTAWIENIA PRYWATNOŚCI
Zobacz: Księgarnia Czeska | Wydawnictwo Książkowe Klimaty | Mapa strony | Lista autorów
KrainaKsiazek.PL - Księgarnia Internetowa
Polityka prywatnosci - link
Krainaksiazek.pl - płatnośc Przelewy24
Przechowalnia Przechowalnia