Richard S.Sutton/共著 Andrew G.Barto/共著

森北出版 2022.10

所蔵

所蔵は 1 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 請求記号 資料コード 資料区分 持禁区分 状態
オーテピア高知図書館 3Fビジネス-IT /007.13/サツ/ 1111759252 一般   利用可

館別所蔵

館名 所蔵数 貸出中数 貸出可能数
オーテピア高知図書館 1 0 1

資料詳細

タイトル 強化学習
著者 Richard S.Sutton /共著, Andrew G.Barto /共著, 奥村 エルネスト純 /監訳, 鈴木 雅大 /監訳, 松尾 豊 /監訳, 三上 貞芳 /監訳, 山川 宏 /監訳, 今井 翔太 /共訳, 川尻 亮真 /共訳, 菊池 悠太 /共訳, 鮫島 和行 /共訳, 陣内 佑 /共訳, 高橋 将文 /共訳, 谷口 尚平 /共訳, 藤田 康博 /共訳, 前田 新一 /共訳, 松嶋 達也 /共訳  
出版者 森北出版
出版年 2022.10
ページ数 18,469p
大きさ 25cm
一般件名 人工知能 , アルゴリズム
NDC分類(9版) 007.13
内容紹介 強化学習の主要な考え方やアルゴリズムについて明確かつ簡潔な形で解説した入門書。発展的手法、心理学・神経科学との関係、AlphaGoなどの新しい話題を盛り込んだ第2版。
ISBN 4-627-82662-5

内容一覧

タイトル 著者名 ページ
第1章 序
第Ⅰ部 テーブル形式の解法
第2章 多腕バンディット問題
第3章 有限マルコフ決定過程
第4章 動的計画法
第5章 モンテカルロ法
第6章 TD学習
第7章 nステップ・ブートストラップ法
第8章 テーブル形式手法におけるプランニングと学習
第Ⅱ部 近似による解法
第9章 近似を用いた方策オン型予測
第10章 関数近似を用いた方策オン型制御
第11章 近似を用いた方策オフ型手法
第12章 適格度トレース
第13章 方策勾配法
第Ⅲ部 さらに深く
第14章 心理学
第15章 神経科学
第16章 応用と事例紹介
第17章 強化学習のこれから