|
内容紹介・もくじなど
著者プロフィール
斎藤 康毅(サイトウ コウキ)
1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです) 斎藤 康毅(サイトウ コウキ)
1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです) |
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提…(続く)
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
もくじ情報:1章 バンディット問題;2章 マルコフ決定過程;3章 ベルマン方程式;4章 動的計画法;5章 モンテカルロ法;6章 TD法;7章 ニューラルネットワークとQ学習;8章 DQN;9章 方策勾配法;10章 さらに先へ;付録