ようこそ!
出版社名:オライリー・ジャパン
出版年月:2022年4月
ISBN:978-4-87311-975-5
355P 21cm
ゼロから作るDeep Learning 4/強化学習編
斎藤康毅/著
組合員価格 税込 3,564
(通常価格 税込 3,960円)
割引率 10%
在庫あり
生協宅配にてお届け
※ご注文が集中した場合、お届けが遅れる場合がございます。
内容紹介・もくじなど
内容紹介:超人気シリーズの第4弾??今回のテーマは強化学習!人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提…(続く
内容紹介:超人気シリーズの第4弾??今回のテーマは強化学習!人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
もくじ情報:1章 バンディット問題;2章 マルコフ決定過程;3章 ベルマン方程式;4章 動的計画法;5章 モンテカルロ法;6章 TD法;7章 ニューラルネットワークとQ学習;8章 DQN;9章 方策勾配法;10章 さらに先へ;付録
著者プロフィール
斎藤 康毅(サイトウ コウキ)
1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです)
斎藤 康毅(サイトウ コウキ)
1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです)

同じ著者名で検索した本