ようこそ!
文庫
新書・選書
文芸
教養
人文
教育
芸術
児童
趣味
生活
地図・ガイド
就職・資格
語学
小学学参
中学学参
高校学参
辞典
コミック
ゲーム攻略本
エンターテイメント
日記手帳
社会
法律
経済
経営
ビジネス
理学
工学
コンピュータ
医学
看護学
薬学
出版社名:オーム社
出版年月:2019年5月
ISBN:978-4-274-22371-6
202P 21cm
強化学習アルゴリズム入門 「平均」からはじめる基礎と応用
曽我部東馬/著
組合員価格 税込 3,135
(通常価格 税込 3,300円)
割引率 5%
お取り寄せ
お届け日未定
※年末年始は商品のお届けが通常より遅れる場合がございます。
内容紹介・もくじなど
強化学習の難解な理論を平均を入口としてやさしく解説。原理→数式→プログラムの流れで全体像を直感的に把握できます。
もくじ情報:第1章 平均で学ぶ強化学習の基本概念(平均と期待値;平均と価値 ほか);第2章 各アルゴリズムの特徴と応用(強化学習における方策π(a|S);動的計画法 ほか);第3章 関数近似手法(関数近似の基本概念;関数近似モデルを用いたV(St)の表現 ほか);第4章 深層強化学習の原理と手法(TD‐Q学習法におけるNNによる行動価値関数の回帰;DQNによる行動状態価値関数の近似 ほか)
強化学習の難解な理論を平均を入口としてやさしく解説。原理→数式→プログラムの流れで全体像を直感的に把握できます。
もくじ情報:第1章 平均で学ぶ強化学習の基本概念(平均と期待値;平均と価値 ほか);第2章 各アルゴリズムの特徴と応用(強化学習における方策π(a|S);動的計画法 ほか);第3章 関数近似手法(関数近似の基本概念;関数近似モデルを用いたV(St)の表現 ほか);第4章 深層強化学習の原理と手法(TD‐Q学習法におけるNNによる行動価値関数の回帰;DQNによる行動状態価値関数の近似 ほか)
著者プロフィール
曽我部 東馬(ソガベ トウマ)
理学博士(物理学専攻)。マックス・プランク研究所(独)博士研究員、ケンブリッジ大学(英)研究員を経て、2009年帰国、株式会社グリッドの設立に携わり、取締役最高技術責任者を務める。2011年より東京大学先端科学技術研究センター特任助教、特任准教授を歴任、2016年3月電気通信大学准教授、株式会社グリッド最高技術顧問(兼務)、東京大学先端科学技術研究センター客員研究員(兼務)(本データはこの書籍が刊行された当時に掲載されていたものです)
曽我部 東馬(ソガベ トウマ)
理学博士(物理学専攻)。マックス・プランク研究所(独)博士研究員、ケンブリッジ大学(英)研究員を経て、2009年帰国、株式会社グリッドの設立に携わり、取締役最高技術責任者を務める。2011年より東京大学先端科学技術研究センター特任助教、特任准教授を歴任、2016年3月電気通信大学准教授、株式会社グリッド最高技術顧問(兼務)、東京大学先端科学技術研究センター客員研究員(兼務)(本データはこの書籍が刊行された当時に掲載されていたものです)