|
内容紹介・もくじなど
著者プロフィール
持橋 大地(モチハシ ダイチ)
1973年生まれ。1993年東京大学文科三類入学、2005年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。博士(理学)。ATR音声言語コミュニケーション研究所、NTTコミュニケーション科学基礎研究所各研究員を経て、2024年より統計数理研究所 統計基盤数理研究系教授/総合研究大学院大学 統計科学コース教授および国立国語研究所 次世代言語科学研究センター教授(兼務)。専門は自然言語処理および統計的機械学習(本データはこの書籍が刊行された当時に掲載されていたものです) 持橋 大地(モチハシ ダイチ)
1973年生まれ。1993年東京大学文科三類入学、2005年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。博士(理学)。ATR音声言語コミュニケーション研究所、NTTコミュニケーション科学基礎研究所各研究員を経て、2024年より統計数理研究所 統計基盤数理研究系教授/総合研究大学院大学 統計科学コース教授および国立国語研究所 次世代言語科学研究センター教授(兼務)。専門は自然言語処理および統計的機械学習(本データはこの書籍が刊行された当時に掲載されていたものです) |
文字・単語・文・文書からなる離散データをベイズ統計モデルでいかに学習するか。さまざまなテキストの統計的なモデル化の数理について一から説明し、ブラックボックスに頼らずとも自分の手で統計的分析を駆使できるようになることを目指す。分野を問わず自然言語処理の必要性が増加の一途をたどるなか…(続く)
文字・単語・文・文書からなる離散データをベイズ統計モデルでいかに学習するか。さまざまなテキストの統計的なモデル化の数理について一から説明し、ブラックボックスに頼らずとも自分の手で統計的分析を駆使できるようになることを目指す。分野を問わず自然言語処理の必要性が増加の一途をたどるなか、読者を基礎から導く好適書。
もくじ情報:1 テキストと言語のモデル化(言語とテキストの特徴;テキストの階層構造 ほか);2 文字の統計モデル(文字の頻度と出現確率;文字の同時確率 ほか);3 単語の統計モデル(文字から単語へ;単語の統計と冪乗則 ほか);4 文の統計モデル(テキストの文分割;文ベクトルと意味的ランダムウォーク ほか);5 文書の統計モデル(ナイーブベイズ法と単語集合表現;ユニグラム混合モデル(UM) ほか)