ようこそ!
出版社名:オライリー・ジャパン
出版年月:2018年5月
ISBN:978-4-87311-830-7
209P 21cm
Rによるテキストマイニング tidytextを活用したデータ分析と可視化の基礎
Julia Silge/著 David Robinson/著 大橋真也/監訳 長尾高弘/訳
組合員価格 税込 2,970
(通常価格 税込 3,300円)
割引率 10%
お取り寄せ
お届け日未定
※ご注文が集中した場合、お届けが遅れる場合がございます。
内容紹介・もくじなど
「Rの神様」ハドリー・ウィッカムに「Rのデータ分析を変えた」と言わしめた革新的なパッケージ、tidytextの開発者たちによる、データ分析と可視化の基礎を学ぶことができるテキストマイニングの入門書です。取得した生データを、「整理データ原則」に基づいてtidytextで扱いやすい形に変換すると、簡単に既存のツールと組み合わせることができ、効果的にデータ分析や可視化を行うことができます。本書はその原則に基づき、tidytext、dplyr、ggraph、widyrパッケージ等を使って、ジェーン・オースティンの小説や古典、Twitter、ニュースサイト、NASAのメタデータなどを分析していきます。著…(続く
「Rの神様」ハドリー・ウィッカムに「Rのデータ分析を変えた」と言わしめた革新的なパッケージ、tidytextの開発者たちによる、データ分析と可視化の基礎を学ぶことができるテキストマイニングの入門書です。取得した生データを、「整理データ原則」に基づいてtidytextで扱いやすい形に変換すると、簡単に既存のツールと組み合わせることができ、効果的にデータ分析や可視化を行うことができます。本書はその原則に基づき、tidytext、dplyr、ggraph、widyrパッケージ等を使って、ジェーン・オースティンの小説や古典、Twitter、ニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルかつ応用力抜群のテキストマイニング手法を提示します。
もくじ情報:1章 整理テキスト形式;2章 整理データを使ったセンチメント分析;3章 単語の出現頻度と特定の文書での出現頻度の分析:tf‐idf;4章 単語間の関係:nグラムと相関;5章 未整理形式へ(から)の変換;6章 トピックモデリング;7章 ケーススタディ:Twitterアーカイブの比較;8章 ケーススタディ:NASAメタデータのマイニング;9章 ケーススタディ:Usenetテキストの分析
著者プロフィール
シルジ,ジュリア(シルジ,ジュリア)
Stack Overflowのデータサイエンティスト。複雑なデータセットの分析、多様なユーザとの技術トピックのやり取りを行う。天体物理学のPhDを取得
シルジ,ジュリア(シルジ,ジュリア)
Stack Overflowのデータサイエンティスト。複雑なデータセットの分析、多様なユーザとの技術トピックのやり取りを行う。天体物理学のPhDを取得

同じ著者名で検索した本