|
内容紹介・もくじなど
著者プロフィール
タニムラ,キャシー(タニムラ,キャシー)
人や組織を、影響を及ぼす上で必要なデータにつなぐことに情熱を注ぐ。20年以上にわたりデータ分析に関わる。その分野は金融からB2Bソフト、消費者サービスまで、多岐にわたる。主なプロプライエタリDBや多くのオープンソースDBでSQLによるデータ分析の経験を持つ。多くのトップテクノロジー企業において、データチームとデータインフラの構築と管理を行う。さらに、トップカンファレンスにたびたび登壇し、データ文化の構築、データ駆動型製品開発、包括的データ分析といったテーマでの講演を行う タニムラ,キャシー(タニムラ,キャシー)
人や組織を、影響を及ぼす上で必要なデータにつなぐことに情熱を注ぐ。20年以上にわたりデータ分析に関わる。その分野は金融からB2Bソフト、消費者サービスまで、多岐にわたる。主なプロプライエタリDBや多くのオープンソースDBでSQLによるデータ分析の経験を持つ。多くのトップテクノロジー企業において、データチームとデータインフラの構築と管理を行う。さらに、トップカンファレンスにたびたび登壇し、データ文化の構築、データ駆動型製品開発、包括的データ分析といったテーマでの講演を行う |
クラウドの普及とともに、SQLの利用範囲は拡大し、データサイエンティストもデータベースを…(続く)
クラウドの普及とともに、SQLの利用範囲は拡大し、データサイエンティストもデータベースを直接扱う機会が増えています。本書は、データ分析に関わるSQLのテクニックを学び、分析プロセスにおいてSQLを最大限に活用するためのものです。時系列解析などでは、SQLが日付・時刻の比較や処理に長けており、威力を発揮できる最たるものです。本書ではデータの前処理から始め、時系列解析、コホート分析、テキスト分析、異常検知など、SQLの操作を通じて高度なテクニックまで学ぶことができる構成になっています。サンプルコードはGitHubからダウンロード可能で、実際に手を動かしながら学ぶことができます。
もくじ情報:1章 SQLによる分析;2章 分析用のデータの前処理を行う;3章 時系列解析;4章 コホート分析;5章 テキスト分析;6章 異常検知;7章 実験分析;8章 分析用に複雑なデータセットを作成する;9章 まとめ