ようこそ!
文庫
新書・選書
文芸
教養
人文
教育
芸術
児童
趣味
生活
地図・ガイド
就職・資格
語学
小学学参
中学学参
高校学参
辞典
コミック
ゲーム攻略本
エンターテイメント
日記手帳
社会
法律
経済
経営
ビジネス
理学
工学
コンピュータ
医学
看護学
薬学
出版社名:オライリー・ジャパン
出版年月:2025年11月
ISBN:978-4-8144-0139-0
356P 24cm
詳解データレイクハウスアーキテクチャ Delta Lakeを使ったデータAI活用とガバナンス
Denny Lee/〔ほか〕著 長谷川亮/〔ほか〕監訳
組合員価格 税込 5,748
(通常価格 税込 6,050円)
割引率 5%
在庫あり
生協宅配にてお届け
※ご注文が集中した場合、お届けが遅れる場合がございます。
内容紹介・もくじなど
内容紹介:Delta Lakeで築く、次世代データ基盤の教科書!本書は、データエンジニア、データサイエンティスト、データアナリスト向けに、Delta Lakeを活用して信頼性の高いデータレイクハウスを本番環境で運用するための実践的なガイドです。ベストプラクティス、最適化技術、実際のシナリオが含まれており、大規模なDelta Lakeベースのシステムを導入・維持する際に直面する課題を乗り越える方法を詳しく解説した実践的なガイドブックです。
データレイクは膨大なデータを柔軟に扱える一方で、スキーマ管理の複雑さや性能の低下、ガバナンスの難しさなど多くの課題を抱えてきました。本書は、これらの問題を解決…(続く
内容紹介:Delta Lakeで築く、次世代データ基盤の教科書!本書は、データエンジニア、データサイエンティスト、データアナリスト向けに、Delta Lakeを活用して信頼性の高いデータレイクハウスを本番環境で運用するための実践的なガイドです。ベストプラクティス、最適化技術、実際のシナリオが含まれており、大規模なDelta Lakeベースのシステムを導入・維持する際に直面する課題を乗り越える方法を詳しく解説した実践的なガイドブックです。
データレイクは膨大なデータを柔軟に扱える一方で、スキーマ管理の複雑さや性能の低下、ガバナンスの難しさなど多くの課題を抱えてきました。本書は、これらの問題を解決するデータレイクハウスアーキテクチャの全貌を解き明かします。オープンソースのDelta Lakeを軸に、ACIDトランザクション、タイムトラベル、スキーマ進化、データ品質管理といった重要機能をわかりやすく解説します。さらに、Apache Sparkとの統合、BIやAI/MLへの応用、運用上のベストプラクティスまで、実践的な知識を網羅しています。データエンジニア、アーキテクト、アナリストにとって必携であり、モダンなデータ基盤を設計・構築する上での指針となる1冊です。
もくじ情報:1章 Delta Lakeにおけるレイクハウスフォーマット;2章 Delta Lakeを導入する;3章 Delta Lakeの操作;4章 Delta Lakeエコシステムの詳細解説;5章 Delta Lakeのメンテナンス;6章 Delta Lakeを利用したネイティブアプリケーションの構築;7章 Delta Lakeへのストリーミングの入出力;8章 高度な機能;9章 レイクハウスのアーキテクチャ設計;10章 パフォーマンスチューニング:Delta Lakeでのデータパイプライン最適化;11章 成功するデザインパターン;12章 レイクハウスのガバナンスとセキュリティの基礎;13章 メタデータ管理、データフロー、リネージ;14章 Delta Sharingプロトコルでのデータ共有
著者プロフィール
リー,デニー(リー,デニー)
Unity Catalog、Apache Spark、MLflowのコントリビュータで、Delta Lakeのメンテナ、Databricksのプリンシパルデベロッパーアドボケート。インターネット規模のデータプラットフォームや予測分析・AIシステムの開発者としての豊富な経験を持つ、実践的な分散システムおよびデータサイエンスの実践的エンジニアである。現在の技術的な専門分野は、AI、分散システム、Unity Catalog、Delta Lake、Apache Spark、深層学者、機械学習、ゲノミクスなどの技術に注力している
リー,デニー(リー,デニー)
Unity Catalog、Apache Spark、MLflowのコントリビュータで、Delta Lakeのメンテナ、Databricksのプリンシパルデベロッパーアドボケート。インターネット規模のデータプラットフォームや予測分析・AIシステムの開発者としての豊富な経験を持つ、実践的な分散システムおよびデータサイエンスの実践的エンジニアである。現在の技術的な専門分野は、AI、分散システム、Unity Catalog、Delta Lake、Apache Spark、深層学者、機械学習、ゲノミクスなどの技術に注力している