ようこそ!
出版社名:翔泳社
出版年月:2024年4月
ISBN:978-4-7981-8228-5
447P 23cm
Apache Spark徹底入門
Jules S.Damji/〔ほか〕著 長谷川亮/〔ほか〕訳
組合員価格 税込 3,960
(通常価格 税込 4,400円)
割引率 10%
在庫あり
生協宅配にてお届け
※ゴールデンウィーク前後は商品のお届けが通常より遅れる場合がございます。
内容紹介・もくじなど
内容紹介:Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apach…(続く
内容紹介:Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習・Spark の操作とSQLエンジンの理解・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化・[日本語版オリジナルコンテンツ]pandas dataframe、spark dataframeに関する各種データフレームの使い分け ・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践※本書は『Learning Spark: Lightning-Fast Data Anarytics 2nd Edition』の邦訳です。
統合型アナリティクスエンジンの仕組みとビッグデータの大規模処理を徹底解説。基本操作からDelta LakeやMLlibを利用したパイプラインの構築まで紹介。
もくじ情報:1 Apache Spark入門;2 Apache Sparkのダウンロードと入門;3 Apache Sparkの構造化API;4 Spark SQLとDataFrame:組み込みデータソースの紹介;5 Spark SQLとDataFrame:外部データソースとのインタラクション;6 Spark SQLとDataset:7 Sparkアプリケーションの最適化およびチューニング;8 構造化Streaming;9 Apache Sparkを用いた信頼性の高いデータレイクの構築;10 MLlibによる機械学習;11 Apache Sparkによる機械学習パイプラインの管理、デプロイおよびスケール;12 エピローグ:Apache Spark 3.x
著者プロフィール
Damji,Jules S.(DAMJI,JULES S.)
Databricks社のSenior Developer Advocateであり、MLflowのコントリビュータ。Sun Microsystems、Netscape、@Home、Loudcloud/Opsware、Verisign、ProQuest、Hortonworksなどの大手企業でソフトウェアエンジニアとして勤務し、大規模分散システムを構築。オレゴン州立大学、カリフォルニア州立大学、ジョンズ・ホプキンス大学でそれぞれコンピュータサイエンスの学士号と修士号、 Political Advocacyとコミュニケーションの修士号を取得
Damji,Jules S.(DAMJI,JULES S.)
Databricks社のSenior Developer Advocateであり、MLflowのコントリビュータ。Sun Microsystems、Netscape、@Home、Loudcloud/Opsware、Verisign、ProQuest、Hortonworksなどの大手企業でソフトウェアエンジニアとして勤務し、大規模分散システムを構築。オレゴン州立大学、カリフォルニア州立大学、ジョンズ・ホプキンス大学でそれぞれコンピュータサイエンスの学士号と修士号、 Political Advocacyとコミュニケーションの修士号を取得

同じ著者名で検索した本