改訂新版 前処理大全
〜SQL/pandas/Polars実践テクニック
2024年5月22日紙版発売
2024年5月22日電子版発売
本橋智光,橋本秀太郎 著
B5変形判/472ページ
定価3,740円(本体3,400円+税10%)
ISBN 978-4-297-14138-7
書籍の概要
この本の概要
BigQuery,Pandas,Polarsを使った実用的なモダン前処理を学びましょう!
データ分析において前処理が重要かつ多くの時間をとられる業務であることは広く知られてきました。同時に前処理を実現するためのライブラリは大きく改善されてきています。また,機械学習モデルの進化によって,求められる前処理の内容も変わってきています。本書は,初めて学ぶ方にも昔学んでから知識をアップデートしていない方にも,悪いサンプルコードと良いサンプルコードを紹介しながら丁寧にデータ分析の前処理を学べる技術書です。
本書は,第一版の前処理大全から大きく構成や内容を変更しています。SQLはBigQuery準拠に変更し,Pandasは最新バージョンの思想に沿い新機能を使ったコードに変更しました。Rの代わりにR同様にパイプラインで書きやすくかつ処理エンジンがRustベースで書かれているため高速なPolarsに変更しました。また,前処理内容も大きく変更し,より現在よく使われる処理を実用ケースとともに解説しています。また,新たな試みとしてコラムとして少しマニアックだけど役立つプログラムの裏側の解説や分析テクニックを紹介しており,中級者の方にとっても有用な知識をお届けしています。
こんな方におすすめ
- データ処理業務に従事するエンジニア
- データ分析者
目次
Part 1 前処理の基礎知識
- 第1章 前処理とは
- 第2章 SQL
- 第3章 pandas
- 第4章 Polars
Part 2 データの構造を対象とした前処理
- 第5章 抽出
- 第6章 集約
- 第7章 結合
- 第8章 分割
- 第9章 整形
Part 3 データの内容を対象とした前処理
- 第10章 数値
- 第11章 カテゴリ
- 第12章 日時
- 第13章 文字列
- 第14章 ウィンドウ関数
Part 4 実践前処理
- 第15章 演習問題
この本に関連する書籍
-
改訂新版[エンジニアのための]データ分析基盤入門<基本編> データ活用を促進する! プラットフォーム&データ品質の考え方
システムとデータの両面にスポットを当て,データ分析基盤の整備/運用/活用の指針をまとめた入門書。 データ分析の中心にある「データ分析基盤」を取り巻く環境は,大...
-
良いコード/悪いコードで学ぶ設計入門 ―保守しやすい 成長し続けるコードの書き方
「ITエンジニア本大賞2023」技術書部門で大賞受賞! 本書は,より成長させやすいコードの書き方と設計を学ぶ入門書です。 システム開発では,ソフトウェアの変更...
-
[エンジニアのための]データ分析基盤入門 データ活用を促進する! プラットフォーム&データ品質の考え方
システムとデータの両面にスポットを当て,データ分析基盤の整備/運用/活用の指針をまとめた入門書。 データ分析の中心にある「データ分析基盤」を取り巻く環境は,大...