Book Watch/ニュース
pandasでデータ分析の基本技術を体系的に網羅!『pandasライブラリ活用入門 第2版』発売
巻末ではPython環境の基本事項も確認できる
2023年9月14日 08:00
(株)インプレスは9月14日、書籍『pandasライブラリ活用入門 第2版』(Daniel Y. Chen 著/吉川邦夫 訳/福島真太朗 監修)を発売した。価格は4,180円。
本書は『Pandas for Everyone, 2nd Edition』の翻訳書。Pythonライブラリから「pandas」などを使ったデータ分析全体の基本手法を解説し、効率的なデータ操作とその可視化を実践できるほか、巻末の付録でPython環境のインストールや文法などの基本事項についても確認できる。
また本書では、初心者から上級者、または教育者向けまで、さまざまなレベルの解説に対応。pandasを使用することで、Pythonによるデータ分析が理解しやすくなり、組織的で保守が可能なデータセットを作ることが可能となる。
『pandasライブラリ活用入門[第2版]』目次
- 第1部 基本的な使い方
第1章 DataFrameの基礎
第2章 pandasのデータ構造
第3章 プロッティングによるグラフ描画
第4章 「整然データ」を作る
第5章 関数を適用(apply)する
- 第2部 データ操作
第6章 データの組み立て
第7章 データの正規化
第8章 groupby演算による分割-適用-結合
- 第3部 データの型
第9章 欠損データ
第10章 データ型
第11章 文字列とテキストデータ
第12章 日付と時刻
- 第4部 データモデリング
第13章 線形回帰モデル
第14章 一般化線形モデル
第15章 生存分析
第16章 モデルを評価する
第17章 正則化で過学習に対処する
第18章 クラスタリング
- 第5部 次のステップへ
第19章 pandas周辺の強力な機能
第20章 仲間と学び続けよう
- 第6部 付録
コンセプトマップ/インストールと設定/コマンドライン/プロジェクトのテンプレート/Pythonの使い方
ワーキングディレクトリ/環境/パッケージのインストール/ライブラリのインポート/コーディングスタイル
コンテナ(リスト、タプル、辞書)/値のスライスと範囲/ループ/リストの内包表記/関数/範囲とジェネレータ
複数代入/NumPyのndarray/クラス/SettingwithCopyWarning/メソッドチェーン/コードの実行時間を計測する
文字列の書式整形(フォーマッティング)/条件文(if-elif-else)/New York ACSによるロジスティック回帰の例
結果をR言語で再現する