Book Watch/ニュース

pandasでデータ分析の基本技術を体系的に網羅!『pandasライブラリ活用入門 第2版』発売

巻末ではPython環境の基本事項も確認できる

『pandasライブラリ活用入門 第2版』

 (株)インプレスは9月14日、書籍『pandasライブラリ活用入門 第2版』(Daniel Y. Chen 著/吉川邦夫 訳/福島真太朗 監修)を発売した。価格は4,180円。

 本書は『Pandas for Everyone, 2nd Edition』の翻訳書。Pythonライブラリから「pandas」などを使ったデータ分析全体の基本手法を解説し、効率的なデータ操作とその可視化を実践できるほか、巻末の付録でPython環境のインストールや文法などの基本事項についても確認できる。

 また本書では、初心者から上級者、または教育者向けまで、さまざまなレベルの解説に対応。pandasを使用することで、Pythonによるデータ分析が理解しやすくなり、組織的で保守が可能なデータセットを作ることが可能となる。

『pandasライブラリ活用入門[第2版]』目次

  • 第1部 基本的な使い方
    第1章 DataFrameの基礎
    第2章 pandasのデータ構造
    第3章 プロッティングによるグラフ描画
    第4章 「整然データ」を作る
    第5章 関数を適用(apply)する
  • 第2部 データ操作
    第6章 データの組み立て
    第7章 データの正規化
    第8章 groupby演算による分割-適用-結合
  • 第3部 データの型
    第9章 欠損データ
    第10章 データ型
    第11章 文字列とテキストデータ
    第12章 日付と時刻
  • 第4部 データモデリング
    第13章 線形回帰モデル
    第14章 一般化線形モデル
    第15章 生存分析
    第16章 モデルを評価する
    第17章 正則化で過学習に対処する
    第18章 クラスタリング
  • 第5部 次のステップへ
    第19章 pandas周辺の強力な機能
    第20章 仲間と学び続けよう
  • 第6部 付録
    コンセプトマップ/インストールと設定/コマンドライン/プロジェクトのテンプレート/Pythonの使い方
    ワーキングディレクトリ/環境/パッケージのインストール/ライブラリのインポート/コーディングスタイル
    コンテナ(リスト、タプル、辞書)/値のスライスと範囲/ループ/リストの内包表記/関数/範囲とジェネレータ
    複数代入/NumPyのndarray/クラス/SettingwithCopyWarning/メソッドチェーン/コードの実行時間を計測する
    文字列の書式整形(フォーマッティング)/条件文(if-elif-else)/New York ACSによるロジスティック回帰の例
    結果をR言語で再現する