Jacaueline Kazil and Katharine Jarmul :Python ではじめるデータラングリング

いろいろ難しい Python

作成日:2020-08-20
最終更新日:

概要

副題は「データの入手、準備、分析、プレゼンテーション」。 原題は "Data Wrangling with Python"。

感想

本書は、私には難しい。

PDF と Python

p.97 には、pip install pdfminer3k をインストールすると pdf2txt.py コマンドが使えるようになるとある。 これでもいいのだろうが、私は pip3 install pdfminer.six でインストールした。

この pdfminer.six による pdf2txt.py を使って得たテキスト出力は、 本書の結果のテキスト出力とは異なる。

pdftables について、p.118 で述べられているが、この pdftables は2013年以降メンテナンスされていない。ひょっとしてインストールできるかも、 と思ったらやはりだめだった。

$ pip3 install pdftables
Collecting pdftables
  Downloading pdftables-0.0.4.tar.gz (19 kB)
Collecting pdfminer==20110515
  Downloading pdfminer-20110515.tar.gz (4.1 MB)
	 |████████████████████████████████| 4.1 MB 3.9 MB/s
ERROR: Command errored out with exit status 1:
(後略)

そのほか、Tabula を使う方法もあるが、これには JRE 、すなわち Java のランタイム環境が必要である。 JRE を導入するのも面倒なので、やめてしまった。これではいけないなあ。

誤植

p.161 の下から4行目「更新後の見出しファル」とあるが、「更新後の見出しファイル」が正しい。

Python の本

書誌情報

書 名Python ではじめるデータラングリング
著 者Jacaueline Kazil and Katharine Jarmul
訳 者長尾 高弘
技術監修嶋田 健志
発行日2017 年 4 月 20 日 初版第1刷
発行所オライリー・ジャパン
発売元オーム社
定 価3700 円(税別)
サイズ
ISBN978-4-87311-794-2
その他越谷市南部図書室で借りて読む
NDC

まりんきょ学問所コンピュータの部屋コンピュータの本Python > Jacaueline Kazil and Katharine Jarmul:Python ではじめるデータラングリング


MARUYAMA Satosi