いろいろ難しい Python
副題は「データの入手、準備、分析、プレゼンテーション」。 原題は "Data Wrangling with Python"。
本書は、私には難しい。
p.97 には、pip install pdfminer3k をインストールすると pdf2txt.py コマンドが使えるようになるとある。 これでもいいのだろうが、私は pip3 install pdfminer.six でインストールした。
この pdfminer.six による pdf2txt.py を使って得たテキスト出力は、 本書の結果のテキスト出力とは異なる。
pdftables について、p.118 で述べられているが、この pdftables は2013年以降メンテナンスされていない。ひょっとしてインストールできるかも、 と思ったらやはりだめだった。
$ pip3 install pdftables Collecting pdftables Downloading pdftables-0.0.4.tar.gz (19 kB) Collecting pdfminer==20110515 Downloading pdfminer-20110515.tar.gz (4.1 MB) |████████████████████████████████| 4.1 MB 3.9 MB/s ERROR: Command errored out with exit status 1: (後略)
そのほか、Tabula を使う方法もあるが、これには JRE 、すなわち Java のランタイム環境が必要である。 JRE を導入するのも面倒なので、やめてしまった。これではいけないなあ。
p.161 の下から4行目「更新後の見出しファル」とあるが、「更新後の見出しファイル」が正しい。
書 名 | Python ではじめるデータラングリング |
著 者 | Jacaueline Kazil and Katharine Jarmul |
訳 者 | 長尾 高弘 |
技術監修 | 嶋田 健志 |
発行日 | 2017 年 4 月 20 日 初版第1刷 |
発行所 | オライリー・ジャパン |
発売元 | オーム社 |
定 価 | 3700 円(税別) |
サイズ | 版 |
ISBN | 978-4-87311-794-2 |
その他 | 越谷市南部図書室で借りて読む |
NDC |
まりんきょ学問所 > コンピュータの部屋 > コンピュータの本 > Python > Jacaueline Kazil and Katharine Jarmul:Python ではじめるデータラングリング