「まえがき」より引用する。
Python プログラミングから出発し、データ分析を学ぼうとするときにもやはり「データ分析に王道はなし」なのでしょうか。 僭越ながら筆者はこの問いに対して、「王道はないが、一般道よりはるかに効率の良い高速道路ならある」と考えます。
本書は、私には難しい。だから、以下に書くことはただの感想か言いがかりである。
「まえがき」の p.iv の注釈に笑ってしまった。
1 若い人にはわからないかもしれませんが、このコンセプトに対して「英語の『出る単』みたいなものだね」と評してもらったことがあります。
私はわかる。だから、本書の著者と同年代なのだろう。『出る単』とは、本書の著者が大学受験のころに英語の単語を覚えるために使っている参考書である、森一郎の 『試験に出る英単語』のことである。なお、私の周りでは『出る単』とはいわず『しけ単』と言っていた。ますます関係ないが、Wikipedia によれば、『しけ単』は関西での呼ばれ方とあるが、 私は関東の出である。
第1章は「Python プログラミング入門」である。p.118 では、Python のリストで使われる内包表記に関して、次のように説明されている。
他のプログラミング言語にはない独特の文法ですが、慣れると簡潔で読みやすい記述法になります。
内包表記に関しては、他のプログラミング言語にもあることを一言言い添えておく。Haskell などが有名だ。
第2章は「データ分析ライブラリ入門編」である。p.132 から始まっている 2.2 節の「NumPy 入門」では、NumPy ライブラリの使い方が説明されている。 NumPy ライブラリを使うと、NumPy で行列やベクトルを表現すれば、行列やベクトルの演算が簡潔な記法で表現できるという利点が述べられている。 なお、本書には明示的に書かれていないが、NumPy を使わずに Python のリストだけで行列やベクトルを表現しても、 演算が簡潔にできるわけではないということに注意したい。
第3章は「データ分析ライブラリ中級編」である。この章ではデータ分析の対象として、 公開データセットとして「ピッツバーグ・ブリッジ・データセット」と「銀行マーケティングデータセット」を例に説明している。 また、公開データセットではないが、「DVD レンタルデータセット」の例もある。私がわからなかったのは、この「DVD レンタルデータセット」はなぜ公開データセットではないのだろうか、 ということである。きっと何か理由があるのだろう。
第4勝は「データ分析実践編」である。ここでは、タイタニック・データセットのデータが分析されている。タイタニック・データセットとは、あのタイタニック号の事故に関するデータ集合である。 本書の p.342 では、タイタニック号の写真を説明した次の文章がある。
当時の写真を写真を図 4-1 に示しますが、窓の大きさからいかに全体が大きな船であるか想像が付くと思います。
写真を見てみるが、窓の大きさ
から全体が大きな船かどうかということはわからなかった。むしろ、窓の数の多さだろう、と思った次第だ。
大きさを実感したいのなら、私はむしろ要目表を見る。それはともかく、本章でのタイタニック・データセットの分析は面白い。
p.383 には次の注釈がある。
8 この例を引き合いに出すと筆者の年齢がわかってしまいますが、 今でも鮮明におぼえているくらい大きな事故でした。
ここではあえて「この例」は何かは伏せておくことにする。わたしも、「今でも鮮明におぼえているくらい大きな事故」だったことを覚えている事故である。
書名 | 最短コースでわかる Python プログラミングとデータ分析 |
著者 | 赤石雅典 |
発行日 | 2022 年 12 月 19 日 第1版第1刷 |
発行所 | 日経 BP |
定価 | 2900 円(税別) |
サイズ | A5 版 |
ISBN | 978-4-296-20112-9 |
その他 | 越谷市立図書館で借りて読む |
まりんきょ学問所 > コンピュータの部屋 > コンピュータの本 > Python > 赤石雅典 : 最短コースでわかる Python プログラミングとデータ分析