統計処理に適した言語 R の紹介。
まだまだ読み込むまでには至っていない。
pp.330-331 ではパイプ演算子 %>% について解説されている。このパイプ演算子は、 magrittr パッケージなどで提供される。なぜ、magrittr という名前なのだろうか。 マグリット、というように読めるので、これはあのベルギーの画家、マグリット( René Magritte )のことだろうか、 と思っていたらその通りだった。
本書 pp.444-445 にある参考文献リストを見てわかった。出典は次のとおりである:
・magrittr - Ceci n'est pas un pipe 「URL: https://cran.r-project.org/web/packages/magrittr/vignettes/magrittr.html」 ( 2019 年 11 月 26 日最終閲覧 )
上記ページを見てみると、Ceci n'est pas un pipe という文字が目に入る。 この「これはパイプではない」という文は、ルネ・マグリットの有名な絵「イメージの裏切り」に描かれた文である。 なるほど。上記ページを見るとこのページで magrittr が提供するのは、a new “pipe”-like operator, %>% とある。 つまり「パイプ」のような演算子である、といっている。パイプとは、UNIX で有名になった演算子である。 パイプについての説明は省略する。
p.158では「数量データとカテゴリデータ」という MEMO がある。ここでは<ごく簡単に述べると、 「計測できるデータ」が数量データです。「計測できないデータ」はカテゴリデータです。 計測できるかどうかは、等間隔であるかどうかで判断するとよいでしょう。>と述べられている。 厳密には、データを名義尺度、順序尺度、間隔尺度、比率尺度の4種類に分ける。そこまで述べてほしかった。
名義尺度は区別のためだけに用いられる尺度である。本書でカテゴリデータとしている地名、お肉の種類は、 名義尺度である。本書では地名として、Naogya, Shinagawa, Yokohama, Kawasaki, Osaka, Kobe, Kyoto, Hukuoka が列挙されている。これらは区別にのみ意味があり、差には意味がない、あるいは差を考えることができない。 お肉の種類は beef と pork が取り上げられているが、これも同様である。
順序尺度は、順序には意味がつけられるが間隔には意味がないものである。その名前の通り順序に意味がある尺度で、 好きな〇〇について順番に並べていく、というものである。たとえば、縁起のいい初夢を順番に挙げろと言われ、 仮に1. 富士、2. 鷹、3. ナス、としたとき、富士と鷹の差1と、鷹とナスの差1が等しいことには何の意味もない。 広い意味では順序尺度もカテゴリーデータに入るが、 狭い意味でのカテゴリーデータは名義尺度に限るので、適用される統計手法がデータについて異なる場合、 注意が必要である。
p.93 上から1行目「少し捕捉します」は「少し補足します」が正しい。
書名 | R 言語ではじめるプログラミングとデータ分析 |
著者 | 馬場 真哉 |
発行日 | 2020 年 1 月 10 日(初版) |
発行元 | ソシム |
定価 | 3000円(税別) |
サイズ | |
ISBN | 978-4-8026-1238-8 |
備考 | 越谷市立図書館南部図書室で借りて読む |
NDC | 007.6 |
まりんきょ学問所 > コンピュータの部屋 > 統計活用術 > 統計、時系列の本 > 馬場 真哉:R 言語ではじめるプログラミングとデータ分析