馬場 真哉:R 言語ではじめるプログラミングとデータ分析

作成日:2020-10-03
最終更新日:

概要

統計処理に適した言語 R の紹介。

感想

まだまだ読み込むまでには至っていない。

pp.330-331 ではパイプ演算子 %>% について解説されている。このパイプ演算子は、 magrittr パッケージなどで提供される。なぜ、magrittr という名前なのだろうか。 マグリット、というように読めるので、これはあのベルギーの画家、マグリット( René Magritte )のことだろうか、 と思っていたらその通りだった。

本書 pp.444-445 にある参考文献リストを見てわかった。出典は次のとおりである:

・magrittr - Ceci n'est pas un pipe 「URL: https://cran.r-project.org/web/packages/magrittr/vignettes/magrittr.html」 ( 2019 年 11 月 26 日最終閲覧 )

上記ページを見てみると、Ceci n'est pas un pipe という文字が目に入る。 この「これはパイプではない」という文は、ルネ・マグリットの有名な絵「イメージの裏切り」に描かれた文である。 なるほど。上記ページを見るとこのページで magrittr が提供するのは、a new “pipe”-like operator, %>% とある。 つまり「パイプ」のような演算子である、といっている。パイプとは、UNIX で有名になった演算子である。 パイプについての説明は省略する。

数量データとカテゴリーデータ

p.158では「数量データとカテゴリデータ」という MEMO がある。ここでは<ごく簡単に述べると、 「計測できるデータ」が数量データです。「計測できないデータ」はカテゴリデータです。 計測できるかどうかは、等間隔であるかどうかで判断するとよいでしょう。>と述べられている。 厳密には、データを名義尺度、順序尺度、間隔尺度、比率尺度の4種類に分ける。そこまで述べてほしかった。

名義尺度は区別のためだけに用いられる尺度である。本書でカテゴリデータとしている地名、お肉の種類は、 名義尺度である。本書では地名として、Naogya, Shinagawa, Yokohama, Kawasaki, Osaka, Kobe, Kyoto, Hukuoka が列挙されている。これらは区別にのみ意味があり、差には意味がない、あるいは差を考えることができない。 お肉の種類は beef と pork が取り上げられているが、これも同様である。

順序尺度は、順序には意味がつけられるが間隔には意味がないものである。その名前の通り順序に意味がある尺度で、 好きな〇〇について順番に並べていく、というものである。たとえば、縁起のいい初夢を順番に挙げろと言われ、 仮に1. 富士、2. 鷹、3. ナス、としたとき、富士と鷹の差1と、鷹とナスの差1が等しいことには何の意味もない。 広い意味では順序尺度もカテゴリーデータに入るが、 狭い意味でのカテゴリーデータは名義尺度に限るので、適用される統計手法がデータについて異なる場合、 注意が必要である。

誤植

p.93 上から1行目「少し捕捉します」は「少し補足します」が正しい。

書誌情報

書 名R 言語ではじめるプログラミングとデータ分析
著 者馬場 真哉
発行日2020 年 1 月 10 日(初版)
発行元ソシム
定 価3000円(税別)
サイズ
ISBN978-4-8026-1238-8
備 考越谷市立図書館南部図書室で借りて読む
NDC007.6

まりんきょ学問所コンピュータの部屋統計活用術統計、時系列の本 > 馬場 真哉:R 言語ではじめるプログラミングとデータ分析


MARUYAMA Satosi