なかなかRの世界に踏み込めないでいるあなたへ...
Last modified on July, 10th, 2017
R(あーる)とは、統計計算とグラフィックスのためのオープン・ソースな言語・環境です。
無料で使えて、世界中のユーザ自身の手によってカイゼンが続けられている、
中身の見える統計ソフトということで、
研究者の間ではじわじわと利用者が増加しているようです。
また、日本語化も進んで、表やグラフ中で日本語フォントも扱えるようになり、便利になりました。
しかし、「窓九拾五」発売以降のここ10年ほどの間にパソコンを始めた人たちの中には、
「コマンドをタイプする」という習慣が全くない方が少なからずおられ、
横文字コマンド・ライン入力が基本のRへの乗り換えになかなか踏み切れないでいるようです。
しかし、「Rコマンダー」というパッケージを利用すれば、
マウスによる操作で基本的な解析ができるようになります。
まずは、Rコマンダーを利用して、少しずつコマンド入力に慣れてゆけばいいのです。
これまで SPSS あたりの統計ソフトを使っていた方は容易に乗り換えられるはずです。
Rに関する日本語情報は RjpWiki
などに集積あるいはここからリンクされていますが、
このページでは、主に Windows ユーザを対象に、
つまづきやすい箇所を乗り越えてRの世界に入るために、
どのように進んでゆけばよいかを提示します
(ややリンク集に近い)。
なお、R利用法の解説は英語・日本語を問わずインターネット上にも多数ありますから、
このページではRの入り口で躊躇している方の背中を押すことに徹します。
私自身、Rを使いこなしているとは言えませんが、入り口は多ければ多いほど良い、ということで、にわかR普及員に。。。
Rのインストール
パッケージ関数の利用
便利なパッケージ
Rコマンダーを利用する
おすすめリンク
R のインストール
最新版のインストールの手順は、
RjpWiki のR のインストール
を参照しましょう。昔のバージョンと違って、そのまま日本語化できます。
Rをインストールするには、
1. The R Project(本家に負荷がかかりすぎるのを避けるため、
なるべく近くの国内ミラーサイト(例えば統計数理研究所ミラー)を利用する)の Download and Install R から
お使いのパソコンのOSに応じた実行ファイル、Windows なら Download R for Windows のR-x.x.x for Windows (32/64 bit)
内の R-x.x.x-win.exe(x.x.xは最新の数字のものを選ぶ)、をダウンロードしてくる。
ファイルは30メガバイト近くあるので注意!
2. 実行ファイル(Windows なら R-x.x.x-win.exe)をダブルクリックして、
インストール中に利用する言語を「日本語」に選んでから、インストールを開始し、
てきとうにお返事しながら(希望者は「デスクトップ上にアイコンを作成する」にチェックする)、
セットアップを完了させる。これで日本語化もできている
(英語版が御希望であれば、インストール開始時に言語を「English」に選ぶ)。
3. R のショートカットがメニューに(上記で設定すればデスクトップ上にもアイコンが)できる。
(必須ではありませんが、Rのショートカット(メニューとアイコンそれぞれ)のプロパティを右クリックで開いて、「作業フォルダ」を解析によく利用するデータの置いてあるフォルダに変更しておくとよいでしょう。)
パッケージ関数の利用
Rでは、本体に最初からセットになっている関数のほかにも様々な関数がユーザによって開発されています。
これらの開発された関数群はパッケージとして提供されていて、Web サイト CRAN (Comprehensive R Archive Network)などからダウンロードしてきて利用します。
なお、パッケージのリストと中身の簡単な日本語解説は RjpWiki の
CRAN パッケージリストに。
ただし、日本語では全部が紹介されていないようです。
全部を見たい人は英語の本家 CRAN の
Contributed Packages のページへ。
これらの関数を利用するには、Rを起動後、
1. 上部のメニュー・バーの「パッケージ ― CRAN ミラーサイトの設定」で出てくるリストからまず「(HTTP mirrors)」でOKし、その後に出てくるリスト中の
なるべく近い国内ミラーサイト(Japan(Tokyo)[https] など)を選択します。
いちど CRAN ミラーサイトを選択すれば、Rを終了するまでは、設定は維持されます。
2. 上部のメニュー・バーの「パッケージ ― パッケージのインストール」で出てくるリストから、
利用したいパッケージを選んでダウンロードします。
これらのダウンロードしたパッケージはR本体がインストールされているフォルダの配下の「library」フォルダに保存されます。
3. 上部のメニュー・バーの「パッケージ ― パッケージの読み込み」で出てくるリストから、
利用したいパッケージを選択します。
いちどインストールしたパッケージは、次回からは「パッケージの読み込み」だけで利用できます。
4. 関数は時々修正などのアップデードがあるので、たまには上部のメニュー・バーの
「パッケージ ― パッケージの更新」で修正された関数をダウンロードしましょう。
注意:プロキシ・サーバを利用するインターネット環境の方は、事前にプロキシの設定が必要です。
プロキシの設定方法は、RjpWiki の CRAN 国内ミラーの使い方
を参照しましょう。「.Rprofile」というオプションの設定を記録しておくファイルを作成しておく方法です。
なお、Windows 環境のノート PC などでインターネット環境(プロキシ)が異なる職場・自宅・外出先を持ち歩く場合は、
「.Rprofile」を利用したプロキシ設定はせずに、Rのショートカット(メニューとアイコンそれぞれ)のプロパティを右クリックで開いて、
リンク先の「"...Rgui.exe"」の末尾に「 --internet2」を追記して、「"...Rgui.exe" --internet2」としておけば、
コントロールパネルのインターネットオプションでプロキシ設定を切り替えた時に、Rでも自動的に切り替わるので便利です。
便利なパッケージ
(私の周辺の研究分野では)
CRAN のパッケージ・リストを眺めると、どれをダウンロードすべきか迷ってしまうほどの
大量のパッケージが存在します。
パッケージ名の綴りから中身を想像して、ひとつひとつ中身を調べたり、
利用したい機能の英文綴りから
キーワード検索
したりするのも時間があるときはいいでしょうが、
とにかく解析を始めたいという方は、以下のパッケージの中から必要に応じて、いくつかインストールすると
良いでしょう。
MASS(VR)
パッケージというよりも、有用な関数がセットになったパッケージ集。
Rcmdr
GUI(マウス操作)でRを扱えるようにするツール(主に Windows ユーザ用)。
詳細は後述。
lattice
グラフ作成に関するパッケージ集。Rcmdr 利用時にはインストールを勧められる。
rpart
mvpart
vegan
群集生態学と植生学用の序列化手法とその他の有用な関数を含むパッケージ。
labdsv
群集生態学と植生学用の序列化手法・クラスター分析などの関数を含むパッケージ。
パッケージ mgcv, MASS, akima のインストールも同時に必要。
glmmML
一般化線形混合モデル(GLMM)のためのパッケージ。
pscl
ゼロ過剰ポアソン回帰モデル(Zero-Inflated Poisson Regression)のためのパッケージ。
Rコマンダーを利用する
Rコマンダー(R Commander)は GUI(マウス操作)でRを扱えるようにするツールです。
Rコマンダーを利用することで、コマンド入力が大幅に省けたり、基本的な解析に関するのコマンドをいちいち暗記しておく必要がなくなります。
特に、データ・ファイルの読み込みの際のディレクトリ指定やファイル指定でタイプミスを繰り返して、
いらいらすることがなくなるのは大変ありがたいです。
Rコマンダーを利用するには、Rを起動後、
1. 上記手順でパッケージ Rcmdr を CRAN からダウンロードしてきて読み込みます。
すると、別窓で「Rコマンダー」が開きます。
Rをインストールした時の言語が「Japanese」であれば、Rコマンダーも自動的に日本語化されます。
2. 解析用データを用意する。
2a. 新しいテーブルにデータを入力する。
(1)Rコマンダーの窓の上部のメニュー・バーの「データ ― 新しいデータセット」を選びます。
(2)別窓が開くので、データセット名(解析中に使う時の表(テーブル)の仮の名前)を入力します。
(3)別窓で「データ・エディタ」が開くので、テーブルにデータを入力します。
変数名(var1, var2, ...)のセルをクリックすると、「変数エディタ」が開いて、
変数名や変数の型(numeric:数値,character:文字)を変更できます。
ゑくせるなどの表から文字を含むデータをコピペする時は、先に変数の型を設定しておきましょう。
なお、数字の大小に特に意味はないのに便宜的に数字を使ってグループ化している変数(1班,2班など)がある場合は、変数の型は character にしておきましょう。
2b. テキスト・ファイルに作成済みのデータを利用する。
ゑくせるデータなどはカンマ区切りテキスト(CSV)ファイルなどに変換しておきましょう。
SPSS や Minitab、STATA のデータ・ファイルは、そのままインポートできます。
最新の Rcmdr(と RODBC も同時にインストール)では、Excel, Access, dbf 形式ファイルが読み込めるようになりました。
(1)Rコマンダーの窓の上部のメニュー・バーの「データ ― データのインポート ― テキストファイルから...」を選びます。
(2)別窓が出てくるので、読み込むデータの形式を設定してから「OK」を押します。
- 「データセット名」は読み込んでくるファイル名ではなく、解析中に使う時の表(テーブル)の仮の名前です。
- 読み込んでくるテーブルの先頭行に変数名を入力していない場合は、「ファイル内に変数名あり」のチェックを外しましょう。
- 「フィールドの区切り文字」はカンマ区切り(CSV)ファイルであれば、「コンマ」にチェックを変更しましょう。
(3)新たに開いた別窓で読み込むテキスト・ファイルを選ぶと、データがインポートされます。
(4)Rコマンダーの窓の上部のメニュー・バーの「データセット:」
の右の枠をクリックして使用するデータセットを選んでから
(複数のデータセットがあるとリストが表示される)、
「データセットの編集」をクリックするとデータの修正ができ、
「データセットを表示」をクリックすると単にテーブルが別窓で表示される。
3. 解析を開始する。
3a. コマンドを打ち込む
Rコマンダーの窓の上部の「スクリプトウィンドウ」がコマンドを打ち込むスペースで、
ここにコマンドを打ち込んでからこのスペースの右下の「実行」ボタンを押すと、
下部の「出力ウィンドウ」に演算結果が表示されます。
グラフは別窓「R Graphics」に表示されます。
なお、「スクリプトウィンドウ」内の任意の行にカーソルを置いて「実行」ボタンを押すと、
その行に書かれたコマンドが何度でも実行できます。
複数行をマウスで選択して文字の色を反転させてから「実行」ボタンを押すと、
選択した複数行内のコマンドが上から順に実行されます。
また、「スクリプトウィンドウ」には他所からコピーしてきた文字列を貼り付けることができます。
つまり、インターネット上のサンプルあるいは別の解析に使ったスクリプトをコピペして、
自分がこれから解析するデータセットに合わせて、
データセット名、変数名等を修正してから「実行」ボタンを押せば良いのです。
コマンド入力もそんなに難しくないでしょ。
3b. メニュー・バーを利用する
コマンド入力するには、コマンドを知らなければ始まりませんが、
Rコマンダーでは基本的な解析については、Rコマンダーの窓の上部のメニュー・バーの
「統計量」、
「グラフ」、
「モデル」、
「分布」
の中から手法をマウスで選ぶことで、容易に実行できます。
また、解析に用いる変数の選択なども別窓内でマウスで行うことができます。
4. 解析結果を保存する。
- 解析に使ったコマンドを保存する場合は、上部のメニュー・バーから「ファイル ― スクリプトに名前をつけて保存」を選びます(拡張子「.R」)。
- 解析結果を保存する場合は、上部のメニュー・バーから「ファイル ― 出力をファイルに保存」を選びます(テキスト・ファイル「.txt」)。
- グラフを保存する場合は、「R Graphics」窓の上部のメニュー・バーから「ファイル ― 別名で保存」の中から
画像の保存形式(Metafile, Postscript, PDF, Png, Bmp, Jpeg)を選びます。
これでRコマンダーの基本操作はだいたい習得できたはず。。。
以下のインターネット情報なども活用しながら、Rに慣れていきましょう!!
おすすめリンク
サンプル・スクリプトを大いに活用させていただきましょう!!
R全般について
統計手法全般について
特定の統計手法について
グラフ描画関係
R でプログラミング:データの一括処理とグラフ描き:国環研・竹中先生
段階的な統計学習
租界Rの門前にて:農業環境技術研究所・三中さん
R言語マニュアル:慶応大・古谷先生(Rコマンダー利用)
上にもどる
HASHIMOTO, Hiroshi