RStudioの使い方・初級編(Mac)

RStudioの利点

RStudioの最大の魅力はノートを取ることとRの実行が同時にできることである。そのため、レポートの提出や研究ノートの作成に最適なツールとなる。マウス操作で統計分析が簡便になるといった利点はないが、Rを使用する場合の記録やまとめはRStudioを使うと格段に便利になる。

RStudioに含まれるR Markdownでは文章の表示とRの実行が同時にできる。研究ノートをテキストファイルなどで作成し、Rのスクリプトファイルを残すという方法ももあるが、R Markdownでは、文章の中にコマンドとその実行昨日までを同梱できるため、ファイルが複数になることがない。利点としては以下の4点が考えられる。

  • 研究ノートが散逸しにくい
  • 結果をレポートに貼り付けるなどのコピペミスが発生しない
  • コマンドも一緒に書かれているので、読む側もどのような分析をしたかがわかる
  • 分析を再実行・部分変更することが容易
  • データファイルとR Markdownは同じフォルダに入れられる
  • R Studioでは、Rの使いにくさが、大きく改善されている。

Markdownの利点

Markdownは文書作成言語の一つであり、非常に簡便に使える。他分野にわたってよく使われている言語の一つである。

  • Markdownで書いたテキストは、HTML、Word、Tex、PDF、ePUB、画像などに変換できる
  • HTML、Texよりはるかに記法が楽
  • Texの数式も使える
  • 習得が簡単
  • 階層的構造を意識した文章に向いている。ワープロではレイアウトや印刷の仕上がりに意識がいってしまいがちだが、階層構造に集中して執筆ができる

参考リンク

RStudioのインストール

https://stats.ni.tama.ac.jp/2022/08/28/002/

Markdown記法

RとRstudioのインストールの方法(2022/7)

RStudioの3つのファイル形式

1.R Script

Rのスクリプトと同じもの。スクリプトだけ使うのであれば、Rと大差がない。これだけ使うのであれば、RStudioを使う意味はない。

2.R Notebook

ノート作成に向いている。基本的にHTMLへの出力のためのもの。PDF、Wordにも出力できる。R Markdownと違い作者名や日時等は挿入されない(手動で挿入はできる)。手動で不足情報は補えるため、NotebookとMarkdownには大きな差はない。拡張子も同じRmdである。

3.R Markdown

こちらはレポート提出などを前提とした書式。R Notebookとの違いもほとんどないため、R Markdownで文書作成をするのかよい。

その他様々なファイルがあるが、ここでは省略する。

R Markdownのデータの置き場所

Rではsetwd()で指定するが、RStudioではこの作業が不要である。
データファイルとR Studioで作成するR Markdownのファイルを同じフォルダに入れておくだけでよい。

Rで最初につまづくところの一つはワーキング(作業)ディレクトリの場所指定である。こういった煩雑な作業が省略できるだけでも相当楽になる。

R Markdownファイルの作成

上部メニューバーから [File]→[New File]→[R Markdown]

なお、メニューバーではなくウィンドウ内の上部リボン最左端からでも同じようにできる。

文書作成のダイアログが表示される。

タイトルと著者を入れる。
タイトルと著者は後から簡単に変えられるので、決められない場合はuntitleのままで作成して問題ない。
アウトプット形式をHTML、PDF、Wordの3つの中から選ぶ。こちらも簡単に変更できるので、特に何も考えがなければHTMLで問題ない。

右下のOKをクリックするとこのようにサンプルが入力されたファイルが生成される。

白紙のファイルがいい場合は、文書作成ダイアログ左下の[Create Empty Document]をクリックするといいだろう。

作業を始める前に、[⌘+S]またはメニューバーから[File]→[Save As…]を選び、用意した作業ディレクトリに名前をつけて保存しておこう。

R Markdown作成

以下はサンプルを参照して説明する。

ヘッダー ファイルの書式。

---
title: "Test Doc"
author: "Sohei IDE"
date: "2018年10月24日"
output: html_document
---

htmlをwordに書き換えると出力がWordに変更できるが、html_documentと書いてあってもWordに出力は可能である。

Rコマンドとチャンク

summary(cars)

実行コマンドを書き込む部分。この{r}とで囲まれた部分をチャンク(chunk)と呼ぶ。
{R}をつけるのがポイント。

R Markdownの保存

拡張子を"Rmd"として保存する。 Rは大文字がオフィシャルの拡張子だがrmdでもRMDでも構わない。

RStudioのエンコードの変更

メニューバーの[Tools] → [Global Options]から[Code] → [Saving]
Default text encodionの[Change]をクリック。

コマンドを部分的に実行

コマンドを書く際には間違い、不完全なものを書くことになるので、最初からknitを実行できるわけではない。 分析一つひとつを確認するには、下の再生ボタンの形をしたものをクリックすると実行ができる。

このような部分をRStudioでは実行すると以下のような形になる。

これはRにもともと含まれている自動車(car)のデータ。

研究ノートの一例

研究ノートの一例を示しておこう。

何の分析か、結果はどうだったかなどを書く。
アスタリスク2つで囲うとMarkdownでは太字になるので後からみると見やすい。

回帰分析をするにしても、まずは分散分析やクロス集計表で関連を確認する必要がある。 数十個、数百個の分析を繰り返すこともまれではないため、コマンドライン(CUI)であることが時短にもなるし、研究ノートも同時にとれるので、一石二鳥である。

レンダリング

最終的にHTMLやWordなどに変換するのがレンダリングである。

Knitをすると、執筆した文章をみることができる。
レポートを作成する場合はWordへの変換がよいが、研究ノートはHTMLがよい。
R Notebookの場合はknitではなくPreviewボタンになる。
R Markdownの新しいファイルを作成した時に表示されるサンプルをレンダリングしたのが以下のもの。

Rのコマンドもすべて実行された形でHTMLになる。

R Markdownの使い道

最終時な分析をRで行わない時もR Markdownは使い道がある。 例えば、クロス集計表、分散分析、相関係数などの基礎分析はSPSSなどのGUIアプリで行うと非常に手間がかかる。代替案として、SPSSのシンタックスもあるが、SPSSのシンタックスは煩雑であり、書式も覚えにくいため、Rのコマンドの方が手早く書ける。また、研究ノートも同時にとることができるという利点もある。 もちろん、最終分析がRでできるなら、Rですべて計算すれば非常にスムーズであるのは言うまでもない。

使用するRのバージョンを変更する

使用するRのバージョンを変更したいときは、CRANより過去のバージョンのRをインストールしRstudioを再起動すれば良い。

しかしこのとき、現存するRを上書きする形でインストールされてしまうため、再び元のバージョンを利用したいときはまたインストールする必要が出てくる。

注:デフォルトでは、インストーラは、Rの以前のHigh Sierraビルドが存在する場合、アップグレードする。もし以前のバージョンを残したい場合はpkgutil --forget org.R-project.R.fw.pkgを使う。

ここで、手軽にRのバージョンを切り替える方法があるので以下に説明する。

RSwitchをインストールする

https://rud.is/rswitch/ にジャンプし、[Downroad RSwitch vx.y.z]をクリック。

appファイルがダウンロードされるので、無くさないようにアプリケーションフォルダに移動しておくとよい。

起動するとメニューバー右側にRSwitchのアイコンが出現する。

クリックすることでRSwichの機能を利用できる。

目的のRのインストール

本来なら上図のメニューの4.1(4.1.3)や4.2(4.2.1)などx.y(x.y.z)をクリックすることでRのバージョンを切り替えられるのだが。ただ目的のバージョンをインストールすれば良いわけではない。

ここで、すでに複数のRをインストールしている場合は以下のように実行していない方のバージョンが不完全である(incomplete)とされていることだろう。

前述のとおり、新しくRをインストールするとき、元々インストールされていたRの一部を削除・上書きする形でインストールされる。それにより、旧バージョンのRのデータが破損してしまうのである。

ゆえに、少し手間をかける必要がある。

まず、普通のRインストール方法と同様にCRANへジャンプし、目的の(まだインストールしていないor不完全な状態の)バージョンのpkgファイルをダウンロードする。

つぎにアプリケーションからターミナルを開き、

sudo pkgutil --forget org.R-project.R.fw.pkg

を実行する。

実行できたら、ダウンロードしたpkgファイルを起動し、指示通り実行すれば良い。

無事インストールできたならば、メニューバーのRSwitchアイコンからバージョンの切り替えができるはずだ。
目的のバージョンを選択した上で、RStudioを再起動すれば、Rのバージョンが切り替わっていることだろう。
(Rstudioを終了したあと、RSwitchのメニューから[Launch Rstudio]を選択すれば手軽に起動できる。)

Rの作業ディレクトリを決める

RStudioはファイルが置かれているディレクトリが作業ディレクトリになるため、作業ディレクトリの指定は不要である。

RScriptを使用する場合には、作業ディレクトリを決める必要がある。ノーマルのRではsetwd()で指定するが、RStudioではGUIでも指定できる。

[Tools]→[Global Options]

Default workimg directleyを指定する。

RStudioを使う限りは作業ディレクトリの指定はおそらく使わないだろう。

執筆環境・参考文献

執筆環境:macOS Monterey ver.12.5.1

参考URL:RSwitch公式Github/issues/#24