RStudioの使い方・初級編(Windows)

RStudioの利点

RStudioの最大の魅力はノートを取ることとRの実行が同時にできることである。そのため、レポートの提出や研究ノートの作成に最適なツールとなる。マウス操作で統計分析が簡便になるといった利点はないが、Rを使用する場合の記録やまとめはRStudioを使うと格段に便利になる。

RStudioに含まれるR Markdownでは文章の表示とRの実行が同時にできる。研究ノートをテキストファイルなどで作成し、Rのスクリプトファイルを残すという方法ももあるが、R Markdownでは、文章の中にコマンドとその実行昨日までを同梱できるため、ファイルが複数になることがない。利点としては以下の4点が考えられる。

  • 研究ノートが散逸しにくい
  • 結果をレポートに貼り付けるなどのコピペミスが発生しない
  • コマンドも一緒に書かれているので、読む側もどのような分析をしたかがわかる
  • 分析を再実行・部分変更することが容易
  • データファイルとR Markdownは同じフォルダに入れられる
  • R Studioでは、Rの使いにくさが、大きく改善されている。

Markdownの利点

Markdownは文書作成言語の一つであり、非常に簡便に使える。他分野にわたってよく使われている言語の一つである。

  • Markdownで書いたテキストは、HTML、Word、Tex、PDF、ePUB、画像などに変換できる
  • HTML、Texよりはるかに記法が楽
  • Texの数式も使える
  • 習得が簡単
  • 階層的構造を意識した文章に向いている。ワープロではレイアウトや印刷の仕上がりに意識がいってしまいがちだが、階層構造に集中して執筆ができる

参考リンク

RStudioのインストール

https://stats.ni.tama.ac.jp/2022/08/28/002/

Markdown記法

RとRstudioのインストールの方法(2022/7)

RStudioの3つのファイル形式

1.R Script

Rのスクリプトと同じもの。スクリプトだけ使うのであれば、Rと大差がない。これだけ使うのであれば、RStudioを使う意味はない。

2.R Notebook

ノート作成に向いている。基本的にHTMLへの出力のためのもの。PDF、Wordにも出力できる。R Markdownと違い作者名や日時等は挿入されない(手動で挿入はできる)。手動で不足情報は補えるため、NotebookとMarkdownには大きな差はない。拡張子も同じRmdである。

3.R Markdown

こちらはレポート提出などを前提とした書式。R Notebookとの違いもほとんどないため、R Markdownで文書作成をするのかよい。

R Markdownのデータの置き場所

Rではsetwd()で指定するが、RStudioではこの作業が不要である。
データファイルとR Studioで作成するR Markdownのファイルを同じフォルダに入れておくだけでよい。 例えば、以下のようにしておく。

Rで最初につまづくところの一つはワーキング(作業)ディレクトリの場所指定である。こういった煩雑な作業が省略できるだけでも相当楽になる。

R Markdownファイルの作成 その1

[File]→[New File]→[R Markdown]

文書作成のダイアログが表示される。

タイトルと著者を入れる。
タイトルと著者は後から簡単に変えられるので、決められない場合はuntitleのままで作成して問題ない。
アウトプット形式をHTML、PDF、Wordの3つの中から選ぶ。こちらも簡単に変更できるので、特に何も考えがなければHTMLで問題ない。

R Markdownファイルの作成 その2

正式には「その1」の方法が説明されるが、実際に運用する上では、煩雑である。
Windowsでは下記のようにR Markdownファイルを作成する。

1.新規テキストファイルを作成する

2.拡張子を.txtから.Rmdに変更する。

ファイル名に特に制約はない。日本語(2バイト文字)も使うことはできる。

R Markdown作成

ヘッダー ファイルの書式。

---
title: "Test Doc"
author: "Sohei IDE"
date: "2018年10月24日"
output: html_document
---

htmlをwordに書き換えると出力がWordに変更できるが、html_documentと書いてあってもWordに出力は可能である。

Rコマンドとチャンク

summary(cars)

実行コマンドを書き込む部分。この{r}とで囲まれた部分をチャンク(chunk)と呼ぶ。
{R}をつけるのがポイント。

R Markdownの保存

拡張子を"Rmd"として保存する。 Rは大文字がオフィシャルの拡張子だがrmdでもRMDでも構わない。

最初に保存をするときには、エンコードを決めるダイアログが出る場合がある。

RのデフォルトはCP932だが、UTF-8を選択するのが良いだろう。もし日本語(マルチバイト文字)が文字化けをする場合にはCP932に切り替える。

RStudioのエンコードの変更

メニューバーの[Tools] → [Global Options]から[Code] → [Saving]
Default text encodionの[Change]をクリック。

CP932に切り替える。

コマンドを部分的に実行

コマンドを書く際には間違い、不完全なものを書くことになるので、最初からknitを実行できるわけではない。 分析一つひとつを確認するには、下の再生ボタンの形をしたものをクリックすると実行ができる。

このような部分をRStudioでは実行すると以下のような形になる。

これはRにもともと含まれている自動車(car)のデータ。

研究ノートの一例

研究ノートの一例を示しておこう。

何の分析か、結果はどうだったかなどを書く。
アスタリスク2つで囲うとMarkdownでは太字になるので後からみると見やすい。

回帰分析をするにしても、まずは分散分析やクロス集計表で関連を確認する必要がある。 数十個、数百個の分析を繰り返すこともまれではないため、コマンドライン(CUI)であることが時短にもなるし、研究ノートも同時にとれるので、一石二鳥である。

レンダリング

最終的にHTMLやWordなどに変換するのがレンダリングである。

Knitをすると、執筆した文章をみることができる。
レポートを作成する場合はWordへの変換がよいが、研究ノートはHTMLがよい。
R Notebookの場合はknitではなくPreviewボタンになる。
R Markdownの新しいファイルを作成した時に表示されるサンプルをレンダリングしたのが以下のもの。

Rのコマンドもすべて実行された形でHTMLになる。
ちなみに新しいファイルを作成すると、サンプルが必ず表示されるが、必要がないので削除する。

R Markdownの使い道

最終時な分析をRで行わない時もR Markdownは使い道がある。 例えば、クロス集計表、分散分析、相関係数などの基礎分析はSPSSなどのGUIアプリで行うと非常に手間がかかる。代替案として、SPSSのシンタックスもあるが、SPSSのシンタックスは煩雑であり、書式も覚えにくいため、Rのコマンドの方が手早く書ける。また、研究ノートも同時にとることができるという利点もある。 もちろん、最終分析がRでできるなら、Rですべて計算すれば非常にスムーズであるのは言うまでもない。

複数のRがインストールされている時に使用するRのバージョンを指定する。

[Tools]→[Global Options]

R versionの[Change]をクリック。

使用するRのバージョンを選択できる。

Rの作業ディレクトリを決める

RStudioはファイルがおかれているディレクトリが作業ディレクトリになるため、作業ディレクトリの指定は不要である。

RScriptを使用する場合には、作業ディレクトリを決める必要がある。ノーマルのRではsetwd()で指定するが、RStudioではGUIでも指定できる。

[Tools]→[Global Options]

Default workimg directleyを指定する。

RStudioを使う限りは作業ディレクトリの指定はおそらく使わないだろう。


更新履歴

本稿はRStudio Version 1.4.1106を基に執筆した。 このコンテンツはWeb上で開催している統計学勉強会で使用したテキストを基に再構成したもの(http://www.idesohei.net/contents/RStudio01.html)にさらに加筆修正したものである。 Copyright (c) 2022 Ide Sohei All Rights Reserved