2015年2月11日水曜日

R言語とRStudioを使う(基本操作編)

事前にRとRStudioをインストールしておく。

RStudio

(1) R基本操作

RStudioを立ち上げる。



まずは足し算。10+20 と入力して Enter 押すと、30 という結果が返る。
> 10+20
[1] 30

次は変数を使う。
x = 10, y= 20 とすると、右上のWorkspace画面のValuesの情報が表示される。
x+y とすると、結果の30 が返る。
> x <- 10
> y <- 20
> x+y
[1] 30


関数やベクトル(配列)も利用できる。
> z <- 1.546
> round(z, 2)                ←Zを小数点第2位に丸めこむ
[1] 1.55
> x <- c(1, 2, 3, 4, 5)      ←5つの数字 (1,2,3,4,5) をベクトル(配列)として x に代入
> sum(x)                         ←x の合計を算出
[1] 15
> mean(x)              ←x の平均を算出
[1] 3


関数の詳細を調べるには、help() を使う。右下にHelp画面が表示される。
> help("mean")



このようにコマンドを1つ1つ打つ以外にも、スクリプトを予め用意して、1行ずつ実行させることもできる。
メニュー→「File」→「Open File」から、スクリプトファイル「demo.r」を開くと、スクリプトのエディタ画面が表示される。


左上のエディタ画面で、実行したいコマンドの行にカーソルを合わせるか、複数行を選択し、Runボタンをクリックすると、そのコマンドが実行される。実行された結果は左下のコンソール画面に表示される。


(2) データの取り込みとプロット表示


作業ディレクトリを指定し、作業フォルダーにあるデータファイルを読み込む。
このファイルは、東京、愛知、大阪、福岡の男女別人口統計を集計したものである。

> setwd("c:/Users/junko/Documents/R/Labs")   ←作業ディレクトリを指定
> getwd()                            ←作業ディレクトリの確認
> ds <- read.csv("jinkou.csv", header=T)       ←ds にcsvデータを読み込む
> ds                                                                  ←読み込んだデータの確認

read.csv() :CSVファイルを表形式のデータフレーム型(data.frame)で取り込む
        第一引数はCSVファイル名。1行目が列の場合headerオプションはT。

> head(ds)                 ←データの先頭部を表示
> tail(ds)                   ←データの最終部を表示
> range(ds$year)             ←年の範囲(最小値と最大値)を確認

range(変数名$列名)  :データの範囲(最小値と最大値)を確認。



(例題)
1960年から2009年までの、東京、愛知、大阪、福岡における男女の人口が入ったデータがある。
①ここから男性の平均人口を求める。
②各年度の男女の合計人口の推移をグラフにプロットする。

> male <- ds$tokyo_m + ds$aichi_m + ds$osaka_m + ds$fukuoka_m
> mean(male)
> female <- ds$tokyo_f + ds$aichi_f + ds$osaka_f + ds$fukuoka_f
> t1 <- male + female
> plot(ds$year, t1, type="l", xlab="年", ylab="人口")         ←グラフのプロット表示

plot() 関数 :データをグラフに表示する。
         第一引数:X軸のデータ
         第二引数:Y軸のデータ
         typeオプション:グラフの種類(線:1、点:p、棒:h)
         xlabオプション:X軸の名前
         ylabオプション:Y軸の名前






Rは標準ではアソシエーション分析はできないので、アソシエーション分析用のライブラリ”arules”を用いる。

0 件のコメント:

コメントを投稿