事前にRとRStudioをインストールしておく。
RStudioを立ち上げる。
まずは足し算。10+20 と入力して Enter 押すと、30 という結果が返る。
> 10+20
[1] 30
[1] 30
次は変数を使う。
x = 10, y= 20 とすると、右上のWorkspace画面のValuesの情報が表示される。
x+y とすると、結果の30 が返る。
> x <- 10
> y <- 20
> x+y
[1] 30
> y <- 20
> x+y
[1] 30
関数やベクトル(配列)も利用できる。
> z <- 1.546
> round(z, 2) ←Zを小数点第2位に丸めこむ
[1] 1.55
> x <- c(1, 2, 3, 4, 5) ←5つの数字 (1,2,3,4,5) をベクトル(配列)として x に代入
> sum(x) ←x の合計を算出
[1] 15
> mean(x) ←x の平均を算出
[1] 3
> round(z, 2) ←Zを小数点第2位に丸めこむ
[1] 1.55
> x <- c(1, 2, 3, 4, 5) ←5つの数字 (1,2,3,4,5) をベクトル(配列)として x に代入
> sum(x) ←x の合計を算出
[1] 15
> mean(x) ←x の平均を算出
[1] 3
関数の詳細を調べるには、help() を使う。右下にHelp画面が表示される。
> help("mean")
このようにコマンドを1つ1つ打つ以外にも、スクリプトを予め用意して、1行ずつ実行させることもできる。
メニュー→「File」→「Open File」から、スクリプトファイル「demo.r」を開くと、スクリプトのエディタ画面が表示される。
左上のエディタ画面で、実行したいコマンドの行にカーソルを合わせるか、複数行を選択し、Runボタンをクリックすると、そのコマンドが実行される。実行された結果は左下のコンソール画面に表示される。
(2) データの取り込みとプロット表示
作業ディレクトリを指定し、作業フォルダーにあるデータファイルを読み込む。
このファイルは、東京、愛知、大阪、福岡の男女別人口統計を集計したものである。
> setwd("c:/Users/junko/Documents/R/Labs") ←作業ディレクトリを指定
> getwd() ←作業ディレクトリの確認
> ds <- read.csv("jinkou.csv", header=T) ←ds にcsvデータを読み込む
> ds ←読み込んだデータの確認
> getwd() ←作業ディレクトリの確認
> ds <- read.csv("jinkou.csv", header=T) ←ds にcsvデータを読み込む
> ds ←読み込んだデータの確認
read.csv() :CSVファイルを表形式のデータフレーム型(data.frame)で取り込む
第一引数はCSVファイル名。1行目が列の場合headerオプションはT。
> head(ds) ←データの先頭部を表示
> tail(ds) ←データの最終部を表示
> range(ds$year) ←年の範囲(最小値と最大値)を確認
> tail(ds) ←データの最終部を表示
> range(ds$year) ←年の範囲(最小値と最大値)を確認
range(変数名$列名) :データの範囲(最小値と最大値)を確認。
(例題)
1960年から2009年までの、東京、愛知、大阪、福岡における男女の人口が入ったデータがある。
①ここから男性の平均人口を求める。
②各年度の男女の合計人口の推移をグラフにプロットする。
> male <- ds$tokyo_m + ds$aichi_m + ds$osaka_m + ds$fukuoka_m
> mean(male)
> female <- ds$tokyo_f + ds$aichi_f + ds$osaka_f + ds$fukuoka_f
> t1 <- male + female
> plot(ds$year, t1, type="l", xlab="年", ylab="人口") ←グラフのプロット表示
> mean(male)
> female <- ds$tokyo_f + ds$aichi_f + ds$osaka_f + ds$fukuoka_f
> t1 <- male + female
> plot(ds$year, t1, type="l", xlab="年", ylab="人口") ←グラフのプロット表示
plot() 関数 :データをグラフに表示する。
第一引数:X軸のデータ
第二引数:Y軸のデータ
typeオプション:グラフの種類(線:1、点:p、棒:h)
xlabオプション:X軸の名前
ylabオプション:Y軸の名前
Rは標準ではアソシエーション分析はできないので、アソシエーション分析用のライブラリ”arules”を用いる。
0 件のコメント:
コメントを投稿