http://netstat.stat.tku.edu.tw
(User from: 54.162.218.214)
機率  |  統計  |  Data Mining  |  資料處理  |  DEMO  |  Data  |  Links  |  Books  |  相關文件  |   ( ENGLISH )

Home

機率
 計算/查表
 隨機亂數
 Density plots
統計
 基本統計
 卡方檢定
 迴歸分析
 ANOVA
 時間數列
 多變量分析
 品質管制
 無母數方法
Data Mining
 決策樹
 Logistic
 判別分析
 集群分析
 類神經網路
 關聯規則分析
 ALL Methods

R 軟體入門

5.2 Example: 一因子設計 (One-Way ANOVA)

by Steve Chen ( , 版權所有, 歡迎散佈)

一因子設計操作

讀入資料檔. 資料檔內容為

                         Factor Y
                         Lev1 11
                         Lev2 12
                         .......

> mydata <- read.csv("mydata.txt",header=T) 
> mydata 

   Factor  Y
1    Lev1 11
2    Lev2 12
3    Lev3 16
4    Lev4 13
5    Lev1 11
6    Lev2 11
7    Lev3 15
8    Lev4 12
9    Lev1 14
10   Lev2  9
11   Lev3 14
12   Lev4 11

如果因子變數本身不是 R 的 factor 型態, 先轉成 factor
> if (!is.factor(mydata$Factor)) 
>       mydata$Factor <- factor(mydata$Factor) 

使用 aov 函數來分析
> a <- aov(Y ~ Factor, data=mydata) 
> summary(a) 

            Df  Sum Sq Mean Sq F value  Pr(>F)  
Factor       3 30.2500 10.0833     5.5 0.02403 *
Residuals    8 14.6667  1.8333                  
---
Signif. codes:  0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 

效果 (effects) 估計量

> coefficients(a) 

  (Intercept)    FactorLev2    FactorLev3    FactorLev4 
 1.200000e+01 -1.333333e+00  3.000000e+00 -3.456979e-15 

畫出殘差的常態機率圖, 預測值 vs 殘差圖, 以及 Boxplot
> residual <- a$res
> qqnorm(residual) 
> plot(a$fit,residual) 
> boxplot(Y ~ Factor, data=mydata) 

顯示設計矩陣 (design matrix)
> dmatrix <-  model.matrix(Y ~ Factor, data=mydata) 
> dmatrix

   (Intercept) FactorLev2 FactorLev3 FactorLev4
1            1          0          0          0
2            1          1          0          0
3            1          0          1          0
4            1          0          0          1
5            1          0          0          0
6            1          1          0          0
7            1          0          1          0
8            1          0          0          1
9            1          0          0          0
10           1          1          0          0
11           1          0          1          0
12           1          0          0          1

使用線性模式(迴歸) lm 函數來分析
> g <- lm(Y ~ Factor, data=mydata) 
> summary(g) 


Call:
lm(formula = Y ~ Factor, data = mydata)

Residuals:
       Min         1Q     Median         3Q        Max 
-1.667e+00 -1.000e-00  1.440e-16  1.000e-00  2.000e+00 

Coefficients:
              Estimate Std. Error   t value Pr(>|t|)    
(Intercept)  1.200e+01  7.817e-01    15.350 3.22e-07 ***
FactorLev2  -1.333e+00  1.106e+00    -1.206   0.2623    
FactorLev3   3.000e+00  1.106e+00     2.714   0.0265 *  
FactorLev4  -3.457e-15  1.106e+00 -3.13e-15   1.0000    
---
Signif. codes:  0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 

Residual standard error: 1.354 on 8 degrees of freedom
Multiple R-Squared: 0.6735,	Adjusted R-squared: 0.551 
F-statistic:   5.5 on 3 and 8 DF,  p-value: 0.02403 
# ------------------------------------------------------------