| 範例資料 (括號中為觀察值數目) |
|
|
|
blood |
[ 一般數值資料 ] 變數數目: 2, 觀察值數目: 16
分別由機器與專家測量的血壓值
- (C1) Machine : 機器測量值
- (C2) Expert : 專家測量值
(View data)
|
brain |
[ 一般數值資料 ] 變數數目: 7, 觀察值數目: 37
37 個人的腦容量測量值與其他資料
- (C1) Gender : 性別
- (C2) FSIQ : FSIQ 指標
- (C3) VIQ : VIQ 指標
- (C4) PIQ : PIQ 指標
- (C5) Weight : 體重
- (C6) Height : 身高
- (C7) BrainSize : 腦容量測量值
(View data)
|
crime |
[ 一般數值資料 ] 變數數目: 3, 觀察值數目: 51
美國 51 個州分別在 1983 與 1993 的暴力犯罪數字
- (C1) y1983 : 1983 年數據
- (C2) y1993 : 1993 年數據
(View data)
|
emissions |
[ 一般數值資料 ] 變數數目: 3, 觀察值數目: 26
26 個國家的二氧化碳排放數據與經濟指標 (1999)
- (C1) GDP
- (C2) perCapita
- (C3) CO2 : 二氧化碳排放量
(View data)
|
florida |
[ 一般數值資料 ] 變數數目: 12, 觀察值數目: 67
2000 年美國總統大選佛羅里達州 67 個郡 (county) 的投票資料
- (C1) County : 郡名
- (C2) GORE
- (C3) BUSH
- (C4) BUCHANAN
- (C5) NADER
- (C6) BROWNE
- (C7) HAGELIN
- (C8) HARRIS
- (C9) MCREYNOLDS
- (C10) MOOREHEAD
- (C11) PHILLIPS
- (C12) Total : 總票數
(View data)
|
homedata |
[ 一般數值資料 ] 變數數目: 2, 觀察值數目: 6841
紐澤西 Maplewood 地區 6841 件房地產在 1970 與 2000 年的估價
- (C1) y1970 : 1970 年的價格
- (C2) y2000 : 2000 年的價格
(View data)
|
movies |
[ 一般數值資料 ] 變數數目: 4, 觀察值數目: 25
美國在 2001 年 6 月賣座最佳的 25 部電影資料.單位:百萬美金
(http://www.movieweb.com/movie/top25.html)
- (C1) title : 片名
- (C2) current : 當週紀錄
- (C3) previous : 前週紀錄
- (C4) gross : 累積金額
(View data)
|
babies |
[ 類別資料 ] 變數數目: 7, 觀察值數目: 1155
初生嬰兒與母親的資料
- (C1) bwt : 出生時的體重 (ounces)
- (C2) gestation : 懷孕總日數
- (C3) parity : 胎序,0= 第一個小孩, 9=unknown
- (C4) age : 母親年齡
- (C5) height : 母親身高 (inches)
- (C6) weight : 母親在懷孕前的體重 (pounds)
- (C7) smoke : 母親是否抽煙. 0:沒有, 1:有
(View data)
|
bumpers |
[ 類別資料 ] 變數數目: 2, 觀察值數目: 23
23 款汽車保險桿 (bumpers) 的修理次數
- (C1) Car : 汽車品牌
- (C2) repair : 維修次數
(View data)
|
cancer |
[ 類別資料 ] 變數數目: 5, 觀察值數目: 12,16,17,6,11
不同類的癌症病患存活時間
- (C1) stomach : 胃癌
- (C2) bronchus : 支氣管癌
- (C3) colon : 結腸癌
- (C4) ovary : 卵巢癌
- (C5) breast : 乳癌
(View data)
|
carbon |
[ 類別資料 ] 變數數目: 2, 觀察值數目: 24=3x8
三個不同地區的一氧化碳測量值
- (C1) Monoxide : 一氧化碳含量
- (C2) Site : 區域編號: 1,2,3
(View data)
|
chicken |
[ 類別資料 ] 變數數目: 3, 觀察值數目: 39 = 3 x 13
肉雞在三種不同飼料下的體重增加值
- (C1) Ration1 : 飼料1
- (C2) Ration2 : 飼料2
- (C3) Ration3 : 飼料3
(View data)
|
crab |
[ 類別資料 ] 變數數目: 2, 觀察值數目: 362
362 隻螃蟹的資料
- (C1) size : 甲殼尺寸
- (C2) shell : 外殼狀況, 1:乾淨, 2:骯髒
(View data)
|
hiv |
[ 類別資料 ] 變數數目: 6, 觀察值數目: 2144
血友病患者的 HIV 感染資料 (http://www.stat.Berkeley.EDU/users/statlabs/labs.html)
- (C1) hiv : HIV status 1= negative, 2=positive
- (C2) factor : Factor 8 平均劑量,1=high, 2=moderate,
3=low, 4=unknown, 5=none
- (C3) year : 年
- (C4) age : 年齡群組,每 5 年為 1 組: 1=0-4, 2=5-9, ..., 13=60-64, 14=65+
- (C5) py : Person years
- (C6) deaths : Number of deaths
(View data)
|
video |
[ 類別資料 ] 變數數目: 15, 觀察值數目: 91
調查青少年關於電玩的問卷
- (C1) time : 每週花在電玩的時數
- (C2) like : 電玩喜好程度:1=Never played, 2=Very much, 3=Somewhat,
4=Not really, 5=Not at all
- (C3) where : 1=Arcade, 2=Home on a system, 3=Home on a computer
4=Home on computer and system, 5=Arcade and Home(system or computer) 6=Arcade and home (both system and computer)
- (C4) freq : 玩電玩的頻率,1=Daily, 2=Weekly, 3=Monthly, 4=Semesterly
- (C5) busy : 就算很忙的時候也照玩:0=no, 1=yes
- (C6) educ : 是否認為電玩有益學習:0=no, 1=yes
- (C7) sex : 性別:0=女,1=男
- (C8) age : 年齡
- (C9) home : 家中是否有電腦? 0=No,1=Yes
- (C10) math : 是否討厭數學? 0=No,1=Yes
- (C11) work : 每週工作時數
- (C12) own : 自己是否有 PC? 0=No,1=Yes
- (C13) cdrom : 自己的 PC 是否有 CDROM? 0=No,1=Yes
- (C14) email : 擁有 email 帳號? 0=No,1=Yes
- (C15) grade : 預期的學業成績:4=A, 3=B, 2=C, 1=D, 0=F
(View data)
|
beer |
[ 資料探勘 ] 變數數目: 6, 觀察值數目: 5
關聯規則資料: Beer and Diaper 每一列為 0 或 1 的 transaction 紀錄
- (C1) Bread : 麵包
- (C2) Milk : 牛奶
- (C3) Diaper : 尿布
- (C4) Beer : 啤酒
- (C5) Egg : 蛋
- (C6) Coke : 可樂
(View data)
|
bloodtw |
[ 資料探勘 ] 變數數目: 5, 觀察值數目: 748
台灣新竹捐血資料 (source: Prof. I-Cheng Yeh, 中華大學資管系)
- (C1) Recency : 距離上次捐血的時間(月)
- (C2) Frequency : 累積捐血次數
- (C3) Monetary : 累積捐血量
- (C4) Time : 距離第一次捐血的時間(月)
- (C5) March2007 : 1 or 0, 是否在 2007 年三月捐血
(View data)
|
boston |
[ 資料探勘 ] 變數數目: 13, 觀察值數目: 350
Boston 住宅區資料
- (C1) Crime : 犯罪率
- (C2) Lots : 大型公共區域比例
- (C3) Industry : 工業比例
- (C4) CHAS : Charles River dummy variable
- (C5) NO : 空氣中的一氧化氮比例(ppm)
- (C6) Rooms : 平均每戶的房間數目
- (C7) Owner : 1940 年之前所建的自宅比例
- (C8) WorkDistance : 距離上班商業中心地點的英哩數
- (C9) HwyDistance : 距離主要高速公路網路的英哩數
- (C10) Tax : 房屋與土地相關的 Tax 比例
- (C11) Teacher : 平均 學生 vs. 教師比例
- (C12) Racial : 與種族有關的數據
- (C13) LowIncome : 低收入戶比例
- (C14) Class : 住宅區評價:Top 20% 或 Bottom 80%
(View data)
|
car |
[ 資料探勘 ] 變數數目: 9, 觀察值數目: 406
406 輛汽車的資料 (1993)
- (C1) Country : 區域類別(是否美國生產)
- (C2) Mpg : Miles per gallon(每加侖可跑哩數)
- (C3) Cylinder : 汽缸數目
- (C4) Displacement : 排氣量
- (C5) HorsePower : 馬力
- (C6) Weight : 重量
- (C7) Acceleration : 加速至車速 60 miles 的秒數
- (C8) Year : 車齡
- (C9) Origin : 生產區域代號(1:US,2:Europe,3:Japan)
(View data)
|
iris |
[ 資料探勘 ] 變數數目: 5, 觀察值數目: 150
資料探勘: iris data
- (C1) SepalLength : 花萼長度
- (C2) SepalWidth : 花萼寬度
- (C3) PetalLength : 花瓣長度
- (C4) PetalWidth : 花瓣寬度
- (C5) Species : 種類
(View data)
|
lung |
[ 資料探勘 ] 變數數目: 10, 觀察值數目: 228
Mayo Clinic 肺癌病人資料
- (C1) inst : 醫療機構的編號
- (C2) time : 存活時間 (days)
- (C3) status : 狀態. 1=censored, 2=dead
- (C4) age : 年齡
- (C5) sex : 性別
- (C6) ph.ecog : ECOG 分數 (0 = good ~ 5 = dead )
- (C7) ph.karno : Karnofsky 分數,由醫生判斷 (0 = bad ~ 100 = good)
- (C8) pat.karno : Karnofsky 分數, 病人自行判斷
- (C9) meal.cal : 用餐的卡路里含量
- (C10) wt.loss : 過去六個月的體重減輕量(負數表示體重增加)
(View data)
|
TS3a |
[ 時間數列 ] 變數數目: 25, 觀察值數目: 97
台灣股價指數與個別產業指數 (2001/12 到 2002/4)
- (C1) Date : 民國年份
- (C2) TWindex : 台灣加權指數
- (C3) Number : 成交股數
- (C4) Cement : 水泥類股
- (C5) Foods : 食品類股
- (C6) Plastics : 塑膠類股
- (C7) Textiles : 紡織纖維類股
- (C8) ElecMach : 電機機械類股
- (C9) ElecAppl : 電器電纜類股
- (C10) Chemicals : 化學類股
- (C11) Glass : 玻璃陶瓷類股
- (C12) Paper : 造紙類股
- (C13) Steel : 鋼鐵類股
- (C14) Rubber : 橡膠類股
- (C15) Car : 汽車類股
- (C16) Electron : 電子股
- (C17) Construction : 營造類股
- (C18) Transport : 運輸類股
- (C19) Tourism : 觀光類股
- (C20) Finance : 金融保險類股
- (C21) Wholesale : 百貨貿易類股
- (C22) Others : 其他類股
- (C23) Cement : 水泥窯製類股
- (C24) Plastics : 塑膠化工類股
- (C25) Electr : 機電類股
(View data)
|
cpi |
[ 時間數列 ] 變數數目: 3, 觀察值數目: 240
台灣消費者物價指數資料, 1982 1 月到 2001 年 12 月
- (C1) time : 西元年月
- (C2) CPI : 消費者物價指數
- (C3) whole.sale : 躉售物價指數
(View data)
|
dow |
[ 時間數列 ] 變數數目: 5, 觀察值數目: 443
美國道瓊指數從 1991 1 月到 2000 年 10 月數據
- (C1) Date : 年月
- (C2) Open : 當日開市指標
- (C3) High : 當日最高指數
- (C4) Low : 當日最低指數
- (C5) Close : 當日閉市指數
(View data)
|
fraser |
[ 時間數列 ] 變數數目: 1, 觀察值數目: 946
Fraser River at Hope, 每月平均水流量 (CMS),1912.3-1991.12 (View data)
|
ind |
[ 時間數列 ] 變數數目: 6, 觀察值數目: 240
台灣工業指數資料 (1), 1982 1 月到 2001 年 12 月
- (C1) time : 西元年月
- (C2) total : 總指數
- (C3) food : 食品業
- (C4) can : 罐頭食品業
- (C5) beer : 啤酒業
- (C6) drink : 不含酒精飲料業
(View data)
|
ind2 |
[ 時間數列 ] 變數數目: 6, 觀察值數目: 240
台灣工業指數資料 (2), 1982 1 月到 2001 年 12 月
- (C1) time : 西元年月
- (C2) car : 汽車業
- (C3) autobike : 機車業
- (C4) toy : 玩具業
- (C5) power : 電力供應業
- (C6) gas : 氣體燃料供應業
(View data)
|
lynx |
[ 時間數列 ] 變數數目: 3, 觀察值數目: 64
加拿大北部 McKenzie River 區的山貓 (lynx) 與 貂 (mink) 的年度補抓數量 (1848 到 1911)
- (C1) Year : 西元年份
- (C2) Lynx : 被補抓的山貓數量
- (C3) Mink : 被補抓的貂數量
(View data)
|
man |
[ 時間數列 ] 變數數目: 5, 觀察值數目: 240
台灣勞動力數據, 1982 1 月到 2001 年 12 月
- (C1) time : 西元年月
- (C2) population : 總人口數
- (C3) labor : 勞動力
- (C4) employed : 就業勞動力
- (C5) unemployed : 失業勞動力
(View data)
|
nino |
[ 時間數列 ] 變數數目: 2, 觀察值數目: 598
海洋表面溫度. Nino 3 and Nino 3.4 指標 (1950.1 到 1999.10) (View data)
|
ozone |
[ 時間數列 ] 變數數目: 1, 觀察值數目: 216
Ozone concentration (臭氧濃度) , downtown L.A. 1955.1-1972.12 (View data)
|