起因於最近正在找台北的房子,希望短期內能找到一個離學校不遠但價錢尚能接受的住處,而長期而言,也希望畢業後能在台北找到不錯的房子,對於可能影響台北房價的因素必須有一定的了解,如地區性、交通便利性、屋齡、主要建材等等,而在此次的作業中希望能透過單位面積的價位區分出房價會如何座落在台北各區。
本資料提供建物交易、用途、車位、建物情況等,此次分析主要觀察單價每平方公尺的價格在不同地區的高低,但由於租金總額元大多數資料不全,而由內政部不動產交易查詢服務網推得租賃總額(元/月)/總坪數(坪) = 單價每平方公尺
head(taipei_rent)
## 鄉鎮市區 租賃標的 土地區段位置或建物區門牌
## 1 內湖區 建物 臺北市內湖區內湖路一段301~330號
## 2 內湖區 建物 臺北市內湖區內湖路一段387巷1~30號
## 3 內湖區 建物 臺北市內湖區南京東路六段331~360號
## 4 內湖區 建物 臺北市內湖區洲子街31~60號
## 5 中山區 建物 臺北市中山區植福路301~330號
## 6 松山區 房地(土地+建物) 臺北市松山區南京東路五段1~30號
## 租賃總面積平方公尺 都市土地使用分區 非都市土地使用分區
## 1 0.0 商 NA
## 2 0.0 住 NA
## 3 0.0 工 NA
## 4 0.0 工 NA
## 5 0.0 商 NA
## 6 37.9 商 NA
## 非都市土地使用編定 租賃年月日 租賃筆棟數 租賃層次 總樓層數
## 1 NA 1060815 土地0建物1車位0 一層 5
## 2 NA 1060731 土地0建物1車位1 十三層 14
## 3 NA 1060815 土地0建物1車位1 十二層 12
## 4 NA 1060727 土地0建物1車位3 四層 10
## 5 NA 1060807 土地0建物3車位1 九層 10
## 6 NA 1060815 土地1建物1車位0 十層 12
## 建物型態 主要用途 主要建材 建築完成年月
## 1 店面(店鋪) 商業用 鋼筋混凝土造 690912
## 2 住宅大樓(11層含以上有電梯) 住家用 鋼筋混凝土造 1001213
## 3 套房(1房1廳1衛) 見其他登記事項 鋼筋混凝土造 970407
## 4 辦公商業大樓 工業用 鋼筋混凝土造 920923
## 5 辦公商業大樓 見其他登記事項 見其他登記事項 1041027
## 6 住宅大樓(11層含以上有電梯) 商業用 鋼筋混凝土造 711202
## 租賃總面積平方公尺.1 建物現況格局.房 建物現況格局.廳 建物現況格局.衛
## 1 209.56 0 0 0
## 2 293.45 4 1 2
## 3 41.03 1 1 1
## 4 194.41 1 0 0
## 5 671.50 0 0 0
## 6 378.04 0 0 0
## 建物現況格局.隔間 有無管理組織 有無附傢俱 總額元 單價每平方公尺 車位類別
## 1 無 無 無 215689 1029
## 2 有 有 有 105000 358 坡道平面
## 3 有 有 有 25000 609 坡道平面
## 4 有 有 有 86451 445 坡道平面
## 5 無 有 無 308668 460 坡道平面
## 6 無 有 有 140000 370
## 租賃總面積平方公尺.2 租金總額元 備註 編號
## 1 0.00 0 RPXPMLQKQHMFFCA66CC
## 2 34.77 0 RPQSMLQKQHMFFCA88CC
## 3 0.00 0 RPRSMLQKQHMFFCA98CC
## 4 0.00 0 RPUTMLQKQHMFFCA76CC
## 5 0.00 0 RPVTMLQKQHMFFCA86CC
## 6 0.00 0 RPPNMLQKQHMFFDA38CC
因分析對象為出租型態為住家使用,因此篩選出以下三種類別:住宅大樓(11層含以上有電梯),公寓(5樓含以下無電梯),套房(1房1廳1衛)
head(taipei_target_rent)
## 鄉鎮市區 租賃標的 土地區段位置或建物區門牌
## 1 內湖區 建物 臺北市內湖區內湖路一段387巷1~30號
## 2 內湖區 建物 臺北市內湖區南京東路六段331~360號
## 3 松山區 房地(土地+建物) 臺北市松山區南京東路五段1~30號
## 4 信義區 建物 臺北市信義區基隆路二段151~180號
## 5 南港區 房地(土地+建物) 臺北市南港區重陽路451~480號
## 6 信義區 建物 臺北市信義區松勤街1~30號
## 租賃總面積平方公尺 都市土地使用分區 非都市土地使用分區
## 1 0.00 住 NA
## 2 0.00 工 NA
## 3 37.90 商 NA
## 4 0.00 商 NA
## 5 58.12 商 NA
## 6 0.00 其他 NA
## 非都市土地使用編定 租賃年月日 租賃筆棟數 租賃層次 總樓層數
## 1 NA 1060731 土地0建物1車位1 十三層 14
## 2 NA 1060815 土地0建物1車位1 十二層 12
## 3 NA 1060815 土地1建物1車位0 十層 12
## 4 NA 1060808 土地0建物1車位0 十層 15
## 5 NA 1060811 土地1建物1車位0 七層 12
## 6 NA 1060801 土地0建物1車位0 十九層 19
## 建物型態 主要用途 主要建材 建築完成年月
## 1 住宅大樓(11層含以上有電梯) 住家用 鋼筋混凝土造 1001213
## 2 套房(1房1廳1衛) 見其他登記事項 鋼筋混凝土造 970407
## 3 住宅大樓(11層含以上有電梯) 商業用 鋼筋混凝土造 711202
## 4 住宅大樓(11層含以上有電梯) 住家用 鋼筋混凝土造 990901
## 5 住宅大樓(11層含以上有電梯) 見其他登記事項 鋼筋混凝土造 1010531
## 6 住宅大樓(11層含以上有電梯) 住家用 見其他登記事項 961225
## 租賃總面積平方公尺.1 建物現況格局.房 建物現況格局.廳 建物現況格局.衛
## 1 293.45 4 1 2
## 2 41.03 1 1 1
## 3 378.04 0 0 0
## 4 105.66 2 2 1
## 5 291.62 0 0 0
## 6 49.57 1 1 1
## 建物現況格局.隔間 有無管理組織 有無附傢俱 總額元 單價每平方公尺 車位類別
## 1 有 有 有 105000 358 坡道平面
## 2 有 有 有 25000 609 坡道平面
## 3 無 有 有 140000 370
## 4 有 有 有 60000 568
## 5 無 有 無 64000 219
## 6 有 有 有 30000 605
## 租賃總面積平方公尺.2 租金總額元 備註 編號
## 1 34.77 0 RPQSMLQKQHMFFCA88CC
## 2 0.00 0 RPRSMLQKQHMFFCA98CC
## 3 0.00 0 RPPNMLQKQHMFFDA38CC
## 4 0.00 0 租金內含大樓管理費。 RPXNMLQKQHMFFDA56CC
## 5 0.00 0 RPUOMLQKQHMFFDA98CC
## 6 0.00 0 RPWOMLQKQHMFFDA56CC
個人認為因房地產與土地位址息息相關,適合將結果與地圖結合,因此根據土地區段位置或建物區門牌
利用google map api得到各地址的經緯度
head(location_from_api)
## lat lng location_type
## 1 25.0822416 121.5703474 ROOFTOP
## 2 25.0583026 121.5844348 RANGE_INTERPOLATED
## 3 Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT
## 4 Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT
## 5 25.0594639 121.61015 ROOFTOP
## 6 25.0322281 121.5604846 ROOFTOP
## address
## 1 No. 1, Alley 3, Lane 387, Section 1, Neihu Road, Neihu District, Taipei City, Taiwan 114
## 2 No. 331, Section 6, Nanjing East Road, Neihu District, Taipei City, Taiwan 114
## 3 Status:OVER_QUERY_LIMIT
## 4 Status:OVER_QUERY_LIMIT
## 5 No. 451, Chongyang Road, Nangang District, Taipei City, Taiwan 115
## 6 No. 1, Songqin Street, Xinyi District, Taipei City, Taiwan 110
將單價每平方公尺價格以每100元為區間,分割結果如下,定義600元以上為較高的房屋價格,600元以下則反之
table(cut(taipei_target_rent$單價每平方公尺,breaks = 100*(1:10)))
##
## (100,200] (200,300] (300,400] (400,500] (500,600] (600,700]
## 12 53 62 62 38 26
## (700,800] (800,900] (900,1e+03]
## 12 2 0
利用package提供之tune方法找出最佳model parameters,建立模型並畫出結果
svm_tune = tune(svm, train.x=dat[,c(1,2)], train.y=label,
kernel="radial", ranges=list(cost=10^(-1:2), gamma=c(.5,1,2)))
print(svm_tune)
##
## Parameter tuning of 'svm':
##
## - sampling method: 10-fold cross validation
##
## - best parameters:
## cost gamma
## 100 0.5
##
## - best performance: 0.1905082
svm_model = svm(label ~ .,data = dat,kernel = "radial",cost = 1,gamma = 1)
plot(svm_model,dat)
#plot the house location on the map
map <- get_map(location = c(lon = 121.564433,lat = 25.037785), zoom = 12,
language = "zh-TW",maptype = "roadmap")
## Source : https://maps.googleapis.com/maps/api/staticmap?center=25.037785,121.564433&zoom=12&size=640x640&scale=2&maptype=roadmap&language=zh-TW
ggmap(map,darken = c(0.2,"white")) + geom_point(aes(x = lng,y = lat,colour = label),data = dat) +
labs(x = "Latitude",y = "Longtitude") +
scale_colour_discrete(name = "House Price",labels = c("Cheap","Expensive"))
由performance與圖中其實可觀察到svm的表現不佳,推測可能因為影響房地產價格的原因十分眾多,只根據房屋地址推估房地產價格過於粗略,改善方向為考慮其他可能重大影響因素。