動機

起因於最近正在找台北的房子,希望短期內能找到一個離學校不遠但價錢尚能接受的住處,而長期而言,也希望畢業後能在台北找到不錯的房子,對於可能影響台北房價的因素必須有一定的了解,如地區性、交通便利性、屋齡、主要建材等等,而在此次的作業中希望能透過單位面積的價位區分出房價會如何座落在台北各區。

資料概況

本資料提供建物交易、用途、車位、建物情況等,此次分析主要觀察單價每平方公尺的價格在不同地區的高低,但由於租金總額元大多數資料不全,而由內政部不動產交易查詢服務網推得租賃總額(元/月)/總坪數(坪) = 單價每平方公尺

head(taipei_rent)
##   鄉鎮市區        租賃標的          土地區段位置或建物區門牌
## 1   內湖區            建物   臺北市內湖區內湖路一段301~330號
## 2   內湖區            建物 臺北市內湖區內湖路一段387巷1~30號
## 3   內湖區            建物 臺北市內湖區南京東路六段331~360號
## 4   內湖區            建物         臺北市內湖區洲子街31~60號
## 5   中山區            建物       臺北市中山區植福路301~330號
## 6   松山區 房地(土地+建物)    臺北市松山區南京東路五段1~30號
##   租賃總面積平方公尺 都市土地使用分區 非都市土地使用分區
## 1                0.0               商                 NA
## 2                0.0               住                 NA
## 3                0.0               工                 NA
## 4                0.0               工                 NA
## 5                0.0               商                 NA
## 6               37.9               商                 NA
##   非都市土地使用編定 租賃年月日      租賃筆棟數 租賃層次 總樓層數
## 1                 NA    1060815 土地0建物1車位0     一層        5
## 2                 NA    1060731 土地0建物1車位1   十三層       14
## 3                 NA    1060815 土地0建物1車位1   十二層       12
## 4                 NA    1060727 土地0建物1車位3     四層       10
## 5                 NA    1060807 土地0建物3車位1     九層       10
## 6                 NA    1060815 土地1建物1車位0     十層       12
##                     建物型態       主要用途       主要建材 建築完成年月
## 1                 店面(店鋪)         商業用   鋼筋混凝土造       690912
## 2 住宅大樓(11層含以上有電梯)         住家用   鋼筋混凝土造      1001213
## 3            套房(1房1廳1衛) 見其他登記事項   鋼筋混凝土造       970407
## 4               辦公商業大樓         工業用   鋼筋混凝土造       920923
## 5               辦公商業大樓 見其他登記事項 見其他登記事項      1041027
## 6 住宅大樓(11層含以上有電梯)         商業用   鋼筋混凝土造       711202
##   租賃總面積平方公尺.1 建物現況格局.房 建物現況格局.廳 建物現況格局.衛
## 1               209.56               0               0               0
## 2               293.45               4               1               2
## 3                41.03               1               1               1
## 4               194.41               1               0               0
## 5               671.50               0               0               0
## 6               378.04               0               0               0
##   建物現況格局.隔間 有無管理組織 有無附傢俱 總額元 單價每平方公尺 車位類別
## 1                無           無         無 215689           1029         
## 2                有           有         有 105000            358 坡道平面
## 3                有           有         有  25000            609 坡道平面
## 4                有           有         有  86451            445 坡道平面
## 5                無           有         無 308668            460 坡道平面
## 6                無           有         有 140000            370         
##   租賃總面積平方公尺.2 租金總額元 備註                編號
## 1                 0.00          0      RPXPMLQKQHMFFCA66CC
## 2                34.77          0      RPQSMLQKQHMFFCA88CC
## 3                 0.00          0      RPRSMLQKQHMFFCA98CC
## 4                 0.00          0      RPUTMLQKQHMFFCA76CC
## 5                 0.00          0      RPVTMLQKQHMFFCA86CC
## 6                 0.00          0      RPPNMLQKQHMFFDA38CC

資料篩選

因分析對象為出租型態為住家使用,因此篩選出以下三種類別:住宅大樓(11層含以上有電梯),公寓(5樓含以下無電梯),套房(1房1廳1衛)

head(taipei_target_rent)
##   鄉鎮市區        租賃標的          土地區段位置或建物區門牌
## 1   內湖區            建物 臺北市內湖區內湖路一段387巷1~30號
## 2   內湖區            建物 臺北市內湖區南京東路六段331~360號
## 3   松山區 房地(土地+建物)    臺北市松山區南京東路五段1~30號
## 4   信義區            建物   臺北市信義區基隆路二段151~180號
## 5   南港區 房地(土地+建物)       臺北市南港區重陽路451~480號
## 6   信義區            建物          臺北市信義區松勤街1~30號
##   租賃總面積平方公尺 都市土地使用分區 非都市土地使用分區
## 1               0.00               住                 NA
## 2               0.00               工                 NA
## 3              37.90               商                 NA
## 4               0.00               商                 NA
## 5              58.12               商                 NA
## 6               0.00             其他                 NA
##   非都市土地使用編定 租賃年月日      租賃筆棟數 租賃層次 總樓層數
## 1                 NA    1060731 土地0建物1車位1   十三層       14
## 2                 NA    1060815 土地0建物1車位1   十二層       12
## 3                 NA    1060815 土地1建物1車位0     十層       12
## 4                 NA    1060808 土地0建物1車位0     十層       15
## 5                 NA    1060811 土地1建物1車位0     七層       12
## 6                 NA    1060801 土地0建物1車位0   十九層       19
##                     建物型態       主要用途       主要建材 建築完成年月
## 1 住宅大樓(11層含以上有電梯)         住家用   鋼筋混凝土造      1001213
## 2            套房(1房1廳1衛) 見其他登記事項   鋼筋混凝土造       970407
## 3 住宅大樓(11層含以上有電梯)         商業用   鋼筋混凝土造       711202
## 4 住宅大樓(11層含以上有電梯)         住家用   鋼筋混凝土造       990901
## 5 住宅大樓(11層含以上有電梯) 見其他登記事項   鋼筋混凝土造      1010531
## 6 住宅大樓(11層含以上有電梯)         住家用 見其他登記事項       961225
##   租賃總面積平方公尺.1 建物現況格局.房 建物現況格局.廳 建物現況格局.衛
## 1               293.45               4               1               2
## 2                41.03               1               1               1
## 3               378.04               0               0               0
## 4               105.66               2               2               1
## 5               291.62               0               0               0
## 6                49.57               1               1               1
##   建物現況格局.隔間 有無管理組織 有無附傢俱 總額元 單價每平方公尺 車位類別
## 1                有           有         有 105000            358 坡道平面
## 2                有           有         有  25000            609 坡道平面
## 3                無           有         有 140000            370         
## 4                有           有         有  60000            568         
## 5                無           有         無  64000            219         
## 6                有           有         有  30000            605         
##   租賃總面積平方公尺.2 租金總額元                 備註                編號
## 1                34.77          0                      RPQSMLQKQHMFFCA88CC
## 2                 0.00          0                      RPRSMLQKQHMFFCA98CC
## 3                 0.00          0                      RPPNMLQKQHMFFDA38CC
## 4                 0.00          0 租金內含大樓管理費。 RPXNMLQKQHMFFDA56CC
## 5                 0.00          0                      RPUOMLQKQHMFFDA98CC
## 6                 0.00          0                      RPWOMLQKQHMFFDA56CC

房屋位址

個人認為因房地產與土地位址息息相關,適合將結果與地圖結合,因此根據土地區段位置或建物區門牌利用google map api得到各地址的經緯度

head(location_from_api)
##                       lat                     lng           location_type
## 1              25.0822416             121.5703474                 ROOFTOP
## 2              25.0583026             121.5844348      RANGE_INTERPOLATED
## 3 Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT
## 4 Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT Status:OVER_QUERY_LIMIT
## 5              25.0594639               121.61015                 ROOFTOP
## 6              25.0322281             121.5604846                 ROOFTOP
##                                                                                    address
## 1 No. 1, Alley 3, Lane 387, Section 1, Neihu Road, Neihu District, Taipei City, Taiwan 114
## 2           No. 331, Section 6, Nanjing East Road, Neihu District, Taipei City, Taiwan 114
## 3                                                                  Status:OVER_QUERY_LIMIT
## 4                                                                  Status:OVER_QUERY_LIMIT
## 5                       No. 451, Chongyang Road, Nangang District, Taipei City, Taiwan 115
## 6                           No. 1, Songqin Street, Xinyi District, Taipei City, Taiwan 110

房屋價格高低定義

將單價每平方公尺價格以每100元為區間,分割結果如下,定義600元以上為較高的房屋價格,600元以下則反之

table(cut(taipei_target_rent$單價每平方公尺,breaks = 100*(1:10)))
## 
##   (100,200]   (200,300]   (300,400]   (400,500]   (500,600]   (600,700] 
##          12          53          62          62          38          26 
##   (700,800]   (800,900] (900,1e+03] 
##          12           2           0

SVM

利用package提供之tune方法找出最佳model parameters,建立模型並畫出結果

svm_tune = tune(svm, train.x=dat[,c(1,2)], train.y=label, 
     kernel="radial", ranges=list(cost=10^(-1:2), gamma=c(.5,1,2)))
print(svm_tune)
## 
## Parameter tuning of 'svm':
## 
## - sampling method: 10-fold cross validation 
## 
## - best parameters:
##  cost gamma
##   100   0.5
## 
## - best performance: 0.1905082
svm_model = svm(label ~ .,data = dat,kernel = "radial",cost = 1,gamma = 1)
plot(svm_model,dat)

利用地圖顯示房屋價格較高分佈情況

#plot the house location on the map
map <- get_map(location = c(lon = 121.564433,lat = 25.037785), zoom = 12,
               language = "zh-TW",maptype = "roadmap")
## Source : https://maps.googleapis.com/maps/api/staticmap?center=25.037785,121.564433&zoom=12&size=640x640&scale=2&maptype=roadmap&language=zh-TW
ggmap(map,darken = c(0.2,"white")) + geom_point(aes(x = lng,y = lat,colour = label),data = dat) + 
  labs(x = "Latitude",y = "Longtitude") +
  scale_colour_discrete(name = "House Price",labels = c("Cheap","Expensive")) 

結論

由performance與圖中其實可觀察到svm的表現不佳,推測可能因為影響房地產價格的原因十分眾多,只根據房屋地址推估房地產價格過於粗略,改善方向為考慮其他可能重大影響因素。