【R】中古マンション販売価格と賃貸物件家賃の分析 (3)

今回は, 前回収集した春季の中古マンション販売価格と賃貸物件家賃のデータを今回収集した夏季のデータと比較して, どの程度傾向に変化があるかを分析してみます。

賃貸物件家賃の分析

今回は, 4,259件 (豊島区 1,565件, 川口市 2,193件, 習志野市 501件)でした。サンプルサイズは前回と同程度です。

データの傾向確認

ggpairsで傾向の確認です。川口市の例です。

ggpairs-kawaguchi

家賃 (price)の分布が前回より正規分布に近づいています。

重回帰モデル

家賃が10万円以下の物件に絞り込んで, 分析を行います。4月/8月のデータで同じ変数を選択して比較してみました。
川口市はサンプルサイズが大きいのもあり, モデルも前回と近い偏回帰係数の推定値になりました。

# 2015年4月
Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) 44218.81     719.51  61.457  < 2e-16 ***
area          743.34      12.73  58.398  < 2e-16 ***
autolock     3249.08     496.38   6.546 7.63e-11 ***
distance     -257.27      26.70  -9.635  < 2e-16 ***
lpg         -3544.82     367.35  -9.650  < 2e-16 ***
structure    2547.32     228.64  11.141  < 2e-16 ***
year_built   -296.92      16.66 -17.820  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 7083 on 1877 degrees of freedom
Multiple R-squared:  0.6992,	Adjusted R-squared:  0.6982
F-statistic: 727.2 on 6 and 1877 DF,  p-value: < 2.2e-16

# 2015年8月
Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) 41416.46     701.15  59.069   <2e-16 ***
area          831.40      11.50  72.267   <2e-16 ***
autolock     4146.30     474.16   8.744   <2e-16 ***
distance     -284.63      27.71 -10.270   <2e-16 ***
lpg         -3519.57     371.45  -9.475   <2e-16 ***
structure    2765.36     225.90  12.242   <2e-16 ***
year_built   -293.39      15.72 -18.665   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 7689 on 2187 degrees of freedom
Multiple R-squared:  0.7582,	Adjusted R-squared:  0.7575
F-statistic:  1143 on 6 and 2187 DF,  p-value: < 2.2e-16

オートロックの有無が900円近く高くなっていますが, 他の偏回帰係数の変化は小さく, 全体的には定数項が3,000円近く安くなっています。
従って, 春季より夏季の方がやはり家賃は安くなる傾向にありそうです。

4月/8月のデータにseason変数を追加後, マージして分析してみました。
対応のあるデータと対応のないデータが混ざっており, この操作は間違っている気がしますが, seasonの効果を大まかに把握するには便利かもしれません。

# 2015年4月/8月の合成
Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  40356.323    606.408  66.550  < 2e-16 ***
area           940.060      9.427  99.723  < 2e-16 ***
autolock      9023.462    386.800  23.329  < 2e-16 ***
distance      -396.539     23.751 -16.696  < 2e-16 ***
lpg          -5047.944    321.470 -15.703  < 2e-16 ***
year_built    -262.451     13.864 -18.931  < 2e-16 ***
seasonspring  1640.039    286.184   5.731 1.07e-08 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 9321 on 4277 degrees of freedom
Multiple R-squared:  0.738,	Adjusted R-squared:  0.7376 
F-statistic:  2008 on 6 and 4277 DF,  p-value: < 2.2e-16

川口市に関しては, 春季は夏季に比べ 1,640円程度高くなる効果がありそうです。

続いて, 習志野市のモデルは下記です。春季には表れなかった宅配ボックスがP値 2e-16以下で有意に表れました。
偏回帰係数が35,176と非常に高くなっています。そもそも習志野市では宅配ボックス付きの物件は 88/502=17.56%と豊島区の36%に比べて少ないです。ちなみに, 川口市は僅か6%。

# 2015年8月
Coefficients:
                Estimate Std. Error t value Pr(>|t|)
(Intercept)     41576.18    2024.18  20.540  < 2e-16 ***
area             1080.74      27.70  39.009  < 2e-16 ***
delivery_box    29374.32    1951.39  15.053  < 2e-16 ***
distance         -516.29      79.21  -6.518 1.76e-10 ***
year_built       -822.74      56.97 -14.442  < 2e-16 ***
is_near_tsudanuma 12012.55  1379.29  8.709  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 12760 on 496 degrees of freedom
Multiple R-squared:  0.9023,	Adjusted R-squared:  0.9013
F-statistic: 916.5 on 5 and 496 DF,  p-value: < 2.2e-16

習志野市モデルでも川口市同様, 4月/8月のデータをマージして分析しましたが, season変数は有意な結果にはなりませんでした。
市区町村の季節別人口増減率がわかれば, この辺もよりわかってくる気がします。

豊島区の重回帰モデルでは, 前回と大きく説明変数が変わりました。
春季と比べて家賃に対して影響の大きい特徴が変化したとは考えにくいような気もしますが, もう少し分析を継続してみようと思います。
もしかしたら, サンプルのバイアスかもしれません。

3つの市区の偏回帰係数をまとめた図です。

coefplot-rental

同一物件の春季からの追跡をしたかったのですが, 夏季と codeが一致していても物件の住所が異なっている場合 [1]があったので諦めました。codeは問い合わせ用の数値なのかもしれません。

中古マンション販売価格の分析

今回は, 988件 (豊島区 385件, 川口市 438件, 習志野市 165件)でした。サンプルサイズは川口市と習志野市は微増です。

データの傾向確認

ggpairsで傾向の確認です。豊島区の例です。

ggpairs-toshima

同一物件の春季と夏季の比較

中古マンション販売価格が1億円以下の物件に絞り込んで, 分析を行います。
nameが一致する物件, つまり成約などの理由で掲載終了にならずに追跡できている物件の中で, 前回 (2015/03)と比較して販売価格が値上がり・値下がりした物件をカウントしてみました。

city-compare-bar

値下がりした物件数は川口市, 習志野市では半数近く, 豊島区では約1/3程度でした。
また, 値上がりした物件における平均値上がり率は59%と, 川口市の15%や習志野市の34%と比較しても高くなっています。

> apply(high, 1, mean)
  price_new price_past   diff
   5913.886   3717.114   2196.771

> apply(low, 1, mean)
  price_new price_past   diff
  3745.7679  4536.3036   790.5357

全体的に, 春に比べて値下がりした物件数は多いですが値下がり率は低く, 値上がりした物件は少ない分, 値上がり率は高い傾向にありました。

重回帰モデル

5月/8月で同じ変数を選択して比較してみます。結果は, 習志野市のモデルが大きく変わりました。

# 2015年4月
Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) 1386.974    284.112   4.882 3.03e-06 ***
area          22.233      3.390   6.558 1.17e-09 ***
year_built   -37.639      4.657  -8.082 3.84e-13 ***
distance     -59.846     11.711  -5.110 1.12e-06 ***
floor      66.656     17.694   3.767 0.000249 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 547.9 on 130 degrees of freedom
Multiple R-squared:  0.5476,	Adjusted R-squared:  0.5337
F-statistic: 39.34 on 4 and 130 DF,  p-value: < 2.2e-16

# 2015年7月
Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) 2126.000    336.165   6.324 2.40e-09 ***
area          17.197      3.995   4.304 2.90e-05 ***
year_built   -41.629      4.378  -9.508  < 2e-16 ***
distance     -64.042     12.435  -5.150 7.52e-07 ***
floor      69.698     17.958   3.881 0.000151 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 651.8 on 161 degrees of freedom
Multiple R-squared:  0.5626,	Adjusted R-squared:  0.5517
F-statistic: 51.77 on 4 and 161 DF,  p-value: < 2.2e-16

3つの市区にはそれぞれ比較的大きな駅があります。川口市は川口駅, 習志野市は津田沼駅, 豊島区は池袋駅です。
物件から最も近い駅が, 上記3つの駅であれば 1とする変数を追加しました。
川口市では最寄駅が川口駅だと, 540万円程度高くなる傾向がありそうです。

# 2015年7月
Coefficients:
                Estimate Std. Error t value Pr(>|t|)
(Intercept)      983.063    127.997   7.680 1.07e-13 ***
area              28.418      1.608  17.677  < 2e-16 ***
year_built       -32.781      2.193 -14.950  < 2e-16 ***
distance         -26.723      2.808  -9.516  < 2e-16 ***
floor             41.552      4.746   8.755  < 2e-16 ***
is_near_kawaguchi 539.081    48.047  11.220  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 444.4 on 433 degrees of freedom
Multiple R-squared:  0.756,	Adjusted R-squared:  0.7532
F-statistic: 268.4 on 5 and 433 DF,  p-value: < 2.2e-16

定数項の推定値が700万円近くずれていますが, サンプルサイズが小さいのも影響していそうです。

3つの市区の偏回帰係数をまとめた図です。

coefplot-purchase

おわりに

今回は追加で江東区の中古マンションのデータを収集してみました。江東区は2020年東京オリンピック・パラリンピックでも注目を集めており, 大型新築マンションのプロジェクトも多く公開されています。
掲載されている物件は950件近くありましたが, 詳細な情報が書かれていない物件は後ろのページに回されているようで, これらは収集対象から外しました。分析に使ったのは, 収集した665件の中で1億円以上を除いた646件です。

Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
(Intercept)    1519.223    146.169  10.394  < 2e-16 ***
area             49.879      1.823  27.367  < 2e-16 ***
distance        -31.754      2.529 -12.556  < 2e-16 ***
security        178.840     57.257   3.123  0.00187 ** 
floor            54.250      2.869  18.907  < 2e-16 ***
year_built      -40.884      2.310 -17.700  < 2e-16 ***
is_near_toyosu  748.107     84.471   8.856  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 618.1 on 639 degrees of freedom
Multiple R-squared:  0.8862,	Adjusted R-squared:  0.8852 
F-statistic: 829.6 on 6 and 639 DF,  p-value: < 2.2e-16

江東区の1億円以下の物件では, 最寄り駅が豊洲駅ではなく高層マンションでなければそこまで高くなさそうで, 分析前の予想とは異なっていました。

仕事が忙しくならなければ, 秋季もデータ収集してみようと思います。
今のところ中古マンションの購入を検討する地域としては, 今後人口減少する中で値下がりしにくい首都圏, 特に東京都内がいいのかなという印象です。時期としては, 東京オリンピック後や次なる不動産バブル崩壊によりファンダメンタル以上に値下がりした時を狙いたいと思います。


[1] この住所は完全な住所ではない