さて、本日は 「SUUMO の中古物件情報を Tableau で分析してみる ~データ分析編~」です。前回のエントリーで SUUMO の情報をスクレイピングしましたが、今回はTableau を使ってそのデータを分析してみようと思います。
なお、本シリーズは以下3エントリーにわたって SUUMO の中古物件情報を扱います。本エントリーはデータ分析編です。
- データ収集編
- 分析に必要なデータを収集します。
- データ分析編
- 収集したデータの分析を行います。
- ]データ予測編](https://www.gis-py.com/entry/suumo-predict)
- 機械学習を使用して物件価格の推論を行います。
使用するデータ
- 前回のエントリーで作成した property.csv
- 全国市区町村界データ
- ESRIジャパンさんが公開しているデータです。最近は本ブログのメインテーマである GIS 要素が少なかったので今回は GIS 的に分析しようと思います。
環境
Windows10 64bit
Tableau Desktop Public Edition 2021.1.0
分析
区ごとの販売価格傾向(平均)
上段が中古マンション、下段が中古一戸建てです。また、価格が高いほど色がオレンジ色に近くなっています。
傾向
- 中古マンション
- 以外にも区ごとに大きな差はありませんでした。ただ、やはり西区や中区などの繁華街が他の区と比べると価格が高い傾向にありますね。
- 中古一戸建て
- 中古マンションに比べると差が出ましたね。中区に加えて東京寄りの区が他の区と比べると価格が高い傾向にありますね。西区の価格が低いことが少し意外でした。
ちなみに中央値で見てみると以下のようになります。 中古マンションの平均販売価格で分析した傾向(西区や中区では価格が高い)が見れなくなりました。一部の高額なマンションが平均を押し上げていた可能性が高いですね。
間取りを4LDK以上(私が望む間取り)に絞る
中古マンション
一気に平均価格が上がりましたね。
中古一戸建て
むむむ、一戸建てだと平均5000万円以上の区が多くなりましたね。中古なのになんという値段でしょう・・・
中央値で見たら少し現実的な値段になった気がします。ここからの分析はすべて中央値で見てみようと思います。それでも西区などの繁華街、青葉区や都筑区などのハイソなエリアに家を買うのは現実的ではないことがわかりました。
世帯人数を確認
世帯人数が多いほど色がオレンジ色に近くなっています。オレンジ色の区はファミリー層が多く住んでいると考えられますね。私が狙うべきは以下の条件でしょうか。
- ファミリー層が多い区
- 価格が安めの物件が多い区
中古マンション
泉区や瀬谷区など郊外の区にファミリー層が多く住んでいることがわかります。
中古一戸建て
こちらも傾向は中古マンションと同じですね。
交通の便なども考えると「港南区」「戸塚区」あたりが落としどころな気がしますね。
バスを使用しない物件に絞る
今までの分析結果に加えてバスを使わない物件に絞ってみます。やはりバスは使用したくないですしね。
中古マンション
以外にも価格はあまり上がりませんでした。
中古一戸建て
こちらも同じで価格はあまり上がりませんでした。
最寄駅徒歩10分以内に絞る
今までの分析結果に加えて最寄駅徒歩10分以内の物件に絞ってみます。日常生活や売却のことを考えたらやはり駅近がいいですしね。
中古マンション
価格がぐっと上がりました。しかし、西区のデータが見えなくなってしまいました。データ不足ですね。
中古一戸建て
こちらも価格がぐっと上がりました。こちらもデータ不足で栄区のデータが見えなくなってしまいました。
価格的に駅近物件を手にするのは少しハードルが高そうですね。
路線ごとの販売価格傾向(中央値)
これ以降は地図上ではなくグラフでデータ分析を行います。
中古マンション
人気の東横線エリアの価格が高いことがわかります。
中古一戸建て
みなとみらい線が圧倒的すぎます。ちょっとこの辺に家を買うことは現実的とは思えないですね。
駅ごとの販売価格傾向(中央値)
中古マンション
石川町の価格が圧倒的に高いですね。さすが横浜随一の高級住宅街といったところでしょうか。
中古一戸建て
みなとみらい線の価格を押し上げていたのは元町・中華街のようですね。そして、東白楽や生麦の価格が高いのが不思議です。外れ値が入ってしまっているのしれませんね。
さいごに
淡々と分析結果を貼っただけですが、いかがでしたでしょうか?データさえあれば Tableau を使って今回紹介したような分析が簡単にできます。また、以下のようなデータを追加するとより面白い結果を得ることができる気がします。
- 各区の病院数、学校数、交番数
- 各区の企業数
- 各区の平均年収
- 地盤データ
- etc
次回はいよいよ本シリーズの最後であるデータ予測編です。どんな結果になるかわかりませんが、楽しみにしててください。本日は以上です。