2015年11月28日土曜日

アドレスマッチングの見える化

小字地名データベース作成活用プロジェクト 41

国勢調査の町丁・字等別境界データを入手してGISにプロットしましたので、結果的にアドレスマッチングの見える化が実現しました。

これまで、アドレスマッチングを多用していますが、そしてその原理は理解しているつもですが、実際の「マッチ」がどのように行われているのかは、自分にとってはブラックボックスでした。

東京大学空間情報科学研究センターのアドレスマッチングサービスを利用していますから、完全な東京大学まかせでした。

しかし、千葉県北部34市町域の小字全部(約46500)をアドレスマッチングでプロットしたものと、境界データを重ねることができますので、アドレスマッチングの有様が広域について、見える化しました。

千葉県北部34市町 小字全部のアドレスマッチングプロットと国勢調査の町丁・字等別境界データ

同上拡大図(部分) 基図 色別標高図(やや薄く)

同上拡大図(部分) 基図 標準地図

昭和59年発行図書(角川千葉県地名大辞典)の小字から最新市町村に対応した所在地表示を生成して、それをアドレスマッチングすると、上記のような分布図になるということが判りました。

アドレスマッチング結果が見える化したことによりいくつかの感想と課題が浮かび上がりました。

感想
大半の境界(大字)ではその中心部付近にドット位置がプロットされていて、確かにアドレスマッチングの原理が実行されていることを確認できました。
また高度成長期以前の市街地部では昭和59年時点大字(町丁目)と細分化された境界データが対応していてより精細な分布状況が判ることも確認できました。

地図上でこうした確認ができたことはアドレスマッチングの有用性を確認できたことになります。

課題 ア
・ドットがプロットされていない町丁・字等別境界がありますから次のような可能性をチェックする必要があります。
1 角川千葉県地名大辞典の小字リストが土地全部を網羅していない可能性がある。
2 アドレスマッチングに使った小字の所在地表記が現在の住所表示と異なっている可能性がある。
3 アドレスマッチングシステムサイドに不具合がある。

3の可能性はゼロと考えます。

2の可能性は大いにありうると考えます。

現在の小字所在地表記は「市町村名」+「昭和59年時点の大字(町丁目)名」+「小字名」です。

昭和59年以降開発地番整理された地域について、この表記を現在使われている住所表示に修正変更する必要性があります。

1の可能性はこれまで全く考えてこなかったのですが、あり得ます。自分にとって盲点でした。

課題 イ
・町丁・字等別境界の中心にドットがプロットされていない
1 アドレスマッチングシステムが使っている境界データが平成22年国勢調査境界データと異なる。
2 アドレスマッチングシステムが所持する境界中心データに誤差がある。

1、2ともその可能性があります。この問題はアドレスマッチング結果を自分で手作業で修正するしかありません。



アドレスマッチングの様相が見える化して、それを利用する際の自分にとっての課題を明瞭に意識できたことはとてもよかったと思います。


今後は課題アに対応した後、アドレスマッチング結果(小字リストの位置情報csvファイル)を、個々データを自分が理解して修正等を行い、正確なcsvファイルに直して、GISにプロットするという作業になると考えます。

その時にはアドレスマッチングの最適投入データを作成するという視点は2の次、3の次にランクを下げています。

なお、境界データは図面上にあるだけでなく、csvファイルとして存在しているのですから、データベースソフトのリレーション機能を工夫して活用すれば、小字データと境界データのマッチングを自分で行うことも可能であると考えます。




0 件のコメント:

コメントを投稿