2016年7月11日月曜日

試用に基づく千葉県小字データベースの改良点

鏡味完二の地名型検討(予察検討)に作成したての千葉県小字データベース(小字数94000)を試用して、データベースとしての問題点を把握し、その改善や改良方向をまとめてみました。

試用により問題点の多くは改善されるか、改善できる目途が立ちました。

1 千葉県小字データベースの問題点

1-1 図書から電子化する際に生じた誤り

図書(角川千葉県地名大辞典)から電子化する際に次のような誤りが生まれました。

試用のなかで判明した誤りは、そのタイプ毎に同様に誤りを全体を対象に検索により見つけ出し、訂正する作業を逐次しています。

大きな誤りはほとんど無くなっています。

・語の誤り例(誤と正が反転する場合もある)

誤   正

エ   工
ー   一
ニ   二
ロ   口
カ   力
,    、
千   干
タ   夕

・その他
レコードの重複
表記とルビのズレ
など

1-2 電子化できない漢字

難字や創作した漢字があり、電子化できないため現在は〓で表示しています。
今後このままの表記〓にするか、類似の漢字で代用するか検討します。

現在47小字の文字の中に〓を当てています。

1-3 図書に内在する誤り

図書では市町村から集まった資料は誤りと考えられるものが含まれていてもそのまま掲載したと断っています。

電子化作業中に誤りと考えられるものがあっても、訂正するべきか否かの基準をつくることが出来なかったので、現在は図書に含まれているもともとの誤りは訂正していません。

今後市町村資料等によって確実に訂正できる誤りは訂正する予定です。

1-4 図書に内在する不都合

ルビが全て欠如している市が2市(船橋市、習志野市)あるほか、ルビが欠如している小字が散見されます。

ルビ欠如小字は船橋市と習志野市で合計1505、その他の市町村で63あります。

ルビ(よみ)による検索は地名に関して大変価値の高い検索であり、今後市町村資料等により船橋市、習志野市はもとより、他市町村についてもできる限り補正(追記)する予定です。

2 千葉県小字データベースの改良方向

大字の位置情報を取得(作成)し、小字レコードにそれを付与することにより、アドレスマッチングという操作をしないでそれと同等のGISプロットが直接できるようにします。

大字の位置情報は現在の「大字町丁目位置参照情報」(国土交通省国土政策局国土情報課)を基本にして、戦後の大幅な大字変更域は古地図(千葉県管内実測全図(1885))等を参考に補正して行う予定です。

参考 千葉県の「大字町丁目位置参照情報」全情報(5507)のGISプロット

情報は国土交通省国土政策局国土情報課からダウンロード



0 件のコメント:

コメントを投稿