2015年4月14日火曜日

ささやかな野望

小字地名データベース作成活用プロジェクト 6

1 ささやかな野望
このブログでは、地形・考古歴史・地名等の興味を自分が居住する花見川流域や下総地域に投影して、情報操作を楽しむ趣味活動を展開しています。

最近その活動の中で、ささやかな野望が生れつつあります。

野望ですから「 分不相応な大きな望み。身の程を知らない大それた望み。野心。」(『精選版 日本語国語大辞典』 小学館)ということになります。

しかし世界制覇を目指そうというほどの大きな野望ではありません。おそらく誰にも迷惑をかけないささやかな望みです。

しかし身の程を知らない大それた望みでもあります。

私のささやかな野望とは、

千葉県全域の小字地名データベースを自前で完成させることです。

小字情報は地域の歴史を伝える貴重な文化資産であると考えます。しかし電子化されていないため、本来そこからくみ取るべき貴重な情報がほとんど汲み取られてこなかったと考えます。

歴史考古分野や地域・都市分野を含めて、社会全体が小字地名のあるべき活用を行っていないことは、社会的損失であると考えてきています。

これまでは、約93000ある千葉県全域小字リストの電子化がされているとどんなに便利だろうと、溜息まじりで何度となく考えてきました。

個人で作業するのは到底できない分量の作業と考えましたから、文化行政に電子化作業をお願いすることを考えてみたりもしました。

あるいは、何かの研究助成金を受けてアルバイトを使って作業するということも考えて見ました。

しかし、自分の個人的興味始発事項を行政にお願いして、それがいくら社会的意義が大きいといっても、行政の仕事になることは現実的には可能性ゼロのように感じます。

また、研究助成金を受けるようなことは不可能なことではないと考えますが、助成を受けると、その活動自体が趣味から仕事化してしまいます。楽しいはずの趣味活動がいつの間にか縛りの多い苦労になってしまうこと必定のように感じます。

このように、「ああだ、こうだ」といつまで考えていても埒があきません。

そうした袋小路にいた時、突然まず千葉市分だけも自分で作業してみようという気分がおこりました。そして、実行してみました。

千葉市分小字地名データベースをつくってみて、電子化作業の効率化を意外と進めることができました。

勢いに乗り、八千代市分小字地名データベースをつくると、作業効率化をさらに進めることができました。作業が楽になり、より一層作業効率化を進める余地がまだあることに気がつきました。

当初93000件(ルビ付きですから作業単位としてのワード数は186000件)の電子化を個人が行うのは「到底無理」と考えていた心理が「できるかも」に変わりました。

この心理変化により、「千葉県全域の小字地名データベースの自前完成」がささやかな野望として自分の中に成立しました。

次のマップが真っ赤に塗られるまでの作業を自前でやってみたいと思います。

小字地名データベース作成市町村(2015.04.12)

丸1年間くらいの時間以内に千葉県下全域の小字地名データベースを作成したいと思います。

恐らく、古代社会のいろいろなテーマを考える時、質の高いヒントを継続的に汲み出すことができる泉になると思います。

2 参考 千葉県小字データベース作成と一緒に進めたい検討事項
ア 房総地域における指標性のある古代地名抽出
古代社会の様子の指標となる地名の抽出を行う。例 カナクソ→鍛冶遺跡など

このブログ記事を書く中で小字地名を検討し、そのなかで今伝わる小字地名のかなりの割合が古墳時代、奈良平安時代に使われていた、あるいは命名された地名であることを実感しています。

古代に使われていた、あるいは命名された地名は特段に珍しいものではなく、どこにでも見られるありふれた地名でもあります。

ただ残念ながら、沢山ある古代地名がだれからも注目されていないため、その文化財的意義はほとんど社会に知られていません。

なお、古代に使われていた地名の一部は原始時代由来の地名です。

イ 「千葉県の歴史 通史編 古代2」附録「古代房総三国の郡・郷・里の変遷と比定地一覧」の情報の内、下総国分をGIS上で地図化する。
古代地名と対応する現代地名を収集する。

ウ 遺跡分布や発掘情報と対応する地名を収集する。
例 別記事で検討しますが、八千代市白幡前遺跡出土の集落内寺院(2群Aゾーン内)に由来して、遺跡西にある谷津に付けられた小字地名「寺谷津」が生まれたと考えます。つまり八千代市小字「寺谷津」は奈良時代に命名された地名です。

3 参考 小字データベース作成プロセス
ア 千葉県地名大辞典(角川書店)附録小字一覧のスキャン
イ OCR用画像作成
ウ OCRによるテキスト作成
エ テキスト調整
・ルビの認識間違い訂正(認識間違いはパターン化している)
・漢字の認識間違い訂正(ほとんどない)
・単位地名を区分するための句読点入力等
・ルビの追加(漢字に混じるひらがら、カタカナにルビを付けてルビをカタカナ表記情報にする)
・その他
オ 完成テキストのExcel流し込み

作業時間のほとんどは「エ テキスト調整」にかかっています。その一層の効率化を進め、作業時間の飽くなき短縮に挑みたいと思います。

0 件のコメント:

コメントを投稿