2018年8月30日木曜日

遺跡データベースの重要コンテンツとしての遺跡資料を収録 2

この記事は2018.08.04記事「遺跡データベースの重要コンテンツとして遺跡資料を収録」のその後の遺跡データベース構築状況のメモです。

私家版暫定版GIS連動千葉県遺跡データベースを学習ツールとして活用するためにコンテンツとして「千葉県の歴史 資料編 考古1(旧石器・縄文時代)」(千葉県発行)に掲載されている「遺跡資料」の収録を進めています。作業の山を越したので、作業上気が付いたことと感想をメモします。

1 図書の解体、スキャン、遺跡別pdfファイル作成
1-1 図書の解体
図書を解体して裁断機でスキャンしやすい大きさにしました。

解体・裁断した図書
1000ページの図書ですから解体・裁断に30分かかりました。

1-2 スキャン
scansnapを使ってスキャンそのものは1時間かかりました。pdfを検索可能にする透明テキスト作成は2時間半かかりました。

1-3 遺跡別pdfファイル作成
遺跡別にファイルを小分けする作業は1時間程度です。

遺跡別に小分けしたpdfファイル
旧石器時代と縄文時代の遺跡は全部で266あります。

ここまでの作業は特段の問題はなく、全部で2日ほどの作業で遺跡データベースに遺跡資料を収録できる予定に狂いはないだろうとタカをくくっていました。
ところが大伏兵があらわれて、次からの作業が難渋します。

2 図書収録遺跡名称と遺跡データベースの遺跡名称の対応作業
図書収録の遺跡名称は近隣遺跡をグループにして新たな説明用名称を付けているものが幾つかあることは知っていました。しかし、ほとんどの遺跡名称は図書でもデータベースでも同じ千葉県資料ですからほぼ一致すると考えていました。しかしこの予想は大きく崩れました。なんと全体の45%(約120)が遺跡名称で一致させることができません。

しかたがないので、1件1件について図書掲載地図とデータベース画面(GIS画面)を突き合わせて対応関係を検討しました。この作業に予期しない2日以上の時間をつかいました。
なぜ45%もの遺跡名が対応しないのかという理由の最大のものは文化財関係者の間における遺跡名称記述方法に基準がないことによると考えました。「の、ノ」「か、カ、ヵ」等の混在、「1、Ⅰ」「2、Ⅱ」の混在、「〇〇遺跡、〇〇貝塚」の混乱、遺跡名称に旧名称を括弧に入れて附記する風習などが自由奔放におこなわれています。従って遺跡管理番号でリレーションをとればほとんどが対応するにもかかわらず、遺跡名称では打率5割5分になってしまいます。

この作業では19600以上の遺跡と266事例との対応にてこずったのですが、それは遺跡データベースの特質を改めて知るよい機会になりました。生の19600遺跡データベースと自分の興味との間になにかのインタフェースが必要で、その一つが図書遺跡資料だということに気が付きました。

3 遺跡資料の時代別分布図
遺跡資料の名称と遺跡データベースの遺跡名称との対応関係を100%とりましたので、遺跡資料(pdfファイル)をGIS画面との対応のなかで探して読むことができるようになりました。

遺跡資料の時代別分布図を作成すると、各時代の代表的遺跡ですから、各時代の社会の様子を示している意味のある分布図として見ることができるような気がして、学習意欲が強くそそられました。

旧石器時代遺跡

縄文時代草創期遺跡

縄文時代早期遺跡

縄文時代前期遺跡

縄文時代中期遺跡

縄文時代後期遺跡

縄文時代晩期遺跡

4 感想
データベース収録作業なかで、計らずも図書コンテンツをかなり読んだ(眺めた)のですが、その内容レベルが自分の知識レベルと大きな乖離はなく、学習に期待がふくらみました。また遺物等の写真やスケッチが豊富で否が応でも強い刺激を受けます。多数の縄文遺跡から私にとっては「異様な」土偶が多出していて、それだけを並べるだけでもいろいろなことが判りそうです。
図書コンテンツを全部読めば、学習上の自己意識が少し変わるかもしれないと予感しました。
9月中には「千葉県の歴史 資料編 考古2(弥生・古墳時代)」「同 考古3(奈良・平安時代)」も解体、スキャン、遺跡別pdfファイル作成して遺跡データベースに収録することにします。さらに同シリーズ本で所持する残り歴史5冊も全部電子化することにします。

0 件のコメント:

コメントを投稿