Sample Site

ロゴ

其の1 登別だけに生育する3種の植物とは

 館外不出の「登別町史」をインターネット上で読めないものか。そんなコチラの思惑と図書館側の懸案が結びついて、電子データ化作業に手を染めることになった。昭和42年発行のこの史書は、巻末の編集後記を含め1333ページもあり、測ってみると厚さ6.5センチと床枕にも十分使えるボリュームだ。当初、仲間を募り手分けして、と考えていたが、試しに作業に着手すると、面白くて、為になって、という訳で一人で挑戦することにした。
 作業手順はこうだ。見開きのページをプリンタのスキャナーで読みとり、パソコンにjpg画像として取り込む。それをインターネット上の無料変換サイトにアップロードし、テキスト・データに変換してもらい、ダウンロードする。実際には途中から文章が2段組になったり、写真やグラフ、表物が途中に掲載されているので、画像処理ソフトで文章部分を分割して再画像化しなければならない。また、ロボット対策で、6桁の変形数字を入力しなければ変換してくれない、無償利用の場合、画像の処理は10回まで、など制限はある。「もう10回超えました」のメッセージが出たら、一度、サイトを離れ、再びアクセスするなど、結構しんどいが、千里の道も一歩からだ。
 昔に比べ、変換精度はかなり高いが、やはり戻ってきたテキスト・データの中に、変換ミス=文字化けはある。例えば、ピリオドの「。」が「0」に変わるなど、数えあげればきりがないが。ここは根気強く原文と照らし合わせながら、修正、また修正の道を行くのみ。
 作業を開始したのは2017年3月29日。4月21日現在、テキスト・データ化を終えたのは150ページだから、まだ1合目を過ぎたあたり。6月中に頂上制覇! の目論見は、甘いか?
 昔の新聞綴りを開いて、目的の記事を探しているうちに、別の掲載記事に目を奪われたりして、舟はいっこうに進まないことが多々あるが、町史とて同じ。早速、36ページ目の「植物」の項で、横道逸れの助になってしまった。 「わが国に登別町だけに生育するもの三種、本州と共通種約456種~」
「えっ! 3種類も」とちょっと驚いたが、それが何という名前なのか、書かれていない。いっぱい列挙された植物の名前をなぞっていったが、そのうちのひとつは単子葉植物でイネ科の「わしべつみやまこうぼう」ではないか。しかし、あくまでも、これは推測の域。探偵心をくすぐられる。(2017年4月24日)