揚羽の蝶 はじめに    Home   Bottom   Next

私は首都圏のサラリーマンの例に漏れず電車通勤である。この1時間をどのように過ごすかは人それぞれのそれなりに大きな課題である。「三上(さんじょう)」と言う言葉があるそうである。鞍上、枕上、厠上というらしい。物を考えるにはこの3つの上が最適であるという事を表す言葉である。鞍上は今や車上であろう。この言葉の通りに、私はこれまで車上は、読書と、考えることに費やしてきた。それがふと、自分の技術史をまとめて試ようと思い立った。理由は幾つかあるが、当面それは措いておこう。HP200LXという筆箱ほどのPC/XT互換機の名機が電車の中での鉛筆と紙代わりである。

これまでに、何人かのライターの方に私の技術史の断片は書いていただいた、中でも内橋克人氏の「新・匠の時代 1 ワープロ誕生の日」文芸春秋社 1987.5.30が最も充実していて、そこそこ正確である。正史ではなく、物語なのだから、言ってみれば三国志ではなく三国志演義なのだから多少、不正確なのは仕方ない。この本は、講談社文庫にもなっていて、「匠の時代 第11巻」1991として発行されている。面白いところでは、小学館の小学五年生1992年6月号の別冊付録「夢への挑戦者たち」という子ども向けの漫画まである。しかし、やはり限られた時間でのインタビューであり、すべてのエピソードが正確に書かれている訳ではない

特に、日本的年功序列感覚の中での、森、河田、天野の3人の役割については正確ではなく、予断によって書かれている印象が拭えない。実はワープロの技術の詳細に言及すると、私しか説明することができないため、最年少の私が主役であると悟った筆者らは、かといって年長者をどう扱っていいか分からず、戸惑っている印象があった。事実、東芝内では意図的に私を単なる最年少のサポータ的に扱って、人事的にもそのようにファイルされていたらしい。しかし、特許、論文、社内研究報告などを見ればワープロを誰が発明したかは明らかなのだが、そのような面倒なことは人事はしないのである。一度、理解ある上司に恵まれ、彼の指示で私が真の発明者であることを示す資料を作ったことがあるが最終的にはもっと上の思惑で無視されてしまった。成果主義という事が一時言われたが、成果さえ他に付け替える事が行われる程に企業の人事というものは、恣意的なものなのである。

また、上で3人と書いたが、プログラミングにおいて大きな貢献をしている武田さんの事には、一切触れられていない。彼は高校卒業という学歴なので、あくまでサポータとしての役割ではあるが、しかし、後節で触れるように、孤軍奮闘していた私にとっては非常に有難い強力なサポータであった。そこで、このことは「武田さんのこと」と言う一節を起こして書き、これも歴史に残す事にした。

仮名漢字変換のプロジェクトにはチームと言うほどのものはなかった。under-the-tableという、研究者が勝手にやっている陰の研究ということで、森さんは私と河田さんを割り当てて、二人で始めたものである。森さん自身は二十数名と言う大所帯の研究室のリーダで、その下で国家プロジェクトを含む色々な重要プロジェクトが動いていた。仮名漢字変換などは、河田さんが言うので、まあやってみようと言う程度で勝算を持っていなかったということである。

二人は一応の分担を決めて研究を開始した。河田さんは当時、いわゆる仮名漢字変換と呼ばれていた形態素解析エンジンをNHKの論文を参考にして大型機の上で3ヶ月ほどで作ってしまった。形態素解析エンジンは有限状態オートマトンと呼ばれる最も簡単な自動機械に分類される物であるので、彼のプログラミング力ならそれで出来ても不思議ではない。1975年のことである。私はミニコン担当であったので、TOSIPICS-Lと呼ぶOSを開発し、エディタをその上で開発していた。これが出発時の分担である。河田さんが仮名漢字変換、私がエディタ。これが1976年以降、大幅に変わるのである。河田さんの形態素エンジンを受け取った私はそれをミニコンシステムに組み込んで一応、入力から出力までを通して稼動させた。当時の社内資料を詳しく調べると、1976年前半には稼働を始めた。東大渡辺教授の「できる道理が無い」宣言は、この翌年の1976年に出される。

このシステムは、しかし、渡辺教授の宣言通りに、変換率の悪いものであり、実用には到底耐えないものであった。まだ通しで稼動しただけだから、ひょっとしたら最適化されていたNHKシステムより性能は悪かっただろう。河田さんはこの形態素解析システムのプログラムをこの時点でほぼ完成させていたから、仮名漢字変換の舞台から降りて他の業務に回った。今後の文法開発は私の仕事である。

坂井研NEAC2200/200の前で。1971年
坂井研NEAC2200/200の前で。1971年 こうして、この1976年早々から、製品出荷1979年早々までの3年間の私の孤軍奮闘が始まる。勿論、JW−10というシステム開発は大勢の技術者の力の賜物であるが、仮名漢字変換の高性能化・実用化の為の発明と言う観点では孤軍奮闘であったのである。3年後、渡辺教授の不可能宣言を覆した力の秘密は、京大の人工知能の力であった。その頃、人工知能を大々的に研究していたのは京大電気工学教室(後に情報工学教室)の坂井研究室だけであった。東大は人工知能をなぜかあまり研究していなかったのだ。私は京大坂井研究室で学んだ人工知能、そしてその一部である形式言語学、計算言語学、自然言語処理、言語学の総力をJW-10に結集してその実用化に成功したのである。

この物語は、編年体と列伝体を交えて−−要するに原則なしに適当な形式で−−74年から79年までのエピソードを、発明者にしか出来ない正確さで綴ったものである。

私は、名古屋市の覚王山で生まれた。近くに日泰寺(にったいじ)というお寺があり、子供のころは良く親に連れられて参道に出る縁日の店を楽しんだものである。小学2年生の時、楽しかった田代小学校を後にし、郊外の岩倉に引っ越した。織田信長の叔父の居城があった街である。駅の近くの神社には「山内一豊公生誕の地」という大看板が私の知るだけでも50年前から立っていた。

この頃、特に機械好きであったかどうか記憶が無い。はっきりと記憶があるのは、隣家の1年上の友人にラジオをつくろうと誘われた4年生の時以降である。これ以来、鉱石ラジオ、ゲルマニウムラジオ、並三ラジオ(12F、6C6、6ZP1というST管3本から成る)、高一ラジオ(高周波一段増幅の略であるが、並三に何を1本足したのか記憶がない。6WC5だったか?)、5球スーパ(部品が集まらず終に完成しなかった)、トランジスタラジオ、その他トランシーバやトランジスタ時計など中学を終えるまで次々と作って遊んでいた。

このころから、鉄人28号、鉄腕アトム、そして高校生の頃には8マンに夢中になっていた。実の所、鉄人や、アトムはそれほど好きではなかった。鉄人はリモートコントロールする単なる機械に過ぎないうえ、コントローラには2本のレバーしかなく小学生の目からみてもリアリティが無さすぎた。アトムは完全な知的ロボットであるが、その構造の説明は一切なく、漫画としては楽しんでも、知的好奇心の対象にならなかった。

その点、8マンは胸に超小型原子炉を持ち、頭脳は死ぬ寸前の人間の脳から記憶を移植した電子頭脳であり、肩には補助電子頭脳まで備えていた。そのような全体の精密な構造図が雑誌のカラー折り込みになったりして、知的好奇心を存分に満足させてくれたものである。尤も、その割には、時々ベルトのバックルに入っている煙草のような薬剤を吸わないと力がでなくなったり、主電子頭脳が壊れかかった時に、自動的ではなく、なぜか自分の「手」で肩の補助電子頭脳のスイッチを入れなければ脳の機能が切り替わらないなど、妙に非科学的な所もあってその点に不満を覚えたものである。

揚羽の蝶 京都大学坂井研究室;人工知能との出会い



坂井研夏合宿 知的ロボットは子供の頃の憧れであった。京都大学の大学院坂井研究室に進んだのは、そのような性向による。坂井利之・長尾真著の「文字・図形の認識機械」という本を見つけて、本屋の店先で立ち読みしながら、機械が人間のように文字を読むことができるという事実に手が震えたものである。人間の知性を機械で実現することが子供の頃からの夢であったのである。坂井研で最初に読んだ文献が、博士課程2回生の先輩、金出さんからもらったMITのMinsky著「Steps toward Artificial Intelligence」であった。

人工知能徒然:人生を決めた3冊の本

1971年の暮近くだったかと思う、隣に座っていた−−正確にはレンガ作りの電気工学棟坂井2研の窓の横の壁に向かって私が座り、窓を挟んで右側反対側に、金出さんは私に背を向けて壁に面して座っていた−−金出さんが、今度、僕の下宿に東芝から人がくるんや、と話し始めた。何をしにくるかはしらんが、とにかくまだ下宿が見つからんので暫く泊めてやるんや、ということであった。河田さんとの出会いはもうそこまで来ていた。

坂井2研にて 1972年
机の周りを見て下さい。大変質素だと思いませんか?仮名
漢字変換が不可能と信じられたのはこういう時代であった
のです。私の右手に本が開かれています。その右にテッシュ
の塊のように見えるものがありますが、英和辞書です。辞書
を読むのが好きで使い込んでふやけてしまったのです。
坂井2研
金出さんはそのころ博士論文を書いていた。スペリング誤りを1個でも見つけたら1個に付き千円やると言って河田さんに読ませたんや、などという話を毎日なにか聞かせてくれたものである。金出さんは、その後、CMUに行ってしまわれたが−−あのサイモンがいる名門大学である、サイモンは、ニューエル、ショウとともにAI(Artificial Intelligence;人工知能)の三羽烏と言われた。中でもサイモンは「法螺吹きサイモン」といわれたらしい。あれもこれも、人間の知的作業は何でも計算機にも出来るのだと言い過ぎたためである。後にサイモンは、人工知能ならぬ経済学でノーベル賞を受賞する−−そこで、米国人の学生の論文の英語を直すほどの自信の持ち主であった。さすがに、当の学生は面白くなさそうだったということであるが。

ある日、例によって坂井2研で話をしていた時、僕は旺文社全国模試で2番だったが、あの時は驚いた、というのである。へー、と私も驚いた。全国2番なんて夢だ。しかし、金出さんは、私とは驚いた理由が違っていた。なんでやいうとな、僕より頭の良い奴がまだ居おったんや。このエピソードは、内橋さんの本にも紹介されているが、後日談がある、この話は、私と、金出さん二人しか知らないのであるが、彼は15、6年も前の一挿話など、毎日朝から晩まで2研で一緒に過ごしていた話の中の一つに過ぎないのだから覚えてもいない。私は、こんな面白い話はそんなにないので良く覚えていたわけである。で、彼がこの話を読んで、奥さんに、僕は覚えてないんやけどな、天野君がそないな事をゆうて本に書かれてしもうたと話した所、奥さん曰く、天野さんが言った事が事実かどうかは、私には分からないが、でも貴方なら言っても不思議ではない。

さて、河田さんは牛乳ビンの底のようなレンズの眼鏡をかけて我々の前に現れた。助教授の長尾さんのところで、研究生として日本語の研究を始めた、らしい。私は直接に見た訳ではないから、らしい、としか言えない。同じ坂井研で仲の良い辻井が長尾さんに師事していたので、彼からよく話を聞かされたものである。そのうち、5月になり企業の見学に行き、東芝に就職を決めた。東芝の森さんだけが、今後「自然言語」の研究をしますと明言されたからだ。自然言語は、当時、企業では知られていなかったに等しかった。要するに「金になる」とは考えられていなかった。私は、大学院に来た当初、文字認識をやりたかったのだが、金出さんの助言を受け、言語っぽい事を杉田さんに師事して始めていた。長尾さんも方針変更した私を、陰に陽に支援してくださり、論文を下さったり、その頃、辞書会社が作りつつあった電子辞書を使った研究をやらないかと誘ってくださったりしたものだった。三省堂の辞書だったのだが、これを使って文章を解析し、日本語の文法の自動抽出をやるというのが、長尾さんの目論見だった。私は乗り気であったのだが、一人の助教授に院生が2人付くのはまずいということで坂井先生のお許しが出ず、ぽしゃってしまった。「一人の助教授に院生が2人付くのはまずい」については、当時何の違和感もなかったが、良く考えてみるとこれは凄いことである。21世紀の今日、大学院は大幅に定員が増加され粗製乱造に近い状態になっているが、この時代は教官手造りとも言うような丁寧な大学院教育が行われていた。この1972年の春、坂井研は新設の情報工学教室に移り、長尾さんは電気に有線通信工学講座担当(中身は情報工学)の助教授として残り、杉田さんが助教授として情報に移っていた。

知的ロボットとは言え、当時の計算機で8マンのような人間のような知的ロボットが出来る訳が無い。言葉を理解する。言葉を話す。音声を聞く。文字を読む。顔を認識する−−ここが目、ここが鼻のように。これら一つ一つが大きな、そして難しいテーマであった。それは今、21世紀になっても、尚、変わってはいない。金出さんは顔の認識に一所懸命であったし、辻井は言語の解析に首っ引きであった。彼は、東大に教授として移り今でもそれをやっている。

揚羽の蝶 日本語ワープロ前夜

仮名漢字変換の歴史は古い。学会から歴史を残すための原稿を頼まれて、これまで曖昧になっていた歴史の奥を調べてみた。これまでにもいろいろな人が書いているが、当事者じゃないので間違いが多いか、踏み込みが足りない。ホームページなどに何の関係も無い人がもっともらしくあてずっぽうで書いている物は当然ながらひどい間違いを犯している。それで、発明者としての人脈を駆使して大学関係者の知人-- 栗原先生のお弟子さん方、長崎大学鶴丸弘昭氏、福岡大学首藤公昭氏、元九州芸術工科大学稲永紘之氏--を頼り、我々より古い時代の物証を書斎の奥から引きずり出すようにして探し出してもらった。

京都大学相沢氏のかな文解析の初出論文。1963年。
目次の先進性には目を見張る。
京大相沢論文 1963年に京都大学坂井研究室で、元京大総長長尾先生の下で相沢さんが研究されていたものが最も古いとわかった。坂井利之、長尾真の指導で論文を書いたのが相沢輝昭さんという、私の坂井研究室の先輩だった。これがかな文を文法解析した最古の研究である。2002年、NHKのプロジェクトXの中で「かれはががくせいです」という仮名文が「彼は画学生です」と「枯葉が学生です」の曖昧性を持つという例で使われていたが、相沢さんの論文からの引用だったことが、この時わかった。相沢さんは既に論文を無くしていて、この例は記憶に頼ってNHKに話されたのだろう。この調査の時、京大の友人稲垣耕作准教授--彼は1年下なのだが修士1回生で世界最大の電気電子系学会IEEEに論文が採録されたという大秀才である。当時、修士2回生の私と辻井は感心して羨ましがった--に図書室を探してもらったら、なんと、出てきたのである。それを稲垣さんがスキャンして送ってくれたので、そのまま転送して相沢さんに差し上げた所、大層喜ばれた。この相沢さんという方が、因果は巡り、後、NHKの技術研究所で仮名漢字変換の研究に取り組んだ方だ。坂井先生は、大学で行うことは汎用の技術、理論であるべきだという考えの先生であったから、この論文は、「仮名漢字変換」のような応用的なタイトルをつけず「言語の計算機処理」という名前の論文になっている。



九州大学栗原先生の1966年の記念碑的「第1報」論文。
九大栗原論文 1966年には九州大学の栗原俊彦先生が、「カナ漢字変換について(第1報)」と言う論文を書かれて、ここで応用としての仮名漢字変換が初めて出てきた。(第1報)は、栗原先生の(第1報)であるけれど、この時代、「仮名漢字変換」という名称で先行している論文は皆無なので、日本での、いや、世界での(第1報)なのである

九州大学栗原先生の1965年の準備段階の論文。
九大栗原論文 実のところ栗原先生は、(第1報)の前、1965年の準備段階でも「日本語の分析・合成のための辞書について」という論文を出されていた。この論文を探し出して下さった栗原先生のお弟子さんであった上記首藤先生の奥様が、この論文の共著者になっているということで、奥様共々感銘を深くされたということで、半世紀近くも前の懐かしい思い出に、九大、京大関係者一同、それぞれに浸ることになった。九大の論文は、従来、1967年の九州大学工学集報に出たものが、孫引き、ひ孫引きで、事実上九大最古の出典として扱われていたが、2年も前に遡る事ができた。

NHK相沢さんの1970年の論文。
タイトルと日付の間が空きすぎているので、縮めてある。
NHK相沢論文 こうして、九大で仮名漢字変換に特化された日本語処理の技術は、栗原先生の高校時代の同期の友人がNHKの相沢さんの上司であると言う奇遇から、相沢さんに引き継がれたのであった。京大と九大の技術が相沢さんという一個人の中で融合したのである。1970年にはNHKから相沢論文「文法情報を利用したカナ漢字変換」が出る。

九大→NHKという、この歴史は比較的良く知られている。しかし、私はこの事に長年違和感を持っていた。それでは九大は「第1報」で終わってしまったのだろうか?という疑問である。栗原先生は1973年(昭和48年)1月4日に物故されていて、「第1報」以後の歴史が良く分からない。それで、再度、鶴丸弘昭氏、首藤公昭氏、稲永紘之氏にお骨折り頂いたところ、第6報まで発掘できたのである。栗原先生の衣鉢はお弟子さんであった稲永先生が継がれていた。

稲永先生の活動の歴史は最近まで続き、現在もご活躍されているのでこの時点では、第6報までをここに記しておくことにする。

■ 九州大学工学集報関係
栗原俊彦、黒崎悦明:仮名文の漢字混り文への変換について 昭和42年 九州大学工学集報第39巻・4号 pp.659-664
栗原俊彦、稲永紘之:カナ漢字変換[T] 昭和45年1月 九州大学工学集報第42巻・6号 pp.880-884

■ 電気関係学会九州支部連合大会関係
栗原俊彦、黒崎悦明、小西彬允: カナ漢字変換について(第1報)  昭和41年10月
栗原俊彦、稲永紘之、小西彬允: カナ漢字変換について(第2報)  昭和43年10月
栗原俊彦、稲永紘之、小西彬允: カナ漢字変換について(第3報)  昭和44年11月
栗原俊彦、稲永紘之、小西彬允: カナ漢字変換について(第4報)  昭和45年10月
栗原俊彦、稲永紘之、小西彬允: カナ漢字変換について(第5報)  昭和46年10月
栗原俊彦、稲永紘之、小西彬允: カナ漢字変換について(第6報)  昭和47年11月


京大、九大の研究は大学の研究であるから、当然、レベルが高い。文法情報を利用したは当然の事であるが、この後、企業--一般的にレベルが低かった--から出てくる仮名漢字変換と自称されている技術は、我々は例外として、実は、文法情報を利用していないのである。とにかく、この1970年の相沢論文が、システムとして仮名漢字変換がまとめられた第一号である。更に、これは、翌1971年、より充実した論文とともに、NHK技研公開で一般に展示されている。:計算機によるカナー漢字変換、研究紹介資料、pp.95-96 (1971.5)。試作で一般に公開された仮名漢字変換システムはこれが最初である。いうまでもなく、製品で公開された最初のものは我々のJW−10である。学会のサイトでさえ、専門家が書いたわけではないので、いろいろな間違いが含まれている。この私のサイトが最も正確である。

我々が読んだのは相沢さんの1973年の論文であるが、これは多分総まとめの論文だったと思われる。すごく詳しい充実した論文で大変に参考になった。しかし、この素晴らしい論文は当時の電子通信学会への掲載を拒絶査定--落と--されている。この時代、如何に先進的な研究であり、同時代人には
理解されえなかったかという事情を象徴している出来事であった。学会というのは一種の組合であり、そこに発表されるべき論文は学会員の多くが興味を持つことという判断基準がある。相沢論文が如何に優れたものであっても受け皿の学会員に興味を持つ人々が皆無に近ければ採録はされないのである。つまりは、当時、自然言語処理などを出来る研究者は日本に数人程度しかしかいなかったということを示す事件であった。 我々がワープロとして成功させなかったら、彼らの論文は、そのまま、まったく忘れ去られていたことだろう。

渡辺茂著「漢字と図形」冒頭
しかし、仮名漢字変換は実用化されなかった。だからかどうか、1976年に東大の情報科学の権威、渡辺茂先生が、何の因果か「NHK」ブックスから「漢字と図形」という情報科学の本をだされ、英文タイプのような機械は日本語では「できる道理が無いのである」と不可能宣言をなされてしまったのだ。

その後、1988年、神奈川県主催の人工知能シンポジウムで渡辺先生とご一緒にパネルに出る。待合室でお会いした時、渡辺先生は「この人が作ったのか」と言うような、末っ子を見るような優しいまなざしで迎えて下さった事は今でも忘れない。
(図をクリックで拡大)
神研連機関誌より引用


しかし、大学の研究というのは、先進導坑の役割だから実用化は元々しない。青函トンネルは本坑を掘る前に2本もトンネルを掘っている。最初に掘るトンネルは、先進導坑である。これは地質などの調査の為に掘る小さなトンネルである。いきなり本坑のような巨大なトンネルを掘っては危険が一杯だ。どこで水がふきだすか、どこで天井が崩れるかわからない。研究も同じである。アイデアがあってもそれが可能かどうかわからない。だから、大学は、真っ先にいろいろな試みをする。こういう方法でやったら、ここまでできた、こういう問題が起きたなどを調査研究する。それで論文を書いて終わり。次の段階に進んで行くのである。徹底して製品になるまではやらない。そうした本坑を掘るのは企業の研究所の使命である。

京大坂井研の場合、1960年代中期には既に自動翻訳を終えているほどに、早いペースであった。私が71年に大学院に居たころ、長尾先生は、米国のMIT--WinogradがPh.D.論文を書いたのは、確かMITだった。この論文が、どの名前で出ていたかは記憶がないが、その後、長尾先生に紹介状を書いてもらって、スタンフォードのT.Winogradを1980年頃に尋ねたので、Stanfordとの記憶が強い--の論文を研究室に持ってこられた。それは分厚い濃い緑色の表紙をもった「言語理解」の論文だった。仮名漢字変換なんて眼中になかったのだ。遥か昔に終わった研究。それが京都大学での認識だった。言語理解とは、言語の表層的な字面の研究ではなく、コンピュータをロボットとに仕立てて、そのロボットと意味のある会話をする技術である。

私が入社前に東芝で行われていた漢字入力の研究
人工知能を知らない研究者が発想できるものは、どこもこのような物であった。
毎日新聞より引用
企業には自然言語処理の技術はどこにもなかった。沖電気だけが黒崎さんという若い研究者を栗原研究室に研究生として送り込んでいたが、どういう訳かその後活用しなかった。東芝が自然言語を研究しようとした思い立った時、どうしていいのかわからないので、長尾先生のところに総合研究所の電子工学の専門家である河田さんを送り込んだのである。そこに私が居て、言語理解の論文を読んでいた、という状況での出会いであった。

河田さんは、京大には来たけれど、仮名漢字変換などは研究できなかった。そんなものは長尾研(1972年、坂井研は新装なった情報工学科の建物に移り、長尾先生は坂井研から独立し、電気工学科に残った)では、10年前に終わっていた。それで、日本語の構文解析の基本を勉強して帰ったのである。仮名漢字変換は形態素解析を使う。構文解析は直接には何の役にもたたない。ただ、坂井・長尾研では大学院生に対しては輪講や、長尾先生の厳しい個人指導があり、そのような雰囲気の中で先進的な自然言語処理の研究が行われていたから、研究生はそのような恩恵には直接にあずからぬとしても、「門前の小僧習わぬ経を読み」的な効果はあったと思う。

1973年4月、京都から同じ時期に川崎の研究所に帰っていた河田さんと二人で研究を始めることになった。私は工学部の人間としては少し異常であった。英語の、それも文法が好きだったので、そこから言語一般が好きになり、大学での単位としては第二外国語はドイツ語、第三外国語はフランス語を取り、他に「スペイン語4週間」と「ロシア語4週間」などを読んでいた。こういう比較言語学的なことをやったので、言語の性質というものが良くわかるようになった。岩波全書の「ラテン語入門」とか「比較言語学」などを座右の書にしている情報工学の専門家など他にいないんじゃないかなと思う。河田さんは純粋に工学者で、仮名漢字変換の高速化プログラミングとか、名詞の自動合成プログラミングとかプログラムの工夫をやっていた。NHKのプロジェクトXでもそのような描写がある。

そのような事情で、私は仮名漢字変換という言語学的研究を暗黙の裡に引き受けた。というか、勝手にどんどんやっていた。どの道、この研究はunder-the-tableなのである。正規の研究ではなく、勝手にやっている研究なのだ。そのうち、九大・NHK方式の限界を感じ出した。「仮名漢字変換」というけれど、実際の文はもっと複雑だ。新聞を開けばわかる。ひらがな、カタカナ、英字、数字、記号、固有名詞、複合名詞、変数入り名詞などの乱舞である。変数とは、「台風11号」や「日中国交正常化35周年」の名詞の中の数字のことであるし、そもそもこのような名詞は辞書には載っていないのである。

仮名漢字変換が実際に扱うのはこのような文章である。
2007年09月17日20時12分

 米投資会社ペリー・キャピタルが、NECに上場子会社の「切り離し」を求めている。NECが70%、ペリーが5%の株式を持つNECエレクトロニクスの業績が低迷。その理由は「親会社から独立していないから」と見るためだ。今のところNEC側は要求を突っぱねているが、ペリーは長期戦の構え。欧米に比べ、少数株主の権利が軽んじられているとされる日本の「親子上場」をめぐる議論に、一石を投じる可能性もある。

-- asahi.comより引用


局所意味処理の初出論文。1976−77年の着想であるが、1977年に急遽製品開発をすることになり、
まず特許を書き、79年に出荷、工場へ移管するために、書いていなかった仕様の作成を後から行った
ため、論文執筆が遅れ、ようやく1980年に発表した。

局所意味処理の論文。


局所意味分析を用いた二層型(統合分析型)仮名漢字変換方式
このような複雑な日本語表記に対処するために、「局所意味処理による二層型(統合分析型とも呼ぶ)仮名漢字変換方式」というアイデアを創出した。それでも、同音語は完全には解決できず、モニター上に賑やかに残る。JW-10では、同音語は先頭の語だけを表示し、同音語が存在していることを示すため、ブリンクさせていた。それで、同音語選択を飛躍的に効率upするためのもうひとつのアイデアを出した。「暫定辞書を用いた短期学習による同音語選択方式」である。このアイデアは局所意味処理を創案する前の試作システムの時に既に思いついたものであった。

この2つの発明は極めて強力で、これを避けて仮名漢字変換方式のまともなワープロは作れない。文法解析を行う仮名漢字変換を行うかぎり前者の特許を侵害せずに作ることはできないし、同音語を持つ変換を行うシステムは、後者を使わなければあまりに不便で商品として競争力を持てない。

1978年9月26日の新聞発表記事を読めば、特に電波新聞は詳しくこの2つの説明を書いている。この2つの発明により、渡辺先生の予想を覆し日本語ワープロを実用化できたのである。他の製品開発とちょっと変わっているのは、アイデアだけでなく、プログラムも私自身が工場に1年間移って、自身の手で書いて実装したことである。発明だけではなく、製品も自分で作った珍しい例だ。

仮名漢字変換を実用化に導いた2つの特許



揚羽の蝶 東芝総合研究所;日本語処理の黎明期

話は、また、少し戻る。

私は、1972年当時、唯一、自然言語−−C++、Javaなど計算機言語に対して、日本語、英語のように人間が従来用いてきた言語をこう呼ぶ−−の研究を行うと明言した森さんのいる東芝に行くことに決めた。1973年春、私は東京に来た。東芝に入社し、新人研修の半年をすごしていた。半年後、河田さんと総合研究所情報システム研究所の森さんの研究室で再会、二人の共同研究が始まった。とは言っても、私は、今度は研究室内での教育である。この研究室はパターン認識を主テーマとしていた。それはアルゴリムの研究だから、実現はソフトを書いて行う。しかし、文字認識、画像認識などはソフトだけでは済まず、専用ハードを自分たちで作らなければならない。当時の汎用計算機では遅すぎるのである。そこで、新人は必ず、ハードを一つ作る事が教育の一テーマであった。

TOSBAC40にはこのようなボードの上でコントローラ回路を
作りバスに挿す。PCのPCIバスに挿すカードに相当する。
インタフェースボード 私は、カセットテープドライブをミニコンピュータに取り付けた。PCにカセットドライブを取り付けるのとは訳が違う。PCなら、scsiカードのコントローラがあってそこにコネクタを差せばすむが(さすがにカセットはもうないだろう。今や、DATである)、当時のミニコン(PCは1981年にならなければ現れない)にはそんな手軽なものは無い。まず、バスに差すコントローラの設計から始まる。バスのタイミングチャートをにらみながら設計。基盤にICをさして結線する。ICといっても、ゲートが4つ程しか入っていないものだ。LSIではない。それをズラッと並べて結線していく。それが出来たら、バスにさし、ミニタワーの上半分を切った位の大きさのある、300万円もするカセットテープドライブにつなぐ。80年代半ばのMSXのパソコンに付けたカセットドライブは2万程度だったが。。。

TOSBAC40(写真は後継機TOSBAC40D)
PCで言えばベアボーンにMPU、
主記憶を付けただけのもの。
OSというものは存在せず、自作した。
TOSBAC40
さて、OSなどないから、ドライバを裸の状態から作らなければならない。勿論、アセンブラである。動かないと、ドライバが悪いのかコントローラが悪いのかさっぱりわからない。その切り分けをするのが大変である。シンクロスコープを睨みながらプローブをICの足に付け、1ゲートずつ信号がでているのを確かめていく。苦労に苦労を重ねてやっと稼動させる事が出来、MT−OSのようなものを作った。当時のミニコンシステムは紙テープが記憶媒体である。プログラムは紙テープにパンチされた穴でビットを表現して記憶されていた。従って、プログラムの作成、修正、保存、読み込みなどを行うプログラムはすべて紙テープを入出力として書かれている。ソースなどないから、それらを逆アセンブルして紙テープからの入出力部分を磁気テープでの入出力に変換していった。これらのプログラムは少ない主記憶で稼働するように精緻な技術を用いて書かれているので、入出力サブルーチンというまとまった単位できれいに書かれておらず、どこに入出力部分が書かれているかを探し出すだけでも大変な仕事であった。「プログラムの中で自分自身の命令を書き換えるプログラムはバグ取りが大変だからやってはいけない」などと、今では考えられもしないテクニックが行われていた時代である。

この頃、直径40cm厚さ5cmはある2MBのハードディスク(この頃のディスクはまだリムーバブルである。PCのHDDのようなウィンチェスタ型HDDが出るのはまだ先の事である)が隣のチームに入って来た。今度はDOS作りである。私のMT−OSの成果を用いて、画像グループの麻田さんがやった。このディスクドライブの方は洗濯機位の大きさであった。

こうして入社1年目が終わった。この頃、森さんはunder-the-table研究ということをしきりに言っていた。自然言語の研究は、まだ研究所の正式テーマになってはいない。under-the-tableなのである。研究というものは、企業でも大学でもスケジュールというものがある。できるかどうか分からないから研究するのにもかかわらずスケジュールがあって、何時何時までにこれを達成する、という事を約束しなければならない。これは矛盾であるが、世の中は矛盾に満ちているものである。

京都に居た頃、助教授の杉田さんには研究テーマは必ず2つは用意し、本テーマが思うに任せない時に備えておかなければならないと教わっていた。森さんはそれをunder-the-tableと呼んでいたのである。私のon-the-table研究は、漢字認識であった。もっとも、私はこちらは余りしなかった。こちらは河田さんが四辺コード法などを提案して、積極的に行っていた。私は、当面、日本語を研究する道具作りを行っていた。先のDOS−−TOSPICS−Lと命名した−−もその一つである。河田さんが工場から、多分森さんの援助で漢字パターンや、漢字プリンタを仕入れてきたりした。漢字プリンタといっても、小型冷蔵庫のような図体の上にトイレットぺーパのような巻き紙が載っている程度のものであったが、当時は、漢字が出るだけでありがたかった。

私はこの時期、意味解析をどうしてやろうか、というような事を考えていた。国立国語研究所の分類語彙表という、単語を意味で分類した表−−といっても、300ページ位の単行本である−−と睨めっこする日を送っていた。意味解析どころか、もっと基礎的な形態素解析も、構文解析もできていないところで、いきなり発想が意味解析に飛んでしまうところが先進導坑(せんしんどうこう)研究志向の大学ポット出らしいところである。74年度も終わりに近づいた頃のある日、河田さんが、森さんが仮名漢字変換をするように言っている、と言う。河田さんによれば、これは河田さんの提案と言う事である。副所長役の玄地さんと森さんに何ができるかと問われて機械翻訳とか自動要約とか色々応えた中の一つらしい。

仮名漢字変換というのは、すでに九州大学でもNHKでも研究は終わっていた。勿論、研究が終わっていたと言うことと、研究が完成しているということとは全然別の話である。大学は基礎研究を終わると、ペーパ(論文)を書いて終了し、次のテーマに移っていく。後継者は、そのぺーパを読んで、何をどこまでやればどこまでは可能かなどの目処がつくのである。勿論、研究をそこで止めないで続行しても良いのであるが、工学の研究を大学で徹底的に行うのはかなり難しい。たとえば、仮名漢字変換では、今では、10万語、20万語という辞書を用いているが、仮名漢字変換が実現していない時点で、どのようにしてこのような辞書を作ることができるのであろうか。

当時、数千字の漢字コードを全部覚えている特殊技能者がいて英字キーボード程度のキーボードで漢字をタッチメッソドで入力する企業があった。RAINPUTが有名であった。日立やリコーもこのような方式を採用していた。そうして打たれた漢字はキーボードの横に付いている機械式の紙テープパンチャで紙テープに出力された。それでなければ、フルキーボードと呼ぶ2千字程とか4千字程の漢字キーを並べた巨大なキーボードでタイプして入力するしかなかった。12段シフトなどという凄いものであった。入力費は1字2円であった。又、漢字パターンにしても満足にない時代である。デザイナーに1字デザインしてもらうと、1万円程度かかった。フルセットなどとても作れないのである。1970年代初期で、大卒の初任給が5、6万円である。このような経済的な理由もあって、基礎研究で終わる事が多かったのである。

京都大学ではすでに1960年代に、坂井、長尾、杉田さんらが文学部と共同で機械翻訳の研究を終えていた。もう絶版になっているかもしれないが、この時の成果が、講談社のブルーバックスから「翻訳するコンピュータ」1969.9.20として一般向けにも本がでている。仮名漢字変換は、NHKも終了していた。大学の頭がまだぬけていない入社2年目の私には、そんな状況の中で、どうして今、仮名漢字変換か分からなかった。しかし、上に書いたように、相変わらず辞書を作る為の漢字入力すらまともにできない時代であったのである。なによりも漢字をどのようにして入力するのか、それを本当に実現しなければ何事も始まらないのである。機械翻訳の研究も、翻訳とはどのようなメカニズムで行うことが可能なのかというアルゴリズムの研究は行えても、実際の日本語の入出力はローマ字や、カタカナであったのである。それを漢字にしたければ、最後は人間が手で書くより仕方なかった。そのような時代であったことを理解しないと仮名漢字変換の真の意義は分からない。この頃、誰も仮名漢字変換が実用になるとは思っていなかった。その上、研究は一段落して皆、実用化などは考えずに終わってしまっているのである。それをいきなり実用の為に研究開発をするのである。正気の沙汰ではなかった。

仮名漢字変換システムを用いたワードプロセッサ初出論文。1977年夏、東北大学で開かれた電
子通信学会の部門全国大会で発表。この時期から武田さんが河田さんに代わって参加している。
仮名漢字変換システムを用いたワードプロセッサ初出論文
もう少し先、1976年暮れの事になるが、本社が英文ワードプロセッサを導入すると言うことを、知人−−誰だったか覚えていない−−が教えてくれた。ついては、デモを見に行くので一緒に行かないかと言う事であった。ワードプロセッシングという概念は、米国IBMが多分60年代の終わり頃、発表していた。MT/STという大きなシステムを実現していた。ST(Selectric Typewriter)で書いた文書を、MT(Magnetic Tape)に記憶して再利用するという概念であった。MTと言ってもカセットではない。古めのSF映画に出てくるような、人の背程もある大きなドライブである。英語では、入力には何の困難もない。一度、入力した文書をMTに記録しておき、編集が出来るということが画期的な事だったのである。それまでのタイプライタでは、A4、1枚タイプした最後の一字を間違えても、廃棄するか、砂消しゴムで汚くなるのを覚悟で消すしかなかったのである。

私の手元にあるのは、私が書いたMT−OSを、HDD用に麻田さんが書き直したDOSであるTOSPICS−−1975年のことである。IBM PCとPC−DOSが出てくるのは、繰り返すが1981年である−−と、それを更に私が言語処理用に書き直し、漢字を扱えるようにしたTOSPICS-Lがあるだけである。私は、この見学で仮名漢字変換を使って、タイプライタのようにした「日本語ワードプロセッサ」に仕立て上げようと思い付いた。このことは、年が明けた1977年正月から書き始めた研究報告書の中で初めて言及された。まだ三人が三様の思いを持っていた時期である。この後、三人、いや、武田さんを入れた四人の思いが私のワープロ化によりJW−10に向かって一つのイメージに形成されていく。片袖の事務机の形をしたJW−10のイメージが出てくるのはまだまだ先である。この形は部品をどのように収めるかというハードグループの要請から生まれたものである。最初は両袖の案もあった。

1950年代の「少年」や「少年クラブ」を読んでいた人なら記憶があるのではないかと思うが、子供用のかたかなタイプライタの通信販売のページが毎号載っていたものである。確かCD程度の大きさの円盤に活字が載っていて、これをまわして、紙の上で叩いて印字するものであった。私はこれが欲しくて仕方なかったが、相当な値段が付いていたはずで、とても買ってもらえるようなものではなかった。第一、小学生には使い道がない。大学院に入ってすぐしたことは四条河原町の丸善に行き英文タイプライタを買うことであった。京大型カードも勿論忘れない。知的生産の技術の実践である。

さて、話を戻すと、この頃、河田さんは、相沢さんの論文を参考に大型機でFortranを用いて、まず、従来型の仮名漢字変換エンジンを試作していた。私は、ミニコン上での日本語環境の構築を急いでいた。なにしろ、研究室のミニコンというものは裸で、言ってみれば、MPUが載っているマザーボードがあるだけの状態に等しい。ハードもソフトも、一から作らなければならないのである。

河田さんが大型機上で仮名漢字変換のエンジン動かした。これは既に大学やNHKで先進導坑研究が終わっていたので方法は分かっていて、すぐできた。言語学的には形態素解析エンジンという。森さんはそれを見て、ミニコン上に移すように言う。これには2人して抵抗した。主記憶たった32KB、CPUサイクルタイム5マイクロ秒、(200KHz。因みに2000年現在、Pentium4は1.5GHzである。ちょっとしたPCなら、主記憶は最低でも128MB。HDDは40GB位は付いている)のミニコンでどうやって、仮名漢字変換のような複雑なソフトを動かすのか?それに、Fortranは使えない。もっとも私はアセンブラーの方が好きではあったのだが。



1976年。河田、天野の仮名漢字変換初出論文。掲載がワープロと逆順になってしまっているが、こちらが
1年早い。この時期は「序」に書いてあるように、まだ計算機への日本語入力の一手段としか考えていない。
河田、天野の仮名漢字変換初出論文
河田さんが形態素解析を大型機からミニコンに移植、私がエディタ開発を担当して、ミニコンの上での最初の試作ソフトが動いた。現在のワープロと同じ形態の日本語ワードプロセッサが誕生したのであった。1976年早々の事である。

カナキーボードは、勿論、106カナキーボードなどある訳がない。私が設計して、アルプスと言う専業メーカに作ってもらった。一台30万円もした。これを2台試作した。漢字ディスプレーはソニーテクトロのもので、蓄積管といって、一度画面に書き込んだら部分書き換えが出来ない。消すときは一度、画面全体をフラッシュさせて全部消さなくてはならないディスプレイであった。それでも研究室レベルで使える最上のものである。解像度は覚えていないが、画像処理に使っていた位だから800x600以上はあっただろう(初期のIBM PC/ATは640x480である)。ただ描画が遅いのには閉口した。何しろ、一点を書くのに、x、y座標値を送らないといけない。輝度が何bitであったか覚えていないが、1点を光らせるだけに5、6byteのデータ転送が必要であった。漢字1字24x24点がポチポチと一点ずつ光って書かれていくのが見えるのである。画面全体で数時間かかったはずである。これでは使い物にならないので、画像処理グループの麻田さんが工夫してブラウン管の偏向部に手を加え、更にコントローラボードを作ってアナログ的に描画するようにした。保証外である。これをパラレルインタフェースと呼んだが、このお陰で、画面一面の表示が2、3秒でできるようになった。

その後、このエディタを使っての実験中に私が思いついて書いた特許が、同音語を一度選択したら、以後その同音語が最初に出てくるというものである。1977年の事である。この特許は極めて強力であった。「暫定辞書を用いた短期学習による同音語選択方式」というものである。一つには、これなしにはワープロは使う気がしないというものが言える。たとえば、「こうしょう」と入力してみよう。MS−IMEでは21個の漢字が出てくる。この内、「工廠」は17番目である。戦艦大和の開発物語を書いたとしたらきっと、「海軍工廠」が頻繁にでてくるだろう。そのたびに、16回も「次候補」あるいはスペースバーを叩くのは耐えられない。

一方、1976年早々のこの時期(出願が1976年4月なので、書き始めたのは75年暮れか、76年早々)、河田さんは辞書を扱っていたので辞書をユーザ向きに最適化することを思いついた。長期学習と呼んでいる。同じ「学習」という言葉を使っているので、私の短期学習と間違われる事がたまにあるが、方式も、発明の経緯も、時期もまったく異なっている。私の発明は私が試作エディタを完成し、大量に入力実験をし始めてから考え付いたものである。河田さんがこの長期学習の特許を書いた時期、私は言語学的な意味を持つ自動分かち書きの特許を書いた。これは学会発表の前に特許を書いておかなければならないという研究所の規則があり、二人でそれぞれの主要な技術を書こうということで同時期に書いたものである。仲良く、同じ日付で出願している。

長期学習の「ユーザ」というのは分野でもよい。総務課、人事課、経理課のように使う部署で同音語が異なるだろうという発想である。この実装には実は難しい問題があった。同音語が選ばれたらその辞書項目の頻度の欄の値に1を加えていく。長く使っていれば、良く使われる同音語の頻度が高くなるので、それを同音語の一位に持ってくれば選択の手間が省ける。

しかし、当時の16ビットコンピュータでは約65000までしか頻度を上げることができない。1語でも最大値に達した後は、どうするのだろうか?これが問題の一つであった。ほっておけば、最後には全ての語が最大値に達してしまい、意味がなくなる。頻度項目を32ビットにすれば約40億まで上げることができるので、一語あるいは数語がその値に達したところで最適化終了として以後は固定すれば良いだろうが、当時の貧弱な性能のコンピュータではそのような贅沢は事実上できなかった。そんなこんなで、すぐには実装されず、後日、名案の無いままに武田さんが実装したが、そんな訳で後続機でも、他社でも使われなかったと思う。


揚羽の蝶 武田さんのこと

仮名漢字変換は、やってみると従来の論文で報告されている程単純なものではなかった。それは実験を始めてから初めて分かったこともあるし(この文の2つの「はじめて」も仮名漢字変換には難しい。)、アルゴリズムの設計段階で直ちに分かった事もある。論文は、ほんの一部、サビの部分しか書いてないのだ。困難は国文法の問題に起因した。国文法というもの、というより従来の言語学というものは言語の枠組みを示すだけで詳細な具体的理論構築などはしないのである。言語学者はそのような実学的なことには興味は無く、人間はどのようにして言葉を獲得したのかとか、言葉を発するおおまかな仕組みを問題にする。変形文法を創始したことで有名なMITのチョムスキーの理論では、言葉を発する仕組みとして、生成文法部門があり、その意味を説明する部門として意味部門があり、同じ意味の、異なる文法形式の文(典型的には、受動態の文と能動態の文)を生成する部門として変形部門がある、というような枠組みをつくった。しかし、個々の文を発生する具体的文法規則の全体を作り上げる事には何の興味もなさそうである。

そのような文法体系を本当に作成することができればそれは素晴らしい成果である。しかし、それには限りない時間がかかる。10人で20年かかっても完全というには程遠い。それでは学者として「仕事」にならないのである。1、2年で一つペーパを書くという事を不断に続けていなくては学界から忘れ去られてしまうという実態が、そのような研究形態の存在をゆるさないのである。現世的利害を考えない仙人のような学者でなければそんな研究は望めまい。しかし、一方、仙人のような学者には研究費が回って来ない。成果が無い学者に何千万円も出す人はいないのである。研究費がなければ、せっかく書いた文法規則の正当性を確認するソフトの開発もできなければ、計算機も買えない。このような仕組みの中では実際に動く文法解析システムを作ることは相当困難な事なのである。

企業の研究所も例外ではない。しかし森さんの決断で、我々はこの困難なことを始めてしまった。形態素解析エンジンは河田さんが開発し、それを用いた仮名漢字変換の意味・文法解析アルゴリズム全体の設計は私が行った。最初は、意味解析を含むアルゴリズムなどは考えも及んでおらず(発明以前なので当然である)、従って、NHKレベルの形態素解析エンジンだけで行けるだろうと、なんとなく思っていたのである。しかし、実際の文書で実験してみると、すぐにそうではないことがわかり、形態素解析エンジンは単なる辞書引きと単語の接続検定の機能を行うエンジンの役割でしかないことが判明した。最初はこのエンジンだけでその改良を進めた。文章を大量に変換してみるのである。河田さんは1975年に3ヶ月で大型機上の形態素解析エンジンを作ってしまい、1976年早々までにTOSBAC−40に移植して彼の役割を終了していた。それ以後、出荷の1979年まで3年にわたる実験、新しい仮名漢字変換アルゴリズムの発明と実装は私に託されたのである。河田さんは漢字OCR、その他で忙しいし、そもそも形態素解析エンジンはもう作ってしまったので、こちらの仕事は私が改良要求を出さない限り、する事がない。

3ヶ月で形態素解析エンジン(当時の仮名漢字変換)を作ってしまったと言うと、眉に唾をつける人がいるかもしれないが、これは本当である。私も河田さんができたと言った時には、そんなに早くと驚いたものだ。70年代の計算機環境では、机の上でコーディング用紙という紙にプログラムを書いた後、カードパンチ機の置いてある部屋に行き、そこでプログラムをカードにパンチする。1命令が1カードになる。そんなカードを2000枚単位でダンボールの箱に入れて計算機センターに持って行き、受付の棚においてくる。半日待つとラインプリンタ用紙に結果が打ち出されて棚に戻っている。つまり、うっかり、「.」を「,」に間違えたとか、命令のスペリングを1字間違えただけでもコンパイルもされずにエラーで戻って来てしまうのだ。「FORMAT」と書いたつもりで「F0RMAT」になっていたり(なぜ、タイプライタは「o」のすぐ上に「0(零)」など置くのだろう)すると、それで半日か、運が悪く計算機が混んでいる日には1日が終わりである。皆、「今日は何もできなかった」と良く愚痴ったものである。そんな環境での3ヶ月なのである。驚くに値する速さであった。もっともこれを完全な仮名漢字変換と言うと語弊がある。シミュレーションであり、また従来技術をキャッチアップしたということであり、出発点である。

私は74年からTOSBAC-40上のOSなどの実行環境を開発し、75年からは河田さんと協力して日本語環境を整えていたので河田さんがこのエンジンをTOSBAC-40に移植するのを待って、すぐに組み込んだ。日本語環境開発開始から数えれば1年ほどで従来技術にほぼ追いついたのである。それは実用化へのささやかな第一歩に過ぎないなどとはこの時点では分からなかった。こうして、とにもかくにもシミュレーションでなくTOSBAC-40上のOSとエディタで入力から出力まで通して動くようになった。実用化に向けて本格的実験が始まる。

当時かなキーボードを高速に打てるものは私しかいない。それも我流であり、完全なタッチメソッドなど出来ないので、何かを見ながらでは効率が上がらない。それで、記憶している文を片っ端から入力して文法の不備を洗いだし、そこから新たな規則を作っては河田さんのエンジンに組み込んでもらっていた。

覚えている文などというものは、普通そんなにはない。中学校、高校時代に覚えた詩、

  やまの あなたの そら とおく さいわい すむと ひとのいう。。。
  ぎおんしょうじゃの かねの おと しょぎょうむじょうの ひびき あり。。。
  ゆく かわの ながれは たえずして しかも もとの みずに あらず。。。
  ああ おとうとよ きみを なく きみ しにたもう こと なかれ。。。 
  くに やぶれて さんがあり しろ はるにして そうもく ふかし。。。
  こもろなる こじょうの ほとり くも しろく ゆうし かなしむ。。。

尽きると、歌の歌詞を使った。

 くれない もゆる おかのはな さみどり におう きしの いろ みやこの。。。
 ああ ぎょくはいに はな うけて りょくしゅに つきの かげ やどし。。。
 いぶきおろしの ゆき きえて きその ながれに ささやけば 。。。 
 ああ れいめいは ちかずけり ああ れいめいは ちかずけり たてよ。。。
 みやこぞ やよいの くも むらさきに はなの か ただよう うたげの。。。
 にいしお はしる くれないの さくらばな さく くになれど はる とこしえの。。。

その内に、歌謡曲の出番が来る。そんなおり、当時副所長役(正式職名としてはこの名称は無いが役割はある)をしておられた玄地さんがぶらぶらと回ってこられて画面を覗き込んだ後、ニコニコとして出ていかれてしまったのには閉口した。遊んでいるとは思われなかっただろうが、70年代前半の歌なんて京都慕情とか、雨のなんとかとか、恋のうたばかりである。

 かぜの うわさを しんじて きょうからは あなたと ふたり きずついて。。。
 ふりしきる あめの ほどう ほほ つたう ぎんの しずく こえ かけて。。。
 ポーリュシカ ポーレ それは あいの ことば ふたりだけの ちかいさ。。。

机上で考える文というものは、単純なものばかりである。上のような詩などは思いもよらない。「もゆる」などという文語はいうまでもなく、「れいめい」、「いぶきおろし」、「うたげ」などの単語も辞書にいれていない。しかし、詩というものは文法的には簡単なものであり、「うたわなければならなかったのだが」などという長い文節はまず出て来ない。この実験で、基本的な文法規則の欠如はほぼ潰すことができた。また、次ぎなる課題もいくつか出て来たわけである。

河田さんは時間ができると、形態素解析エンジンの改良を行っていた。日本語では名詞を単純にくっつけていくらでも長い名詞をつくることができる。このような複合語を辞書にすべて登録しておくわけにはいかない。第一、「ハワイ沖潜水艦衝突事故合同調査委員会」などというような語が出来たとして、これをあらかじめ想定することはできない。自動的に名詞を複合するアルゴリズムが必要で、これは河田さんの担当であった。二人でああでもない、こうでもないと議論しながらこういうことを決めていった。

言語学は私の独壇場で、文法を担当していたのであるが、いわゆる国文法の文節の定義では日本語の一部しか説明できないことにすぐ気がついた。。。文節とは、名詞、動詞、形容詞、副詞、のようなそれだけで意味をもつ自立語1個に助詞、助動詞が0個あるいは複数個ついたものである。簡単な判別法は文をしゃべる時、「ネ」を入れられる最小の単位である。

  私はネ、機能ネ、駅前のネ本屋でネ。。。

所が、新聞、雑誌などに出てくる現実の文は

  文節=自立語+付属語*  (*は0回以上の繰り返しを許すことを表す)

では全然変換できない。形態素解析エンジンはこれが基本になっているから、もっと大局的に文法を解析するアルゴリズムが必要になった。例えば、「第1回青梅マラソンに」というような文節は上記の定義を満足しない。純理論的には「第1回青梅マラソン」を自立語と解釈できるから全くの間違いではないが、こんな要素を単語として辞書に登録するわけにはいかない。それでは「第2回青梅マラソン」も「第3回青梅マラソン」も、これまた純理論的には無限(無限に続くとしてだが)の要素を辞書に登録することになる。それはできないから、結局、自立語に構造を持たせることになり、従って、結局その構造を文節の中で記述することになる。これは文節は上記のような簡単な定義ではできなくなることを意味する。

「第」や「回」は助数詞と呼ばれるもので、それに「1」という数詞があり、その全体が青梅マラソンを修飾している構造になっている。更に複雑な構造もある「2回目以降の」は「回」、「目」、「以降」と3つも助数詞らしきものが連なっている。これらを同一の助数詞とはできない。そんなことをしたら、「2目(メ)」という表現が可能になってしまう。もっとも、「2目」は「にもく」と読んで囲碁の地の数え方というのなら別である。

これを解決する品詞論は当時なかった。20巻ほどもある品詞大全のような専門書でもまったく扱われていなかった。私は、一括して助数詞と呼ばれていたものを、前置助数詞と、後置助数詞という用語を作って2つに分類した。同じ「読み」をもつ「第」と「台」では使い方が異なるからである。「台2回オリンピック」という変換はしたくなかったのである。同様なことは、固有名詞の扱いにも起きる。「よこはまし」は「横浜市」と変換されて欲しい。「横浜氏」はひょっとしたらあるかもしれないが、「横浜死」はいやである。更に、前置助数詞と、後置助数詞には呼応するものがある。「第21回オリンピック」とは言っても、「第21階オリンピック」とはいわない。このような処理をする機能も加えた。

しかし、これには難しい問題がある。恐らく、日常的には、「第」と「階」は呼応しない。「マンションの13階にすんでいる」、とは言っても、「マンションの第13階にすんでいる」とは言わない。本来、この「13」は序数であるから「第」が付くべきかもしれないが、そんな表現をは聞いたことがない。しかし、「第1階述語論理」というような表現は普通に行われる。辞書や文法を作るにあたって難しいことは、自分が何を知っていないのかを自分では知ることができないことである。どこに確実性を求められるのだろうか、人間用の辞書、文法はこの点では役にたたない。結局、大量のデータで実験する事と、その再評価を繰り返すしか方法はないのだろう。

こうした困難に会いながら、国文法にはない品詞も作っていった。もっとも品詞の建てかたは研究者の数だけあると言われている。そんな中に「サ変名詞」というものがある。これは私の命名ではない。既に存在していた記憶があるので、九州大学で作られたものではなかろうか。これは、「勉強」、「記憶」、「開発」など「する」という「サ変動詞」を付けることができる「名詞」の品詞名である。このような品詞を建てることによって、「交渉する」と正しく変換することが可能になり、「校章する」などの誤変換を減らすことが可能になる。このような概念は、既に英文法にはあり、action nounと呼ばれていたから、私なら、「行為名詞」としたと思う。

入力された文節は、その構造を大局的に分析する文法を新たに作った。実際には、文法ではなく、意味解析であった。こんな時、京大で学んだ言語理解が役に立った。言語理解の第一歩は、意味解析である。研究所に来た当初は意味解析ばかり考えていたが、それらの経験から「局所意味処理による二層変換型仮名漢字変換方式」を思いついたのである。

それをアルゴリズム化すると同時にそのアルゴリズムに対応できるよう河田さんの形態素解析エンジンにもマイナーチェンジを加えもらった。河田さんはプログラミングの腕が立つので、2、3日たつと、「天野君、できたよ。これ使って」という具合であった。

ここでやっと、武田さんが出て来る。これまでは、プログラム開発は河田さんと二人で行ってきた。その為の管理、お膳立てはリーダである森さんが陰に日向にしていた。Under-the-tableであるだけにこれは必須であった。文法論が充実してくるととても2人のプログラミングでは足りなくなって来たのである。もっとも河田さんは主業務としては他のプロジェクトに回っているので、既に2人ではなく、実質1.05人という状態であった。そんな事情で、武田さんが助っ人に入ってきたのである。助っ人などを入れずに、河田さんがずっと仮名漢字変換プロジェクトに従事していれば良いと思えるのだが、そこがunder-the-tableなのである。とにかく、こんな人事上の問題を解決する役割は森さんである。ある日紹介されたのが武田さんである。この日から名目上は、4人のチームになった。実質は天野、武田の2人である。河田さんはこの人事に、口には出さないが不満そうであった。彼も本当はこちらをやりたかったのではなかったかと思う。

武田さんは私より1年下であった。彼は、高卒であるので冒頭の本などでも紹介されることがない。本というものは歴史を一部も欠かさずに記述するものではない。物語を書く物である以上、京都大学大学院というラベルは、その意味では興行価値があるので、我々が前面にでてしまうのは致し方ないかも知れない。しかし、世界初の日本語ワードプロセッサに彼は大きな貢献をしているのである。まず、固有名詞の処理エンジンは彼に任せた。勿論、重要な点は「これどうしたら良い?」と相談にくるので議論して決めていった。

特筆したいのは、彼の積極性である。研究が終わり、工場での開発が始まった時、最初2年間のスケジュールを立てた。1977年秋10月頃、青梅工場の溝口部長と児玉課長が森さんを尋ねて来られた。偶々席に居た私と森さんで対応、ご説明とデモをした。この頃、情報システム研究所は手狭になった総合研究所本館から隣の工場の建物を借りてガラーンとした1フロア境界無しの部屋(というのかどうか)に移っていた。フロアーの中ほどの会議机で4人で話していた。外の立ち木の葉が枯れていた光景がなぜか印象的に頭に残っている。この後、1979年10月のデータショウに出展しようというスケジュールが決まり、我々3人は青梅工場に通い始める。これが、3ヶ月程立った時点で、1979年5月のビジネスショウに出展すると言う事になった。

半年近くののスケジュールの前倒しは辛い。ソフト開発というものは普通、スケジュールより遅れるものである。プログラム開発には我々3人の他、青梅工場のメンバーが参加する事になっていた。なにしろOSから開発するのである。完全なプリエンプティブのマルティタスクOSである。これは撤退したばかりの大型計算機開発メンバーが作った。さすがにメインフレームを作っていた技術者は素晴らしかった。あっという間に書き上げて稼動を始めた。何しろ本物のOSの上で仮名漢字変換とエディターを動かすのははじめての事である。

河田さんは、上述のように形態素解析エンジン担当であったからOSとの接点はなく、私が担当する上位プログラムの中で呼ばれるだけなので、さっさと書き上げて、その頃始まっていた別の業務の方に回ってしまった。私は、エディタとエンジン以外のかな漢字変換全体、それに自動文節認識部を抱えていた。所が、私はそれまでのテストシステムの経験からアルゴリズムの全面的変更を画策していた。上記の言語処理部分は工場の技術者にはできない。大体、電気工学技術者で、言語学にも長じ、それも単なる言語学ではなく、未だ誰も挑戦したことのない深みにまで入った計算言語学にも長じている技術者など、当時どこを探しても居る訳が無いのである。エディタ部分は、方式とアルゴリズムと仕様さえ与えれば先のOSと同じで、それを書くことができる強力なプログラマは居た。

しかし、そのアルゴリズムは私の頭の中にしかない。完成した暁の操作方、画面の構成の仕方、その内部構造など全てこうしたい程度のレベルで頭の中にあるだけである。外部仕様さえ書けない。まして内部仕様を書き下すなど論外であった。そんなものを書く時間があれば、いきなりコードを書いてしまった方が速い。もし仕様を完全に書こうとしたら、何度も書き直し書き直ししていたことだろう。こんな訳で私は内部仕様を書かなかった。正確に言えば書く時間がなかった。それで、私とコンビを組んだ工場側のの技術者は仕事が無くなってしまった。

結局、私は、2人分の仕事を抱え込んでしまったのである。その上、上記スケジュールは更に3ヶ月程たった時点で、1978年10月3日から始まるデータショウに出すということになってしまった。さすがにプログラミング速度には自信があり、強気の私も、その知らせを持ってきた河田さんに不満を言った。出来るわけがないでしょ、と。2年のスケジュールが1年に、しかも走っている内にだんだん縮められていくなんて、普通のプロジェクトではありえないのではないか。これは不満を言うだけでは済まない。強気でプログラミング好きの私も音を上げていた。試験担当から虫の知らせがくる。エディタは虫を出す、自動文節認識も虫を出す。仮名漢字変換も虫を出す。一つの虫の原因特定に注力できないのである。その上、まだ方式さえ考えていない部分があった。

こんな時、武田さんが助けてくれた。彼の担当しているファイルシステムは、私のエディタ部分と、接点があった。この部分は一種の仮想メモリになっていて複雑なのである。当時の遅いマシンでユーザに遅さを感じさせない工夫がいるのである。今、ユーザが30ページ目を入力していて、ふと思い付いて、いきなり、2ページ目を開き、そこに50行も挿入したらどのようにファイルを扱っていいのか、しかも待たせることはできないのである。こんなことはかって誰もしたことがない。何しろIBMがワードプロセッシングという概念を唱えてそれほど時間がたっていないばかりか、ワードプロセッシングなどという言葉は研究所でもほとんど知られていない新しい概念であった。計算機は計算をするものというのが常識で、言葉など扱うものではなかったのである。当時の大型機を用いた最新鋭のエディタでさえラインエディタといって、行毎に独立してしか扱えなかった。各行の後ろにかならず改行が入っているわけである。今、ワープロでそんな事をしたら大変である。しかし、当時は、一字挿入しても、次の行に自動的にずれて行き次々と文書全体に一字ずれるなどと言う処理は、遅いCPUと小さなメモリではとても出来るとは思われていなかったのである。いや、その前にそんな試みは考えもされなかった。技術というものは一般に保守的なのである。

この厄介な処理は私の受け持ちであった。私には仮名漢字変換と、エディタ本体のコーディングに忙しく、とてもそんな所まで考えている余裕は無かった。大体、自分の責任とは言え、所期の倍のプログラミング量を抱え込んでしまっていたので、この窮状は当然ではあった。武田さんは、私の窮状を見て、私との接点をずらす提案をしてくれた。私の頭の中にしかない部分のコードは私にしかかけないが、接点の部分は連続性があるのでそれをずらすことは可能なのである。それに私にも特にアイデアはなかった。普通は、こんな提案を技術者はしないものである。コーディングというものは実に細心な注意を不断に要請される。デバッガというエラー検出ソフトが充実している現在でさえ、バグをとるのは容易ではない。まして、デバッガーなどろくに無く、しかもアセンブラという機械語に毛が生えた程度の言語で書いているのである。だれしも自分の負担は少しでも減らしたいところである。この提案は本当にありがたかった。「一体あの部分はどのように実現したらよいだろうか」と思いながら、何も考える余裕がない焦りから開放されたのである。二人とも若かったから無謀なことが出来、しかもそれで出来上がってしまったのであった。

我々4人−−森、河田、武田、私−−は、この発明で、常陸宮殿下が総裁をされておられる発明協会からまず全国発明賞を、その後、同特許長官賞を戴いくことができた。本には出てこないが必ず、このような実質のある名誉には武田さんも加わってもらっているのである。


揚羽の蝶 青梅工場

1977年11月頃から青梅工場での開発が始まった。元々メインフレームを作っていた部隊だから非常に強力な技術者集団である。

1974年頃から、研究所で開発していた時はミニコンの上であるからOSなど無い。PCとは違いBIOS(Basic Input/Output System)さえない。PCではBIOSの機能の一部にIPL(Initial Program Loader)がある。これは計算機の電源を入れた時に最初に起動するソフトで、我々のミニコンでは主記憶に常駐している。PCでは主記憶にDRAMを使うから、電源を切れば記憶内容は失われる。それで、別途不揮発性のメモリにBIOSが入れて有る。70年代初期のミニコンでは磁気コアメモリといって数mm程度直径のフェライトのドーナツ型をしたコアの中にx線、y線、読みだし線の3本の線を通したものを使っていた。磁石だから電源を切っても内容は保持され消えない。

1960年代中頃、京都大学にあったメインフレームHITAC5020では
この磁気コアは直径は0.7mm程度であった。64個x64個の平面で、4096bit。
これを32面+パリティの1面を重ねて、4Kwordとしていた。おおよそ、
15cmx15cmx20cm程度の直方体であった。


しかし、実験/開発用の計算機なのだからプログラムは使う度に暴走する。主記憶の50番地から20-30ステップ程入っているIPLは壊れていることはめずらしくなかった。一人1-2台のPCあるいはUnixワークステーションという1990年代後半の恵まれた環境とは違い、当時は研究室の20人程で1、2台を共用で使っていた。ミニコンは今の400Lの冷蔵庫程度の大きさである。この前面に16個のスイッチがずらりと並んでいた。言うまでも無く、これは2byteの情報を主記憶に書き込むためのスイッチである。その下にはこれも16個の豆球が並び、読み出した主記憶の内容を表示している。それらの左にはラジオのつまみと同じ回転式ボリュームが付いている。信じられないかもしれないが、計算機のCPUの速度を連続的に変える為のものである。デバッグをする時、1ステップ毎に実行して、どこでおかしなことが起きるか追い掛けることがあるが、1ステップ毎ではうっとおしい。かといって、全速力で流しては一瞬で狙っている箇所を通り過ぎてしまうと言う時に使うと便利である。しかし、そんな使い方をした事はほとんどなかった。

他人が使ったあとでこのミニコンを使うと、IPLはたいていは壊れているので16個のスイッチを使って、ピアニストが鍵盤を叩くような操作よろしく、あるいは蝶が花の間を飛びかうような手さばきで、暗記している機械命令コードを主記憶に書き込んで行く。その後、紙テープリーダに16進数のコードが1列8bitずつ1に当たる部分に穴を穿たれている紙テープをかける。テープリーダは流れるようなスピードでコードを読みとっていく。反対側には解かれて山のようになった紙テープが溜まる。船が出港する時に投げる紙テープを全部ほぐしたようなもので、後始末が大変であった。今度は巻き取り器にかけて手で思い切りハンドルを回してまきとるのであるが、何かの拍子にテープが捻れたり、うっかり足で踏みつけていたりで良く切ったものである。

IPLが最初に読みとるテープにはローダが入っている。アプリケーションプログラムをメモリに配置するためのプログラムである。次にアプリケーションのテープをそのローダを使って読み取らせる。ローダであるから何本もの紙テープに別れているサブルーチンも当然メインルーチンとリンクしながら読み込んでくれる。こうしてやっと自分の書いたプログラムが実行できるようになるのである。このような今からみると貧弱そのものの環境が当時は普通であった。京都大学の坂井研究室には当時の日本電気の最新鋭のメインフレームであるNEAC2200モデル200があったが、研究室ではOSなど使っていなかった。ローダの入っていると思しきMT(磁気テープ)を人間の背より少し高いくらいの大きさのMTハンドラに掛け、自分の書いたプログラムを紙テープにパンチしたものを紙テープリーダにかけ、前面のコンソールパネルから40Boot 40Boot Run Run Runとスイッチをおすのである。BootとRunはそういう名前のスイッチがあったのである。そうすると、おもむろにMTからローダが主記憶に読み込まれ、紙テープリーダからプログラムが主記憶にロードされて実行できるようになる。

今なら、アプリケーションのアイコンをダブルクリックすれば、紙テープではなく、ハードディスクからこれと同じ事が行われる。便利になったものである。70年代初期は紙テープからハードディスクに環境が変わる端境期であった。その頃坂井研でもディスクパック装置が導入されつつあった。総合研究所でも75年には既に、このような紙テープ環境から、HDD環境に移っていた。2MBのリムーバブルハードディスクが入って、一挙にアプリケーション実行は楽になった。DOS、あるいはUnixのような環境を我々は独自に作っていた。しかし、初期のUNIXがそうであるようにマルティタスクOSではなく、単に次々とコマンドを入力してアプリケーションをロードして実行していくだけの物にすぎない。

このような事情で、工場でスクラッチから、つまり零からワードプロセッサの設計を始めた時、マルティタスクOS下でワードプロセッサを動かした経験は私にはなかった。キーボードからの入力から仮名漢字変換を通してCRTに表示するまでの数多くのタスクをマルティタスクOSの下でどのようにタスクとして切り分けてインタフェイスをとるのかは知らなかった。武田さんは既に工場で大きなシステムを設計した経験があり、そのようなシステム設計は彼が一手におこなった。いくつもの箱−−タスクを表す−−が紙の上に書かれその関連図が記されていった。

新設計のワードプロセッサを動かすハードは、この為に工場が新たに作った1台しかない。ハードに関らない部分は従来のミニコンで大部分開発できるが、エディタのようにキーボドやディスプレイと密接に関係するものはこのハードでしか動作を確認できない。この上でOS、仮名漢字変換の一部、エディタなどほぼ全ソフトを開発するのである。工場の実力に驚いたのは、我々がソフトをメインフレームで開発(アセンブルまではメインフレームのラインエディタとクロスアセンブラーで行う事ができる)しているちょっとの間にこのようなハードを作ってしまったことである。

たった一台のハードの使用時間は私に最優先権が与えられた。その意味でもあの素晴らしいOSをほんの空き時間で作り、デバッグは大部分、紙の上で行って私に最大限の時間を回してくれた羽多野さんには頭が下がる。

後日の事になるが、この素晴らしいOSは、JW-10専用に作られたものであり、工場標準のものでないからという理由で、技師長の判断で青梅工場の標準OSであるマイコスに変更された。このOS変更がされたモデルは同時に価格も下げられ、JW-10モデル2と呼ばれる。我々が、プロのタイピストの入力速度に追いつくようにと設計した処理時間(NHKProjectXではこの点も強調されている)などはまったく考慮されておらず、ただ工場の保守効率だけを追求して、性能は無視された。企業の論理で作られた代表的な悪機であった。遅い鈍重なOSの上で動くワープロソフトは、変換が入力に追いつかないと購入者の不評を買った。技術者はこういうことをしてはいけない。

今も、JW-10と言う名称で歴史に出てくるマシンは実際にはこのモデル2であることが多い。外見は些細な一箇所をのぞいてまったく同じ、ハード仕様もまったく同じであるので通常はわからないだろう。

さて、時は既に78年に入っていた。私はと言えば、本来、工場では許されないことだが、大型計算機を使いアセンブラでプログラムをいきなりキーボードから打ち込んでいた。仕様も、流れ図もなにもない。これまで、蓄積管で行った表示形式で、これまで誰も作ったことのない文書エディタをどのように設計すべきかのアイデアは頭にあった。今で言えば、XMLのような発想である。主記憶の中では文書はマークアップされた状態で画面と対応していた。画面とメモリの状態を物理的に対応させると、訂正した時に非常に厄介なことになるからである。主記憶の中の文章はこれまでのラインエディタのように行で管理するわけにはいかない。ページで管理するわけにもいかない。理論的には、100ページの文書の第1ページの冒頭の1字を消した瞬間に100ページ全体に影響するのである。これをどのようなファイル形式と、表示形式で実現するかについては、研究所時代にさんざんやってアイデアがあった。その上に武田さんの実務経験が上乗せされた。

主記憶上のバッファという文書の一部を記憶している領域には、タブ、インデント、改行などがマークアップとして表現されていた。画面のイメージをそのままバッファ上で表現すると、例えば1行の字数を40字として文書を作った時、5字目で改行すれば、35字の空白をバッファの上でも詰めなければならない。後で、1行を30字に変換した場合、至る所にある改行の後ろの空白を調整しなければならない。実際には、これは非常に面倒である。空白が本当の空白なのか、改行したために生じた空白なのかを全ページに渡って調べながら書き換える必要があるからである。HTMLのように<BR>というタグを使えば、こんな面倒なことはしなくてすみ、文書形式を自在に変えることができる。改行そのものは既にコードという概念があったが文書エディタという概念の下で扱ったのはこのエディタが初めてであった。タブ、インデントなどもこのマークアップ方式で自在に変更できることとなった。同音語もマークアップして全てバッファの中に持っていたため、一度選択した同音語の候補は常に先頭にくるように置き換えられると同時に異なる候補が欲しい時には同音語キーで高速に表示することができた。

このようにエディタ自体が画期的なものであったが、その上、新たに試みるつもりの日本語解析法も、まだ頭の中にしかない。新しいアイデアの実装方法は開発につれ自分のなかで明らかになってくる。こうして78年が進んで行く。


揚羽の蝶

青梅工場は、当時私の住んでいいた南武線矢向から2時間弱かかる。河田さんはこの頃、結婚してもう少し遠くに移っていた。武田さんも似たようなものである。川崎市の多摩川に近い国道一号線沿いにある総合研究所に通う人達は川崎、横浜、湘南あたりに住む事が多い。この地域から青梅までの往復4時間の通勤は首都圏の標準からみても少し遠い。それで森さんは青梅工場と交渉して三人のために工場近くの寮をとった。しかし、この部屋は、ほとんど使われなかった。河田さんは元々、既に小さな部分を受け持っているだけで、バーコードプロジェクトを本務としていて青梅工場にくる必要があまりなかった。私は下に書く理由でここで過ごしたくなかった。必然的に、武田さんも毎晩、私と一緒に南武線の客となっていた。

この頃、私は耳をわずらっていた。中耳炎の手術の予後が悪く、本来なら一日置きに耳鼻科に通わなければならない状態だった。耳にはいつも脱脂綿を詰めて溢れてくる耳だれを塞き止めて置かなければならなかった。吸収ではなく、塞き止めるのである。それ程ひどかった。胸の定期入れには常時一日分の脱脂綿が入っていた。午後、トイレの中に入り、便器に向けて耳を傾け脱脂綿をはずすと吸いきれなかった耳だれが、ザーと便器に流れる。後は定期入れから出した脱脂綿を綿棒に巻くような形に絞り、耳の中に入れて何本も取り替えながら奥まで丹念に掃除する。時にはリンデロンというステロイドと抗生剤を混ぜた点耳薬を使うが、自宅の部屋にもどらないと、そういう消毒はできないので、丹念に掃除しなければ炎症がひどくなり、耳だれが一層多くなるのである。週末まで医者にかかれないので、この掃除を自分で最低でも朝、昼、晩の3回行わなければならない。こうしてなんとか、土曜までもたせ近所の耳鼻科に通った。寮に泊まれば、この掃除をするので、一緒に泊まることになる武田さんにわかってしまう。こんな状態は、無駄に心配させることになるだけなので知られたく無かった。森さんは、せっかくの寮を利用しない私に一言も苦情を言う事はなかった。

こうして2時間弱の通勤がほぼ一年間続いた。どれほどサービス残業したか計算もできないほどだった。何しろ、公式には外出扱いでタイムカードなしだから。南武線立川駅から矢向駅までは約1時間である。立川駅は始発であるし、その上、帰りは時間の遅い電車なので必ず座ることができる。青梅線と南武線の接続はなぜか悪く、青梅線から降りて南武線のホームに着くと赤いテールランプが遠ざかっていくのが見える日々であった。南武線の一時間は、虫取り(デバッグという英語より、この言葉の方が私は口に出易い)で熱くなった頭を冷やすにはうってつけであった。計算機の前で虫取りをすると、つい余り考えずに思いつきの可能性をいろいろと試みてしまう。思った事をすぐに実行できるからである。計算機から離れると、思いついても実行できない。勢い、もっと深く考えることになる。その結果、馬鹿らしい誤りに気がつくのである。

ある夜、いつものように、チョコレート色の南武線の電車の中でラインプリンタ用紙を広げて虫取りを始めた。この頃はレーザプリンタなどなかったので、ドラムの一列に同じ活字を並べて回転させる事により、ヘッドが移動して印字していくテレタイプより高速に印字できるラインプリンタというものを使っていた。このような方式なので大きな図体になる。それだけに価格も高く、メインフレームにしか使われない。そこで使う用紙はA3位の大きさの紙にミシン目を入れて折りたたんだものである。書かれている字は全部英字のアルファベットである。アセンブラはそうであるし、コメントも英語かローマ字書きの日本語である。ある晩、途中の駅から中年の酔っぱらいが乗って来て隣に座った。プリンタ用紙を除き込む。しかし、そこには、


  LH reg1,data(ireg3)
  AHI ireg3,one
  CLH reg1,pittasi
  BTC true,ok



のような意味不明の文字列があるだけである。
「これ何?」
酔っぱらいのお父さんにこんな物をどう説明できよう。無視して虫取りをしていたら、日本語が分からないと思ったのか
「あんたアメリカ人?」
そんなエピソードで一杯の日がまだまだ続く。






Home    Next    Top