情報の量と質。(2007年年頭挨拶)   

2007年1月5日



☆2007年の初詣   
皆様、新年あけましておめでとうございます。 本年も、よろしくお願いいたします。

カレンダー通り三箇日で冬休みが終了した当方より冬休みの短い方、1/8まで悠々自適の長期休暇の方、 人それぞれ事情は違うのであろうが、当サイト管理人は今年は12/30から1/4まで帰省。 (例によって下道ブラブラ帰省のため、初日と最終日は移動だけで終了。) 大晦日+三箇日だけの帰省期間中は追っ手がかからないので遊び呆けていて、結局今年初の更新は三箇日過ぎになってしまった。

さて、当サイトにとって旧年中は厄年とも言える年だった。 ともかく仕事が忙しく、パソコンをいじっている暇がほとんど無かった。 結局、冬休み前半戦も年賀状を書くだけで終わってしまい、 パソコンの組み立てはおろか 荒れ果てた自室の大掃除すらできずに帰省しなければならない始末。

当然、自室の床は雑把に荒れ果てたままで視界が効かず、 下手に歩くとステップアップトランスの角で足の小指を蹴躓く。 あれは本当に痛いんだよね。

でも、12/29はおみやげ(豪石クッキー)をもらったお師匠様が秋田より戻ってくるとのことなので、 貴重な自由時間を投入して秋葉原で集合する事に。久しぶりの秋葉原で思いっきり買い物...って感じだ。

ところが運の悪い年は最後までツキがないようである。 お師匠様と二人でパーツ屋巡りをしていたところ、 見知らぬ人に道を聞かれた。

「あのー、メイド喫茶どこっすか?」

あぁ、何と言うことだあぁ〜。 当日はCyrixウインドブレーカーを羽織っていたから PCマニアに見えるのは仕方ないにしても、 メイド喫茶に詳しそうな人物に見えるのか?1)

お師匠様はもう笑いをこらえきれないって感じで、 必至で笑いを噛み殺している。

PCパーツショップなら結構答えられるんだが... なんと言うか...言葉も出ないのでゼスチャーで「知らん。知らん。」とやってわかってもらったが、 それ以降、お師匠様の嬉しそうなこと嬉しそうなこと。

何を話してもニコニコ。「もう今日一日は何をやってもオレに頭が上がらんだろっ!」 って顔に書いてある。 鬼の首でも取ったかのようなあんな嬉しそうな顔、久しく見たこと無い。

しかし...もう秋葉原はPCの町では無いのだろうか?  ショップの入れ替わりを象徴する あまりにも寂しすぎる年の瀬であった。ショボン。

☆まずは厄落としの初詣   
と言うわけで、今年の初詣はまずは厄落としって事で、 それに加えてお仕事方面に御利益の大きそうなところへ参拝を計画。

今年の初詣は海津市にあるお千代保稲荷(おちょぼいなり)にした。 旧年中はもう災厄に憑かれていたというか、 仕事に憑かれていたというか...(確かに仕事に疲れてはいたが...) ともあれ無意味に大変だったので、真っ当な意味で商売繁盛をお願いしたいと思ったからだ。

初詣その1・お千代保稲荷(おちょぼいなり)
写真の通り参道まで長蛇の列で入場制限まで行われる始末。おかげでたき火が無い!

このお千代保稲荷、通称おちょぼさんと言って岐阜・愛知県地方では 商売繁盛の神様として結構有名だ。 当然参拝客も多いわけであり、実際もの凄い数の参拝客。 あまりの参拝客の多さに参道まで長蛇の列で、しかも時々ピクリとも動かなくなる。 拝殿では危険防止のため入場制限が行われていたのだ。

で、新年なので毎度のたき火にあたりながら考えるシリーズな訳だが、 お千代保稲荷では参拝客があまりに多すぎて危険なので、たき火が無いのね。 (たしかにあの人数ではたき火に追い落とされる人が出るかもしれない。)

と言うわけで、海津市から揖斐川を越えて南下。 養老山系の南端・多度山にある多度神社にも初詣をはしごすることに。

初詣その2・養老山系の南端に有名な多度神社がある。
白い神馬が多度神社の象徴であるので、神社内に白馬が居ました。

多度神社は三重県北部にあり、勇壮な上げ馬神事で有名な神社である。 南には歴史ある桑名市を控え、北は養老山系、西は藤原岳や御在所岳、東は木曽川三川2)を経て名古屋に通じる。

ここ多度を訪れたのは初めてなのだが、雪山を遠景に名古屋という大都市から 近すぎもせず遠すぎもせず、適度なローカル感があってとても住みやすそうだ。 当サイトは新興住宅街の生まれなので、雪山の見える街並みとか、 海の見える街並みとかに凄く憧れがあるんだよね。 (風景以外では山車祭りのある古き街並みなんてのにもとても憧れるねぇ。)

多度神社は神様に人々の願いを伝える白い神馬の伝説が有名な神社で、 参拝すると写真の通り白馬が居る。 こちらも参拝客は多いのであるが、境内がお千代保稲荷より大きいので 参拝客が捌ききれない程ではない。しっかり、たき火もありましたよ。

たき火にあたって考える。
今年はどんなネタで行くとおもしろくかつ興味深くなるのかね〜。

たき火にあたりながら考えるシリーズは フレーズだけで実体のあるものではないが、 まぁ、去年変なことを書いてしまったので、 ここは意地でもたき火に当たらないと...

帰りに道にはいなべ市にも寄り道して雪景色を堪能。 巡見街道沿線では日本猿の群にも遭遇。 かわいい子猿も居たりして、ちょっと得した気分に。 こりゃ初詣というよりは、ちょっとした日帰り旅行だね。

多度神社の帰りに少々寄り道ドライブ。
雪山が見える風景にはとても憧れがあるねぇ。

で、たき火にあたって考えたその中身はと言うと...今年考えたのは 情報の質と量の問題だ。

☆低品質多量と高品質少量の情報では、後者の価値が断然大きい。   
旧年中のネタは以前のネタに比べてプロの論文を読んでベースにしたものが多かった。 これは情報の質を考えてのことである。

情報理論ではネットワークの価値は接続しているユーザーの数の2乗で決まるという説をどこかで見たことがある。ユーザー数の2倍多いネットは4倍の価値があるというのである。

当サイトはアマチュアだから、プロの情報科学者がそのような説を提唱すれば 当然それに乗っかる訳だが、この件に関しては間違いだとは思わなかったものの、 それだけで説明する事にどうしても納得がいかなかったという記憶がある。

それは、その理論がすべてのユーザーを対等に考えていて、 情報の品質に対して何の考慮も成されていなかったからだ。

ネットワークに接続しているユーザーにはアクティブな人、パッシブな人がいる。 アクティブな人の中にも高品質な情報を提供している人もいれば、 当サイトのようにジャンク情報しか発信できていない人もいる。 情報のやりとりは新聞やTV放送のように一方向ではないが、 さりとて完全な双方向でもない。 また、情報を評価する側も必ずしも情報品質に従って評価している訳ではない。

最近、典型的な例に遭遇した。Googleである。

当サイトは検索サイトとしてはGoogleを最も重用している。 検索サイトとして見た場合Googleはダントツで優れた評価を得ているし、 当サイトの実感でも確かに(特に情報量において)優れた検索サイトである。 リンク評価を基本とした独自のPageRankアルゴリズムは各方面で非常に高い評価を受けているのは事実である。 (以下はその点を認めGoogleを貶める意図は無い事を明らかにした上での話である事にはご注意いただきたい。)

だが、最近その評価システムは根本的には株式市場における株価の値付けの仕組みと同じであるという 問題点が如実に現れる例が多くなってきたように思う。

Googleの検索評価は被リンク回数や参照回数を基準としている。 悪意のあるサイトが検索順位を意図的に上げたりできないように各種の工夫が凝らされてはいるが、 簡単に言うと「人々からよく見られて、たくさんリンクされるサイトは良いサイト。」という基準だ。

しかし、これは株式市場の株価の値付けと同じ論理である。 株価は需要と供給の関係で決まるので、その株を欲しい人が多いほど値が上がる。 20世紀最大の経済学者ケインズは、いみじくも株価は美人投票の様なものだと喝破した。 美人投票は各個人の主観の集合体であって、つまり客観性は非常に薄い。 (美人の客観的定義なんてもちろん無い。要するに独断と偏見による好みの問題だね。)

株価は企業価値を代表してない事は時価総額最大化戦略が結局は虚業の戦略だったことでわかるだろう。 高株価すなわち時価総額最大化戦略がホリエモンのような歪んだ経営者を生み出したように、究極的には人気投票では正しい情報品質の評価ではないのだと思う。

Googleの検索結果も同様であり、「被リンク数の多いサイトは良いサイト。」という基準は人気投票としての検索順位と考えれば申し分ないアルゴリズムだが、情報の客観性や内容の信頼性を考えた場合は非常にあやふやな検索結果しかもたらさない例が多い。 学会論文では引用回数が論文価値の評価に用いられたりするが、これは 引用する側も一定水準を越えたプロであるという大前提があって成り立つのだ。

ネットショッピングのように、そもそもサイトの情報品質を考えなくても良く、人気そのものが情報品質に相当する場合にはこれでもいいのかもしれないが、当サイトがスパコンネタなどで情報を集めようとすると(情報量ではなく検索順位という観点からは)途端に馬脚を現してしまうのである。

具体例をお目にかけよう。

例えば、当サイトがよくネタに使うスパコン系のキーワードで検索をしてみて欲しい。 例えば「京速計算機」&「バンド幅」といった具合だ。 当サイトが引用した論文よりも当サイト自身の記事が上位に引っかからないだろうか?

情報品質が当サイトより格段に高い一次文献が、一介のアマチュアの文章よりも下位に検索されるのである。

それもこれも、真面目な論文は難しいので読まれる回数も被リンク数も少なく、逆に程度が低く笑って読める当サイトのコラムの方が読まれている回数や被リンク数が多いことから来るものである。だが、学術論文に代表される価値の高い情報が下位に埋もれてしまうという意味で、被リンク数の大小という根本的な検索アルゴリズムが情報の質に対してはうまく機能していない。 これこそ「悪貨は良貨を駆逐する。」が検索順位上で発生した決定的な証拠である。

我ながら苦笑してしまうが、当サイトもPCマニア界の虚業サイトとも言えるわけだ。 もちろん意図してそうしたわけではないが、最近はそれなりにアクセス数が増えたので 内容の薄さ(情報品質の低さ)にも関わらず検索アルゴリズム(アクセス数と被リンク数の多さ)の関係で上位検索されたりする場合が出てきているわけだ。 (ちなみに、こういう物もあるが、当サイトの記事が引っかからないのは良いが、 今度は情報量が少なくなり過ぎてしまう。)

Googleの検索アルゴリズムは情報品質に関する評価が成されていないと言う指摘は 当サイト独自の主張ではなくていろいろなところで掲載されているが、 サイトの内容ではなく被リンク数をベースにしている以上、本質的に改善の難しい問題であろう。 情報の質を検索できるアルゴリズムがこの世に現れていない以上、 これを自分で評価できる実力を身につけるのがメディアリテラシーという奴だと思う。

低品質な情報は量が多くても多くの場合まったく使えない。 情報量が多いのは情報品質の高い情報を集めるためのあくまで手段であって、 最終的には決して目的ではないと思う。

☆質を伴もなわない情報は非常に扱いにくい。   
検索サイトとしてあまりにも有名になったGoogle。 しかし、「Googleに無いものは世の中には存在しないも同じ扱い。」 という言葉に代表される通り 情報の母集団という意味では凄いと思うが、 検索順位的には非常に使いにくいと思う。 世間の評価とは異なり残念ながら当サイトはGoogleには情報量以上の期待は持っていない。3)

しかも、「Googleで検索上位でないサイトは見てもらえない。」 という評価は当サイトでは全く当てはまらない。

当サイトがGoogleで情報を収集するとき、検索ページは 最低でも5ページ分位は見る。それでも必要な情報品質に到達しなければ 何ページ先に掲載されているサイトでも読んでいく。 検索語彙によっては全部見ることも希ではないし、 引っかかったサイト数が多い場合でも20ページ以降まで探してみることは常時発生する。結局、Googleの情報収集力は大きな助けになっているが、 情報品質の判断は完全に人力に頼っているわけだ。

しかし、情報品質を検索結果に反映できれば、 本来なら最初の1ページ分を見るだけでOKなハズである。 そうならないのは、Googleには偉大な情報収集力はあっても、 残念ながら本質的に情報品質を反映できないからだろう。

余談だが、これ、受信機におけるS/Nの問題と考えるとわかりやすい。 情報収集力は受信機の感度に相当する訳だが、 感度を最終的に決定するのは受信機のゲインではなくNFである。 同様に情報量の多さはゲインに相当するが、最終的に使いやすさを決めるのは 情報のS/Nの良さだと思う。

こうして考えると、今、情報収集に求められる概念は情報量から 情報品質に移行しつつあると思える。 検索サイトは情報のS/Nを高める事、つまり受信機におけるノイズキャンセラーや S/Nエンハンサーに相当する機能を実装することがGoogleを超える検索サイトにつながるとも思える。

情報品質の判断という面までコンピュータに任せてしまったら人間の価値とは何なのか...と言った哲学的疑問を別とすれば、質を伴わない情報を減らして情報のS/Nを高め、扱いやすくコンパクトにまとめてくれる検索サイトの登場が望まれるのではないだろうか? (たとえば、スパコン系の真面目な情報を集めようと思ったとき、当サイトの記事なぞは真っ先に下位ランクへ落とされる検索アルゴリズムが 正しい知的検索アルゴリズムであろう。)

☆結局は正統派の勉強をするしかない。   
ここでMBA取得のためアメリカに留学した友人のおもしろい話を掲載してみよう。

その大学ではシナジー効果4)を授業で説明するのに、おもしろい体験学習をしていたという。それは、登山用品を目の前に並べて遭難したときに生き残るために重要なグッズを上位3つだけ選べというものだ。

そして、各人が3つのグッズを選んだら、今度は数人のグループにまとめて相談させ、 グループとしての3つのグッズを合議の上で決めさせる。

最後にプロの登山家を連れてきて、遭難時に必要なグッズを上位から解説していく。 すると、ほとんどの場合で各個人の判断よりも合議の判断の方が正しいグッズに到達するそうだ。シナジー効果を効果的に体験できる授業なわけだね。

しかし、その話を聞いたとき当サイトは思ったね。

最後にプロの登山家が出てきて正解を説明するならば、 結局シロウトが合議で判断するよりも一人のプロの判断の方が上なのだと。 シナジー効果と言っても、結局は厳しく訓練された プロの方が正しい判断を下せるのではないかとね。 (ちなみに、Googleの判断基準から言えばプロの登山家よりも シロウトのグループ協議の結果が正しい選択となる。)

当サイト的には旧年中はプロの論文をベースにしたものが増えたが、 これはこのような事情を考えてのことだ。 プロといえども人間であるから100%信頼するわけではないが、 当サイトが記事を書く上で情報収集した経験から言わせていただくと、 情報品質という意味ではプロの論文はベースの高さが比較にならないというのが印象なのである。ヨタ情報は結論をミスリードするという意味では、情報価値がマイナスだったりさえする。(これは当サイト自身のことであったりもするわけだが...)

サイトの内容をレベルアップしようと思ったら、 情報のS/Nを上げるための判断力・洞察力を身につける必要がある。 それには結局は基礎からコツコツ勉強するしかない。 コツコツ勉強なんて浪人時代や研究室時代を思い出させて、 当サイトのおつむには無駄骨のような気もするが、無駄骨だろうと何だろうと メディアリテラシーとしての基礎力が無ければ入手した情報の真偽すら確認できないのだ。

当サイトのような中身のないお笑い系PCマニアサイトといえど、 (自分自身が周囲をミスリードしないという自戒の意味も込めて) 技術論議をする以上は本人のレベルを上げるしかないと、 ちょっと真面目な気分になった。

今年年頭の主張は情報品質の重要性だ。 今回はGoogleの事を比較的悪く書いてしまったが、 Googleが被リンク数を検索順位の判断基準にしている以上、 Googleの検索品位は我々の情報リテラシーの程度の低さを間接的に表しているとも言えるだろうね。

ネットは入手可能な情報量を増やしてくれたが、 今の技術では情報のS/Nは決して高めてくれない事を 頭に入れた上で利用する必要があると思う。

去年の年頭挨拶は新年ということで少々夢物語を語らせていただいたが、 ことしは新年ということで少々真面目な努力目標を語らせていただくこととした。 当サイトのトリ頭が少しでも万物の霊長足り得るよう精進してみたいと思う。

元旦に早起きして初日の出を見た。ありがたや、ありがたや。
本文とは全然関係ないけれど、最後に正月らしい写真を掲載しておきます。
本年もよろしくお願い申し上げます。



1)
これ、受け狙いのガセネタっぽく見えるが、証人もいる全くの実話。

まぁ、でも何だ...メイド喫茶好きの方も他人に迷惑かけている訳ではないから、 あんまり悪く言うのも何かもね。 個人的には秋葉原が電脳歌舞伎町化するのを恐れているわけだけど。 (妻子持ちの友人は「もう子供連れで行ける町では無くなった!」と嘆いていた。)

余談だが、羽織っていたウインドブレーカーは当時のCyrixの拡販グッズ。 BOX版の6x86MXを購入するとCyrixロゴ入りウインドブレーカーが付いてきた。 このウインドブレーカーでPCマニアだとわかる方は、ご自身もマニアってことですな。

2)
木曽川・長良川・揖斐川の3つ。 この辺りは3つの大河が集中しているので、 愛知県側から三重県側に行くときは一瞬だけ岐阜県を通過して 川を3つ分一気に渡ることになる。結構壮観である。

3)
当サイトもGoogleはよく使うが、それは他の検索サイトでは引っかからない情報が 網にかかるからであって、検索順位にはほとんど期待していない。 つまり、Googleの強みとしてこの検索順位付けアルゴリズムを例示する人が多いが、 (当サイト的な使用分野でだけの話かもしれないが)当サイトはあまり賛成できない。

Googleの強みはサイトの奥深くにあるpdfファイルやWordの文書まで収集してしまう 圧倒的な情報収集力検索のスピードであって、 残念ながら当サイト的な使用分野では巷で噂の検索品質の良さはまったく生かされないというのが当サイトの経験だ。

Googleの事を悪く書いてしまったので最後に一つだけ擁護しておく。 学術論文が下位に埋もれるという問題はGoogleだけのものではない。 現代の検索サイト一般の問題でもある。

また、特に学術系のデータを入手したいと思ったら、Googleの情報収集量は他の検索サイトを完全に圧倒している。比較にすらならないと言って良い。 検索順位が下位ではあっても、そもそも検索に引っかかる(情報の母集団の量が多い)という点では確かにIT界の巨人なのである。

4)
シナジー効果を簡単な日本語で説明すれば「三人寄れば文殊の知恵。」だ。 経営判断上のミスを減らす方法としてアドバイザーとの合議の効果を説明するためなどに使われる。