TOP500雑感(日本製HPCが世界最速の分野も。)   

2010年11月28日



☆静岡は茶花の季節。   
まずはいつもの余談から。

仕事が忙しいので余談のネタがないのだが、 円高の影響と景気悪化でようやく仕事が一息かな... と思っていたらいろいろあってやはり仕事は楽になりそうもない。 何の資源もない日本では技術力こそ国力の源泉なのだから、 技術開発から手を抜くことイコール国ごと国民全員食いっぱぐれを意味する。 なので、まだ国内に仕事があるだけマシと思って無い知恵を絞って働く他ない状況だ。

ちなみに、学生時代にもう少し勉強しておくべきだったな〜と後悔の毎日 を送る当サイトである。 (当サイトのようなお間抜け技術者にならないように、 このサイトをお読みの学生さんは是非まじめに勉強してください。 特に...座学侮るべからず! 役立たせ方さえちゃんと習得すれば、これほど効果的なものはほとんど無いですから!)

その上に、それに加えて某国家試験を受ける羽目になったり(合格発表12月中旬)、 さらになっていたり(これから受験)...というわけで、 今月は勉強漬けの週末になっている。 「こんな仕事状況で試験に受かるのかね〜。」なんて、 頭の悪い当サイトはこの段階で不合格の言い訳を考えているような状況。

というわけで、週末も息抜きがあまりできないので、別の息抜き方法を考えた。 じつは当サイトは健康診断で生まれて初めて医者から体重を減らせと言われてしまった。 冗談抜きでメタボ突入なのである。 そこで、息抜きを兼ねて毎日1時間歩くことにしたのだ。

ここ静岡は全国有数の茶処なので、国道を離れれば周囲はのどかなお茶畑。 しかも、今は茶花の季節なのである。 まず、歩いて体重を減らす。そして、茶花見物で息抜き。(温暖な静岡なので紅葉の盛りはこれから。) 息抜きにならない市街地を歩くときは単語帳に資格試験の暗記事項を書いて覚えながら歩く。 一石二鳥ならぬ一石三鳥。

ここ静岡では茶花の季節。
静岡らしい、心和む風情である。

効果は早速現れた。山歩き開始以降、体重が約6kgも減ったのだ。 もちろん、体重は(ギリギリとは言え)適正体重の範囲内に復帰。 久しぶりの達成感である。

で、先日、旧居成田に出張があったので、仕事の後で昔仲間と飲み会に... 体重が減ったことを誉めてもらえるのかな〜、と期待しながら会場に出かけたのであるが... なんと先輩の一言は、「おっ、おまえ、なんかやつれたな〜。」

あれだけ頑張って体重減らしたのに...トホホ。

☆中国の躍進に対して危機感の薄いアメリカの本心は?   
そんな中で当サイト的に興味のある分野というと、直近ではスパコンネタ。 TOP500の発表があったのだ。

今回のTOP500での最大のネタは中国がトップになった事だろう。 過去のスパコンの歴史と言えば 「1にアメリカ、2に日本、3,4が無くて、5もペンペン草さえ無い。」 という状況で、事実上日本とアメリカの戦いであったのだ。 そこで今回の中国の躍進である。 メンツの国である中国では面目躍如と言うところだろう。 ところが、この中国の躍進を見てアメリカが猛烈な対抗心かと思いきや、 過去に地球シミュレータが世界一となったときとは違って危機感が薄いのである。

これには、近いうちにアメリカが首位を奪還するから...という観測があるため、 とマスコミ等では報道されている。 ところが当サイトの見解はちょっと異なる。

今のアメリカになぜ地球シミュレータに首位を奪われたときほどの危機感が無いのかというと、 それは中国のスパコンに何が使われているかを見れば簡単にわかる。 それは、NVIDIAのGPUが使われているからであるというのが当サイトの見解である。

現段階ではGPGPUをコネクトするチップのみが自国の技術で作られているが、 もし今回の中国製HPCがすべて中国製のチップで作られていたらどうだろう?  アメリカと政治的覇権を争う意志の無い日本に対してさえあれほどの危機感を持っていたのである。 当然、当時の地球シミュレータ以上の危機感をあからさまに表現する事になっていたことは間違いない。 なぜならば、中国には将来的にアメリカと覇権を争う意志があるからである。

スパコンは日本ではサイエンスや産業技術に使われているわけだが、 アメリカでの本流は核開発に代表される通り軍事利用が主役である。 この技術がアメリカの支配下から逸脱する事をアメリカが簡単に容認するハズはない。 逆にアメリカ製チップがメインに使われている状況ならば、それは事実上HPCがアメリカの支配下にある事を意味している。 地球シミュレータの場合にアメリカにあれほどの危機感があったのは、 それがすべて日本独自の技術で作られていたからなのだ。

もちろん中国もそのような事情は承知している。 中国製HPCチップを開発したとしてもそれが世界市場で売れまくって儲かる確率はゼロ% である事は明白であるにも関わらず、独自チップ開発に力を入れているのもそのためであろう。 だが、HPC関連の技術全てを独自開発して世界一の座につくのにはまだかなりのタイムラグがある。 このためにアメリカには危機感の欠如がある訳である。

☆NVIDIAはHPC界に打って出るよりも、まず自分の城を守るべきである。   
ちなみに、日本のTOP500での首位は東工大のTSUBAME2.0であった。 当サイトは過去の東工大の方式、つまりピーク性能だけを高めるアクセラレータという方式には汎用機としてはかなり懐疑的な立場であり、 東工大の方々には失礼ながら正直な話あまり期待感を持っていなかった。(専用機ならば非常に有望な方式だとは思うけれど。) しかし、今回GPU系に方針を転換した事には期待感を持っている。 なぜならば、汎用機を狙うならばバンド幅の重要性を認めるしか無いと気づいたことになるからだ。

実際、以前の方式では「流体用途でも高速になる。」と主張しつつも、 実績を出すことができなかったわけだが、今回はいきなり気象用途でかなりの実績を出してきている。 特にプログラミングの難易度の高い分野で高効率を出したのはすばらしい。

当サイトはベクトルプロセッサとスカラプロセッサは有効用途がジャンルとして異なるので、 スカラ機の躍進でベクトル機が駆逐されることはないと予測してきた。 逆にGPGPUのような高バンド幅対応可能なプロセッサが普及するときが、 ベクトル機の危機が訪れるときと予測していたわけだ。

NECの撤退はGPGPUの躍進期とスカラプロセッサの拡大と時期が一致しているため、 当サイトの見解が正しかったのか間違っていたのかはわからない。 ただし、この予想の判断はスパコン界でスカラプロセッサのマルチコアが主流になるのかGPGPUが主流になるのかで一定の判断がつく事がわかる。

ベクトル vs スカラの戦いならば、今後のスパコン界での主流はスカラプロセッサのマルチコアバージョンである。 一方、当サイトの考え方が正しければバンド幅が重要な用途ではGPGPUが スカラプロセッサのマルチコアを駆逐していく事になる。 当然、当サイトはGPGPU派である。 今後の展開には特にご注目いただきたい。

ただし、GPGPU派だからといってNVIDIA派というわけではない。 それどころか、NVIDIAの将来には強い危機感を感じているのである。 それはなぜか?

それは、実性能はトップクラスでありながらHPCから撤退せざるを得なかったNECのビジネスモデルに象徴されていると思う。 ベクトル機は実性能ではスカラ機よりも数段HPC向けであったにも関わらず、 HPC業界だけでビジネスモデルを成立させなければならないという事情により 撤退を強いられた。他の分野で技術開発費用を併用するというビジネスモデルが使えないため、 全開発費用をHPC分野につぎ込まざるを得ず、その結果製品価格の高騰を抑えきれなかったためである。 技術的には優れた方式ながら商売として利益が出せないという、収益逓増の法則から逸脱した商品となってしまったわけだ。

つまり、GPGPUがスカラプロセッサに勝つためには、アーキテクチャ的に優位なだけでは駄目だと思う。 商用プロセッサとしてビジネスが成立する事が大前提な訳である。

だが、NVIDIA最大の苦境は当サイトの予測通りマルチコアから GPU混載へと時代の流れが変わりつつある事である。 HPC用途の市場規模はPC用途とは比較にならない位小さい。 つまり、HPC用途でいくら高く売れたとしても、それだけでビジネスを成立させることは不可能だと思う。

というわけで、NVIDIAのGPGPUをHPC向けに振り向ける発想は、 技術的には正しいものでありながらビジネスモデルとしては決して正しいものとは言えないと思う。 ビジネスモデル的には従来の市場を確保する事が大前提なのだ。

従って、当サイトの予想としては、 現場のままならばNVIDIAのHPC業界での勝利は短期間で収束すると思う。 時代の流れはGPGPU単独ではなくCPUへのGPGPU混載である。 この流れに乗れずPC業界から脱落しつつある状態から脱却する事無しにHPC分野での勝利もあり得ない。 技術的に正しくてもビジネス的に立ちゆかなくなるという状況に陥る事は明白だと考えているのだが...

というわけで、NVIDIAが生き残ろうと思ったらARM搭載によるSOC化が必須である。 HPC分野単独での生き残りはあり得ない。 PC業界ではx86以外での勝利は無いから、タブレット市場等を制するしかないし、 そのためにはCPUとのSOC化無しには生き残ることは不可能だと思う。

逆にintelやAMDのHPC分野での躍進は確約されていると思う。 それは単純なマルチコア化から脱却してGPU混載へと方針を切り替えたからである。 後は倍精度の演算ユニットにどの程度力を入れるかという市場価値判断の 問題となるが、もしそこに力を入れる判断が下されればHPC業界を制すると思う。 一方、GPU混載ではなく現場のマルチコア化で開発を進める限り、 IBMはこの業界では以前の勢いを無くすと当サイトでは予測している。

☆日本のスパコンは、ある分野では世界最速であった。   
さて、当サイトはスカラマルチコアとGPGPUの比較ではGPGPU派であるが、 この背景にはGPGPUがベクトル機に近いプロセッサであるという事情がある。 当サイトは、ベクトル機のHPC分野での実効性能優位性を主張してきた。 これに対してNECの撤退をもって当サイトの判断ミスとする意見がある。 この意見に対してどちらが正しかったのかという判断基準が今回のTOP500で示された。

さて、今回のTOP500の発表で日本最速のHPCはどれだろうか?

東工大のTSUBAME2.0?  たしかにLINPACKではそうである。 しかし、HPC業界ではLINPACKだけではHPCの性能指標としては情報不足という意見が 学会の主流である。このため、最近ではHPC Challengeが追加された。

その主要測定項目は、LINPACKと同様の線形代数項目であるG-HPL、フーリエ変換処理能力を測るG-FFT、 メモリバンド幅の能力を測るEP-Stream、ランダムアクセス能力を測るG-RandomAccessの4つ。 (詳しくはもっと何項目かあるけれど。)

TOP500では過去の歴史的経緯からLINPACKメインで判断されているが、 実のところこの4つの項目には優劣はつけられない。 線形代数はもちろん重要項目であり、 当サイトはLINPACKが無意味な指標とは言うつもりは全くない。 しかし、FFTの重要性は科学分野では抜きに語れないし、流体分野ではバンド幅の重要性は最重要。 また、疎行列計算ではランダムアクセス性能が最大重要項目であり、また、疎行列計算の重要性も言うまでもないと思う。

つまり、この4つの指標はオリンピックで言えば競技種目が違うだけで、 それぞれ同等の重要度だと思う。 (100m走の金メダルとマラソンの金メダルに優劣の差は無いのと同様。) LINPACKが主に語られるのは、過去の歴史的経緯としてLIPACKが評価項目として使われてきた時代が長かったという事情のみなのである。

その上で、今回のTOP500で最大の金星をもぎ取った日本のHPCは何だろうか? 東工大のTSUBAME2.0はLINPACK4位であり、残念ながらわずかに銅メダルに届かなかった。 しかし、実は日本には金メダルマシンが存在するのである。

それはJAMSTECの地球シミュレータ(ES2)である。 地球シミュレータはLINPACKでは54位であるにも関わらず、 G-FFTで世界トップの金メダルを確保したのである。 この事実はベクトル機時代遅れ論が如何に思慮に欠けているかを、 事実を持って証明していると思う。 競技種目が違っても4位と金メダルでは順位の差は明白だからである。

ちなみに、純粋な性能指標ではないが、消費電力あたりの性能を評価するGreen500という評価項目もある。 今回のGreen500には評価にちょっとゴタゴタがあって本当のところははっきりしないが、 HPCシステムが大規模化する一方の現代では非常に重要な項目であると思う。 ただし、消費電力でボロボロと言われていたベクトル機がじつは流体分野の実効性能あたりの消費電力ではスカラ機に勝っていたことでわかるように、 これをLINPACKでの消費電力だけで計る事には問題があると思う。(キャッシュやローカルメモリの能力が過大評価される傾向にあるため。)

と言うわけで、当サイトはこのGreen500もHPC Challenge同様にG-FFT、EP-Stream、G-RandomAccess等での 電力効率評価も追加すべきであると当サイトは考えている。 HPCの本当の電力効率に対して、より客観的なデータが得られると思うからである。