開発の「デメリット」が勝利の主因。   

2017年2月18日



☆第二東名で帰省したら...長篠設楽ヶ原の合戦。   
まずはいつもの余談から。

当方の実家は愛知県にあるが、従来の新東名は蒲郡直前で不通になっていた。 しかし、去年に新東名が名古屋まで全線開通。 このため、GWにはいつも大渋滞していた旧東名の蒲郡付近を避けて帰ることができた。

実際の状況も予想通りであり、GWでも第二東名は渋滞していなかった。 (第二東名が無い箱根山付近の東名では大渋滞だったが...) おかげさまで気分良く帰ることができて、渋滞回避の必要も無いので 長篠設楽ヶ原SAで息抜き。

この長篠設楽ヶ原SA...名前通り戦国時代の長篠設楽ヶ原合戦を象徴した おもしろ型のSAだった。当方は下り車線走行なので、下りの行き先に起因する 織田信長・徳川家康の陣営が見せ所としてSAが設定されていた。

長篠設楽ヶ原SA下り側の景色。
下り側は愛知県側なので、織田信長・徳川家康を象徴としたSAになっていた。笑えるよ。

写真の通り、SAには信長・家康の でイメージ作りされている。 それだけではなくて、売り上げお土産も信長・家康のイメージお菓子がたくさん売られていた。 当サイトが買ったお土産も「尾張名古屋列伝」という織田・豊臣・徳川を象徴したお菓子。

この印象は息抜きになかなか良かった。そんなわけで、 帰り道は逆に武田陣営側を象徴するSAとなっているそうなので、 帰りにもこちらのSAに寄り道してみた。

帰り道には武田側を象徴する長篠設楽ヶ原SAに寄り道してみた。
武田はボロ負けした陣営なので、こちらはお客様を寄り道させにくいのかと思っていたが、 こちらも良い。

下り側のSAは長篠設楽ヶ原合戦で大勝利した織田・徳川側だから良いイメージを出しやすいのだが、 上り側のSAはボロ負けした武田側だから、SAのイメージを良くしにくいと思っていたのだが... こちらもお客様が寄り道しやすい状況にすることに成功していた。

SAというと高速運転の疲れ抜きのイメージがあるのだけれど、 おもしろいSAは雰囲気的に笑えて、確かに息抜きしやすいですね。

☆TOP500のみでは評価がダメな証拠。   
と言うわけで、本題へ。 今回はスパコンの評価方法の最適化に伴う問題点の解消方法について検討してみた。

前々回のコラムではスパコン開発最大の問題点をTOP500のスパコン評価状況であると指摘してきた。 TOP500は一部の性能だけが高ければ一位になる事ができる。 つまり、スパコンでのアプリが高効率で運用できる範囲の広さが全く評価されていない 大問題点がある評価アプリなのだ。

では、正しいスパコン評価アプリとはどのようなものなのであろうか?  それは、スパコン評価アプリの評価順位結果と そのスパコンを使った科学分野の論文数や論文評価の良さが比例関係にあるアプリである。 TOP500で高順位にありながら、そのスパコンを使ったシミュレーションな等での論文数が 比例関係にある事。これが最重要項目なのである。

と言うわけで、スパコン評価アプリの改進を考えてみよう。

この意見は当方がずいぶん前から発言していた内容だが、 最近ではプロもそう考える人が増えてきている。 このため、TOP500だけでは性能判断が間違っており、 他の評価プログラムの結果も報告記入の記事が増えてきている。

では、具体的に最近のTOP500以外のスパコン評価記事を見ていただこう。 この例としては スパコン「京」、実アプリ向け処理性能指標ランキングで世界1位を獲得や、 スパコン「京」、スパコン性能ランキング「Graph500」で4期連続で1位を獲得や、 という記事が参考になるようだ。

この記事を読んでいただければわかるが、TOP500で2回連続1位の天河2号は 4年も前に完成していた京速計算機に実質的にはボロ負けしている。

まあ、当サイトは日本人なので、京速計算機との比較では日本人のバイアス思考 だと思われてしまうかもしれない。 だから、京速計算機だけではなく、同じ中国製のスパコンでも比較してみよう。 (神威太湖之光と、それ以前にTOP500で首位(現行2位)の天河2号。 これを理論ピーク性能、TOP500、Graph500、HPCGで比較。)

 スパコン   理論ピーク性能   TOP500性能   Graph500性能   HPCG性能 
 神威太湖之光(中国)   125.4359PFlops   93.014PFlops/s   23755.7GTEPS   371.2TFlops/s 
 天河2号(中国)   54.9PFlops/s   33.862PFlops/s   2061.48GTEPS   580.0TFlops/s 
 京速計算機(日本)   10.62PFlops/s   10.510PFlops/s   38621.4GTEPS   602.7TFlops/s 
 天河2号に対する神威太湖之光の性能向上率   2.28倍   2.75倍   11.52倍   0.64倍 
 京速計算機に対する神威太湖之光の性能向上率   11.81倍   8.85倍   0.62倍   0.62倍 

上表を見ていただければわかるが、神威太湖之光は理論ピーク性能が極端に高く、 TOP500はそれに近い性能が出せることがわかる。 しかし、Graph500での中国機同士の比較値(11.52倍)倍を例外とすれば、 神威太湖之光は性能が上がるどころか逆に下がっているアプリも多い事がわかる。

要するに、日本製の京速計算機との比較では無い中国機同士の比較でも旧型スパコンに 負けたりするわけだ。だから、神威太湖之光はTOP500で勝つことが主目的であり、 実際の科学研究で役に立つスパコンとしては全然考えられていないのである。

また、おもしろかったのはTOP500以外での京速計算機と神威太湖之光の比較値では 倍率がGraph500とHPCG性能で全く同じ0.62倍であったことだ。 さらに、HPCGでは中国機同士の比較でも0.64倍と誤差範囲で同等の倍率となっている。 ここまでの数値一致が偶然に発生することはあり得ない。

この数値の同位性があるということは、性能阻害要因が両者ともに一致して存在し、 理論ピーク性能以外の性能阻害要因を防ぐハード性能が京速計算機の方が神威太湖之光より 格段に良好なわけである。

残念ながら中国製スパコンは性能の評価結果だけが発表されていて、 評価時の内容までは発表されていなかった。 このため、なぜこのような数値の一致が発生するのか、その原因までは解明できなかった。 しかし、0.62倍、0.62倍、0.64倍なんて倍率数値の一致が偶然に発生するなんて事は原理上あり得ない。 なので、その原因を解明させれば、それを改善することがスパコンの性能向上の最優先項目であることがわかる。 少なくとも、理論ピーク性能さえ良ければそれで良いなんて考え方は明白に間違いである事がはっきりしたのである。 (当サイト的には、バンド幅に代表されるデータ伝送能力の差が原因ではないかと推定しているのであるが...)

☆実質的にスパコン性能を高める技術の方向性。   
さて...TOP500とHPCGの比較でわかったことは、当サイトの意見通りTOP500だけでは スパコン性能の正しい評価ができないということである。 また、HPCGは当サイトと同じ意見のプロがTOP500より科学的性能を正しく判断できる 評価プログラムとして2014年に開発したものである。スパコン性能評価パラメータとしては TOP500値よりもHPCG値の方が格段に正確な評価パラメータである事がご理解頂けよう。

前々回の当サイト発表では、スパコン評価方法の改善を具体的にどうやるかを 次回のスパコンネタで発表すると書いていた。 しかし、あれから約半年経過した今では、当サイトだけではなくプロでも 次々と意見が発表されており、HPCGでの評価はその代表例とも言える。

と言うわけで、今後はTOP500の評価結果はあまり優先評価とされず、 HPCG等がスパコン性能の評価パラメータとなって行くのであろう。 また、TOP500のプログラム自体をHPCG関連に改定してしまう方法もあり得るであろう。

で...理論ピーク性能さえ高ければ良いスパコンという考え方は間違いであることは証明できたので、 これをどうやって対策するかである。 バンド幅が原因かは証明できていないが、これが原因というのが当サイトの仮設である。

しかし、ベクトル機を作るとすると、今は半導体の開発コストが上がっているので、 スパコン以外で使用されない半導体だとコストパフォーマンスが低下してしまう。 だから、ベクトル機と同じ高バンド幅を量産関連の半導体として使用される 大量生産品を見いださなければならない。

また、問題点の解決はソフト対応でもできる可能性が過去に指摘されていた。 (当サイトの意見としては、ソフトでの対応は困難と発表していたが...) しかし、ソフト対応での改善で難易度が低いとすると、 上記表での理論ピーク性能と実際の性能に大差が発生する事はあり得ない。 つまり、現段階ではソフト対応での改善ができていない事は明白なのである。

と言うわけで、ハンド幅改善を低コストで行う研究がスパコン改善の最優先項目なのであろう。

この方向性でパソコン関連に関与することでコストを下げられる技術としては、 メモリコアとCPUコアの重ね合わせ接続がある。

これはムーアの法則の飽和が原因であり、ムーアの法則が飽和しても 進歩を進行させようという半導体業界の新技術開発の方向性である。 だから、開発者の目的としてはスパコン用途でのハンド幅改善が目的では無い。 しかし、結果的にはスパコン開発と同一方向性の改善効果が期待できるのである。

さらに、電磁誘導を利用してCPUとDRAMの接続を(TSV方式のような金属的な接続ではなく) 電波接続方式とする研究も行われている。 この方式は、開発の難易度こそ高いが、成功すればTSV方式より良好な効果を出せるだろう。

また、GPUは単精度優先で、スパコンで重要な倍精度は優先されていない。 しかし、最近は単精度計算で倍精度を出す算出メカニズムが開発されてきている。 だから、単精度装置にちょっとわずかに回路を追加するだけで倍精度コアを作り出せるわけである。

とすると、倍精度演算をほとんど使わないパソコン関連のプロセッサでも、 それほどコストを上げること無く倍精度用途で使用できるようになる。 このため、今後の方向性としてはパソコン用途とスパコン用途の差異が 減らすことが可能と推定できるわけである。

ただし、PC用途とスパコン用途の差異はこれだけではない。 なので、これ以外の当サイトが気づいていない障壁が原因でボトルネックが発生する可能性には注意が必要だ。

実際、京速計算機以上に高速と推定されていた次世代日本製スパコンであるOakforest-PACS。 これは、理論ピーク性能では京速計算機より2.2倍も速いのに、TOP500では1.29倍にしかなっていない。 理論ピーク性能に対する実性能の低下は、中国製スパコンと同じ問題点が日本でも発生しているという、ちょっと悲しい話である。 その失敗の原因は、おそらくは使用CPUが京速計算機よりOakforest-PACSの方がパソコン向けのCPUだから、 スパコンとしての高性能を維持しにくくなったからであると推定しているからだ。

☆京速計算機の「デメリット」が神威太湖之光に勝つ主因。   
では、当サイト的な今後の推定対応手段を書き込もう。 ここで、過去に世界一の性能を出した「地球シミュレーター」と、 中国製スパコンが最速になる前に世界一の性能だった「京速計算機」の 優位性の共通点を考えてみた。

これは、一般的な意見とは真逆な方向性であることがはっきりした。 理論ピーク性能はほとんど意味が無いのである。

その昔、京速計算機が世界一の性能となったとき、 それ以前に日本製で世界一となった経験のある地球シミュレータとの比較で 理論ピーク性能が主要因でバンド幅性能改善はスパコン性能にほとんど意味が無いという意見があった。 理論ピーク性能以外のハード項目に投資するスパコンは、デメリットなハード構造と言われていたのである。 しかし、この意見が正しいとすると、神威太湖之光は現時点ではあらゆる分野で世界トップの性能となるはずなのである。

京速計算機は現時点でGraph500やHPCGで神威太湖之光に勝っている。 だが、理論ピーク性能がスパコンの性能支配要因であれば、この分野でも神威太湖之光にボロ負けのはずである。 京速計算機が神威太湖之光に勝っている分野が複数ある原因は、理論ピーク性能が支配要因では無い事であるのは明白だ。

つまり、過去に京速計算機が地球シミュレータに勝った要因と主張されていたメカニズムが間違っている事自体が、 京速計算機が神威太湖之光に勝つ結果を複数達成した原因なのである。

これは上記の通り笑い話ではあるが、 理論ピーク性能さえ高ければすべからく高速になるという考えの間違いの象徴である。 今後の日本製スパコンは、スパコンアプリで何が性能阻害要因になっているかを 複数の実用アプリで分析して、その阻害要因に対策を行う事で開発をしなければならない。

どうしても神威太湖之光的な理論ピーク性能支配だけで安くスパコンを作りたいというのならば、 あらゆる実用アプリでノーベル賞級のソフト改善を行わなければならない。 ソフトで対応不可能かどうかはやってみないとわからないが、難易度はノーベル賞級なのは明白である。 だから、ハイリスク・ハイリターンでも我慢するというのならば理論ピーク性能以外には物理投資をしない スパコンを作っても良いが、その場合はソフト開発者にノーベル賞級の天才を導入しなければならない。

と言うわけで、リスク管理という意味でも理論ピーク性能だけのスパコンは無意味なのである。

☆自作パソコン衰退。   
と言うわけで、次回の話題だけれど...

もう自作パソコンは市場から大衰退傾向にあり、 自作どころか普通のパソコンですら市場規模が急減している。 つまり、当サイトのネタも読んで楽しいと感じる人も激減しているだろう。

当サイト自身がサイト更新を減らしてしまった原因の一つでもあるが、 もうパソコンの時代は終わりつつある。

悲しい...という状況であるが、自作パソコンマニアの方々で この問題を解消し、今でも全く楽しさは落ちていないという方はいらっしゃるだろうか?

当サイトは色々と考えてみたが、衰退傾向の完全な対策は考えつかなかった。 まぁ、永遠の成長はパソコン関連だけではなく、あらゆる産業で達成できていない話ではあるが...

ただ、自動車産業ではハイブリッド化や電気自動車化によって今後も改善が進んでいく。 だから、PC関連でも天才が現れて、画期的改善を行って再成長時代を作って欲しいですね。

と言うわけで、次回はパソコン衰退傾向の阻止について考えてみたい。