本文へジャンプ

世界一の並列化コンパイラーを作る

マルチコア・Everywhereの21世紀プロセッサーを先取り


21世紀のプロセッサーはマルチコア・Everywhere

9コアで構成したCellチップの写真
9コアで構成した
Cellチップ
最近のプロセッサ・テクノロジーの主流は1チップに複数個のCPUを入れたマルチコア・チップと言われる段階に突入した感があります。これはコンシューマー製品向けのインテル系プロセッサーが最近デュアルコアとして出荷され始め、広く知られるようになってきたこともあるようです。
IBMでは早くからマルチコアに取り組んでおり、2001年には1チップに2-way SMP(2 CPU)を載せたIBM POWER4™ プロセッサー搭載のUNIX®サーバーを出荷しています。さらに今年2006年には9プロセッサ/チップのCell チップ (IBM、ソニー、東芝の三社による共同開発)搭載のブレード・サーバーに注目が集まっています。

早稲田大学 笠原 博徳 教授
早稲田大学
笠原 博徳 教授
早稲田大学の笠原 博徳教授は早くから、組み込みプロセッサーからスーパーコンピューターまで、21世紀はあらゆるところにマルチコア・プロセッサーが使われるようになるという点に気づき、そのためにはソフトウェア側の対応がたいへん重要になると考えていました。実環境でのシステムの高速性、価格性能比、ソフトウェア開発の生産性を考えると自動並列化コンパイラーの開発が特に重要で、さらに並列コンパイラーと協調し高効率実行を可能とする協調型マルチコア・プロセッサーやチューニングツールの必要性についても深く認識していました。

笠原教授の関心はHigh Performance Computing(HPC)分野にとどまらず、最近では日本が国際的に優位な市場を持つカーナビ、携帯電話、ゲーム機、デジタルテレビ、DVDなどの情報家電用マルチコア・プロセッサの分野にも力をそそぎ、アドバンストチップマルチプロセッサ研究所のリーダーとしてソフトウェア、ハードウェア両面に渡って研究を推進されています。情報家電用マルチコア・プロセッサーの分野で市場競争力を決定する因子は、アプリケーションソフトウェアの充実、短期間のシステム開発、低コスト・低消費電力・高機能プロセッサー開発能力です。

笠原教授は、「情報家電の製品開発サイクルは半年から一年程度とスーパーコンピューターに比べて非常に短いです。プロセッサーのコア数が増えたり、新アプリケーションを開発したときに、それにあわせて人間がプログラムを毎回手で並列化チューニングしていくのでは時間がかかりすぎます。もしよいコンパイラーがあればプロセッサーの変更や新アプリケーションの並列化にすばやく対応できるようになります。それを実現するのが自動並列化コンパイラーと協調型マルチコア・チップの組み合わせです。こうした研究開発が日本製品の競争力強化へとつながっていくと考えています」とマルチコア時代のコンパイラーの重要性について指摘します。

マルチコア用自動並列化コンパイラーの研究

日本製ベクトル型スーパーコンピューターが世界をリードしていた1990年代には、日本製Fortranコンパイラが高性能さと使いやすさとで国際的に高い評価を得ていました。しかし1980年代に米国ベンチャー企業から起こり1990年後半からの高並列型スーパーコンピューター市場の急拡大という潮流に日本の主要メーカー、ユーザーの多くが懐疑的であったこと、また国産ベクトルプロセッサー単体の性能が非常に優れていたことから結果的に「並列コンパイラーの研究開発は米国に比べて10年以上も遅れてしまいました」と笠原教授 。

そうした中で、当時助教授だつた笠原先生は、先生オリジナルのマルチグレイン並列化コンパイラー研究およびコンパイラーとアーキテクチャーとの協調の研究をさらに進めるため、コンパイラーの権威が集まるイリノイ大学Cedarスーパーコンピュータープロジェクトに1989年から1年間客員研究員として参加。そして早稲田大学に戻り、世界一の並列化コンパイラー開発を目標にプロジェクトとして研究を推し進めました。
「イリノイ大には並列化コンパイラーの世界的権威であるDavid Kuck博士やDavid Padua教授等をはじめ、アーキテクチャーやアプリケーションが専門の研究者が100名以上世界各国から集まってきていました。彼らと一緒に研究・議論をすることにより私が提案していたマルチグレイン並列化とメモリー最適化、そして開発中であったOSCARマルチプロセッサ・アーキテクチャーの方向性の正しさが確認できました。その後もお互いに協力し合いながら研究を進めています。
また、後にIBMでBlue Gene® /Lのコンパイラー開発に携わることになったJose Moreira博士、HPCSペタスケール・スーパーコンピューター・プロジェクトでX10言語の開発を行っているIBMワトソン研究所のVivek Sarkar博士ともこの期間に知り合いました。」と笠原教授はイリノイ大での研究時代を振り返ります。
Advanced Parallel Compiler(APC)プロジェクトと呼ばれるこのプロジェクトは、内閣府ミレニアム・プロジェクトIT21(経産省NEDO担当)の一つであり、

  1. 自動マルチグレイン並列化技術の開発
  2. 並列化チューニング技術の開発
  3. 性能評価技術の開発

という三つを課題にかかげ、世界先端から10年遅れていると言われていた国内産業界の並列コンパイラ技術を、共有メモリ型マルチプロセッサ(SMP)上で市販コンパイラに比べ2倍の演算実行性能実現までに向上させることを目標にしました。

このようにしてOptimally Scheduled Advanced Multiprocessor(OSCAR)並列コンパイラーの研究が進められてきました。

大学研究室では世界最高レベルの計算機環境を駆使

研究室の皆さんの写真
使用中のシステムはp5 550Q
笠原・木村研究室ではプロジェクト当初から、世界一を目指した並列コンパイラーの研究成果をあげるためには、世界最高レベルの計算機環境の実現が欠かせないとし、デュアルコア・チップを当時世界で初めて搭載したIBM eServer® p690(通称レガッタ)のSMPサーバー(24-wayシステム)を導入しました。そしてOSCARコンパイラーの性能をレガッタのIBM XL Fortran 8.1とベンチマーク比較評価しながら研究を進めました。さらに、データローカライゼションとプリフェッチなどのオーバーラップ転送制御の技術評価をSun V880サーバーで実施、Intel® Itanium® 2についてもCC-NUMAアーキテクチャーのSGI Altix 3700での性能評価を行っています。

約50人に増えた研究者、学生によるコンパイラーおよびマルチコア・アーキテクチャー開発のために、最新鋭の8-wayまたは4-way POWER5+™ プロセッサー搭載のIBM System p5™ 550Q 20台、550 4台の計24台のOpenPower™ デスク・サイド・システムを開発用ワークステーションに利用し、大学研究室としては世界最高レベルの計算機環境のもとで、世界をリードする研究が進められています。

白子 準助手と博士課程の中野 啓史さんの写真
白子 準助手(左)と
博士課程の中野 啓史さん(右)
「学生が並列マシンでのチューニングや解析に使うために8コア程度のデスク・サイド・システムが必要でした。その目的にぴったりミートしたのがQuad-coreのIBM p5 550Qでした。研究室ではSun Solarisをずっと使っていましたので、550Qには同じように学生が使い慣れているLinux®を入れ、気軽に使える環境にしています。研究に非常に有用です」と笠原教授。「550Qは騒音と発熱が少ないので狭い研究室環境に多数入れられ、これも大変大きな利点です。ただ200V単相が必要のため追加の配線工事が必要になりました。導入は株式会社アルゴグラフィクスにサポートしていただき、たいへん楽に導入を終えることができました」と、自動並列化コンパイラ 制御研究リーダーの白子 準助手。「550Qは、メモリー周りがよくできていて、細かいチューニングを気にしなくても並列性能が出るので、使いやすいです」と、ローカル・メモリー最適化の研究に加え、研究室のIT環境を一手引き受けの博士課程の中野 啓史さん。

政府ミレニアムプロジェクトIT21で高い評価

APCプロジェクトの顕著な成果に、当時のIBM最新ハイエンドサーバーp690の24プロセッサーシステム上でOSCARコンパイラーとIBM最新コンパイラーXL Fortran Ver.8.1と比較した結果があげられます。SPEC標準ベンチマーク(SpecFP95およびSpecFP2000)の16種のプログラムで、各コンパイラーからの出力コードによる実行速度は、OSCARが最大10.7倍、平均3.5倍速いという、大きく目標を上回った成果が得られたのです。この成功をもたらした高度なコンパイラー技術が、ライフサイエンス、環境、自動車、金融工学等のさまざまなHigh Performance Computing分野での競争力強化に貢献できることから、産官学連携プロジェクト(経産省NEDO)の参加企業と開発コンパイラーを発展させ、情報家電用マルチコア・アーキテクチャーとコンパイラーの製品化を目指した経済産業省・NEDOプロジェクトを進められています。

高い評価のOSCARコンパイラー
高い評価のOSCARコンパイラー
また、人材育成と研究分野の両面では、博士号取得6名をはじめ、査読付き論文45件、研究会論文43件、全国大会論文15件、特許申請8件、招待講演9件、情処学会解説APC1件と大きな貢献がなされています。
これらのコンパイラー研究開発の成果は、2003年(平成15年)3月20日開催の国際シンポジウムで発表され、コンパイラーの世界的権威といわれる海外の研究者から、非常に高い評価を得ました。

そのときの代表的なコメントは次のとおりです。 1) 並列化コンパイラーによる2倍の速度向上は、米国における経験では18年の期間を要したが、APCは2倍をほぼ18カ月で達成した。この成果は素晴らしい、2) 超高性能コンピューターのハードでは地球シミュレーターが世界一(2003年3月)であるがAPCの成果により高性能コンピューター用のソフトでも日本が世界一になった、3) 米国なら1社との協力関係で実施するところだが、日本では競合他社数社が協力して成功させており、ユニーク。また、IT21評価助言会議(2003年7月18日)では、「1) 当初の目標を、十分以上に達成している。コンパイラーという困難な分野で世界に冠たる成果を出したのは、実に素晴らしい、2) この成果は米国の当分野のキーパーソンからも評価されており、米国に相当遅れているといわれていたこの分野において米国を凌駕する並列コンパイラー技術を構築したことは、本プロジェクトの成果である」と、この挑戦的でユニークなプロジェクトについて高い評価を与えています。

イノベーションを目指した産官学連携と人材育成を重視

笠原教授が率いる研究は、スーパーコンピューター分野から家電用組み込みプロセッサーへと拡大しています。理由は、あらゆる分野で利用される最新高性能プロセッサーが次の三大技術課題につきあたっていて性能向上が図られにくくなっている現在、その解決にコンパイラー技術が大きく貢献できると期待されるからです。

  1. クロック周波数増加により消費電力が増大し、発熱が限界を超える。
    コンパイラーによる解決法: 動作周波数を抑えたマルチコア・チップのハードウェア支援に基づく低消費電力制御機能をうまく使うように、アプリケーション内部でコンパイラーが周波数-電圧制御・電源遮断をきめ細かく制御し、消費電力を最小化する。

  2. 半導体集積度向上(使用可能トランジスター数増大)が進むにつれ、投入トランジスター数に見合う性能向上が得られていない。
    コンパイラーによる解決法: プログラム全域の並列性を利用するマルチグレイン並列化により、従来の命令レベル並列性よりも大きな並列性を抽出し、複数マルチコアでの集積度向上に対しスケーラブルな速度向上を実現する。

  3. メモリーウォール問題による性能鈍化が発生。
    コンパイラーによる解決法: ローカルメモリーあるいはキャッシュメモリーへのデータ分割配置、DMAコントローラーによるタスク実行とデータ転送とをオーバーラップさせ、メモリアクセスのオーバーヘッドを最小化しつつデータ転送のオーバーヘッドを隠す。

こうした解決法の研究のために、2005年から自動並列化コンパイラー協調型チップ・マルチプロセッサーOptimally SCheduled Advanced multiprocesso®(OSCAR)の研究開発を経産省/NEDOリアルタイム情報家電用マルチコア・プロジェクトとして開始しました。

そしてOSCAR並列化コンパイラーをベースに世界初のマルチベンダー・リアルタイム・マルチコア用APIを開発しました。これは、プロセッサー間データ転送と消費電力制御を指示できるようにすることを目指しています。コンパイラーによりマルチベンダーのリアルタイム・マルチコアチップの電源制御および周波数電圧(FV)制御が世界で初めて実現されます。

OSCARマルチコアプロセッサ
OSCARマルチコアプロセッサ
「情報家電用チップでは、消費電力の少なさが最重要であることが産学連携によりわかりました。コンパイラーにより電力制御することにより、40%から60%もの電力が削減できることが私たちの研究で示すことができました」と、制御研究リーダーの白子助手。

「この研究にあたっては、半導体メーカー等の企業研究者が客員教授、客員研究員としてプロジェクトに参加し『授業であって開発の場』(早大 白井総長と内閣府塩沢審議官による提言)を実現しながら、産官学の連携を図り、将来の日本のITをになう人材育成と競争力強化を目指しています」と笠原教授。

そして挑戦は続く

笠原教授は日本の競争力持続という観点から、イノベーティブな研究の重要性を語ります。
「戦後日本は海外輸出で成長してきました。これなしでは産業界は生き残れず、これからの日本の成長も考えられません。そのためにはオリジナリティーのある付加価値の高い製品の創出が大事ですが、アメリカではスタンフォード大に見られるように、大学の研究室が最先端研究をし、その卒業生が企業に移ってその製品化をリードし成功するというモデルがめずらしくありません。日本が将来に渡って質の高い生活を維持していくためには、このようなモデルを日本流にアレンジした産官学連携を成功させていく必要があります。OSCARマルチチップ・コアについては、4コアが今年の10月に完成し、来年10月には8コアが出来上がりますので、さらに研究を続け、プロジェクトを成功させていきたいと考えています」


お客様情報

笠原・木村研究室について
笠原博徳教授、木村啓二助教授はじめ50名の研究者・学生により、自動並列化コンパイラー、協調型マルチコアプロセッサーのコンパイラー制御、マルチコア・アーキテクチャーを主なテーマに研究をおこなっています。

[所在地]
〒169-8555 東京都新宿区大久保 3-4-1
早稲田大学理工学術院理工学部コンピュータ・ネットワーク工学科


アドバンストチップマルチプロセッサ研究所について
早稲田大学では、IT関連プロジェクトを強化・充実することを目的に機能的発展的組織として「IT研究機構」を設置しました。同機構は国家大型プロジェクト、産学官連携プロジェクトへの参画をはじめ、学内研究・教育の強化、学外へのアピールを含めたIT国際競争力強化戦略を策定します。その一員であるアドバンストチップマルチプロセッサ研究所では日本のIT研究開発・産業の国際競争力強化を目指し、 今後IT産業界の利益の源泉となると考えられる携帯電話、ゲーム、デジタルTV、ホームサーバーから高性能サーバーに至るまでのIT機器の心臓部となり高付加価値化に必須なチップマルチプロセッサーに関する最先端研究開発及びその基礎となる 高度な人材育成を産官学連携して行います。

[連絡先]
早稲田大学理工学術院 笠原博徳教授

本事例中に記載の肩書や数値、固有名詞等は初掲載当時(2006年9月13日)のものであり、閲覧される時点では、変更されている可能性があることをご了承ください。
事例は特定のお客様での事例であり、全てのお客様について同様の効果を実現することが可能なわけではありません。

IBM、IBMロゴ、Blue Gene, eServer, POWER4, POWER5, POWER5+, System p5, OpenPowerは、IBM Corporationの商標。
Intel, Itaniumは Intel Corporationまたは子会社の米国およびその他の国における商標または登録商標。
UNIXはThe Open Groupの米国およびその他の国における登録商標。
Linuxは、Linus Torvaldsの米国およびその他の国における商標。
他の会社名、製品名およびサービス名等はそれぞれ各社の商標。