素粒子物理学などの計算物理学や気象予報、地球の総合的な将来像のシミュレーションといった、大規模な計算を必要とする分野ではいま、非常に高度な計算能力が計算機に対して求められている。従来のマイクロプロセッサは1つのCPUしか持たず、キャッシュメモリに依存しているため、扱うデータの量が膨大な大規模科学技術計算には適当でない。そこでそういった計算に適した新しいメモリーシステムの構造やその構造を採用するプロセッサアーキテクチャに関する研究が行われている。さらにそのプロセッサアーキテクチャを数千台結合させることで極めて高い処理能力を有することになる超並列処理計算機の開発、実用化を目指している。
プロセッサの性能は半導体技術や命令レベルの並列度を活用する制御方式の進歩により、これまで飛躍的に向上してきたが、命令レベルの並列度の限界、プロセッサと主記憶の性能差の拡大などの、性能の向上を頭打ちする要因が看過できなくなりつつある。命令レベルの並列度の限界は次のような卑近な例で説明される。
「0から9までの数字のいずれかが書かれたカードがN枚あり、その中から9と書いてあるカードを全て探し出す。」という課題Pが与えられている。
n人でこの処理を行うと、1人あたりの検索枚数はN/nであり、処理速度は1人で行うときのn倍となる。
「自然数が書かれたカードがN枚あり、その中から最大値が書かれたカードを探し出す。」という課題Qが与えられている。
Ⅰ、講義内容の要約と関連話題
素粒子物理学などの計算物理学や気象予報、地球の総合的な将来像のシミュレーションといった、大規模な計算を必要とする分野ではいま、非常に高度な計算能力が計算機に対して求められている。従来のマイクロプロセッサは1つのCPUしか持たず、キャッシュメモリに依存しているため、扱うデータの量が膨大な大規模科学技術計算には適当でない。そこでそういった計算に適した新しいメモリーシステムの構造やその構造を採用するプロセッサアーキテクチャに関する研究が行われている。さらにそのプロセッサアーキテクチャを数千台結合させることで極めて高い処理能力を有することになる超並列処理計算機の開発、実用化を目指している。
プロセッサの性能は半導体技術や命令レベルの並列度を活用する制御方式の進歩により、これまで飛躍的に向上してきたが、命令レベルの並列度の限界、プロセッサと主記憶の性能差の拡大などの、性能の向上を頭打ちする要因が看過できなくなりつつある。命令レベルの並列度の限界は次のような卑近な例で説明される。
「0から9までの数字のいずれかが書かれたカードがN枚あり、その中から9と書いてあるカ...