AIで成長する半導体、需要の中心はクラウドからエッジへ| SEMICON Japan

2024年11月29日（金）

AIで成長する半導体、需要の中心はクラウドからエッジへ

株式会社エンライト伊藤元昭

現在の半導体産業は、ビジネス面においても技術開発面においても、人工知能（AI）に関連した応用動向を中心に回っていると言えます（図1）。

図1　現在の半導体産業はビジネス面でも技術面でもAI関連動向を中心に動いている
出所：AdobeStock

2024年、言語生成用のChatGPTや画像生成用のStable Diffusionをはじめとする生成AIが、生活やビジネスの中で積極活用されるようになりました。こうした中で、AIモデルは、より大規模化する方向へと進化。米OpenAIの言語モデルを例に挙げれば、2019年に開発した「GPT-2」が15億パラメータだったものが、2020年発表の「GPT-3」は1750億パラメータ、2023年に公開された「GPT-4」は5000億～数兆へと飛躍的に大規模化しています。

AI処理向けHPCの演算性能は「ムーアの法則」を超えて向上

AIモデルの大規模化に伴って、学習処理に要する演算量が急増しています。さらに、AI関連ビジネスに注目すれば、市場での応用サービスの利用シーンとユーザー数も急増。AIモデルが大規模化に、AI関連ビジネスでの演算需要に応えるための演算性能を社会のインフラとして整備していく必要が出てきています。

そして、AI関連の演算需要の増大に呼応して、学習処理を実行するデータセンターの高性能コンピュータ（HPC）の演算性能は、1.2年ごとに2倍と「ムーアの法則」を超えるペースで向上し続けています。そして、2022年には1 E（エクサ）FLOPSに達するHPCが開発されました。10年後の2032年には、さらに1000倍の性能を持つ1 Z（ゼタ）FLOPSを超えるHPCが登場する可能性があります（図2）。ビジネス面でも、データセンターの増設・増強に向けた投資が急激に活発化。IDCは、2023年から2028年に掛けてのデータセンターに対する設備投資は年率18.1％のペースで増加し、2024年には2530億ドル、2028年には4922億ドルにまで達すると予測しています。

図2　HPCの演算性能は、1.2年ごとに2倍と「ムーアの法則」を超えるペースで向上
出所：AMD Lisa Su氏、ISSCC 2023基調講演「Innovation For the Next Decade of Compute Efficiency」

こうした需要家の旺盛な投資を背景に、足下では代表的データセンター向けAIチップであるGPU (Graphics Processing Unit)の需要が急拡大しています。常に需要過多で品不足の状況にあり、トップメーカーであるNVIDIAの最新アーキテクチャ「Blackwell」を導入した高性能GPU「B200」は、2024年5月時点で6万～7万ドルで取引されるまでになりました。こうした状況は、AIチップの技術開発トレンドを変調させる要因となっており、さすがに効果すぎると考えた需要家である米GAFAMなどのIT企業は、自社サービスを差異化できる機能・性能を備えた独自AIチップの開発・導入を急ぐようになりました。

AI関連の演算需要の中心は、クラウド側からエッジ側へと移行

Gartnerの調査・予測によると、あらゆる種類のAIチップを統合した市場規模は、2023年には前年比20.9％増に相当する534億4500万ドルに達し、2027年にはその2倍に相当する1194億ドルにまで成長するとしています。

AIチップには、クラウド側のデータセンター中のサーバーに搭載するチップと、エッジ側のPCやスマートフォン、組み込み機器などに搭載するチップの大きく2つに大別できます。そして、現在のAI関連の演算需要の中心はクラウド側にあり、過熱気味のGPU需要を生み出しています。

クラウド側では、特に高い演算性能が求められるAIモデルの学習を行います。さまざまなAIモデルやタスクに柔軟対応することが求められるため、AIチップには汎用的な処理に対応可能な内部構造を採用したチップが採用される傾向があります。ここではGPUの他にも、汎用性の高いCPU（Central Processing Unit）、実行するAIタスクに合わせて演算回路構成を最適化できる柔軟性を持つFPGA (Field Programmable Gate Array)、AI処理で多用するテンソル演算を高速化する回路構成を取るTPU (Tensor Processing Unit)なども利用されています。このうちTPUは、IT企業が自社サービスへの適用を想定した要求仕様に合わせて、独自開発するが多く見られます。

これが現在、徐々にエッジ側へと移行していく兆候が見え始めてきています（図3）。

図3　AI関連処理の演算需要の中心がクラウド側からエッジ側へと移行
出所：筆者が作成、図中の写真はAdobeStock

エッジ側では、主に学習済のAIモデルを利用して、画像認識や音声処理など特定タスクの推論処理を行います。また、バッテリー駆動の端末などでの動作も想定して、処理能力は抑えながら、低消費電力で動作可能なAIチップが求められます。このため、推論処理に利用するAIモデルに最適化した内部構造を採用し、低消費電力化を推し進めたAI関連処理用コアが利用される傾向があります。近年では、NPU（Neural network Processing Unit）と呼ばれる、AI関連処理に特化した演算器や専用回路、メモリーアクセスの仕組みを導入したコアを搭載したSoCやマイコンの開発が進み、多様な用途に利用されるようになりました。

スマホやPCでは、AI処理用コア搭載が業界標準に

既にエッジ側の機器の典型であるスマートフォンやPCでは、NPUを導入したSoCの採用が本格化してきています。そして、今後は産業機器などへの組み込みシステムやIoT機器へと、AI関連処理を効率化したコアを導入したマイコンやSoCを活用する潮流が広がりそうです。

AI関連の演算処理の中心が、クラウド側からエッジ側へと移行していくのにはいくつかの理由がありますが、最大の理由は、AIの推論処理に関してはエッジ側で処理した方が何かと好都合だからです。例えば、スマホやPCなどのカメラで撮影した画像データを対象にAI処理する場合を想定します。クラウド側で処理を実行しようとすると、大容量の写真データをエッジ側からクラウド側へと転送する必要があります。すると、ユーザーは撮影時に長時間待たされ、通信インフラにも大きな負荷を掛けることになります。また、そもそもオフラインではAIを使った高度な撮影はできず、ユーザー体験は悪化してしいます。推論処理をエッジ側で実行できれば、リアルタイム処理が可能になり、こうした問題はすべて解決します。加えて、エッジ側で処理すれば、ユーザーごとの利用目的に最適化したパーソナルなAIを実現できるようになり、なおかつ個人データを手元の端末にとどめてプライバシーを保護することもできます。

スマホ用SoCには、米Appleが2017年発売の「iPhone 8」に搭載したSoC「Apple A11 Bionic」に、「Apple Neural Engine（ANE）」と呼ぶNPUを初めて導入。その後、Android系も含む多くのチップにNPUが導入され、現在ではほぼすべてのスマホにNPUを導入したSoCが搭載されるようになりました。

一方、PC用のSoCでも、Appleが2020年に「MacBook Air」に搭載した「Apple M1」に16コアNeural Engineを搭載。画像処理や音声認識などに利用しています。同社は、2024年6月に開催した「Apple Worldwide Developers Conference（WWDC）24」の中でエッジAI技術「Apple Intelligence」を投入し、スマホやPCの多様なアプリケーションの高度化に向けて活用していくことを発表しています。一方、米Microsoftも2024年5月に「Windows」の基本機能としてAIの導入を推進していくことを発表。40TOPS以上のNPUの演算能力を持つPCを「Copilot+PC」と定義し、米Intel、米AMD、米Qualcommなどが対応SoCを市場投入しました（図4）。

図4　Copilot+PC対応のSoCが続々登場
出所：Qualcomm、Intel、AMD

AIがAIチップを設計する時代が到来

ここまで紹介してきたように、AIの活用領域の拡大と高度化には、半導体の進化と増産が不可欠であると言えます。その一方で、近年では、半導体チップの設計と量産において、AIが不可欠になってきています。特に設計の領域では、直近で大きな動きがありました。

米Google傘下の英DeepMindが開発したAIを利用した半導体チップの自動設計システム「AlphaChip」が、半導体チップ設計に革命をもたらしつつあります。AlphaChipとは、既存チップを強化学習することで新しいチップのレイアウト設計に関する知見を学び、自動化するAIシステムです。チップ設計を「ゲーム」として捉え、空白のグリッドに回路構成要素を順次配置して配線長の短い高性能なチップを設計していきます。このシステムを活用すれば、専門家が数週間から数ヶ月かかる作業を専門性に乏しいエンジニアでも数時間で完了できるといいます。

既に、Googleが最新の第6世代TPU「Trillium」やArmベースのCPU「Axion」の設計などに活用しています。DeepMindはAlphaChipの一部をオープンソース化し、外部の研究者や開発者がこのチップ設計AIを利用可能にしています。既に、台湾のMediaTekも5Gチップセット「Dimensity」の開発に採用しています。

最先端の半導体チップの設計難易度は高まり続けています。その一方で、独自半導体チップを設計したいという需要が高まっています。こうした背景から、AIを活用した半導体チップ設計の効率化には大きな期待が掛かっています。

2024年12月11日（水）から東京ビッグサイトで開催される「SEMICON Japan 2024」では、会期1日目に東2ホールのSuperTHEATERにて「AIが切り開く新しい半導体市場 AIチップリーディングカンパニーが描く未来戦略」を開催します。ここでは、生成AIの登場と利用拡大によって大きく姿を変えつつある半導体市場の中で、いかにして競争力を強化し、成長を持続していくのか。日本政府の行政機関、最先端ロジックファウンドリ、AI技術をリードする米国企業のトップが登壇します。これからのAIと半導体の関わりと、未来に向けたビジョンを知る絶好の機会となることでしょう。

SEMICON Japan に参加する

来場登録はこちら

特集記事一覧

SEMICON Japan 2024 未来を探る視点3