現在の生成AIブームは米オープンAI社が昨年11月にChat GPTを公開したことが契機です。その2週間後、この分野に精通する親友から「今後はChat GPTに注目」と教えてもらった際には、何のことかよくわかりませんでした。Chat GPT利用者は2ヶ月で1億人を突破。たった半年で世界のIT産業やAI関連企業の様相が急変しています。それを受け、AIチップ企業への投資も急増。中でもNVIDIAに注目が集まっています。以下、耳なれない企業名や技術用語が登場しますが、こういう情報をキャッチアップし、深層を理解することも、日本社会や産業界の重要な課題です。

1.バットマンの悪夢

7年前のメルマガ364号で、SGB(ソフトバンクグループ)による英半導体設計企業Arm(アーム)買収の背景、そしてArmがどのような意味で超重要企業であるかをお伝えしました。その年、英国ケンブリッジにあるArmにも実際に行きました。

3年前の9月、SBGがそのArmを米企業NVIDIA(エヌビディア)に売却することを決定した事実をメルマガ447号でレポート。今後はNVIDIAの動向から目が離せないとお伝えしました。

その際、Armの公共財的性質(後述)を鑑みると、主要国の独占禁止政策上の承認が必要であり、売却交渉は難航するだろうと指摘しました。とりわけ米中対立が本格化していた中、Armが米国の手中に収まれば中国は極めて不利な立場に陥るため、中国が難色を示し、安全保障上の問題に発展する可能性もあることを記しました。

案の定、中国に加え、他の主要国及び競合企業の水面下の抵抗もあって、2022年2月、SBGはArm買収断念を発表。SBGは「規制上の課題」を鑑みて、買収契約解消に合意とコメントしました。

契約締結時にSBGが売却対価前受金として受領した12.5億ドルについては契約条項に基づき返金義務はなく、同社の利益として計上された一方、NVIDIAは20年間のArmライセンスを取得。そして今年4月29日、Armは米国での上場を規制当局に申請しました。

NVIDIAによるArm買収計画失敗のように聞こえますが、別に失敗したわけではありません。むしろ、昨年末のChat GPT公開以降、NVIDIAには一層注目が集まっています。まずはNVIDIAの復習です。

NVIDIAは米カリフォルニア州サンタクララにある半導体企業。CG(コンピュータ・グラフィックス)処理に用いるGPU(グラフィックス・プロセッシング・ユニット<後述>)の設計が主業です。

Armと同様のファブレス(自社工場を有しないOEM<委託製造>専業)企業。主なファウンドリー(受託生産メーカー)はTSMC(台湾積体電路製造)です。

NVIDIAはジェン・スン・ファン(黄仁勳、現在も社長兼CEO)が1993年に設立。ファンは台湾系米国人。オレゴン州立大、スタンフォード大で電気工学を専攻。マイクロプロセッサ設計者等として働いた後、NVIDIAを起業しました。

コンピュータの演算処理に用いる半導体はCPU(セントラル・プロセッシング・ユニット<中央処理装置>)とGPUの2つが柱であり、2020年当時、ArmはCPU設計の世界の中心企業、NVIDIAはGPUの主力企業でした。

とは言え、ArmとNVIDIAのそれぞれの分野における立場は違いました。Armは設計IP (Intellectual Propertyつまり「知的財産」「設計資産」)を半導体メーカーに提供。世界のほとんどの主要IT企業の半導体はArmの設計IPに依存。つまり、Armの設計IPは公共財のような存在であり、「半導体産業のスイス(永世中立国)」とも言われる所以です。詳しくはメルマガ364号をご覧ください。

Arm買収を計画していたNVIDIAのGPUはその段階ではArmのCPUの域には達していませんでした。その違いに買収に纏(まつ)わる懸念が存在していました。

NVIDIAはGPU分野ではArm顧客群のIT企業と競合関係にあり、NVIDIAがArmを買収することは、公共財であるCPUのArm設計IPがNVIDIAに優位に構築されたり、NVIDIAだけに情報開示されることが懸念されました。

そうした懸念があることを理解している故に、NVIDIAはArm買収計画発表の際にわざわざ「Armの中立性を維持する」と言及したのです。

GPUは単純大量計算に強い一方、CPUは高度で複雑な演算に優位性があります。そこにNVIDIAによるArm買収の理由があり、ArmのCPUとNVIDIAのGPUが結びつくとAI(人工知能)時代のエコシステムが誕生すると予想されていました。したがって、競合企業や主要国にとっては脅威だったのです。

そもそも、僕がNVIDIAという企業を知ったのは今から約20年前に見たNHK特集が契機。NVIDIAの社史を概観しつつ、それを振り返ります。

1993年創業のNVIDIAには、1997年、SGI(シリコン・グラフィックス・インターナショナル)の技術者が続々と参加。低価格かつパワフルなGPU開発に成功し、NVIDIAは一躍GPU主力メーカーとなりました。

1999年、PC用GPUとして世界で初めてジオメトリエンジンを搭載した廉価な「GeForce 256」がブレークし、NVIDIAの地位を不動のものとしました。

ジオメトリエンジンとは、3DCG(3次元コンピュータグラフィック)において座標変換を行うソフトウェアやハードウェアのこと。3DCGは座標データ等を基にコンピュータ内の仮想3D空間に構築されますが、最終的には2Dスクリーン(モニター)上へ描画する必要があります。この3Dから2Dへの座標変換をジオメトリ処理と言います。変換には膨大な演算が必要であり、PC用にジオメトリエンジンを搭載した廉価な製品が上記の「GeForce256」でした。

NVIDIAはPC用チップに内蔵して販売し、ハリウッド映画級の3DCGが個人PCで実現可能となり、ユーザーや市場に衝撃を与えました。

その後、NHK特集が3DCG技術の革命的進化を取り上げました。映画「バットマン・ビギンズ」でバットマンがビルから落ちて地上に着地するシーンがあまりにもリアルなCGであったため、「役者がいらなくなる」と話題になった頃です。番組の中でジオメトリエンジンが紹介され、NVIDIAという社名を初めて知りました。

以降のGPUはジオメトリエンジン搭載が標準となり、搭載していない製品は商品価値を消失。そして、2017年頃に起こったAIのディープラーニングブーム。NVIDIAがさらに脚光を浴びる中で打ち出されたのがArm買収計画だったのです。

折しも今月、全米映画俳優組合が大規模なストを決行。争点のひとつは「AIによって仕事が奪われる」ことです。20年前の「バットマンの悪夢」が現実のものとなりつつあります。

2.CPUとGPU

NVIDIAのこと、これから起きることをフォローアップするために、GPUとは何かを4つの観点から整理しておきます。

第1に役割です。GPUは(Graphics Processing Unit)は3DCGの画像処理等を行う際に必要なプロセッサ(半導体チップ)のことです。コンピュータのプログラム実行、制御、演算を行うプロセッサであるCPU(Central Processing Unit)と対をなす存在です。

3Dのコンピュータゲームを考えると理解し易いと思います。GPUはゲームの画像処理に特化したプロセッサのことです。3Dゲームの画像はどんどん精緻化していますが、それを実現するためには膨大な演算が必要となり、それを行っているのがGPUです。

一方、ゲームプログラムそのもの、つまりユーザーがキーボードやマウスで入力したコマンドをプログラムに従って処理すること等、画像以外の処理を行っているのがCPUです。

つまり、コンピュータ全体の「司令官」がCPUであり、ユーザーインターフェイスの画像部分を担う「特殊専門部隊」がGPUというイメージです。

第2に機能及び性能です。GPUの役割である画像処理を行うには、迅速かつ大量の演算を行う能力が求められます。そのため、GPUの演算速度はCPUの数倍から100倍以上です。

それを可能にしているのが、プロセッサの脳あるいは心臓と言っていい「コア」と呼ばれるパーツの数です。CPUでは1個から数個であるのに対し、GPUは数千個を擁しています。言わば「特殊専門部隊」は人海戦術で迅速かつ大量の演算を行っているのです。

「コア」とはその名の通りプロセッサの中心的部品であり、演算の基本動作を担います。PCやスマホの仕様表に記載されたCPUスペック情報に「デュアルコア(コア数2)」「クアッドコア(コア数4)」「オクタコア(コア数8)」等の表記があるのを見たことがあると思います。これは、PCの演算性能を表しています。

そう聞くと、GPUの方がCPUより優れていると感じがちですが、これはあくまで同じような演算を並列処理するための仕組み。つまり、3D画像が円滑に変化していくためには、複雑ではないけれども膨大な演算を瞬時に行う必要があるからです。

一方、CPUは難しい演算を順番に、連続的に、直列的に行うことが仕事なので、少ない「コア」で仕事をしています。

第3に構造です。CPUはコンピュータのマザーボード(基盤)に搭載されています。マザーボードとは「中央管制室」のようなイマージです。そこから「司令官」として判断し、指示を出すのがCPUです。パソコン、スマホ、タブレット、自動車、医療機器、産業用ロボット、白物家電等を含め、プロセッサを使用するあらゆる製品に装填されています。

一方、GPUはグラフィックボードという画像専用の別の基盤に搭載されているのが基本構造です。マザーボードに搭載されているCPUから命令を受けてモニター上に画像を描写します。グラフィックボードはパソコン等にとって必須ではありませんが、これを搭載することでより詳細で円滑な画像処理が可能になります。「司令官」に対して「特殊専門部隊」が完全別組織化されているイメージです。

「必須ではない」という上記の説明から「グラフィックボードがない場合はどうするのか」という疑問が湧くと思います。それに対する回答が、GPUには単体型と統合型(内蔵型)の2種類があるということです。

単体型はグラフィックボードに搭載されている構造で、演算性能が高い反面、消費電力、発熱量が多いという難点があります。

一方、統合型はマザーボード上に搭載されています。この場合は「オンボードグラフィック」とも言われます。統合型の製品にあえてグラフィックボードを装備すると、マザーボード側のGPU(つまり統合型GPU)の機能は無効化されます。

統合型は単体型に比べて画像処理の性能は低いものの、低価格で消費電力、発熱量が少ないのが特徴です。統合型は画像処理等に高い性能を必要としない事務作業用PC等の製品に向いています。

第4に最近の新たな傾向についてです。CPUを「司令官」、GPUを「特殊専門部隊」に喩えましたが、その「特殊専門部隊」を「司令官」として使う動きが広がっています。

その契機はAIに必要とされるディープラーニングです。例えば、膨大なデータから傾向を読み込み、画像認識や音声認識を行う際には、同じような演算を迅速かつ大量に処理する必要があります。それには、CPUよりもGPUの方が向いているということです。

このような演算処理をHPC(ハイ・パフォーマンス・コンピューティング)と言うそうですが、CPUよりも並列演算性能に優れたGPUを一般的な演算に活用するので「GPGPU(General-Purpose Computing on Graphics Processing Units)」 とも呼ばれます。

GPGPUを利用することで、スーパーコンピュータに匹敵する性能を持つ「GPUサーバー」をより安価に構築できるそうです。

そしてGPUサーバーはAI分野で注目されています。AIを急速に発達させたディープラーニングに適しているからです。以前はコンピュータの処理能力が足らず、ディープラーニングのアイデアがあっても実現しませんでした。その点、CPUよりはるかに高い演算性能をもつGPUサーバーであれば、容易かつ安価にディープラーニングを実行できるわけです。

画像認識や音声認識の開発・実用化が本格化してきた2010年代初め頃からディープラーニングが注目され、その演算に適したGPU及びGPUサーバーに注目が集まったということです。

なお、GPUサーバーは一般的なコンピュータと異なり、画像出力機能を有しません。画像描写以外の目的に特化されたサーバーです。最近では月額数万円でGPUサーバーを使ったHPCサービスも登場しています。

3.米台連合

NVIDIAのファンCEOは「AIはパソコンやスマホに匹敵する革命的テクノロジー」「iPhoneが登場した時のような革命がAIで始まった」「我々は生成AI新時代の始まりにいる」と発言しています。

そしてNVIDIAはGPUによってその主導権を握っています。上述のとおり、もともと製造していたGPUがディープラーニング、AIに適していたことが奏効しました。GPUは膨大なデータを学習して精度を上げていく「学習」と、ユーザーからの質問等を受けて答えを導く「推論」の両方に使われます。

生成AIサービスの多くはDC(データセンター)のサーバー上で開発・運用されています。Chat GPTを公開したオープンAIは開発に約1万個のGPUを用いました。今後は1つのサービスを開発・運用するのに3万個以上のGPUが必要になると言われています。

ゲームや画像編集に使われる一般的なGPUは市販価格が1個1千ドル(10万円超)程度ですが、AI向け高性能GPUは1万ドル(100万円超)以上です。

AIチップの市場規模は現状半導体全体の約10%ですが、今後数年で飛躍的に増加し、2030年には現在の倍以上の約1兆2500億ドル市場になると予測されています。NVIDIAはそのAIチップの80%以上を掌握しており、同社の時価総額は既に1兆ドルを突破。

NVIDIAがTSMCと組んでいることも強みです。両社は生成AI向け高性能専用半導体の新製品(推論スピードが現在の最大12倍)を年内に投入すると発表しています。NVIDIAが設計した半導体をTSMCが量産するという2大企業による「米台連合」が当分の間、AIチップの世界を席巻しそうです。

両社の関係は1990年代半ばに遡ります。創業間もないNVIDIAは生産委託先の確保に苦しんでいたそうです。台湾出身のファンCEOが頼ったのは当時ファウンドリーで躍進しつつあったやはり台湾出身のTSMC創業者モーリス・チャン(張忠謀)会長でした。

雑誌で読みましたが、張氏が電話で直接ファン氏の交渉に応じ、両社の取引がスタート。以後約30年、TSMCはNVIDIAに対してゲーム、パソコン、AI向けに至る幅広い製品を供給し続けています。

近年、両社はAI向け半導体の性能向上に「パッケージング技術」を活用。異なる機能を持つ複数の半導体を同じパッケージ内に収めて効率的に連動させる技術ですが、NVIDIAは2010年代中頃にいち早くGPUに採用。量産技術を開発するTSMCと二人三脚で「パッケージングAI向け半導体」を実現しました。

盤石の「米台連合」ですが、もちろん競合企業も本気になってきました。NVIDIAの最強ライバルはAMD(アドバンスト・マイクロ・デバイセズ)。同社は先月、生成AIに使用されている高度なアルゴリズムに対応した新型チップを発表。また、昨年には350億ドルを投じてAI向け半導体製造のザイリンクスを買収しています。

インテルも2019年に約20億ドルで買収したイスラエルのAIスタートアップ企業ハバナラボを拠点にして、AIチップの生産に注力しています。

NVIDIAのAIソフトウェアは知的財産権を保護していますが、AMDとインテルのAIソフトウェアはオープンソースです。市場のデファクト・スタンダード(標準規格)を巡る水面下のバトルが続くでしょう。

最近のベンチャーキャピタル投資先としての主役は暗号資産企業。市場調査会社によれば、同分野の企業が昨年調達した資金は268億ドル。AIチップ分野の約100億ドルを大きく上回っていましたが、これが逆転する可能性が出てきました。

Chat GPTの登場は米IT大手5社GAFAMの生成AI開発競争にも火をつけました。マイクロソフトはオープンAIとの連携を表明、グーグルは独自の生成AIを公開しました。

生成AIの「学習」には高性能かつ大量のGPUを備えた大規模DC(データ・センター)が欠かせません。GAFAM各社は自社のDC用に独自のAIチップを設計し、TSMC等に製造委託し始めました。各社はDCによる生成AIサービスを梃子に、NVIDIAを追撃するでしょう。

アマゾンは独自のAIチップを使用したAIサービスをリリース。既に民泊仲介 エアビーアンドビーやTikTokを提供するバイトダンス(北京字節跳動科技)、スナップ等の大企業が採用。バイトダンスはアマゾンのサービスを利用することで自社のAIサービスのコストが60%削減したと発表しています。

米中だけではありません。英グラフコアはNVIDIA対抗を目指して投資家から約7.5億ドルのAIチップ開発資金を調達。米当局がNVIDIAの最先端チップの対中輸出を禁止しているため、中国がグラフコアを供給源にすることを目指していると報道されています。

AIに必要な要素は、答えを導くための「モデル」、学習させて最適化するための「データ」、そして演算を実行する「ハードウェア」です。

スマホやSNSの普及で大量のデータが日々Web空間で増殖。ハードウェアについてもGPUの普及で「学習」と「推論」に必要な時間の大幅短縮が可能になりました。

一番の難関は、人間の言葉を扱う自然言語処理モデルでした。文の構造や文脈を理解し、省略された単語を補って推定するなどの高度な能力を獲得することが従来の深層学習モデルでは難しかったそうです。

流れが変わったのは2017年。グーグルが、文中の重要な単語に注目して高い精度で「学習」「推論」を行う「トランスフォーマー」という手法を開発したことです。

世界のIT主要企業がAIの激戦を戦う中、日本の半導体製造装置メーカーにとっては追い風。アドバンテストのテスター(検査装置)はNVIDIAも使っています。東京エレクトロン、東京精密等の他の製造装置メーカーにとっても朗報です。

しかし、AIそのものや、CPU・GPUの半導体チップで世界に注目される日本企業が現れないのは残念なことです。スタートアップ企業、新興企業を牽引する若手エンジニア、若手経営者を応援していきたいと思います。(了)