9 年苦戦 → 30 日で 200 億ドル — Stanford MS&E 435 第 2 回

Stanford MS&E 435 第 2 回

サニー・マドラ / Sunny Madra · 17:38 「同じ電力で、 2.5 倍のトークンが出る」

Stanford 大学のゼミ MS&E 435 第 2 回 (2026/04/15 公開、約 56 分)。投資家 + 元 Groq 社長との対談

Groq が 2016 年創業から 9 年、競合 NVIDIA の影で「あの SRAM 中心の決定論的アーキテクチャは面白いけど、ニッチでしょ」と言われ続けてきた。その同じ会社が 2025 年 12 月、 NVIDIA に 200 億ドル (NVIDIA 史上最大の M&A) で買収される。きっかけは 1 通のテキストメッセージ。動作するシステムをジェンセンに見せてから、 200 億ドルが振り込まれるまでわずか約 30 日。

語るのは 2 人。ブラッド・ガースナー (Brad Gerstner) — Altimeter Capital 創業 CEO、 OpenAI / Anthropic / Cerebras / Groq の主要投資家。 18 年で運用資産 150 億ドル超に育てたヘッジファンドの主。もう 1 人がサニー・マドラ (Sunny Madra) — 元 Groq 社長、 4 度の Exit を経験した連続起業家 (Pivotal / Ford / Groq / NVIDIA)。進行は MS&E 435 講師アプールヴ・アグラワル (Apoorv Agrawal、 Altimeter パートナー)。

議論の前提は前回 (Class #1) と同じ — 「ソフトウェアが世界を飲み込んだ」公式は AI には当てはまらない。アプリのユーザーが増えるたびに GPU 計算が消費される世界では、限界コストはゼロやない。そしてその制約が世界中で同時に効いている結果、「電力 1 ワットあたり何トークン出るか」が経済の根本指標になっている、という時代認識から始まる。

Groq が NVIDIA に持ち込んだ提案は技術的にシンプルやった。推論を「prefill (入力処理)」と「decode (出力生成)」に分離し、さらに decode の中の「演算集約的」と「メモリ帯域集約的」な部分を切り分ける。 NVIDIA の GPU は演算と HBM が強い (ただしメモリは外付けで遅い)。 Groq の SRAM チップは演算は少ないが SRAM 帯域が約 1 桁速い。 NVLink 経由で両者をつなげば、同じ電力フットプリントで 2.5 倍のトークンが出る — これが「同じ電力 → 2.5 倍トークン」の根拠。

個人的に面白かった点

Brad が 1 週間「ジェンセンへのメール」を出さなかった話 (18:00)

Sunny が Brad に「NVIDIA と提携できる、ジェンセンにメッセージを送って」と言った瞬間、 Brad は固まった。競合の親玉に協業を持ちかける、しかも自分は政治資金まで使ってジェンセンと近い関係。「クレイジーな案やと思われたくない」で 1 週間放置。 Sunny から「で、送った?」と再催促されて、ようやく送信。ジェンセンは即返信、「面白い、話そう」。ベンチャーキャピタリストにも保身バイアスがある、という人間味が漏れる場面。

「動作するシステムを見せてから 30 日で $20B」 (20:23)

Apoorv が時系列を確認する場面。ジェンセンに動作するプロトタイプを見せる → NVIDIA から 200 億ドルが振り込まれる、までわずか 30 日。 9 年間「ニッチ」と言われ続けた会社が、 1 ヶ月で NVIDIA 史上最大の M&A 対象になる。 200 億ドル ≒ 約 3 兆円 ≒ 任天堂 1 社相当。それが 30 日。「決算が動く速度の世界では、提携・買収は 6 ヶ月かけてやるもの」という業界常識を、物理制約 (電力 / メモリ) の切迫感が圧縮した瞬間。

NVIDIA は「もう GPU を作っていない」 (20:39)

Sunny の指摘 — NVIDIA はすでに 7 種のチップ + 5 種のラックからなる垂直統合エコシステムを構築している。「NVIDIA は GPU を作っているのではなく、推論システム全体を作っている」。だから decode 専用チップや SRAM 集中型チップを内製する余地は社内にもあった。そこに Groq の動作プロトタイプが届いたから、「カルチャーとエンジニアリングが補完的」と判断できた。もし Groq がただ「もっと良い GPU」を作っていたら、内部紛争で買収は成立しなかった、と本人が言い切る。

動画の構成

(00:00) 前提共有 — ソフトウェアが世界を飲み込んだ公式は AI には効かない
(00:30) ゲスト紹介 — Brad Gerstner (Altimeter)、 Invest America
(03:55) Sunny Madra 紹介 — Pivotal / Ford / Groq / NVIDIA で 4 連続 Exit
(05:11) 過去 2,000 年の人類一人当たり GDP — 1,800 年間ほぼ横ばいから 1800 年代に爆発
(15:00) Groq → NVIDIA 提携の発端
(16:04) 推論を prefill / decode に分離、さらに decode を細分化
(16:34) GPU (演算 + 遅い HBM) と Groq (SRAM 中心、 1 桁速い) の構造的差
(17:00) NVLink Fusion でチップ間接続
(17:38) 同じ電力フットプリントで 2.5 倍のトークン
(17:51) Sunny からのテキスト「NVIDIA と提携できる」
(18:00) Brad が 1 週間メールを出さなかった話
(20:23) 「動作システム → $20B 振込、 30 日」
(20:39) NVIDIA は GPU を作っていない、推論システム全体を作っている
(21:46) Marc Andreessen の観察 — 周りが 1 日 $100〜$1,000 を Claude / ChatGPT トークンに使う時代

出典

Class #2 | MS&E 435: Economics of the AI Supercycle Stanford University Spring '26 Apoorv Agrawal

講演者プロフィール: ブラッド・ガースナー / Brad Gerstner · サニー・マドラ / Sunny Madra · アプールヴ・アグラワル / Apoorv Agrawal

個人的に面白かった点

Brad が 1 週間 「ジェンセンへのメール」 を出さなかった話 (18:00)

「動作するシステムを見せてから 30 日で $20B」 (20:23)

NVIDIA は 「もう GPU を作っていない」 (20:39)

動画の構成

出典

Brad が 1 週間「ジェンセンへのメール」を出さなかった話 (18:00)

NVIDIA は「もう GPU を作っていない」 (20:39)