サニー・マドラ / Sunny Madra · 17:38 「同じ電力で、 2.5 倍のトークンが出る」
Groq が 2016 年創業から 9 年、 競合 NVIDIA の影で 「あの SRAM 中心の決定論的アーキテクチャは面白いけど、 ニッチでしょ」 と言われ続けてきた。 その同じ会社が 2025 年 12 月、 NVIDIA に 200 億ドル (NVIDIA 史上最大の M&A) で買収される。 きっかけは 1 通のテキストメッセージ。 動作するシステムをジェンセンに見せてから、 200 億ドルが振り込まれるまでわずか約 30 日。
語るのは 2 人。 ブラッド・ガースナー (Brad Gerstner) — Altimeter Capital 創業 CEO、 OpenAI / Anthropic / Cerebras / Groq の主要投資家。 18 年で運用資産 150 億ドル超に育てたヘッジファンドの主。 もう 1 人が サニー・マドラ (Sunny Madra) — 元 Groq 社長、 4 度の Exit を経験した連続起業家 (Pivotal / Ford / Groq / NVIDIA)。 進行は MS&E 435 講師 アプールヴ・アグラワル (Apoorv Agrawal、 Altimeter パートナー)。
議論の前提は前回 (Class #1) と同じ — 「ソフトウェアが世界を飲み込んだ」 公式は AI には当てはまらない。 アプリのユーザーが増えるたびに GPU 計算が消費される世界では、 限界コストはゼロやない。 そしてその制約が世界中で同時に効いている結果、 「電力 1 ワットあたり何トークン出るか」 が経済の根本指標になっている、 という時代認識から始まる。
Groq が NVIDIA に持ち込んだ提案は技術的にシンプルやった。 推論を 「prefill (入力処理)」 と 「decode (出力生成)」 に分離し、 さらに decode の中の 「演算集約的」 と 「メモリ帯域集約的」 な部分を切り分ける。 NVIDIA の GPU は演算と HBM が強い (ただしメモリは外付けで遅い)。 Groq の SRAM チップは演算は少ないが SRAM 帯域が約 1 桁速い。 NVLink 経由で両者をつなげば、 同じ電力フットプリントで 2.5 倍のトークンが出る — これが 「同じ電力 → 2.5 倍トークン」 の根拠。
個人的に面白かった点
Brad が 1 週間 「ジェンセンへのメール」 を出さなかった話 (18:00)
Sunny が Brad に 「NVIDIA と提携できる、 ジェンセンにメッセージを送って」 と言った瞬間、 Brad は固まった。 競合の親玉に協業を持ちかける、 しかも自分は政治資金まで使ってジェンセンと近い関係。 「クレイジーな案やと思われたくない」 で 1 週間放置。 Sunny から 「で、 送った?」 と再催促されて、 ようやく送信。 ジェンセンは即返信、 「面白い、 話そう」。 ベンチャーキャピタリストにも保身バイアスがある、 という人間味が漏れる場面。
「動作するシステムを見せてから 30 日で $20B」 (20:23)
Apoorv が時系列を確認する場面。 ジェンセンに動作するプロトタイプを見せる → NVIDIA から 200 億ドルが振り込まれる、 までわずか 30 日。 9 年間 「ニッチ」 と言われ続けた会社が、 1 ヶ月で NVIDIA 史上最大の M&A 対象になる。 200 億ドル ≒ 約 3 兆円 ≒ 任天堂 1 社相当。 それが 30 日。 「決算が動く速度の世界では、 提携・買収は 6 ヶ月かけてやるもの」 という業界常識を、 物理制約 (電力 / メモリ) の切迫感が圧縮した瞬間。
NVIDIA は 「もう GPU を作っていない」 (20:39)
Sunny の指摘 — NVIDIA はすでに 7 種のチップ + 5 種のラックからなる垂直統合エコシステムを構築している。 「NVIDIA は GPU を作っているのではなく、 推論システム全体を作っている」。 だから decode 専用チップや SRAM 集中型チップを内製する余地は社内にもあった。 そこに Groq の動作プロトタイプが届いたから、 「カルチャーとエンジニアリングが補完的」 と判断できた。 もし Groq がただ 「もっと良い GPU」 を作っていたら、 内部紛争で買収は成立しなかった、 と本人が言い切る。
動画の構成
- (00:00) 前提共有 — ソフトウェアが世界を飲み込んだ公式は AI には効かない
- (00:30) ゲスト紹介 — Brad Gerstner (Altimeter)、 Invest America
- (03:55) Sunny Madra 紹介 — Pivotal / Ford / Groq / NVIDIA で 4 連続 Exit
- (05:11) 過去 2,000 年の人類一人当たり GDP — 1,800 年間ほぼ横ばいから 1800 年代に爆発
- (15:00) Groq → NVIDIA 提携の発端
- (16:04) 推論を prefill / decode に分離、 さらに decode を細分化
- (16:34) GPU (演算 + 遅い HBM) と Groq (SRAM 中心、 1 桁速い) の構造的差
- (17:00) NVLink Fusion でチップ間接続
- (17:38) 同じ電力フットプリントで 2.5 倍のトークン
- (17:51) Sunny からのテキスト 「NVIDIA と提携できる」
- (18:00) Brad が 1 週間メールを出さなかった話
- (20:23) 「動作システム → $20B 振込、 30 日」
- (20:39) NVIDIA は GPU を作っていない、 推論システム全体を作っている
- (21:46) Marc Andreessen の観察 — 周りが 1 日 $100〜$1,000 を Claude / ChatGPT トークンに使う時代
出典
Class #2 | MS&E 435: Economics of the AI Supercycle Stanford University Spring '26 Apoorv Agrawal
講演者プロフィール: ブラッド・ガースナー / Brad Gerstner · サニー・マドラ / Sunny Madra · アプールヴ・アグラワル / Apoorv Agrawal