拆解2030
AI 实验报告 · LAB
← 返回报告列表
002 · LAB · 2026-06-01

个人 AI 算力下沉 · 2026-2028

训练仍在云 · 推理大规模迁向本地 · DGX Spark 是试验机 · 年销 50 万台 = AI PC 拐点 · 类比 2008 iPhone 之于移动互联网

主线 2026-2028 拐点信号 50 万台/年 类比锚 2008 iPhone + App Store 结构性 · 非季度催化
核心论点 · CORE THESIS

2022-2025 大模型主战场在云,因为训练 + 推理都需要数据中心级算力。但 2025 年 GB10 Superchip + 统一内存架构第一次把"跑 200B 参数模型"压到 $3,000 桌面。这不是降价 —— 是物理条件的结构性下沉。Spark 解决之前缺的"在家跑大模型的设备"。设备到位后,开发者长尾应用(Agent / 私有 RAG / 个人助理 / 工作流自动化)的爆发只是时间问题。2008 年的 iPhone 不是因为它好用才改变世界,而是因为它让 App 第一次能在口袋里运行。Spark 在做同样的事 —— 让大模型第一次能在桌面上运行。

·

主控节点 · 拐点指标

DGX Spark 年销 50 万台
2027 H1 验证 · 拐点门槛
硬件链
HBM / OEM / MediaTek / 4N 同步放量
软件长尾
本地 Agent / RAG / 助理生态启动
行业垂直
医疗 / 金融 / 法律本地 AI 部署
云端反向
中小 GPU 租赁需求结构性下移
01

下沉时间轴 · 6 个关键时点

从云端独占到桌面普及的物理条件演进 · 每一步对应一个"能不能在本地跑某种模型"的门槛突破。

2022
ChatGPT 公开 · 大模型全部在云。GPT-3.5 175B 参数 · 单次推理需 8×A100 · 个人完全没可能本地跑 · 云端独占。
2023
Llama 开源 · 量化技术成熟。Llama 65B 通过 4-bit 量化可在 2×4090(~$3K)上跑推理 · 早期 hacker 进入本地 AI 第一波 · 但仅小众
2024
Llama-3 70B + Apple Silicon 统一内存。M3 Ultra Mac Studio($4K)首次让普通开发者本地跑 70B · 但价格仍偏高,生态弱(macOS not CUDA)。
2025
NVIDIA DGX Spark 公布 · $3,000 + GB10 + 128GB + 200B 模型。CUDA 生态 + 价格突破 + 200B 模型 · "在家跑大模型"的物理条件首次全面成熟
2027 H1
Spark 累计出货 50 万台 = AI PC 拐点(本期判断)。OEM 渠道成熟 + 开源模型生态完整 + 主流开发者迁移到本地 · 触发杀手级应用集群涌现。
2028
Spark 2 + 主流 PC AI 化。$1,500 价位 + Windows/macOS/Linux 全平台 · 类比 2010 年 iPhone 4 时代 · App Store 应用爆炸的"次年"。
02

类比拆解 · 2008 iPhone vs 2026 Spark

不是营销类比 —— 是物理条件等价:某种工具第一次进入个人可负担+随时可用区间,触发开发者长尾应用涌现。

维度2008 iPhone2026 DGX Spark
前置技术触屏 + 移动网络 + ARM 处理器大模型 + 量化 + 统一内存 + GB10
关键瓶颈"应用没法在口袋里运行""大模型没法在桌面上运行"
价格突破$199(2 年合约) · 个人可负担$3,000 · 中产开发者可负担
软件平台App Store(2008-07)NIM + AI Workbench + HuggingFace + Ollama
开发者门槛Xcode 免费 + Obj-C 学习CUDA 已成熟 + Python 全栈
第一年杀手级Tap Tap / Doodle Jump / 简单工具(预期)Cursor 类 Agent / 私有 RAG / 个人 AI 助理
第三年突破Instagram / Uber / WhatsApp 出现(推演)2028 出现"AI 原生第一公司"
对老世界冲击诺基亚 / 黑莓两年内崩(推演)中小云 GPU 租赁结构性下移
受益者类型ARM / 显示屏 / 摄像头 / 应用开发者HBM / 先进封装 / OEM / 本地 AI 软件商
故事时间跨度2008-2014 移动互联网建仓黄金期2026-2032 个人 AI 算力建仓黄金期
类比的边界 · 不是所有变量等价:① iPhone 自带网络效应(SMS / 邮件 / 浏览器)· Spark 需要靠开源模型生态 ② iPhone 物理便携 · Spark 仍在桌面 ③ AI 推理结果质量比早期 App 体验更难评估 · 用户期望管理更难。这条线慢 1-2 年成立,但方向上等价。
03

三分支推演 · 2027 验证窗口

A 基准 / B 中性 / C 尾部 · 看 2027 H1 Spark 累计出货量与开源模型下载量两个共振信号。

A · 拐点验证
基准 · 概率 45%
Spark 2027 H1 累计出货 >50 万 · 开源模型月下载 >2x · 主流开发者迁移本地完成 · 杀手级应用第一波出现。
触发信号ASUS/Dell 季报 AI Workstation 出货 · HF Llama-4 月下载 >1B · GitHub "Agent" 仓库 star 倍增
B · 渐进迁移
中性 · 概率 35%
Spark 出货增长但不到拐点 · 本地 AI 仍小众 · 多数开发者继续混合云/本地 · 拐点延后到 2028-2029。
信号Spark 季度出货 50-80K · 开源模型下载平缓 · 混合云使用率上升
C · 个人 AI 失败
尾部 · 概率 20%
个人 AI 需求实际有限 · Mac Mini + 云 API 组合击败 Spark · 本地大模型沦为"发烧友玩具" · 拐点推迟到 2030+ 或不发生。
信号Spark 季度出货 <20K · Apple Silicon AI 性能反超 · 主流开发者仍以云 API 为主
04

受益清单 · 4 大链路

不押单一标的 · 横向覆盖硬件 + 软件 + 行业 + 反向 4 链。

▸ 链 01 · 硬件上游
HBM + 先进封装 + 内存
SK Hynix · Micron · 三星 · TSMC
Spark/Station 量起来后,LPDDR5X + HBM3E + CoWoS 全部受益。单机 Spark 128GB,单机 Station 784GB,放量即吃量。
▸ 链 02 · OEM 桌面
高毛利 AI 工作站新品类
DELL · HP · LENOVO · ASUS
摆脱通用 PC 价格战 · AI Workstation 单机毛利可能比通用 PC 高 3-5 倍 · 季报 KPI 重构。
▸ 链 03 · CPU 协同
MediaTek 战略入场
2454.TW MediaTek
首入 NVIDIA 高端 SoC 合作 · 估值故事从"手机芯片公司"扩展为"NVIDIA ARM CPU 合作方"。
▸ 链 04 · 软件长尾
本地 AI 应用生态
Anthropic · Mistral · Ollama · LM Studio · Cursor
本地部署需求放量 · 类比 2008 后早期 App Store 开发商 · 长尾分散但增速最高。
▸ 链 05 · 平台 NVDA
从硬件公司到平台公司
NVDA
估值锚从 Intel/Broadcom 迁向 Apple/Microsoft · 平台估值 vs 硬件估值的 10x 空间差。
▸ 链 06 · 行业垂直
主权 AI 大客户
PLTR · SNOW · Databricks · 政府/医疗/金融垂直
本地 AI 让"数据不出门"成为可能 · 触发敏感行业 IT 架构重塑 · 政府类预算大幅倾斜。
05

高频跟踪信号 · 6 个数据点

判断这条主线成立与否 · 不看 NVDA 财报 · 看以下 6 个高频信号。

▸ 01
OEM 季度 AI Workstation 出货
ASUS / Dell / HP / Lenovo 财报 · Spark 系列累计 50 万台 = 拐点
▸ 02
HBM3E + LPDDR5X 价格走势
SK Hynix / Micron 季报 + 现货市场 · 价格涨幅是真实需求映射
▸ 03
开源模型月下载量
HuggingFace Llama / Mistral / Qwen 月下载 · 同比 >2x = 信号
▸ 04
GitHub 本地 AI 仓库 star 增长
Ollama / LM Studio / vLLM / llama.cpp 类项目周 star 增速
▸ 05
中小云 GPU 租赁单价
Lambda / RunPod / Vast.ai H100 单价 · 个人开发者端价格下行 = 信号
▸ 06
Cursor 类 Agent 用户增长
本地优先的 Coding Agent / Workflow 工具 MAU 数据 · 是杀手级前置
06

综合判断

⚑ 三个不要做的事

这条线慢 1-2 年 · 不是季度催化

不要单押 NVDA · 这是"硬件链 + 软件长尾 + 行业垂直"三线故事 · 单押会失去一半弹性
不要在 2026 等 Spark 销量爆发 · 这是 OEM 渠道与开发者生态共建期 · 真实拐点在 2027 H1
不要把这条线和"AI 训练算力扩张"混淆 · 训练继续在云 · 这条线是推理 + 应用层 · 估值逻辑不同

⚑ 三个该做的事

结构性建仓 · 信号驱动 · 横向覆盖

结构性建仓 · 不押单一季度 · 这条线 6 年(2026-2032)· 用月度甚至季度节奏调仓 · 不做日内或周内交易
用 6 个信号驱动 · 不靠新闻 · 杂讯多 · 噪音高 · 只看上面 6 个高频数据点的同向共振
横向覆盖 4-5 链路 · 不集中 · HBM + OEM + MediaTek + 软件 + 平台 NVDA · 5 个篮子配比 · 避免单链失败

07

来源与局限

来源

NVIDIA CES 2025 + 2026 keynote · NVIDIA 官方技术博客 · Reuters / Bloomberg / The Verge / AnandTech · HuggingFace + GitHub 开发者评测 · MIT / Stanford 早期 benchmark · OEM 官方公告 · MediaTek 投资者关系材料 · Apple Silicon 性能基准。

局限

① 50 万台 = 拐点这个门槛是本期建模假设,非官方共识 · ② 2008 iPhone 类比有边界(网络效应 + 物理形态差异)· ③ Spark/Station 性能数据多为 NVIDIA 自测 · 独立 benchmark 仍在汇总 · ④ MediaTek 合作可能是单代过渡 · ⑤ 不可模拟变量:Trump 政府对中国/韩国半导体新关税 · Apple Silicon 下一代性能 · 开源模型监管 · ⑥ 非投资建议 · 所有判断为情景推演 · 一切风险用户自负。