AI基础设施的下一个千亿市场，为何藏在网络里？

4h ago

·~3 min·7/3/2026·zh·1

Quick Answer

Quick Take

The DPU market is rapidly expanding as AI infrastructure shifts focus from GPU performance to network efficiency, with companies like Cloud Leopard achieving significant milestones in DPU development, including a 400Gbps product. This transition highlights the critical role of DPU in optimizing AI systems for high-frequency inference and resource scheduling.

Key Points

NVIDIA's acquisition of Mellanox emphasized the importance of DPU in AI infrastructure.
DPU market projected to grow from ¥649.93 billion in 2021 to ¥1.964 trillion by 2025.
Cloud Leopard's DPU can achieve 400Gbps, optimizing GPU utilization and reducing latency.
DPU's role is evolving from auxiliary to a core component in AI systems.
Agent era demands increased focus on resource scheduling and network efficiency.

Article Content

From source RSS / original summary

过去六年，国产GPU公司一路站上AI风口，估值不断刷新，DPU却被忽略了。这并不符合产业现实。 2020年英伟达完成收购Mellanox后，就已经明确了“GPU+CPU+DPU”的三芯战略。过去几年，英伟达也持续强化网络能力，黄仁勋在2026年CES展示“六芯组合”时，其中四款都与网络相关。一个越来越清晰的趋势开始浮出水面：AI基础设施的瓶颈，正在从算力本身转向网络与调度。尤其Agent时代到来后，AI系统开始从训练转向高频推理与持续运行，GPU利用率越来越依赖网络效率。 DPU也从过去的数据中心可选项，逐渐变成AI基础设施里的关键角色。但一个耐人寻味的问题是，既然英伟达早已押注DPU，为什么过去六年，整个行业依然低估了DPU？直到云豹智能冲刺国产DPU第一股被深交所受理，招股书呈现在所有人眼前，市场才开始意识到，一款可以支持低时延、高带宽和高性能数据调度的全功能DPU可能是AI基础设施里被低估最久的一块拼图。一个被低估六年的大芯片赛道过去几年，AI行业竞争的焦点始终是GPU。更大的模型参数、更强的单卡性能、更昂贵的HBM，几乎吸引了整个行业的注意力。

但随着模型规模不断扩大，AI集群开始从千卡迈向万卡，越来越多公司发现，GPU已经不是AI系统里最稀缺的资源，真正昂贵的开始变成低时延、高带宽与数据流动效率。不少算法工程师对此感受明显。在当前AI基础设施体系下，单节点算力相对容易获取，存储容量次之，最难、也最昂贵的其实是带宽和低时延。尤其在大规模训练与推理场景中，GPU利用率往往并不理想，即便经过深度优化，系统瓶颈也经常出现在网络与数据调度环节。这也是过去几年英伟达不断强化网络能力的关键原因。释放出的信号也非常明确：AI基础设施的竞争，正在从单芯片性能竞争转向系统效率竞争。在这一过程中，DPU的角色也发生了变化。在过去以CPU通算为主的云计算时代，DPU更多承担网络、存储、安全等基础设施任务卸载，被视为数据中心里的辅助芯片。在Agent时代，随着AI基础设施开始从训练转向高频推理、资源编排与持续调度，DPU正在成为连接计算、网络与存储的系统级核心节点。尤其在Scale Up场景下，DPU能够优化单节点内CPU与GPU之间的内存共享与数据流动，降低数据搬运时延，提升异构算力协同效率。

在Scale Out场景中，DPU则承担大规模集群间的数据调度与网络卸载任务，直接影响GPU利用率。推理需求的大爆发，也进一步放大了DPU的重要性。随着大模型上下文窗口持续增长，GPU显存容量成为推理成本的重要瓶颈，DPU可以在不增加GPU硬件数量的情况下，扩展AI系统的有效可用内存容量。 2026年GTC上，黄仁勋就展示了新一代DPU在KV-Cache分层存储上的能力演进。在最新的Vera Rubin系统中，BlueField-4系列DPU承担KV-Cache管理与硬件加速任务，在GPU高速HBM与外部存储之间构建“温数据层”，为每颗Rubin GPU动态分配16TB专用上下文空间，打破上下文处理的硬件瓶颈，将单Token推理成本降低90%。 AI 推理上下文存储流转机制，来源：中国信息通信研究院DPU正在从过去的数据中心可选项，变成AI基础设施里的关键组件，这也让DPU市场开始快速扩张。根据沙利文（Frost & Sullivan）2026年专项报告，全球DPU市场规模已从2021年的649. 93亿元增长至2025年的1964. 91亿元，预计到2030年将进一步增长至4362.

39亿元；中国市场则预计在2030年达到1290. 91亿元，成为AI基础设施中增长最快的细分领域之一。但一个耐人寻味的问题是，为什么过去几年，这个市场始终没有真正成为行业焦点？为什么AI行业过去六年低估了DPU？当模型的规模越来越大，网络就越来越成为整个系统的瓶颈。随着Agent时代开始到来，AI基础设施的需求正在发生变化。系统开始从训练更大模型，转向让推理更高频、更低成本、更长时间运行。在这一过程中，资源编排、任务调度、KV-Cache管理、存储池化等系统能力的重要性快速提升。这种变化让AI系统对CPU与DPU的需求同步上升。因为当CPU承担越来越多推理调度与系统管理任务时，网络卸载、安全隔离、虚拟化、存储加速等基础设施能力，就需要卸载到DPU上。所以Agent时代不仅重新抬高了CPU的重要性，也重新放大了DPU的价值。但DPU被低估，还有一个更重要的原因：真正能把全功能DPU做出来的公司极少。 DPU并不只是更复杂的网卡，它同时涉及网络、计算、存储、虚拟化、安全隔离等多个领域，本质上是一颗系统级芯片。

真正决定DPU壁垒的，也不仅是芯片本身，还包括数据面处理能力、软件栈、云原生适配以及大规模数据中心里的稳定性。 DPU功能示意图，来源：中国信息通信研究院即便强如英伟达，在DPU领域也经历了较长的产品演进周期。英伟达早期斥巨资收购Mellanox补齐DPU能力，而Mellanox早期BlueField系列产品（BF1，BF2）并没有真正被市场大量采用，直至英伟达收购Mellanox后开发的BF3, 才算得上是成功的DPU产品。而国内真正具备全功能DPU研发与量产能力的公司更少。除了华为外，云豹智能是其中少数已经实现产品化与规模落地的独立厂商之一，也是唯一能够达到400Gbps的全功能DPU产品，对标英伟达BF3。云豹智能之所以能够切入这一高壁垒赛道，与其团队背景密切有关。

创始人萧启阳24岁获得斯坦福大学电子工程博士学位，其博士论文攻克人工智能领域悬置三十余年的经典理论难题，相关研究成果编撰成书《Discrete Neural Computation: A Theoretical Foundation》，获人工智能之父马文・明斯基亲笔作序推荐，这项在早期的AI神经网络上突破性的理论令他获得美国国家科学基金会青年研究员奖，他后来长期专注于网络与分布式计算方向研究，曾在MIT任endowed-chair副教授。在创立云豹智能之前已有大芯片领域创业经验，其之前在硅谷作为联合创始人的网络处理器公司后被博通以37亿美金收购。同时，云豹智能的核心团队来自博通、英特尔、ARM、华为海思、阿里巴巴等公司，覆盖网络芯片、云计算与系统架构等多个方向。强大的团队让云豹能设计出系统级的DPU芯片。据接近云豹的人士透露，其首代DPU产品在A0版本阶段即实现客户部署与量产，在高端芯片领域里，无论在国内还是国外，都极为少见。也就是说云豹智能在第一次流片后，就已经能够直接进入真实数据中心环境。推出产品只是一家大芯片公司迈向成功的第一步，大规模落地才是最苛刻的检验。

云豹智能自主研发的DPU产品为国内首家达到400Gbps速率的芯片产品。相比参数本身，更重要的是其产品已经进入真实数据中心场景，目前已在头部客户场景中实现超过十万片规模化商用，应用于高性能计算、存储与网络卸载等业务。但过去几年，无论是产品研发还是客户落地，云豹整体都保持相对低调。这也使得DPU虽然一直存在于AI基础设施体系中，却很少真正进入公众视野。直到英伟达持续强化网络布局、Agent推动AI系统进入重调度时代后，以及云豹智能冲刺国产DPU第一股，行业才开始重新意识到，DPU可能是AI基础设施中被低估最久的一块拼图。 Agent时代，DPU迎来价值「重估」DPU的重要性正在持续上升。对于真正具备全功能DPU能力的公司，AI市场不仅意味着新增需求，更意味着更大的能力外溢空间。雷峰网了解到，云豹智能将在今年推出专门针对AI网络场景的DPU产品，以进一步满足AI基础设施市场需求。决定全功能DPU公司长期价值的，并不是单一产品，而是持续进入核心基础设施场景的能力。 DPU已经开始在数据中心、云计算、高性能计算、大模型推理等场景中帮助提升GPU利用率、降低系统时延，并优化整体资源效率。

DPU的应用还进一步扩展至金融、运营商、能源等行业。在金融场景中，DPU能够提升核心交易系统的稳定性与安全隔离能力，在能源领域，则能够支撑电网与工业系统的数字化调度需求。对于全功能DPU厂商来说，持续的技术演进能力同样重要。目前DPU网络接口速率已经进入“400Gbps规模化部署、800Gbps开始商用”的阶段，AI基础设施对更高带宽与更低时延的需求仍在快速提升。据悉云豹智能新一代800Gbps/1. 6Tbps DPU产品也即将推出市场，以进一步适配下一代AI数据中心需求。而在行业竞争格局中，DPU厂商本身也极为稀缺。中国信通院近期发布的《DPU发展分析报告》显示，在中国DPU市场中，英伟达凭借长期的芯片架构积累、成熟的数据面处理能力以及完善的软件生态占据市场首位。云豹智能排名第二，并在本土DPU厂商中位列第一，是目前国内少数实现DPU大规模量产与商用落地的独立厂商之一。随着AI基础设施越来越强调系统能力，某种程度上国产高端网卡市场的竞争格局已经开始收敛，未来可能只剩下两类玩家：云豹，以及其他厂商。这种稀缺性，也让云豹开始获得更广泛的关注。

在中国国家博物馆与工业和信息化部联合主办的《筑基强国路——中国制造“十四五”成就展》中，云豹DPU系列产品成功入选并亮相国家博物馆“国之重器”展区，成为展览重点展示的芯片产品之一。中国国家博物馆展出云豹DPU系列产品随着国产AI基础设施公司持续获得资本市场关注，DPU赛道的价值也开始被重新评估。相比GPU市场已经进入高度拥挤阶段，真正具备全功能DPU研发、量产与规模化落地能力的公司依然极少。 IPO申请获深交所受理后，云豹智能向“国产DPU第一股”更进一步，其在国产AI基础设施领域的稀缺性也开始受到资本市场关注。过去两年，国产GPU公司上市后普遍获得数千亿元人民币市值，也让资本市场开始重新评估国产DPU公司的长期价值空间。作为国内DPU领域最具代表性的独立厂商，在这千亿市场的赛道上，云豹智能的稀缺性，在未来资本市场上的表现，拥有更大的想象空间。 DPU已被列入国家战略，从“卡脖子”到“基础底座”，DPU已成为算力基础设施自主可控的最后一环。国内DPU公司，正在迎来属于自己的价值重估周期。更多DPU和AI基础设施行业和公司的交流，欢迎添加作者微信 BENSONEIT 互通有无。

Read on leiphone.com

Want this in your inbox every morning?

Daily brief at your local 8am — bilingual EN/中文, free.

Subscribe — it's free

More from 雷峰网芯片

See more →

雷峰网芯片

2w ago

FeaturedOriginal

给 AI 建「流水线」，九章云极看清了什么？

AI Summary

JiuZhang Cloud's AI Factory aims to revolutionize AI deployment by standardizing computational power measurement and enhancing model production efficiency. With the introduction of DCU (standardized computational unit), the company addresses the industry's infrastructure gap, enabling scalable AI solutions that can adapt to various business needs.

#Inference #Open Source #AI Startup #Enterprise AI

AI基础设施的下一个千亿市场，为何藏在网络里？

Quick Answer

Quick Take

Key Points

Article Content

Want this in your inbox every morning?

More from 雷峰网芯片

给 AI 建「流水线」，九章云极看清了什么？

Agent时代的CPU军备竞赛，至强6+如何把Agentic AI变成生产力？

被遗忘十年的LPU翻红，一门新生意成立了吗？

Related in this space

Deploy a Production-Ready NVIDIA AI-Q Blueprint on Oracle Cloud Infrastructure

Deploy Long-Context Reasoning and Agentic Workflows with MiniMax M3 on NVIDIA Accelerated Infrastructure

Deploy Self-Evolving Agents for Faster, More Secure Research with a Hermes Agent and NVIDIA NemoClaw