
给 AI 建「流水线」,九章云极看清了什么?
Quick Answer
JiuZhang Cloud's AI Factory aims to revolutionize AI deployment by standardizing computational power measurement and enhancing model production efficiency.
Quick Take
JiuZhang Cloud's AI Factory aims to revolutionize AI deployment by standardizing computational power measurement and enhancing model production efficiency. With the introduction of DCU (standardized computational unit), the company addresses the industry's infrastructure gap, enabling scalable AI solutions that can adapt to various business needs.
Key Points
- AI token usage in China reached 140 trillion daily by March 2026.
- Stanford reports inference costs have dropped 280 times in the last two years.
- JiuZhang Cloud's AI Factory introduces a systematic approach for AI deployment.
- DCU standardizes computational power, enabling cross-platform comparisons.
- The AI Factory aims to create a self-optimizing production system for AI models.
Article Content
From source RSS / original summary当一个行业的核心问题开始转移,旧的基础设施就会在无声中失效——AI,正在经历这样的时刻。 2026年3月,国家数据局公布了一个数字:中国日均Token调用量已达140万亿;4月,斯坦福人工智能指数报告写道,过去两年推理成本下降了280倍;Gartner的预测则显示,2026年将有40%的企业把AI Agent嵌入自己的业务系统。 这些数字拼在一起,看起来像是一个时代到来的宣告。 九章云极创始人兼董事长方磊打了一个比方:第一次工业革命,始于瓦特的蒸汽机,但真正定义那个时代的,是福特的流水线——它把天才的一次性灵感,变成了每个人都能享用的产品。 AI正站在完全相同的拐点上:过去几年的大模型突破是"蒸汽机时刻",而现在,真正的考验是能不能建起那条"流水线"。 但这条"流水线",究竟建起来了多少? 把视线从宏观数字移开,去问那些真正在大规模部署AI的工程师,你会发现数字的另一面,是一组依然悬而未决的问题——大量Token消耗并未转化为实际的业务成功,代码在本地、算力在云端的开发环境依然割裂,企业在评估AI项目的真实回报率时缺乏可靠的工具。 这些现象指向一个根源:整个行业缺少一套能够度量“智能生产”的基础设施。
6月17日,九章云极正式发布“AI工厂”核心战略,推出基于AI工厂锻造的新一代智算云Alaya NeW Cloud 3. 0——一套从算力投入到专业智能交付的工程体系。 这是一家拥有超过十年AI技术积淀的公司,对当下这组困境给出的系统性回答。 理解它的设计逻辑,需要先把问题看清楚。 AI工业化卡在了度量上AI产业的竞争重心,正在悄然转向。 九章云极副总裁胡宗星把这个转变拆成了三段历史:模型发明期,核心问题是“能不能做出更强的模型”,基础设施形态是算法、参数和单点突破;产业验证期,核心问题是“能不能跑通行业场景”,基础设施形态是项目制、PoC和私有部署。 而现在,正在进入的是第三个阶段——智能工业化期,核心问题变成了“能不能规模化生产与交付智能”,需要的基础设施是AI工厂、标准化生产和专业Token。 胡宗星认为,前两个阶段,行业已经走完;第三个阶段,才是真正的硬仗。 它意味着基础设施的竞争逻辑已经彻底改变,而大多数企业赖以运转的基础设施,还停留在上一个阶段。 这种错配,正在让三件事同时失效。
▎第一重失效:算力投入无法被标准化度量今天,一家企业如果同时采购了不同架构的GPU和NPU,它很难用一把统一的尺子回答:这笔钱到底换来了多少“有效算力”? 不同芯片的FLOPS数字互不可比,不同厂商的“X卡时”定义各异,算力利用率更因架构差异天壤之别。 这不只是报表难看的问题,更深的麻烦在于:一旦说不清投入了多少,优化就无从下手——换芯片、调调度、改模型,哪个更值得试? 根本没有判断的依据。 对于需要长期规划算力预算的智算中心运营方而言,这直接决定了采购能否理性化、资源能否跨平台调度、规模扩张的边际成本能否被真正管控。 没有统一的“度”,就没有现代电力工业;同样,没有统一的算力度量,算力就无法成为可以被采购、被运营、被持续优化的社会级基础设施。 ▎第二重失效:Token单价已经不是成本标尺Token价格战打了两年,中端模型的Token单价已经接近为零。 但对于企业而言,比起“每百万Token多少钱”,更关心完成一项业务的总成本,即真实成本。 这两者的差距,远比想象中大。 假设一个AI Agent执行一项20步的自动化任务,每一步的成功率是85%,那么整个任务完成的概率只有约4%。
如果把单步成功率从85%提升到98%,任务完成率就会跃升至67%——模型的专业程度,在多步任务中产生的收益,是指数级而非线性的。 胡宗星把这个逻辑拆成了一个公式:AI应用成本=Token消耗×推理时延×重试次数×人工兜底成本。 这意味着,任意一项失控,即使单Token再便宜,任务总成本也会面临失控的风险,这也解释了为什么在Token价格大幅下降的当下,很多企业的AI部署成本反而还在上升。 ▎第三重失效:专业模型生产还停留在“手工作坊”阶段每家行业客户都需要一个真正理解自己业务的专业模型,但今天,训练一个垂类模型的路径,往往是:收集数据、清洗数据、精调、评测、部署、运维——每一步都是定制的、不可复用的、需要大量人工介入的。 手工生产最大的问题,不只是慢,而且经验难以形成复用。 一次金融领域的专业模型训练积累的业务知识,很难直接迁移到制造业的专业模型生产中;每个客户的模型交付,在数据和业务层面几乎都是从零开始的新项目。 这意味着,无论做多少个项目,边际成本都很难实质性下降。 大量企业因此陷在PoC(概念验证)阶段出不来,从模型研发到上线动辄半年以上,模型交付,正是在“作坊化”里被大规模浪费。
三种失效,指向同一个本质:AI竞争的形态已经改变,但工业化所需要的基础设施——一套能够标准化度量投入、降低任务完成成本,并实现模型规模化生产的体系——至今仍然缺位。 而这,正是九章云极试图填补的空白。 AI工厂如何让「算力到智能」第一次可被计量从本质上看,AI工厂试图让“智能生产”第一次具备工业体系中的三要素:统一计量、标准生产与规模交付。 胡宗星在发布会上给AI工厂下了一个定义:"AI工厂,是智能工业化的工程底座。 "“工程底座”这个定语,透露了产品的底层逻辑:一套能被度量、被管理、能持续优化的生产体系。 工厂的本质,是一条可以持续运转、不断降低边际成本的生产线。 沿着这个逻辑,AI工厂的完整链条可以概括为:DCU(标准化算力单位)→训练工厂(专业模型生成)→Token工厂(专业智能流通)→企业任务(价值实现)→数据回流(模型迭代)。 链条的起点是DCU。 九章云极把DCU定义为1度算力=312TFLOPS*1小时,第一次把异构、多厂商、多架构的算力资源折算成一个可以跨平台比较的标准量。 客户按DCU采购,不必理解底层芯片型号和集群拓扑,GPU、NPU、不同代际的芯片,都可以换算成统一的DCU单位进行采购和结算。
只有投入侧有了度量,生产才有核算的基础。 有了标准化的算力投入,下一步是把它转化为专业智能,这是训练工厂的任务。 训练工厂负责把“通用智能”冶炼为“专业智能”,胡宗星特意用了“冶炼”这个词,其背后的工艺由四个节点构成:数据处理、领域精调、强化学习、评测反馈。 其中强化学习是最关键的一环,也是训练工厂区别于平台精调服务最核心的地方。 通用大模型经过领域精调之后,能更好地“回答问题”;但只有经过强化学习,模型才能真正学会“完成任务”——拆解复杂目标、调用外部工具、在失败后调整路径。 胡宗星把这个区别概括为:让专业模型从"会回答"走向"会执行"。 这个区别在Agent大规模落地的今天尤为重要,对企业而言,模型会不会回答问题早已不是门槛,真正的门槛是:模型能不能在有容错率约束、有工具调用链路、有业务边界限制的真实生产环境里稳定执行任务。 专业模型从训练工厂产出后,需要经过压缩、量化、评测和分发,才能进入下一段——Token工厂,胡宗星将这个“中间环节”称之为“模型转运”,是专业智能从“被生产”到“被消费”之间不可省略的工程步骤。
Token工厂则负责专业智能的流通与交付,不同于行业常说的推理工厂,推理工厂的出发点是资源调度,核心命题是如何把已有模型部署稳、服务好、延时低,优化的是单任务性能。 而Token工厂的出发点是价值交付,核心命题是如何把智能封装为可以精确计量的价值单元,优化的是规模化产出的效率。 这意味着Token工厂交付的不是泛化的Token,而是分层分档的专业Token——消费级、专业级、前沿级,对应不同类型的模型、不同复杂度的任务和不同的服务等级。 每一类Token的定义,对应的是它所封装的智能密度与业务价值,而不只是它背后消耗的算力成本。 在这个框架下,“每任务完成成本”终于有了被计算的基础:投入侧用DCU度量,产出侧用专业Token度量,两者之间的转换效率,就是工厂效率。 胡宗星将其总结为:"同样的DCU,能不能生产更多、更稳定、更高价值的专业Token,这就是工厂效率,也是客户价值。 "每一次企业任务的完成,都会产生反馈数据——成功了什么、失败了什么、哪里卡壳、哪个步骤需要人工兜底,这些数据会持续回流到训练工厂,驱动专业模型的下一代迭代。 至此,闭环完成。
AI工厂因此不只是算力到智能的一次性转化,更成为了一个可以自我优化的生产体系,每一轮任务,都在为下一个更专业的模型积累原料。 这套体系为企业用户带来的变化,可以归结为三个更直接的结果:第一,算力成本开始具备可预测性。 通过DCU统一计量,算力投入不再依赖多厂商、多口径的碎片化统计,而是可以像电力一样被预算、被核算。 第二,智能交付效率显著提升。 Token Factory将底层芯片、模型与调度能力封装为标准化的Token服务,专业Token的分层分档交付,使不同复杂度的业务任务可以被更稳定地规模化执行,减少重复试错与人工兜底。 第三,模型能力可以持续复用与迭代。 业务任务产生的反馈数据持续回流至训练工厂,驱动专业模型的下一代迭代,形成“越用越强”的价值增强回路。 工厂用得越多,模型越专业;模型越专业,任务完成率越高;任务完成率越高企业落地 AI 项目的综合价值可清晰衡量。 这是双工厂区别于单纯算力租赁和推理服务的本质所在。 在算力与模型之间,AI开始出现“中立工厂层”当前,智算赛道参与者日趋多元,综合云厂商、大模型企业、传统 IDC 服务商纷纷布局算力领域,行业竞争维度不断丰富。
九章云极坚持独立智算云定位,走出差异化发展路径。 综合云厂商业务布局较为全面,同时覆盖算力、应用等多个领域。 九章不竞争模型,不竞争应用,意味着它和每一家模型公司、每一家行业客户之间,理论上都不存在利益对立——平台的中立性,让它有可能成为整个生态的"公共基础设施"。 而不做模型、不做应用,就意味着九章的价值,需要通过生态的繁荣来兑现。 平台不以单一业务作为利润核心,价值依托整个产业生态共同成长实现。 只有当足够多的专业模型在平台上被训练、被交付、被调用,当足够多的行业任务在AI工厂里跑通,平台的价值才得以实现。 这套体系要真正运转起来,前提是必须有足够多、足够好的专业模型进入Token工厂——没有专业模型,专业Token就是一个空概念。 于是,九章启动了"智算开放计划",计划遴选并孵化1000个高价值专业模型与智能应用,通过算力支持、技术共创、商业分成、市场联动,与行业开拓者深度绑定,这是整个双工厂体系能否成立的公开验证。 目前持有的筹码来自三处。 首先是已被验证的规模:九章累计服务超过3万次客户算力任务,平台上已经预置了50多款主流基座模型 以及100余款的面向金融、制造、政务、科研等真实开源数据集。
其次是全栈自研的效率护城河:全栈自研的智算操作系统、算电协同优化、跨中心跨型号全局调度、模型量化与推理优化,五条路径相乘,构成独立于硬件之外的效率优势,即使竞争对手购入同等算力,也未必能在任务完成成本上达到同等水平。 第三是更远处的一个思考。 当千倍降本实现、算力便宜如水电,什么会成为下一道关卡? 九章的判断指向高质量产业数据,以及传统企业缺乏AI原生工作流与组织能力。 打通算力这一关,正是为了让产业界尽早面对这些更深层次的"软性"瓶颈。 这个判断,或许是理解九章战略的另一个视角:AI工厂既回应了当下的竞争格局,也提前布了一局棋——关于“算力之后是什么”。 推理成本的下降,确实让AI进入了规模化应用的临界点,但下一阶段产业效率的真正决定因素,已经从“能否用AI”转向了“能否用工业化方式持续生产智能”。 在这一点上,AI行业仍处于基础设施重构的早期阶段:算力需要统一计量,智能需要标准化生产,模型需要工程化交付。 九章云极提出的AI工厂,本质上是在尝试回答一个更基础的问题:当AI从能力竞争进入工业化竞争阶段,谁来定义“智能生产”的基础设施标准?
这套体系的成熟度,最终取决于两个层面的验证:它能否支撑更多行业场景中稳定运行的专业模型,以及这些模型能否在真实业务中持续创造可衡量的价值。 雷峰网雷峰网
Reader Mode unavailable (could not extract clean content).
Want this in your inbox every morning?
Daily brief at your local 8am — bilingual EN/中文, free.
More from 雷峰网芯片
See more →
Agent时代的CPU军备竞赛,至强6+如何把Agentic AI变成生产力?
Intel's Xeon 6+ processor, with 288 E-cores, can run over 1000 AI agents simultaneously, addressing a 417% surge in China's AI computing demand. Key technologies QAT and IAA enhance performance and reduce memory costs, making Agentic AI production-ready.
