您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给成妍菁
发送

0

无问芯穹夏立雪:做高效智能的“Token工厂”,打造中国特色Token经济学

本文作者: 成妍菁   2026-03-27 17:17
导语:Token需求暴涨10倍,AI基础设施如何接招?

“Token每两周翻一倍”,AI infra 正在被重写”。

“这种增长速度,在人类历史上都很少见。”

这是无问芯穹CEO夏立雪对当下AI行业最直观的感受。

“养虾”成潮流后,AI产业进入到一个更有意思的变化:需求侧反向重塑 AI 基础设施。

随之而来的是,Token调用量暴涨、算力供需错配、系统架构承压,这些原本属于底层的问题,正成为行业发展的关键变量。

3月27日,在2026中关村论坛年会——AI开源前沿论坛上,由月之暗面创始人杨植麟领衔主持,智谱华章CEO张鹏,无问芯穹联合创始人兼CEO夏立雪,小米MiMo大模型负责人罗福莉,香港大学助理教授&博士生导师、Nanobot团队负责人黄超同台,围绕当下智能体浪潮、AI Infra的演进方向等议题展开深度对话。

作为基础设施层的代表,夏立雪从Token供给与产业可持续发展的视角,分享了对这一轮AI变革的观察与思考。

Token爆发:像极了3G时代的流量

在夏立雪看来,Token 不再只是一个计费单位,而正在成为类似“电力”“流量”的基础生产要素。

他将这一阶段类比为3G时代初期。当年移动互联网刚刚普及时,用户很快发现每月100MB流量远远不够用,需求迅速释放,最终催生出整个移动互联网生态。

“现在Token的状态是一样的。”他说,“我们甚至在开玩笑,未来手机可能会有两张卡,一张是流量卡,一张是Token卡。”

但与流量不同的是,Token的增长背后,不只是“用得更多”,而是使用方式发生了根本变化。

随着 Agent 的出现,AI开始从“回答问题”走向“执行任务”。一个复杂任务可能包含多轮推理、多次工具调用、多个子任务协同,这些都会显著提升Token消耗。

与此同时,并发能力也在发生变化:

“一个Agent可以一秒钟起1000个任务,没有人类工程师能做到。”

围绕 Token ,新的产业分工也在逐渐清晰。夏立雪将AI产业的核心拆分为三个要素:模型的智能性、从资源到 Token 的转化效率、资源规模。

三者共同决定整个系统的产出能力。

“模型厂商解决的是智能性的问题,而我们更关注的是生产效率——怎么把能源、算力转化为更多、更高质量的 Token 。”

在这个框架下,无问芯穹将自身定位为“ Token工厂 ”:通过软硬件协同、资源整合与调度优化,把分散的算力资源转化为可用的Token供给,并尽可能提升单位资源的产出效率。

 

基础设施重构:从“服务人类工程师”到“服务AI”

如果说Token的爆发是表象,那么更深层的变化在于:现有基础设施的设计前提,正在被打破。

“过去我们服务的是CTO,是开发者,但未来的客户,其实是AI,是Agent。”夏立雪说道。

人类工程师的工作节奏是串行的,而Agent具备高度并发能力;人类的响应速度是分钟级,而AI的反馈是秒级甚至毫秒级。这意味着,原本围绕“人”的行为模式构建的系统,在面对AI时会迅速成为瓶颈。

夏立雪对雷峰网(公众号:雷峰网)表示,基础设施要适应 AI 超出人类的能力。

比如 Agent 可以瞬间发起上千个并发任务,这种规模和响应速度,是人类工程师不具备的。所以底层系统必须支持更高并发、更快调度,比如毫秒级弹性、分布式任务协同。

如果基础设施还是按照“人”的节奏设计,就会成为瓶颈。

其次,基础设施本身必须具备自我进化能力。

夏立雪提到, AI 的需求变化非常快,今天和明天可能完全不一样。所以Infra不能是静态系统,而是要能够持续迭代。我们现在也在基础设施里引入 AI 能力,让AI参与运维、调度、优化,甚至像一个“CEO”一样去协调多个Agent之间的协作。

从这个角度看,未来的基础设施不是简单支撑AI,而是和AI深度融合的——“你中有我,我中有你”。

这一判断,也解释了无问芯穹当前的技术路径:通过打通不同芯片架构、整合分散算力资源,并在系统层引入AI能力,实现资源调度与系统优化的持续进化。

“我们希望做到的是,把容器、调度这些能力做到毫秒级弹性,去适应AI的行为方式。”夏立雪认为。


供需错配与 Token 经济学:一场尚未完成的体系构建

尽管需求在快速增长,但当前行业面临的依旧是供需之间的结构性错配。

一方面,高端算力资源供不应求;另一方面,大量“可用但未被充分利用”的资源处于闲置状态。

“大家都在用最优质的资源,但其实有很多资源是可以被用起来的。”

在夏立雪看来,这种现象并不意外。任何新兴产业在早期,都会集中使用最优资源完成突破,但随着规模扩大,必然走向分层与分化。

“一个成熟的产业,不可能只有最顶级的产品和最顶级的资源。”

这也意味着,低端算力、非主流芯片、延迟较高的集群,并非“无效供给”,而是尚未被正确匹配的资源。

无问芯穹的一个重要方向,就是通过调度与系统优化,让这些资源找到适合的应用场景,比如离线任务、低实时性需求等,从而缓解整体供需压力。

与此同时, Token 价格的变化,也成为市场的重要信号。

面对各家云厂商的提价现象,夏立雪的判断是:“提价本质上说明,这件事情在用户侧产生了价值。”

在他看来,当前行业的一个关键问题,并不是“有没有价值”,而是ROI是否跑通。

一方面,AI已经可以替代部分人类劳动,例如助理型工作;另一方面,这些能力往往依赖高成本模型与算力,使得投入与产出未完全匹配。

“模型厂商解决的是这个岗位存不存在,而我们要解决的是,这件事情能不能以更高效率完成,让它的成本和价值匹配。”

从更长周期来看,他认为Token经济体系仍在形成之中。

与移动互联网时代不同,AI的服务对象不仅是人,也包括AI本身,这意味着未来可能出现全新的价值交换方式。

夏立雪也表示,AI行业的健康发展必须打通完整的经济链路:将中国的能源转化为算力,把算力转化为Token,最终落地转化为GDP。

通过软硬件生态的底层打通,我们要打造属于中国的特色Token经济学,这不仅是盘活国内算力,更是要复刻“Made in China”的奇迹,推进“AI-Made in China” 。

当中国庞大的能源与成本优势,通过高效率的Token工厂转化为优质、稳定的服务并输出到全球时,中国也将成为新时代的“世界 Token 工厂”,为AI时代的全球分工贡献不可替代的中国方案。

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说