您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
芯片 正文
发私信给姚单
发送

0

独家丨直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资

本文作者: 姚单   2026-03-09 18:06
导语:不做 GPU,只做速度。 

雷峰网(公众号:雷峰网)独家获悉,国内一家专注超快流式推理芯片的创业公司——「寒序科技」宣布完成数千万元融资,投资方为启高资本、赛意产业基金,源合资本担任本轮独家财务顾问。

此前,寒序科技一直较为低调,其AI推理系列(SpinPU-E Series)产品的相关进展在过去两年间并未对外系统披露。

知情人士透露,寒序科技首颗芯片样片回片测试结果“非常理想”,关键指标中,其「单位面积带宽」与Groq LPU(Language Process Unit,语言处理单元)披露一致,达到惊人的100 GB/s/mm^(2),这是衡量AI芯片推理性能的最重要指标,也是直指2000Tokens/s的底气。

在业内看来,这类能力决定了大模型(LLMs)推理时能否真正把“流式输出”、“高Tokens/s”做出来。关键的是,这家公司下一代芯片已经在流片中,以“片上MRAM+SRAM”和“确定性流式乘加单元”,目标性能指向夸张的2000Tokens/s+,反观目前主流对话模型推理速度仅约30-50Tokens/s。

在当前推理芯片竞争中,这几乎是最具辨识度的硬指标之一。也因此,接近项目的人士将其评价为:国内少有的、真正沿着Groq方向往下打的团队。

值得注意的是,业内近期普遍传闻,NVIDIA已以约200亿美元估值级别锁定Groq的推理技术合作,并计划在NVIDIA GTC 2026即将发布的新一代AI推理系统中采用Groq芯片设计。寒序方案被业界认为是最贴近该方案的超大带宽流式处理芯片。

与GPU路线不同,这家公司选择的是更聚焦、更极致的产品定义:不卷大而全,不卷通用训练,而把资源压到推理速度上,核心理念四个字——唯「快」不破。

寒序科技成立于2023年8月,源于国内磁学研究重要高地「北京大学磁学中心」。核心团队是国内首个有能力跑通从物理、材料、器件到异质集成、芯片设计、算法的交叉团队。

有接近本轮融资的人士告诉雷峰网,这家公司之所以近期开始对外释放信息,一个重要背景是:其关键技术与样片验证已经走过最危险阶段。目前,该公司新一轮融资也已在推进中。

更多创业项目,添加微信 ydinitialheart 了解。

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

主笔

长期关注创新3C和AI硬件,欢迎大家找我交流~微信:ydinitialheart。加好友请备注公司、姓名及来意
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说