0
| 本文作者: 成妍菁 | 2026-03-06 14:31 |
“2023 年初我们就已经明确要做可交互的 3D 内容。”
作为 VAST 的创始人,宋亚宸回忆起当时创业的渊源,语气依旧笃定。在他的判断里,3D 生成迟迟没有真正普及,并不是因为技术路线不清晰,而是因为“到现在为止,其实都没有真正意义上的 3D UGC 平台”。(雷峰网雷峰网雷峰网(公众号:雷峰网))
这也是VAST选择从工具和模型入手,而不是等平台成熟后再进入的原因。在他看来,平台形态或许尚未出现,但内容生产方式的变化已经足够明确。
见到宋亚宸时,他正坐在办公室的桌前吃午饭。当天上午,一场访谈活动刚刚结束,他抓紧空档简单吃了几口,下午还有新的会面安排。月底,他还将飞往美国参加 GDC(游戏开发者大会)。
VAST 是一家成立于 2023年的人工智能公司,专注于通用 3D 大模型的研发与落地产品建设,其核心产品Tripo Studio(一站式 AI 3D 工作台),VAST 在 Tripo 系列中的两项核心突破,分别指向不同的 3D 生成方向:H3.1 强调高保真、高还原度的 3D 资产生成,而 P1.0 则聚焦于“可用性”——以接近人工建模的拓扑结构,实现极高速的 3D 资产生成。
对于游戏、XR 和 3D UGC 等实时引擎场景而言,真正决定资产能否被直接使用的,并不只是面数高低,而是拓扑是否干净、布线是否稳定,以及能否无缝进入 Unity、Unreal 等引擎管线继续编辑与部署。
打个比方,可以把 3D 模型理解成一件由很多小三角形拼成的“外壳”。三角形越多,细节就越丰富,但也越“费劲”。像 5000 面左右的低模,相当于一张分辨率不高、但足够清晰的图片,肉眼看来已经足以呈现出栩栩如生的逼真细节:轮廓和结构的完成度尚可,却不会给设备带来算力负担。
正因为如此,这类模型才能被广泛用在游戏、XR 和面向普通用户的 3D UGC 场景中,既能实时交互,又能规模化使用。
在商业落地上,生态合作覆盖阿里巴巴、腾讯、字节、网易、上汽、拓竹、优必选等头部企业与超过9万个开发者,旗下Tripo Studio平台已聚集超过650万创作者,累计生成近1亿个3D模型。
就在昨日,VAST宣布完成5000万美元A轮融资。本轮融资由阿里、恒旭资本(上汽旗下)联合领投,元禾璞华、百度风投、东方嘉富等跟投,老股东春华创投、北京市人工智能产业基金超额加注。
值得注意的是,这是阿里与百度同时在 AI 3D 赛道同框下注,也侧面反映出头部互联网与产业资本对 3D 生成赛道的共识正在形成。
与此同时,VAST 还同步更新了Tripo H3.1和Tripo P1.0大模型。
正如现场演示的一样,Tripo H3.1从输入指令到模型成型,系统在数秒内即可输出结构完整、贴图清晰的 3D效果图。而另一款Tripo P1.0,则进一步压缩了 3D 资产生成所需的时间成本——能够在2秒内输出专业建模师级别的3D模型,生成速度相当快。
VAST的创始人———宋亚宸,1997 年出生的他并非科班出身,而是文科背景,获得美国约翰霍普金斯大学国际关系学和经济学双学士学位,在创办 VAST之前,他曾任职于商汤科技,负责多个人工智能项目从 0 到 1 的战略分析与商业化落地;并联合创立 MiniMax。
在并不充裕的时间里,我们聊了3D大模型、Tripo Studio、世界模型、工业与创作,被问及模型相关时,宋亚宸现场为我演示了最新一版的Tripo Studio 的工作流程,仅需输入一张单图,进度条几乎在眨眼间跑完——仅仅一两秒钟,一个带有精细贴图材质、面数控制在 5000 面左右的可用 3D高精低模,便流畅地渲染在了屏幕中央。
这种需要专业人员耗费数天的“手工活”,直接被压缩至秒级就能完成。宋亚宸提到这些技术时认为,VAST 当前在跑的这套技术路线已经是“断崖式、断层式的领先”,甚至在谈到竞争格局时,他表示:“这两个技术一出,市面上基本没有什么对手”。
那是一种不太需要反复解释的自信,更像是已经在心里验证过多次后的结论。
其实,VAST 还是李飞飞World Labs 的 BP 里唯一提到的中国公司——李飞飞曾定义世界模型是由三大场景构成:3D 生成、XR 空间智能、机器人——前两个才是重点。
而 VAST 从成立之初,就押注了 3D 这一最原始、最自然、信息密度最高的内容模态。宋亚宸认为,世界模型是通用模型的终极形态,必须建立在对三维空间的原生理解之上。
以下是AI科技评论与VAST创业者宋亚宸的聊天实录:
AI科技评论:公司在创立初期的愿景是什么?为什么最终会选择切入 AI 3D 大模型赛道?
宋亚宸: 最早我们是想做一个世界级的交互内容平台,可以理解为“3D版的 TikTok” 。但在推进过程中我们发现,传统交互内容的创作门槛和成本太高了,如果不解决工具问题,就像是在“用毛笔写微博”,因此我们意识到,必须先打造一个大众级别的创作工具,让每个人能零门槛、零成本地实时创作。
当时平台形态还不存在,但我们觉得这件事一定会发生,所以选择先从底层工具和能力开始做。
因为创造一个世界需要两个能力:“造万物”(生成模型和场景)和“定规则”(编写代码和交互逻辑)两者结合,即构成创造世界的基础设施。基于此判断,我们确立了AI 3D大模型的定位:在AI coding已被广泛布局的背景下,专注于UGC交互内容平台,降低3D内容的生产门槛。
AI科技评论:在你们的产品出现之前,传统的 3D 内容生产面临哪些痛点?你们是如何改变工作流的?
宋亚宸: 传统的 3D 制作管线非常繁琐,需要基于十几种不同的引擎、建模软件,搭配几百种中间件和几千种插件,完全依靠手工搭建工作流 。 我们2025 年推出了全新的全链路 AI 工作流产品(Studio),它通过一系列自研算法,将几何、贴图、材质、绑定等环节整合在了一起,用 AI 工具替代了传统复杂的制作管线,极大地提升了生产力 。
AI科技评论:目前平台的用户体量如何?这些 3D 生成技术主要落地在哪些具体的行业场景中?
宋亚宸:目前我们的服务了超过9万家客户,工具平台拥有 650多万的专业开发者 ,我们的受众主要是海外用户,落地场景主要涵盖四大类:
重工业: 比如帮助车企(如上汽)快速生成海量 3D 车型,替代传统周期长、成本高的油泥模型评审,尤其是周期缩短才是核心变化。传统车型开发动辄一年,如今借助AI可压缩至数月;线下评审、层层审批的冗长流程,也被线上协作替代,效率提升的同时,设计方案的可选空间也更大。
轻工业与 UGC 制造: 涵盖首饰、玩具(如泡泡玛特)、鞋服包包的工业设计,以及彻底打通 3D 打印社区的建模门槛 。
虚拟内容: 包括游戏(网易等大厂及 UGC 游戏)、XR 元宇宙、动画和影视制作 。
交互展示展陈: 例如电商商品的三维展示、文博、教育课件等 。
AI科技评论:Tripo Studio 想解决的核心问题是什么?
宋亚宸:关于 Studio 的产品非常好理解,它本质上是打造了一个完整的 AI 工作流。在这个工作流中,用户可以顺畅地完成几何处理、贴图与材质赋予、PBR(基于物理的渲染)、拆分与补全、编辑与组合、笔刷风格化等一系列复杂操作。
核心还是生产效率和门槛。现在社会里几乎所有工业品,本质上都来自 3D 模型,但建模的成本、周期和专业门槛都非常高。
Tripo Studio 的目标,是让专业用户在工业设计、创意生成、产品外观等环节中,把原本需要几个月甚至一年的流程,压缩到几周甚至更短。
为了支撑这套全链路的工作流,我们在各个环节都自研了一系列全新的 AI 算法并重新定义了这一产品形态。产品推出后的市场反馈非常积极,无论是在收入还是用户规模上,都实现了爆发式的增长。
基于以上技术,我们目前主要提供两条产品线:第一条线是面向 PGC(专业内容生产)等用户的 Studio 工具平台;第二条线是面向企业客户的 API 服务。企业可以通过调用我们的 API,去赋能他们自身的 To B 或 To C 业务。截至目前,我们的 API 已经累计服务了超过 9 万家客户。
AI科技评论:公司近期在测试高模(高精度模型)和Smart Mesh(Tripo P1.0),两者在技术表现和应用落地上有什么差异?
宋亚宸: 这两款模型分别对应了不同的工业级需求:
高模(高精度模型): 它的面数高达数百万面,细节极其精细,连内部结构和螺纹都能精准呈现 。它非常适合工业设计、3D 打印和影视等对模型精度要求极高,但对实时渲染压力不敏感的场景 。
Smart Mesh(Tripo P1.0): Tripo P1.0 可以在2秒内直接生成专业建模师水平的3D模型——拓扑干净、布线稳定、引擎可用,并且我们发现在这一全新思路之下,模型的可编辑性和精度的可拓展性获得极高的优化潜力。
AI科技评论:为什么 3D内容一直没有像文字、图片、视频那样普及?
宋亚宸:在过去两年里,3D打印在硬件机型和新材料上并没有出现本质的技术突破,FDM 依然无法实现全彩,行业的传统痛点依然存在 。然而,3D 打印机的出货量却迎来了暴涨 。其核心原因在于,行业的目标用户群体从千万级别跨越到了十亿级别。
3D 打印普及的真正难点,其实不在于机器的操作按钮有多复杂,而在于普通用户缺乏 3D 建模能力,导致买完机器后“不知道能打什么” 。过去,普通用户哪怕只是想打印一个简单的手机壳,都需要去学习 Blender、3DMAX 或 Maya 等专业软件,这对大众而言显然是不现实的门槛 。而现在,3D 生成技术的出现真正解决了这个问题。
AI科技评论:数据显示目前海外用户占比很高,当时为什么会制定出海的商业化策略?
宋亚宸: 目前海外用户占比大约在 85% 。其实起初我们对全球市场是一视同仁的,但在实际跑数据的过程中发现,欧美等海外市场的付费率更高、用户的忠诚度和续费率更好,整体的 LTV(客户终身价值)也更高 。所以是真实的数据反馈决定了我们以海外市场为主的策略 。
AI科技评论:公司目前的团队规模如何?在内部团队管理上秉持什么样的理念?
宋亚宸: 我们团队目前有 100 多人,绝大部分是研发人员 。 我们的管理理念是非常实事求是的 。我们没有强制的打卡、复杂的职级或是 Title,前三年甚至都没有设置 OKR 。我们把市面上所有的管理机制当做一个“工具箱”,只有当公司发展到特定阶段、遇到了真实问题时(比如团队变大需要对齐目标时),我们才会从工具箱里拿出相应的管理工具来解决问题,而不是盲目照搬大厂机制。
AI科技评论:您个人并非传统理工科方向,这种跨界背景对您执掌一家硬核 AI 科技公司有什么独特影响吗?
宋亚宸: 创业的核心在于你想做成一件什么样的事,把这件事情的终局描述清楚是最重要的,而技术(无论是 AI 还是世界模型)只是达到这个终局的路径,并不是说做科技公司就必须是特定学科的教授或博士出身 。
AI科技评论:公司目前在做3D大模型和世界模型,这两者之间是什么关系?
宋亚宸: 其实它们本质上是一个东西。世界模型的底座就是基于 AI 3D大模型的算法建立的 。你可以这样理解,世界模型是 AI 加上图形学 。如果说原来的 3D 大模型是80% 的图形学加 20% 的 AI,那么世界模型可能就是 AI 和图形学各占一半的比例。
AI科技评论:世界模型的应用场景和目标用户群体是怎样的?
宋亚宸: 世界模型是给所有人、所有客户使用的,具体的应用场景非常广泛,你可以用它来做具身智能的仿真模型,也可以用来做数字孪生,或者应用于文娱等各种各样的场景,任何需要“在一个世界里运行和互动”的场景,都可能用到世界模型。
AI科技评论:近期公司完成了新一轮融资,您如何看待融资与公司战略“正确性”之间的关系?投资人为何在这个阶段选择下注?
宋亚宸: 融不融资与事情本身是否完全正确并没有必然联系,它更多代表的是市场和投资人对这件事情形成了一定的阶段性共识 。创业本身就是一个不断探索的过程,在最后一刻真正把事情做成之前,很难定论什么是绝对正确的 。
投资人之所以在这个阶段选择投资,主要基于三方面原因:首先,我们在世界模型等前沿方向上布局较早且走在比较前沿的位置 ;其次,AI 3D 大模型技术的成熟已经切实带来了不错的商业化收入 ;最后,市场对于可交互的 UGC 内容平台也产生了新的认知与共识 。(作者持续跟踪 AI 应用与模型更新,欢迎加微信Who123start交流)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。