全球「AI学术顶会」精华汇聚地
您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给小七
发送

0

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

本文作者: 小七   2026-06-25 17:40
导语:商汤新一代旗舰多模态模型即将发布,8K 原生能力突围 AI 设计赛道。
日前举办的股东大会上,商汤科技首次对外预告了其下一代旗舰多模态基座模型——商汤日日新 SenseNova-U1 Pro它定位为业界首个以理解·生成·行动原生统一为内核的多模态智能体基座,预计将于20267月正式启动邀请测试。值得注意的是,此次商汤明确全球顶尖模型 GPT-Image-2 作为对标对象,并把交付级设计作为模型应用的重要赛道现场共展示五组预览图,覆盖从传统文化图鉴到专业影视创作的多类高难度场景。

此次股东大会使用的全套 20 余页演示 PPT,也是由 SenseNova-U1 Pro 一次性生成,在这个过程中模型自主进行了规划、思考、制作、评估的全过程,「保证信息传达的逻辑、每个数字的准确,每个页面的美观,所有东西都浑然一体,是一个非常复杂的工程」。商汤方面还表示,这是其首次在正式对外公告中全程采用日日新大模型完成制作。

在技术层面,SenseNova-U1 Pro 主打的核心能力包括:在同一内核内打通多模态理解与生成。同时基于内在的图文交错思维能力,它面对复杂需求,像一个会思考的设计师一样,实现设计、生成、评审的长程循环以生成城市规划图为例,模型会先对整个城市布局进行智能评估,尝试部署不同的规划与生成策略,在内部评估生成效果并不断自主调整,最终输出可以直接交付的成品级结果。

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

SenseNova-U1 Pro将规划构生成为设计工程草图

此外,SenseNova-U1 Pro 还率先支持了原生 8K 分辨率输出据介绍,GPT-Image-2 等当前全球最强的生成模型,原生直出分辨率上限仅为 4K

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

01

知识信息图(竖版),

PK 对标 GPT-Image-2

同一国画风「二十四节气」提示词下,SenseNova-U1 Pro 完整呈现全部 24 个节气、逐一标注日期与序号、四季分区清晰;GPT-Image-2 生成内容相对缺失。

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

GPT-Image-2生成

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

SenseNova-U1 Pro生成

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

02

国画长卷(横版) 

同一主题切换为横版长卷形式,SenseNova U1-Pro 一句提示词直出,24 个节气完整有序,每格配以独立国画插图与气候描述,顺时而生、四季有序。

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

SenseNova-U1 Pro生成 (点击查看大图

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

03

杂志跨页

SenseNova-U1 Pro 以一句提示词生成 GQ 风格「007 · 阿斯顿·马丁 DB5 座驾档案」横版跨页,涵盖车辆详细规格参数表、多角度实拍图集、车主历史时间轴、电影片场注记等,版式还原度达到商业出版可用水准。如此包含了复杂多栏混排与长文本段落控制的出版与品牌设计场景,也是目前图像生成模型最难实现的能力维度之一。

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

SenseNova-U1 Pro生成 点击查看大图

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

04

学术海报,PK 对标 GPT-Image-2

SenseNova-U1 Pro 一键输出 SenseNova U1 的论文海报,信息密度极高,包含架构图、基准表格与可识别二维码;GPT-Image-2 版本留白偏多、密度偏低。

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

GPT-Image-2生成

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

SenseNova-U1 Pro生成

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

05

电影分镜,PK 对标 GPT-Image-2

基于同一段深夜暗巷追逐戏的提示词,SenseNova-U1 Pro 可以输出 16000×24000+ 像素、含 40-60 格的导演级分镜稿,每格附景别、机位与情绪标注;GPT-Image-2 仅输出 1024×1536,放大后存在细节失真,分镜形式简单,情绪表现力也偏弱。分辨率上百倍的差距,对专业创作场景有着极大影响。

针对这一场景林达华表示:思考、理解和创作在一个大脑里面统一,就像编剧和导演融为一体。”  SenseNova-U1 Pro 的这一突出能力,也将为商汤短片智能体 Seko 进行复杂的剧集创作提供强大支持。

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

GPT-Image-2生成

商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

SenseNova-U1 Pro生成

行业普遍预测,OpenAI 即将在近期发布国际前沿模型,并同样将设计锚定为重点发力方向。商汤在此预告 SenseNova-U1 Pro 全新旗舰模型,不但是与顶尖 AI 巨头的正面对垒,也向外界释放了一个信号,表明在编程以外,设计正在成为顶级多模态模型的下一个主要赛场。

当模型能力突破工业红线,其产业空间极为广阔,将给产品开发、平面设计、工业设计、视频制作、城市和园区规划等行业带来变革性升级。

对于商汤而言,SenseNova-U1 Pro 所承载的远不止于此,它还将成为数字智能与物理智能融合的技术基座,驱动 AI 走向更广阔的物理空间

分享:
相关文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说