商汤新模型 SenseNova-U1 Pro 曝光，对标 GPT-Image-2，瞄准「设计」赛道

本文作者：小七

2026-06-25 17:40

导语：商汤新一代旗舰多模态模型即将发布，8K 原生能力突围 AI 设计赛道。

在日前举办的股东大会上，商汤科技首次对外预告了其下一代旗舰多模态基座模型——商汤日日新 SenseNova-U1 Pro。它定位为业界首个以“理解·生成·行动”原生统一为内核的多模态智能体基座，预计将于2026年7月正式启动邀请测试。值得注意的是，此次商汤明确将全球顶尖模型 GPT-Image-2 作为对标对象，并把“交付级”设计作为模型应用的重要赛道。现场共展示五组预览图，覆盖从传统文化图鉴到专业影视创作的多类高难度场景。

此次股东大会使用的全套 20 余页演示 PPT，也是由 SenseNova-U1 Pro 一次性生成，在这个过程中模型自主进行了规划、思考、制作、评估的全过程，「保证信息传达的逻辑、每个数字的准确，每个页面的美观，所有东西都浑然一体，是一个非常复杂的工程」。商汤方面还表示，这是其首次在正式对外公告中全程采用日日新大模型完成制作。

在技术层面，SenseNova-U1 Pro 主打的核心能力包括：在同一内核内打通多模态理解与生成。同时基于内在的图文交错思维能力，它面对复杂需求，像一个“会思考的设计师”一样，实现设计、生成、评审的长程循环。以生成城市规划图为例，模型会先对整个城市布局进行智能评估，尝试部署不同的规划与生成策略，在内部评估生成效果并不断自主调整，最终输出可以直接交付的“成品级”结果。

商汤新模型 SenseNova-U1 Pro 曝光，对标 GPT-Image-2，瞄准「设计」赛道

SenseNova-U1 Pro将规划构生成为设计工程草图

此外，SenseNova-U1 Pro 还率先支持了原生 8K 分辨率输出。据介绍，GPT-Image-2 等当前全球最强的生成模型，原生直出分辨率上限仅为 4K。

知识信息图（竖版），

PK 对标 GPT-Image-2

同一国画风「二十四节气」提示词下，SenseNova-U1 Pro 完整呈现全部 24 个节气、逐一标注日期与序号、四季分区清晰；GPT-Image-2 生成内容相对缺失。

商汤新模型 SenseNova-U1 Pro 曝光，对标 GPT-Image-2，瞄准「设计」赛道

GPT-Image-2生成

商汤新模型 SenseNova-U1 Pro 曝光，对标 GPT-Image-2，瞄准「设计」赛道

SenseNova-U1 Pro生成

国画长卷（横版）

同一主题切换为横版长卷形式，SenseNova U1-Pro 一句提示词直出，24 个节气完整有序，每格配以独立国画插图与气候描述，顺时而生、四季有序。

SenseNova-U1 Pro生成（点击查看大图）

杂志跨页

SenseNova-U1 Pro 以一句提示词生成 GQ 风格「007 · 阿斯顿·马丁 DB5 座驾档案」横版跨页，涵盖车辆详细规格参数表、多角度实拍图集、车主历史时间轴、电影片场注记等，版式还原度达到商业出版可用水准。如此包含了复杂多栏混排与长文本段落控制的出版与品牌设计场景，也是目前图像生成模型最难实现的能力维度之一。

SenseNova-U1 Pro生成（点击查看大图）

学术海报，PK 对标 GPT-Image-2

SenseNova-U1 Pro 一键输出 SenseNova U1 的论文海报，信息密度极高，包含架构图、基准表格与可识别二维码；GPT-Image-2 版本留白偏多、密度偏低。

商汤新模型 SenseNova-U1 Pro 曝光，对标 GPT-Image-2，瞄准「设计」赛道

GPT-Image-2生成

商汤新模型 SenseNova-U1 Pro 曝光，对标 GPT-Image-2，瞄准「设计」赛道

SenseNova-U1 Pro生成

电影分镜，PK 对标 GPT-Image-2

基于同一段深夜暗巷追逐戏的提示词，SenseNova-U1 Pro 可以输出 16000×24000+ 像素、含 40-60 格的导演级分镜稿，每格附景别、机位与情绪标注；GPT-Image-2 仅输出 1024×1536，放大后存在细节失真，分镜形式简单，情绪表现力也偏弱。分辨率上百倍的差距，对专业创作场景有着极大影响。