商汤股价涨超30%,大模型性能全面对标GPT-4 Turbo

admin 2024-04-24 10:32 阅读数 87 #知识百科
文章标签 商汤模型

4月24日,商汤-W(0020.HK)股价涨超30%。4月23日,商汤科技发布日日新5.0大模型,采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到 200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。

商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”

商汤端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

商汤股价涨超30%,大模型性能全面对标GPT-4 Turbo
(图片来源网络,侵删)

徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。(澎湃新闻记者 秦盛)

商汤股价涨超30%,大模型性能全面对标GPT-4 Turbo
(图片来源网络,侵删)
版权声明

本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。

热门