解构商汤暴涨:让AI帮助程序员提效,而不是取代他们

admin 2024-04-26 21:41 阅读数 34 #知识百科
文章标签 商汤模型场景


4月23日,商汤发布日日新SenseNova5.0,性能一举超越GPT4,全面对标GPT4 Turbo。

次日,商汤港股仅一上午暴涨31.15%直接暂停交易,截至发稿连涨三天。

在一众对股价的分析讨论中,绝大多数观点认为商汤暴涨的主因是其大模型能力的飞跃,诚然国产大模型超越GPT4确实令人振奋,但或许,更重要的原因,是商汤在AI时代的定位——

提供全套AI落地,实现降本增效的解决方案。


相比于各类AI公司创造一个全新场景,或许对于人工智能尚未普及的当下,利用大模型改造现存场景以提升生产力,才是产品视角下更现实的思路。

一台AI,等于一个初级程序员的年薪

大摩此前一份研报显示,中国生成式AI应用的日活正在飞速增长,但平均每日的使用时间大多只有短短的6-8分钟。

这正说明对于普通人而言,本该成为先进生产力的AI工具,仍旧处于“尝鲜”阶段。


这不仅仅是AI所遇到的问题,绝大多数生产力工具在普通人手中都难逃“买前生产力买后爱奇艺的命运”, 平板电脑的没落,Vision Pro遇冷都是如此 。

目前大多数引爆社交平台的AI应用,也都是娱乐为主,比如之前的“决战拜年之巅”“舔狗模拟器”。

这些利用AI创造出的全新场景几乎没有发挥其作为先进生产力的能力,更好的思路或许还是应该利用AI提升现有场景的效率。

譬如办公应用。

对于绝大多数企业而言,使用Saas,甚至是外包等服务的出发点都出奇的类似:它能为我省多少钱?

这笔账很好算, 人力外包财务外包等公司大行其道,请一个外包和招三五个专员之间的人力费用差能够清楚落在每年的财务报表中,但购买人力软件或是财务软件到底能省多少钱则是见仁见智的问题 。

企业大多将其归类在IT费用中,而这笔费用通常只占公司运营成本的2%~5%,再怎么折腾也是螺蛳壳里做道场。

因此对于Saas软件而言,如何将自己的定位从“IT成本”转换到“人力成本”,是当下最迫切的难题。而提供先进生产力的AI,与之高度契合,起到一个“10个人用AI工具,能够带来12个人的产出”的效果。

商汤给出的解决方案,是一台一体机。

简单而言,商汤一体机系列产品就是一台部署在本地,预置搭载各类适用于不同场景的大模型,一方面是为了提供办公场景使用AI提效的方案,另一方面则是出于数据需要私有化部署的安全问题做出的考量。


一个典型案例就是商汤日前推出的“小浣熊家族”。

以代码小浣熊为例,它依托日日新基础模型,专注于智能编程助手功能,支持Python、Java、JavaScript、C++、Go、SQL等30+主流编程语言和VS Code、IntelliJ IDEA等主流IDE,实际应用中,可帮助开发者提升编程效率超50%。

并以此为基础,同步推出代码小浣熊推理一体机轻量版,与代码小浣熊相同的编程助手功能,但部署于本地,主打高性价比、开箱即用、数据安全以及能够完成国产化芯片的适配。


有意思的是,这台代码小浣熊一体机售价35万元,差不多正好是一个初级程序员的年薪。

在医疗、政务、金融等行业,商汤同样推出了相应的一体机产品,这些产品其实解决的都是同一个问题,即利用AI的信息数据处理能力,实现更高效的决策。

它们最终都依托于商汤的基础模型能力之上。

大算力+大模型双轮驱动

商汤的模型能力,首先依托于其“大装置”,也就是算力。

在今年3月的一次访谈中,山姆阿尔特曼明确指出算力将会成为未来的货币,并且成为全球最宝贵的资源。

假如算力价格异常高昂,那么从商业角度考虑可能只会被用来解决癌症治疗或者发射火箭之类的重大事件,反之如果算力价格低廉,那么大家才会用它来解决日常问题。

从这个角度来看,AI的落地和普及首先需要的是低成本的算力。

目前,商汤大装置总算力规模在超过4.5万块GPU的加持下,达到12000 petaFlOPS。

量化来看,这个算力可以支撑超过20个千亿级参数大模型同时训练,并支持万亿参数大模型的全生命周期生成。

庞大的算力只是基础,用户真正需要的是低价的算力,多卡集群的效率就是算力成本的关键,两张GPU互联往往会产生1+1<2的结果,这种损耗往往导致了算力成本的激增。

而商汤实现了万卡的超大集群互联,并保持90%的加速效率。

在训练稳定性上,商汤实现了超30天稳定训练不间断的能力,而出现训练间断时的诊断恢复时长也优化到了半小时。

在大模型推理服务上,商汤也实现了领先业界的推理极致优化,过去一年内推理服务的性价比提升了3倍,为客户提供了业界性价比最优的大规模弹性推理服务。


在提供算力这项基础设施之外,商汤为解决重复造轮子的问题,推出了云端、端侧、边缘侧全栈基础大模型矩阵。

用户可以按照自己的需求选择最适合自身场景的大模型进行微调,做到即取即用、开箱即用。

云端大模型即商汤日日新5.0,在一众评测基准中对标GPT-4 Turbo,并以此为基础开发出一系列模型,例如对话模型SenseChat、多模态大模型SenseVision、拟人大模型SenseChat-Character、以及营销、医疗、文生图等一系列模型。

数量众多的模型看似散乱,但其实商汤只是在当下最常见的一些AI应用场景中“打样”,其目的则是说明在日日新基础模型之上,可以轻松微调出一系列适合企业自身场景所需的形态。

与之类似,端侧模型SenseChat-Lite面向手机平板智能汽车等轻量场景,边缘侧产品“一体机”则是部署在本地,提供给数据需要保存在本地,有隐私需求的企业使用。

通过大装置+大模型的双轮驱动,给予不同企业最匹配自身情况的解决方案,最终实现“模型即服务”的商业模式。

每个行业都可以有一套“商汤模式”

商汤在商业化落地上的尝试早已开始。

近日商汤发布的2023年年报显示,其生成式AI业务收入短短一年从零达到12亿元,这块收入主要来自于一些2B的场景,为企业提供AI解决方案。

例如小米的小爱同学,是一个典型的B2B2C的场景。

此前与小爱同学的对话基本停留在操控智能家居,和简单的知识检索型的问答,能力非常有限,还经常出错,比如那个经典段子:“我有21万,小爱让我买本田思域”。

在这个过程中想让小爱变得更加智能有三个难点:响应速度、信息收集、输出内容处理。

商汤与小米小爱的合作正是基于这三个问题。

首先在接入商汤大模型后,小爱在用户说完话之后能够在两秒内完成响应。其次在商汤大模型的信息检索能力辅助下,小爱生成的回答都会由明确的引用来源。最后在保证了时效性的同时,商汤大模型可供微调的能力保证了小爱不会攻击友商。


另一个典型案例是商汤医疗领域大模型“大医”。

面向医生端,其拓展了临床辅助决策、医学文献解读、医学统计助手等一系列全新使用场景。

不仅支持智能分析解读论文PDF文件,还可帮助医生在“0代码”条件下完成复杂医学数据统计并获取可视化医学统计图表,成为医生诊疗、科研工作的得力助手。

面向患者端,商汤科技推出健康管理小程序,在移动端实现用药咨询、体检报告解读、检查检验结果分析、健康档案管理等多样化功能,为用户打造“专属AI健康管家”,实现全周期个人健康管理。


类似的场景涉及各个行业,比如在办公场景中,商汤与金山办公达成合作,内置在WPS 365各个场景中,譬如代码生成工具和文档表格管理。

又比如在金融领域,商汤与海通证券合作,在智能客服、合规风控、代码辅助、展业办公助手等领域助推业务落地,并共研智能投顾、舆情监控等行业前沿场景。

去年9月,红杉资本曾发表过一篇文章,认为AI浪潮正转向“第二幕”,即利用新技术端到端地解决现实社会中的问题。

但当时的红杉认为,进展效果并不理想,大模型仍需要证明价值。

而商汤如今所做的,正是在各个行业深入合作,将大模型与产业、应用场景结合,探索出一套解决现实问题的方案。


编辑:李墨天

视觉设计:疏睿

责任编辑:李墨天

封面图片来自ShotDeck


版权声明

本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。

热门