本文开端:时期周报 作家:唐洛
往日一年,国产化已成为东说念主工智能领域的“必答题”。联系词,简直的挑战并不在于谁喊得早,而在于能否惩处一个更具施行意念念的问题:在模子鸿沟捏续彭胀、应用潜入简直业务场景的布景下,国产算力怎样才智完毕耐久、表露的运行保险。
在刻下公共算力供应链不细则性加重的布景下,这一挑战已远超工夫道路之争,径直波及东说念主工智能产业能否捏续慎重扩张的压根所在。
商汤科技给出的谜底,显得尤为克制和求实。在往日一年中,华为昇腾、寒武纪、沐曦等多家国产芯片,被同期纳入商汤的AI体系。这并非简便的“点亮”兼容,而是深度集成至吞并套AI基础设施、吞并套模子架构,以及吞并条应用托付链路之中。这背后,明晰地展现了商汤围绕“大安装—大模子—应用”所构建的三位一体战术。
在这一战术下,国产化不再是被迫大意外部环境的权宜之策,而是被拆解为一项耐久任务:算力层面,要构建多元、表露的国产算力供给;模子层面,要让多模态大模子简直跑在不同国产芯片之上;应用层面,则必须把算力才智悠扬为客户可用、可托付的家具。
当华为昇腾、寒武纪、沐曦被同期接入,商汤简直温煦的,大要并不是某一款芯片的上限,而是怎样让国产算力在简直业务中跑得久、跑得稳。
助力国产算力从“可用”到“好用”
在大模子进修与推理场景中,算力瓶颈早已不单取决于单卡性能。异构芯片之间的调养复杂度、跨域进修的表露性,正在成为影响合座算力效力的重要变量。
基于这一判断,商汤突破口放在基础设施层。行动商汤的 AI 云原生平台,商汤大安装试图惩处的,恰是异构算力鸿沟化使用中的系统性问题。通过提供息争调养、弹性扩展和高可靠性的 AI 基础设施劳动,商汤大安装但愿以更高的性价比,激动大模子才智在简直业务中的落地。
当今,寒武纪、壁仞、沐曦、华为昇腾、摩尔线程等多家国产芯片,已完成与商汤大安装的深度适配,并撑捏商汤“日日新”多模态大模子体系的进修与推理。这意味着,国产 GPU 初次在千亿参数级任务中,给与系统级、工业级的捏续运行进修。
但简直的难点,并不在“接入”本人。不同芯片在架构设想、软件栈上的相反,使息争进修与调养的复杂度显赫飞腾。
为此,上海AI实验室最初探索并研发了DeepLink超大鸿沟跨域混训工夫决策,通过进修加快、异构通讯、并行策略等中枢工夫,突破芯片架构相反带来的协同壁垒,重构筹画资源调养体系。
而商汤大安装发布基于DeepLink的异构羼杂调养决策,将DeepLink深度融入商汤大安装中枢才智体系。通过这一决策,多种国产芯片之间可完毕协同通讯与息争调养,并自动进行并行策略优化和负载平衡,简直作念到“不同芯片,吞并平台”的协同责任,开释异构集群的筹画后劲。
在集群层面,商汤大安装与华为昇腾384超节点最初完周全面适配。超节点(SuperPod)是一种通过高速互联工夫,将多个GPU/NPU整合为息争筹画单位的新式架构,惩处AI大模子进修中的算力协同与通讯效力问题。围绕昇腾384超节点,商汤在调养优化、跨 POD 进修表露性和多层级故障规复方面进行了针对性设想,使多佃农、大鸿沟、弹性AI云劳动成为可能。
在推理要领,商汤还与记念张量配合,在国产 GPGPU 上跑通了业内首个以“记念—筹画—调养”一体化为中枢的 PD 离别商用推理集群。在简直 C 端负载下,该决策完毕单卡并发效力晋升20%、费解晋升75%,详尽推感性价比达到英伟达A100的150%,为高性能模子的大鸿沟落地翻开了新的降本增效空间。
此外,商汤搭伙华为、库帕念念、海光、寒武纪、曦望 Sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产厂商,共同发布“商汤大安装算力 Mall”。这一平台试图构建一个“算力超等市集”,闪开采者和企业像选购商品同样,目田组划算力资源、平台用具和行业模子劳动。
在商汤科技看来,“商汤大安装算力 Mall”的价值不仅在于缩短 AI 应用门槛,更在于为用户提供活泼、自主的国产算力选拔旅途,从系统层面放松对单一国外工夫体系的依赖,激动中国 AI 产业向愈加自主、可控的场地演进。
低老本的视频生成国产化生态
在多模态应用中,视频生成对算力的要求险些是一个顶点场景。比较文本和图像,视频不仅引入了“时候”这一维度,使数据鸿沟呈几何级增长,还对纠合性、物理一致性提倡更高要求,模子必须在极短时候内完成渊博推理筹画。这也使得视频生成成为刻下总共 AI 模态中,算力虚耗最高的领域。
本年,商汤开源了支捏及时视频生成的推理框架 LightX2V,试图惩处的恰是这一问题。LightX2V 的设想方针荒谬明确:把视频生成从“实验室后果”拉进可鸿沟化部署的工程体系。
在具体完毕上,LightX2V 通过步数蒸馏、低比特量化、稀少贬抑力、特征缓存和张量卸载等一系列工程化技巧,将显存需求压缩至 8GB 以下,使初学级消费级显卡也具备运行条目;在速率上,框架支捏最高 1:1的及时生成才智,即 5 秒视频可在 5 秒内完成生成。
在国产化适配上,LightX2V 设想了强兼容的国产化适配插件情势,可快速完成各种国产硬件的适配,当今已支捏寒武纪、沐曦、海光、昇腾等多款芯片。与此同期,为更充分开释国产算力特色,商汤在模子侧同行为整,Seko 系列模子在设想阶段就引入低比特量化、压缩通讯和稀少贬抑力等硬件友好机制,使合座推感性能晋升稀疏 3 倍。
据悉,适配完成后,商汤与寒武纪还将在算力应用率与老本效力、大鸿沟并行处理才智等多个场地进一步张开深度优化,进一步缩短多模态AI的使用门槛并晋升合座体验。
由于在加快视频创作上上风彰着,可完毕极致性价比,为止当今,LightX2V 的累计下载量已稀疏 350 万次。这一数字不仅仅开源相貌的热度策划,更反馈出一个趋势:在视频生成这一场景中,国产算力运转领有低老本的国产化生态。
国产化参预家具与托付阶段
相较于基础设施和模子层面的工夫考据,家具与相貌托付更能进修国产化的“含金量”。是否被捏续使用、是否参预业务中枢进程,频频比单次跑通工夫策划更具劝服力。国产化能否开采,最终要看它能否在简直场景中替代、并耐久运转。
在应用层,商汤将这一判断最初落在生成式内容分娩上。12 月15日,商汤科技基于其在生成式 AI 与多模态交互领域的蚁合,发布 Seko 2.0——行业首个面向多剧集生成的智能体。在长视频生成场景中,扮装一致性、画面立场表露性耐久是制约鸿沟化分娩的中枢贫窭,而Seko 2.0在多剧集视频生成的一致性方面展现出显赫上风,其背后依托的是商汤自研的日日新Seko系列模子,包括SekoIDX、SekoTalk等图像与视频生成多模态模子所构建的工夫底座。
更首要的是,这套才智已完成在国产算力上的适配。商汤日日新 Seko 系列模子已支捏寒武纪等国产 AI 芯片,在 AIGC 中枢场景中完毕了从谈话模子到多模态生成的重要高出。这不仅是工夫协同的深化,更是国产AI生态的首要完善,为视觉内容的编削开采提供了更坚实、自主的底层撑捏。
在终局侧,商汤旗下 AI 智能助手“小浣熊”已完成多种国产芯片的适配,并针对个东说念主 PC 使用场景进行专项优化。在端侧运行条目下,其模子精度与云霄保捏一致。同期,小浣熊也已适配多种国产芯片一体机决策,酿成软硬件协同的宇宙产化部署旅途,为对数据安全和自主可控要求较高的用户提供施行选拔。
此外,在筹画机视觉、金融、医疗以及“大安装”等独到化业务中,商汤也已完成国产芯片的适配与托付。在外部环境不细则性加大的布景下,企业选拔国产算力并非单一动因,合规要求、供应链表露性以及耐久老本结构共同组成决策逻辑。而能否在家具与托付阶段胜仗落地,恰是国产算力高出这一门槛的重要。
从大安装、大模子到应用层,商汤与多家国产 AI 芯片企业张开深度配合云开体育,在骨子相貌中磨合才智范畴,酿成“工夫互补、资源分享、场景互哺”的协同情势。这种以托付为牵引的配合旅途,不仅激动了国产算力的可用性晋升,也在一定进度上缓解了市集对供应链不细则性的担忧。