讯飞星火之后蚂蚁用国产芯片练习出2900亿参数大模型
来源:乐鱼体育官方首页 发布时间:2025-04-24 08:29:023月24日,彭博社征引知情人士音讯称,蚂蚁集团已成功运用阿里巴巴、华为等国产芯片,结合混合专家(MoE)架构练习出参数规划达2900亿的大模型“Ling-Plus”,其功能与英伟达H800芯片练习的同类模型适当,且练习本钱下降20%。这一打破是继科大讯飞“星火大模型”之后,我国国产算力生态行将迎来的第二个标志性大模型。
据蚂蚁集团Ling团队发布的论文,其自研的Ling系列模型通运用国产芯片(如壁仞科技、天数智芯、寒武纪等)的低功能设备,练习1万亿Token的本钱从635万元降至508万元,降幅达20%,但模型功能仍可对标阿里通义Qwen2.5-72B和DeepSeek-V2.5。
针对外媒(彭博社)关于蚂蚁百灵大模型练习本钱的报导,蚂蚁方面回应观察者网称:蚂蚁针对不一样芯片继续调优,以下降AI运用本钱,现在取得了必定的发展,也会逐渐经过开源共享。
除了自研功能抢先的大模型以外,该技能论文最大的打破在于提出了一系列立异办法,以提高资源受限环境下AI开发的功率与可及性。试验标明,其3000亿参数的MoE大模型可在运用国产GPU的低功能设备上完结高效练习,功能与彻底运用英伟达芯片、同规划的稠密模型及MoE模型适当。作为国内较早布局AI大模型的厂商,蚂蚁自研的百灵大模型2023年已经过存案,要点布局在生活服务、金融服务、医疗健康等场景的运用。
在此之前,科大讯飞发布了首个根据全国产化算力渠道练习的全民开扩大模型——讯飞星火V3.5。
本月,科大讯飞与华为联合团队宣告,成功在昇腾国产算力集群上完成MoE模型的大规划跨节点专家并行推理。这是继深度求索(DeepSeek)揭露MoE练习计划后,业界首个彻底根据国产算力的解决计划。
经过算子交融、混合并行战略和通讯核算并行优化等一系列立异,科大讯飞在国产算力上完成了明显功能提高:单卡静态内存占用缩减至双机布置的1/4,功率提高75%,专家核算密度添加4倍,推理吞吐提高3.2倍,端到端时延下降50%。
根据此次科大讯飞携手华为所做的首个根据国产算力的MoE模型训推计划,科大讯飞称,这一打破性的解决计划也将运用于讯飞星火深度推理模型的练习加快,预期练习时推理功率将提高200%。一起,根据该计划的推理引擎也完成了国产算力上DeepSeek-V3和R1的高效推理。
科大讯飞“星火”验证了国产算力的可行性,蚂蚁“Ling系列”则进一步证明其规划化和经济性。跟着阿里、华为等巨子加码,我国AI工业正从“单点打破”转向“生态协同”。这场算力平权运动,或将成为全世界AI比赛的新变量。