三亿(中国体育)官方网站

科大讯飞华为联手“飞星一号”MoE模型集群推理性能翻倍突破极限!-三亿体育官网注册平台

欢迎您访问 三亿体育官方网站

三亿体育简介 联系我们 网站地图

欢迎来电咨询

0511-88522496

新闻资讯

全国服务热线

0511-88522496

技术过硬,据实报价

新闻动态

当前位置: 主页 > 新闻资讯 > 新闻动态

科大讯飞华为联手“飞星一号”MoE模型集群推理性能翻倍突破极限!

2025-07-03 06:31 已有人浏览 小编

  三亿体育品牌价值科大讯飞与华为昇腾携手,在“飞星一号”平台上实现了MoE模型集群推理性能的显著提升。这一突破性进展,标志着国产算力在AI领域的应用迈出了重要一步。

  据悉,双方联合团队通过一系列创新优化手段,成功将MoE模型在“飞星一号”平台上的集群推理性能翻倍。这一成就不仅彰显了国产算力在处理复杂AI任务方面的潜力,更为AI技术的广泛应用提供了有力支持。

  在此次优化过程中,联合团队针对MoE模型的特性,升级了PD分离+大规模专家并行系统解决方案。他们通过定制集合通信协议,有效消除了集合通信流量冲突,解决了推理过程中Prefill阶段和Decode阶段的相互干扰问题。这一创新举措使得P实例和D实例均达到了系统最优状态,性能提升超过20%。

科大讯飞华为联手“飞星一号”MoE模型集群推理性能翻倍突破极限!(图1)

  联合团队还在国产算力上实现了MTP多token预测技术,这一技术的引入显著降低了MTP层的计算耗时,整体性能提升超过30%。同时,他们还对专家负载均衡算法进行了升级,实现了多DP负载均衡,卡间负载均衡差异小于8%,集群推理吞吐性能因此提升了30%以上。

  联合团队还创新性地实现了异步双发射技术。这一技术有效解决了高并发下的高CPU负载问题,实现了CPU和NPU的高效协同。通过降低服务请求调度耗时,系统性能得到了进一步提升,提升幅度达到10%。

  基于上述一系列创新解决方案的迭代与升级,联合团队在“飞星一号”平台上对星火MoE模型、DeepSeekV3/R1进行了实测。测试结果显示,推理性能相较于上一个版本有了显著提升,几乎逼近了国产算力上MoE集群推理的性能上限。这一突破性进展无疑为国产算力在AI领域的应用注入了新的活力。

  开源鸿蒙OpenHarmony 5.1.0发布:ArkUI等特性全面升级,万物互联再进一步

  美国太空探索技术公司(SpaceX)火箭制造与发射基地所在的得克萨斯州南部墨西哥湾沿岸地区于5月3日投票,决定是否将当地升级为一座名为“星舰基地”的城镇。太空探索技术公司首席执行官埃隆·马斯克在社交媒体发文:…

  3、市场对 Copilot 预期较高,实际却没太多惊喜:重要性和关注度排名第二的商业微软 365 云服务(Microsoft 365Commercial cloud)本季收入增长了 12%,看似较上季大幅…

  值得注意的是,政策影响之下,存量光伏项目的毁约废标的同时,增量光伏项目也出现同比下跌。 无论是光伏项目业主方,抑或是项目总包方、安装商,抑或是组件厂商,抑或是贸易商,他们都是理性的经济行为主体,在经济活动中…

  持续亏损的局面,安莉芳控股似乎没能找到有效化解的办法,在竞争加剧的内衣市场里,声量逐渐减弱。汇洁股份通过对新渠道的高投入,换来了2024年的营收微增0.85%。 重注下沉市场的都市丽人,在内衣上市企业中唯…

  假期之前,这一趋势就体现在多家OTA平台的预测数据里:“请4休11”拼出超长假期,进一步刺激了长线远途旅游的下单;海南、新疆、西藏、云南、贵州等长线游目的地商品预订量增速领先全国。 旅游一直是拉动经济增长的…

  一加13手机大升级!ColorOS 15.0.0.821带来旁路供电等新功能

  开源鸿蒙OpenHarmony 5.1.0发布:ArkUI等特性全面升级,万物互联再进一步

  迈金C706智能码表上市:3.3英寸大屏+四维图新地图,骑行新助手只要999元!

  华为智能手表Fit 4 Pro与Watch 5认证通过,2025年中发布在即

  华为Watch Fit 4 Pro与Watch 5智能手表即将发布,多项认证信息曝光

  开源鸿蒙OpenHarmony 5.1.0发布:ArkUI等特性全面升级,万物互联再进一步

  本网站LOGO小熊标志受版权保护,版权登记号:鲁作登字-2015-F-025467,未经ITBEAR官方许可,严禁使用。

与科大讯飞华为联手“飞星一号”MoE模型集群推理性能翻倍突破极限!相关的其他内容