本文作者:真实自我

百度百舸AI计算平台4.0发布:模型训练有效时长达99.5%

真实自我 09-25 431
百度百舸AI计算平台4.0发布:模型训练有效时长达99.5%摘要: 在赛季英超第轮曼联客场对阵南安普顿曼联经历了戏剧性的分钟奥纳纳首次在英超扑出点球之后德利赫特打入英超处子球比赛的第分钟迪布林利用速度优势强行内切达洛特盲目放铲结果铲倒了迪布林主裁判...

在2024-25赛季英超第4轮,曼联客场对阵南安普顿。曼联经历了戏剧性的5分钟,奥纳纳首次在英超扑出点球之后,德利赫特打入英超处子球。比赛的第30分钟,迪布林利用速度优势强行内切,达洛特盲目放铲,结果铲倒了迪布林,主裁判判罚点球。

9月25日消息,在2024 云智大会上, 智能云宣布将百舸AI异构计算 升级至4.0版本。升级后的,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型推理四大方面,为企业提供“多、快、稳、省”的AI基础设施。

为了 算力资源短缺的问题,百舸4.0对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上95%的多芯混合训练效能,达到业务最领先水平。

百度百舸AI计算平台4.0发布:模型训练有效时长达99.5%

在集群部署环节,升级后的百舸能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至1小时,极大地提升部署效率,缩短业务上线周期。

针对大模型训练过程中故障频发的问题,百舸4.0 升级了故障检测手段和自动容错机制,可以有效降低故障发生频次,大幅减少集群故障处置时间,在万卡集群上实现了超过99.5%的有效训练时长。

在模型推理上,最重要的是速度和成本。现在长文本推理逐渐成为主流,百舸4.0整体上做了推理速度和成本优化,长文本推理效率提升了1倍以上。(定西)

本文来自 科技报道,更多资讯和深度内容,关注我们。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享