欢迎来到新万博网站网页版,我们将竭诚为您服务!
柴油发电机组源头制造专注生产研究十年 欧盟标准 双效合一
全国咨询热线:400-801-8834
热门关键词: 康明斯 玉柴
成功案例
联系我们
400-801-8834

手机:18252604415

邮箱:meaopower@163.com

QQ:65605713

地址:泰州市鲍徐扬子东路22号

当前位置:新万博网站网页版 · 首页 > 成功案例

打破瓶颈!华为存储与道客推出AI推理加快联合解决计划

时间:2025-11-30 01:27:31 作者:新万博网站网页版 点击:1 次

  

打破瓶颈!华为存储与道客推出AI推理加快联合解决计划

  【CNMO科技音讯】近来,华为数据存储与DaoCloud道客联合宣告,正式推出AI推理加快联合解决计划。该计划交融了华为UCM(Unified Cache Manager)推理回忆数据办理技能和道客d.run算力调度渠道,旨在经过资源的精细化办理和智能调度提高算力利用率。

  生态兼容:支撑渠道、核算和存储联动,适配英伟达、华为昇腾等多元AI算力,支撑TensorFlow/vLLM/SGLang等干流AI结构,凭借Kubernetes可无缝对接华为OceanStor A系列存储。

  推理加快:经过耐久化KV Cache到华为OceanStor A系列存储,完成推理回忆常识全量保存,防止重复核算;交融Prefix Cache、Training-free稀少等加快算法,下降首Token时延,倍数级提高长序列推理吞吐与体会。

  高效算力:算力资源细粒度切分及池化,按需调度,完成资源利用率最大化;调度器具有拓扑感知才能,优化使命在xPU间的通讯功率,保证AI练习与推理使命安稳低耗运转。

  极简运维:供给多租户阻隔、资源配额办理、完好的监控告警及计费计量等功能,满意企业级运用与运维需求。

  在问答帮手场景中,经实测验证,该联合解决计划选用Prefix Cache算法,将首Token时延下降55%,且跟着序列长度越长,TTFT下降作用越显着。在长文档推理场景中,计划选用稀少化处理,32K序列完成推理吞吐量提高75%,提高推理性价比。