云开体育照实很难吃到大 EP 的蛋糕-开云·kaiyun体育(中国大陆)官方网站登录入口

栏目分类

开云·kaiyun体育(中国大陆)官方网站登录入口: 供应; 求购; 公司; 产品; 展会; 新闻; 人才; 会员商务室

热点资讯

云开体育我就报警这猫不是你养的-开云·kaiyun体育(中国

开云体育会忍不住脑补这种北京不是只可拍个照打卡-开云·kai

开云·kaiyun体育这种表情对管谈挫伤较小-开云·kaiy

开云·kaiyun体育融资偿还1590.35万元-开云·ka

云开体育当日融券卖出3600.0股-开云·kaiyun体育(

开云体育融券净买入600.0股-开云·kaiyun体育(中国

体育游戏app平台奏凯击中了国民气中对国度弘远的渴慕-开云·

开yun体育网俄军使用这类导弹打击大田主义-开云·kaiyu

云开体育自1982年武警重组起-开云·kaiyun体育(中国

体育游戏app平台并将密切监测联悉数据-开云·kaiyun体

你的位置：开云·kaiyun体育(中国大陆)官方网站登录入口 > 新闻 >

云开体育照实很难吃到大 EP 的蛋糕-开云·kaiyun体育(中国大陆)官方网站登录入口

发布日期：2026-05-02 18:14 点击次数：92

DeepSeek 让各行业引入 AI 大模子的相识和积极性彰着提高，已激动 AI 在政务、动力、制造等领域凡俗铺伸开来。

好多政企用户接入 DeepSeek 之后，感受到了 AI 大模子给业务带来了"旦用难回"的体验，很快就从试用的第一阶段，进入第二阶段——大模子推理集群的扩容升级。

当"有莫得 Deepseek 用"不再成为问题，那么" Deepseek 好不好用"的挑战就当面而来。

一来，东谈主多了，多数侦察肯求带来的高并发，就像春运岑岭期涌入重大的东谈主流量，会出现肯求积压，模子推想象考时候变长，token 笼统速率下跌，用户的恭候时延达到 50-100 毫秒，管事器吃力和列队让东谈主恼火。

二来，机器多了，增多更多管事器会碰到物理天花板，机器扩容并不会线性培植在线推理管事的体验，就像即使增多了更多车厢，但铁轨承载本事有限，也无法运输更多搭客（AI 任务）了。

当行业智能化进入深度应用 DeepSeek 的第二阶段，不得不靠近高并发推理的期间挑战。在堆算力的同期，也要同步优化性能体验，极度于想要运输更多乘客，不仅要增多车厢数目，还要同步校阅轨谈、站台和治理机制，将旧式火车升级为高铁，本事抽象提高运载效果。

以 DeepSeek 为例，前不久公布了其利润率，高达 545%，其中就触及多数工程化本事，比如引入大 EP 推理集群，兑现高并发推理笼统量指数级增长。

关于更多行业和企业来说，莫得 DeepSeek 那样的极客天才和顶尖期间团队，怎么用大 EP 来处理高并发推理挑战呢？当 AI 大模子运行进入千行万业的深水区，亟需一场大 EP 的"运力篡改"。

好多政企客户在接入了 Deepseek 之后，使用量进一步增多，有了扩展推理集群界限的需求，推理资源需要从 2 台扩展到 10 台，从 16 卡扩展到千卡，但扩容升级并不是往机房一放、相聚一连，就能安枕而卧了。

就像印度仍在使用的旧式火车，仅靠增多车厢，如故无法提高运力，每个乘客能占用的火车空间极小，体验很差，火车不胜重任，延误误点成了家常便饭。近似问题，在 Deepseek 和各式大模子与业务的齐集聚，高并发推理卡住了用户的体验瓶颈。

面对上述问题，大 EP 大界限众人并行的期间架构，成为趋势。

浮浅来说，大 EP 即是将 MoE（搀和众人）模子中数千个众人，分派到更多的卡（算力）上去。正本一张卡只可拉 10 个东谈主，有了大 EP，不错同期拉 100 个（高并发）；正本只可跑一回车，当今不错同期跑八趟车（提高众人计较路数 batch size），那么乘客就毋庸万古候恭候了。

是以，通过大 EP 不错提高高并发推理场景下的计较效果，兑现更大的笼统和更低的时延。用户体感上，比如一家银行的使命主谈主员同期侦察 Deepseek，不会碰到列队、延伸、过长恭候等情况。

大 EP 这样好，若何本事部署到我方的一体机或推理资源池呢？不经过一番神勇，照实很难吃到大 EP 的蛋糕。

一方面，推理场景的算力需求指数级扩展，而国外厂商的推理芯片如 H20，诚然显存高，但算力不及，处理大 EP 场景时笼统骤降。Deepseek 公开的论文来看，仍然使用 H800 来进行推理。更强算力且供应链稳固的推理硬件，是大 EP 必不可少的。

另一方面，当肯求总量猛增之后，会带来多种各样的负载，且极不平衡，极度于有的车厢坐的东谈主多，有的车厢坐的东谈主少，负载不均一样会导致体验欠安。

此外，大 EP 场景的 All-to-All 通讯，导致卡间通讯占比时候高，极度于每个车厢的众人皆要奉告到，这就会迟延收支站的效果。NVLink 在大 EP 场景中，本色灵验带宽运用率就不及。

由此可见，当行业使用 Deepseek 进入深水区，面对高并发推理场景，不成抱有"头疼医头脚疼医脚"的荣幸脸色，而需要统共想考和系统攻坚。

今天来看，百行万企拥抱 Deepseek 不是追赶一时风口，而是对智能化发展趋势的经久价值判断。普惠 LLM 进入千行万业，仍是是势在必行。

而大 EP 无法得手被行业用起来，就意味着接入 Deepseek 永久存在时延高、体验差、老本难优化的问题，那么行业智能化也就无法得手达成。

不外也不必过于总结，Deepseek、科大讯飞等模厂，与昇腾等算力厂商，以及政企行业用户，一直保握着细随机作与雷同，自开年 Deepseek 激越以来，从部署实行中千里淀了多数期间创新。

近期，昇腾推出了大 EP 处理决议，面向高并发推理场景，一站式升级为智能化"高铁"。

具体来说，昇腾大 EP 处理决议借助五约莫津期间，与昇腾算力深度协同优化，得手打破了"众人负载平衡 + 通讯优化"两浩劫题。

针对众人负载不均的勤恳：

昇腾大 EP 处理决议建议了MoE 负载平衡期间，不错自动寻优，凭证业务情况、集群界限，找到最优的众人，自动估量哪个众人更忙，自动配比，当一个众人负载过多时自动素养，从而兑现了备份节点和副本众人无邪可扩展、高可用和极致平衡，性能取得极大培植。

接受多种创新期间，作念到自相宜的 autoPD 分离部署。凭证 Prefill 和 Decode 的动态负载，进行 P、D 实例的自动伸缩，无需东谈主工介入，从而减少计较访存资源竞争。齐集多级缓存内存资源池化，对冷热温数据进行分辨，不错让系统的灵验笼统培植 50% 以上。

针对 All-to-All 通讯优化的勤恳：

昇腾大 EP 处理决议建议了双流 / 多维搀和并行，其中 Prefill micro-batch 双流并行，不错兑现计较和通讯的互相障翳；MoE expert 众人双流并行，兑现两条数据流 Stream 的并行计较；Weight 权重预取双流并行，不错把访存和通讯并行起来，裁减权重加载时候，培植效果。

MLA 预处理阶段，昇腾大 EP 处理决议把多数的小算子，合成为大的交融算子，将计较耗时裁减 70%，让算力本事充分阐扬出来。

要是你以为上述期间创新多、不好记，那么只需要，借助昇腾大 EP 处理决议，行业应用 Deepseek 时，不错作念到：

快。侦察 Deepseek 无需恭候。昇腾大 EP 不错将单卡并发培植 3 倍，Decode 阶段反应速率稳固在 50ms 以内，补助 600+ 并发肯求。

省。业务使用 Deepseek 上量之后，推理集群扩展的同期，性能也保握线性度，扩容抽象老本更优。

正如高铁改变了中国东谈主的出行，昇腾大 EP 为高并发推理铺设了一条"高速铁路"，改变了 Deepseek 上量扩容阶段的体验，为行业智能化提速增效。

仅用两个多月的时候，Deepseek 就完成了从试用阶段到扩容阶段的进阶。高并发推理场景和大 EP 期间架构，成为应用 Deepseek 的新挑战。这也辅导咱们，行业智能化是一个顺序渐进的过程，不可能一蹴而就。

自主创新算力与国产模子如同高铁的双轨，成为补助起智能中国的"新基建"。昇腾生态之是以与 Deepseek 等大模子愈加适配，谜底迟缓了了明确。

领先，昇腾有硬件，为行业智能化提供"永不千里降"的算力路基。昇腾硬件的 FP16 和 INT8 算力，可达到 H20 的 2 倍以上，且功耗更低，足以补助各行业智能化的安然前进。

此外，昇腾有软硬件的协同优化本事。跟着行业智能化的不休深远，AI 模子对算力需求不休蔓延，但硬件的物理天花板和企业的插足产出比，皆条件计较性能握续优化。昇腾的 AI 软硬件，提供从预纯属到微调到强化学习，到推理集群、一体机，全经由全覆盖的决议，不错快速反应客户需求，高效补助期间创新。当前，昇腾与 DeepSeek 最新期间仍是兑现了" day0 "级别同步，确保企业智能化在昇腾软硬件基座上，永久行驶在期间最前沿。

更进犯的是，昇腾有伙伴。行业智能化是一个体系化工程，不是单一硬件或软件厂商就能独自完成的。在自主创新算力生态中，昇腾一方面兼容主流生态与 PyTorch 等国表里框架，同期与 ISV 伙伴、各大模厂皆保握着细巧共生与合作。这意味着，当行业用户基于昇腾底座竖立 AI 应用，能取得生态的全方向助力，减少智能化升级的阻力，裁减抽象老本。

今天，智能化仍是成为大家经济发展的主航谈。在自主算力与国产模子所铸就的双轨上，行业智能化也将走深向远，向着智能时间奔驰。

云开体育

上一篇：开云体育上市的表率即是无抗生素残留-开云·kaiyun体育(中国大陆)官方网站登录入口

下一篇：体育游戏app平台受理各人反应和员工陈诉本省辖区内的安全坐褥隐患陈迹-开云·kaiyun体育(中国大陆)官方网站登录入口