华为云AI-Native智算存储，加速AI推理应用

发布：2024-09-29 11:24:52

阅读：22957

作者：转载自“极客网”

9月20日，在华为全联接大会2024期间，华为云成功举办AI Native Cloud主题论坛。华为云在论坛上解读业界首家以内存池为中心的大模型推理存储架构，以及AI-Native智算存储如何使能模型加载快、对话问答快和查询检索快，邀请行业领袖分享AI推理技术及华为云基础设施在游戏、影视制作、办公软件等领域的应用成果。

EMS助力大语言模型降时延、提吞吐

显存有限是业界公认的影响大模型训练和推理效率的一个难点，也就是业界所说的内存墙难题。“华为云首创EMS弹性内存存储服务，在NPU显存和持久化存储两层间增加弹性内存存储层。基于Memory Pooling专利技术，通过显存扩展、算力卸载、以存代算三大创新打破内存墙。”华为云首席产品官方国伟在《AI Native Cloud: 全新为AI负载和应用设计的云基础设施》主题演讲中指出。

华为云首席产品官方国伟

EMS弹性内存存储服务为AI推理应用带来3大价值：

•以存代算，缓存和复用历史KV计算结果，首Token时延降低 80%;

•算力卸载，KV计算卸载至CPU+EMS，吞吐量提升100%;

•显存扩展，无需堆砌NPU，NPU算力节省50%。

AI推理应用已在各行各业开花结果。作为中国首个游戏人工智能实验室，网易伏羲每年都会在游戏AI领域推出新的玩法。今年，网易伏羲推出了全球首创的游戏Copilot AI队友，为玩家带来丝滑的多模态游戏交互体验。其中，为了实现近乎真人的问答效果，时延成了一大挑战。“我们与华为云联合创新，在伏羲的多轮对话和公共前缀场景使用EMS内存存储进行体验优化尝试，测试结论显示了4大优化：更大的容量，有了EMS，算力卡可以搭配TB级的虚拟显存;更高的吞吐，测试结果显示，QPS请求数提升了40%;更低的时延，EMS使能首字节时延降低84%;更高的效率，P95时延降低了32%，真正地做到了以存强算。”网易伏羲语音技术负责人莫名在《AI x 游戏，可实时语音交互的游戏队友》主题演讲中表示。

网易伏羲语音技术负责人莫名

近日国产3A游戏爆火，让大家看到了国内CG(计算机图形学)动画技术的日新月异。作为国内头部的电影视效公司，墨境天合创新地将大语言模型及图像模型应用到视效制作中。“在剧本拆解、镜头规划场景中，墨境天合使用AI辅助加速传统人工工作内容，显著提升了视效制作效率。在剧本拆解应用中，将剧本内容作为同样的文本多次输入，受显存限制，每一轮与LLM的交互均需重新计算，越问越慢，且剧本内容越长，对时延的影响越大。我们与华为云存储进行了联合创新测试，结果显示：使用EMS后首字节时延降低了75%，吞吐量增加了22%，大大提高了剧本拆解和镜头规划工具应用的效率。”墨境天合AI算法工程师负责人李晨阳在主题演讲《AI x视效制作，探索人工智能在影视制作中的应用与突破》中表示。

墨境天合AI算法工程师负责人李晨阳

OBS知识湖存储使能海量数据高效检索

大语言模型与企业业务场景结合的过程中，RAG(检索增强生成技术)是目前最成熟也是应用最普遍的关键技术。在将RAG应用到生产环境中时，如何高效的处理企业海量规模的非结构化数据，仍然面临诸多工程上的挑战。方国伟表示：“华为云基于OBS服务构建了实现语义向量化的知识湖存储，简化客户针对海量数据实现RAG方案的难度。基于读、写、算分离把千亿级规模场景下数据的读性能从百毫秒级降到10毫秒以内。同时，我们把对性能要求高、访问频繁的索引层放在内存，并结合超高性价比的对象存储来实现持久化。通过高低结合，不仅性能更高，整个成本做得更优，实现50%的成本降低。”

华为云首席产品官方国伟

WPS AI是金山办公旗下基于大语言模型的人工智能办公助手，锚定AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展。如果把大模型比做发动机，那么企业知识就是燃料。为了更好地搭建企业知识与大模型之间的桥梁，金山办公提出了AI Docs智能文档库解决方案，使能全程闭环的可控智能。“今天的企业AI知识库，仍然面临众多的技术挑战。其中如何支持千亿规模的文档量级、在大并发请求的同时保持高效检索、消减数据幻觉是数据存储面临的挑战。为了解决传统向量数据库明显的读写性能和成本问题。AI Docs目前在和华为云OBS知识湖存储进行共创，探索能够支持更大规模的文档量级、检索更精准、速度更快的使用体验，给企业AI提供更好的赋能。”金山办公助理总裁朱熠锷在《AI x办公，WPS AI 高效智慧办公助力企业提效》主题演讲中指出。

金山办公助理总裁朱熠锷

全面智能化时代已然来临，每个行业、每个企业都有自己的探索。华为云存储正积极响应推理模型崛起的变革，通过不断创新为千行万业提供安全可靠、稳定高效的云存储产品与解决方案，携手客户、伙伴，共赢数智未来。

人工智能

人工智能之模型与理论：智能系统构建的科学根基

人工智能的理论体系为模型设计提供逻辑基础与方法论指导，而模型则是理论在具体任务中的实现载体。理论研究关注智能的本质、学习的边界、推理的机制等根本问题，涵盖计算学习理论、概率推理、优化方法、信息论等；模型则聚焦于可计算、可训练、可部署的算法结构，如神经网络、决策树、支持向量机等。二者相辅相成：理论推动模型创新，模型验证理论可行性。正是这种“理论—模型—应用”的闭环演进，驱动了人工智能从符号主义、连接主义到当前数据驱动范式的持续跃迁。

2026-03-06 18:36:24

人工智能之模型与理论：驱动智能涌现的核心引擎

当我们谈论人工智能时，那些令人惊叹的图像生成、流畅的对话交互和精准的预测决策，都非凭空产生。它们背后，站着一系列深邃的数学模型与理论基础，正是这些理论与模型的演进与突破，构成了人工智能从概念走向现实、从简单走向强大的核心驱动力量。理解人工智能的模型与理论，并非仅是技术专家的专利，更是我们洞察科技发展趋势、把握未来创新方向的关键。它揭示了机器如何学习、如何理解、如何进行决策的内在逻辑。从浅显的线性回归到深不可测的神经网络，从经典的符号主义到连接主义的崛起，一部人工智能发展史，本质上就是其核心模型与理论不断进化与融合的历史。

2026-03-06 18:35:50

人工智能-机器视觉：赋能现代产业的智慧感知基石

在当今科技飞速发展的时代，人工智能与机器视觉的结合正以前所未有的深度与广度重塑我们的生产和生活。这不仅仅是让机器“看见”图像，更是赋予其理解、分析和决策的能力，就像为设备装上了智能的眼睛与大脑。从无人工厂里精准的自动化检测，到自动驾驶汽车对复杂环境的感知，再到医疗影像的辅助分析，人工智能驱动的机器视觉已成为推动各行业智能化升级的核心力量。理解这一融合技术的核心内涵、技术架构与应用价值，对于把握数字化转型的脉搏至关重要。

2026-03-04 17:30:34

人工智能-机器视觉：赋能智能感知的核心技术

机器视觉是人工智能在图像与视频理解领域的关键应用分支，致力于让计算机系统具备“看”和“理解”视觉信息的能力。它通过摄像头、传感器等设备采集图像数据，结合图像处理、模式识别与深度学习算法，实现对目标的检测、识别、测量、定位与行为分析。人工智能为机器视觉提供了强大的模型训练与推理能力，使其从传统的规则化图像处理迈向数据驱动的智能感知。二者深度融合，共同构成了智能制造、自动驾驶、安防监控、医疗影像等众多智能化场景的技术底座。

2026-03-04 17:29:58

人工智能-机器学习：驱动智能时代的核心引擎与演进路径

在当今数字化浪潮中，人工智能与机器学习已然成为推动社会变革和产业升级的核心技术力量。它们不仅是学术研究的前沿热点，更是广泛应用于各行各业、重塑生产与生活方式的实践工具。理解人工智能与机器学习的深刻内涵、相互关系以及发展脉络，对于把握技术趋势、发掘商业价值至关重要。

2026-02-26 18:22:08

人工智能-机器学习：驱动智能系统发展的核心技术引擎

人工智能是使机器模拟人类智能行为的科学与工程，涵盖感知、推理、学习、决策与交互等多个维度。而机器学习作为人工智能的核心分支，专注于通过算法让计算机系统从数据中自动学习规律，并在未见过的场景中做出预测或决策。简言之，机器学习为人工智能提供了“从经验中成长”的能力，使其不再依赖人工编写的固定规则，而是通过数据驱动实现自适应优化。当前绝大多数先进的人工智能应用，如图像识别、语音助手、推荐系统等，其底层技术均建立在机器学习基础之上。

2026-02-26 18:19:01

具身智能：打开AI通往物理世界的新大门

要理解具身智能，首先需要打破一个常见的惯性认知：智能并非只存在于“大脑”中。具身智能的核心思想源于“具身认知”哲学理念，它强调感知、思考、学习和行动是一个连续、一体的过程，而智能正是从智能体（Agent）本身与其所处环境的持续动态交互中涌现出来的能力。简单定义，具身智能是指一个拥有物理或虚拟身体的智能体，它能够通过该身体所具备的多模态传感器（如视觉、听觉、触觉）去主动感知环境，并通过计算模型（如深度学习、强化学习）进行理解、推理与规划后，驱动执行器（如机械臂、轮子）与环境产生互动，从而完成特定任务或在交互中自我进化。其核心特征在于形成一个紧密的 “感知-理解-决策-行动” 闭环，使智能体能够在充满不确定性的动态物理世界中自适应地运行。这与传统AI仅在静态、封闭的数据集上进行训练和推理的模式形成了鲜明对比。具身智能的“身体”是它理解世界、获取经验并最终执行任务的必要媒介。

2026-02-25 18:18:38

具身智能：在物理世界中生成与演化的智能新范式

具身智能（Embodied Intelligence）是一种强调智能必须根植于具有物理形态的身体，并通过与环境持续交互而涌现的认知科学与人工智能范式。其核心观点是：真正的智能并非仅源于抽象符号处理或静态数据训练，而是通过感知、行动与环境反馈的闭环循环中逐步形成。具身智能体拥有可与物理世界互动的身体——无论是机器人、虚拟角色还是生物体——并通过“做中学”（learning by doing）不断积累经验、调整策略并发展出适应性行为。这一范式标志着人工智能从“观察世界”向“生活在世界中”的根本转变。

2026-02-25 18:04:55

具身智能的发展趋势：从理论探索到产业融合的演进路径

当前具身智能系统正从孤立的功能模块向一体化架构发展。传统机器人系统通常将感知、规划、控制等环节分离设计，导致信息流断裂与决策延迟。新一代具身智能架构强调端到端的学习与优化，通过多模态融合感知、统一表征学习和联合策略训练，实现从原始传感器输入到动作输出的直接映射。这种架构能够更好地处理现实世界中的不确定性，提高系统的适应性与鲁棒性。

2026-02-09 18:25:33

具身智能的发展趋势：迈向通用物理智能体的演进路径

具身智能正经历从任务专用向任务通用的关键转变。早期系统多针对单一场景（如仓库分拣、家庭递送）进行定制开发，行为模式固定、泛化能力弱。当前发展趋势聚焦于构建具备跨任务迁移能力的通用具身智能体，其核心在于发展统一的感知-决策-执行架构，使同一智能体能通过高层指令理解与底层技能复用，完成多样化物理任务。例如，一个机器人既能整理桌面，也能操作家电或协助烹饪。这种通用性依赖于基础模型的引入与模块化技能库的建设，标志着具身智能从“工具”向“伙伴”的角色升级。

2026-02-09 18:24:52