网易伏羲携手昇腾AI打造玉知-悟空图文理解大模型，推动个性化体验升级

发布：2023-03-28 09:53:45

阅读：18531

作者：网易伏羲

不少人都有过这样的“心动”体验：上班路上打开网易新闻，推荐内容恰好是自己最近关注的行业动态；下班途中打开网易云音乐，惊喜的发现了几个小众宝藏歌手，忍不住直呼“网易云真是太懂我了！”

个性化的推荐机制像一个贴心的朋友，在互联网的海量信息中，总能捕捉到最合你心意的那个。

01：个性化推荐机制的背后：多模态大模型保驾护航

作为国内专业从事游戏与泛娱乐AI研究和应用的顶尖机构，网易伏羲于2021年起着力打造“玉知”多模态理解大模型。基于图片-文本双塔结构，先后训练了2亿、4亿、9亿参数的“玉知”版本。同时，利用网易伏羲开源的EET高效推理框架，对模型压缩、算法适配、硬件底层等方面进行优化，使其推理速度提升4倍，满足了线上的高并发需求，降低了部署资源的损耗。

在业务数据集的zero-shot评测中

“玉知”多模态理解大模型优于Chinese-CLIP的CN-CLIPViT-H/14

同时网易伏羲联合网易新闻及网易云音乐团队，将“玉知”多模态理解大模型在网易的多个业务场景中落地验证，为个性化推荐机制保驾护航：网易新闻基于“玉知”构建的图文内容表征，在推荐环节采用基于该图文向量的dropoutnet召回优化，对召回源、列表页视频试投、列表页试投整体等效果明显改进，实现视频和整体大盘的业务指标提升；网易云音乐基于“玉知”构建的内容表征引擎和内容相似检索引擎，在云音乐视频、长音频、广告等多个业务中，实现了对内容冷启动效率、CTR预估模型的优化，带来显著收益。

02：网易+昇腾AI：创造1+1>2的智能体验

为了更好的使能大模型应用创新，昇腾AI构建了从规划、开发到产业化的大模型全流程使能体系，并于2022年正式发布了昇腾AI大模型开发使能平台，打通了大模型从开发到部署的全流程。

在大模型的开发上，通过昇思MindSpore提供的自动混合并行API来加速训练过程，利用高阶的Transformer API，百行代码实现千亿级参数的模型开发，同时获得更好的模型性能；为加速大模型场景化适配，打造了丰富的微调套件，已成功应用于紫东太初大模型开放服务平台建设，支持小样本训练和模型一键微调；在大模型的推理部署上，昇腾AI提供的模型压缩工具，在精度基本无损的情况下，降低了70%计算量，提升了20%以上的推理性能。

为了给用户带来更好的智能体验，网易伏羲联合昇思MindSpore及华为诺亚团队，充分分析互联网行业数据集特性，对多模态模型结构进行优化，优选合适编码器并采用多阶段训练模式，基于昇腾AI大模型开发使能平台，共同打造了玉知-悟空图文理解大模型。

玉知-悟空图文理解大模型可广泛应用在互联网推荐搜索等业务中，通过提取图文的特征进行相关的检索。在网易视频推荐业务的应用中，玉知-悟空图文理解大模型在核心算法指标中得到近5%的提升，效果远超预期。未来，联合团队将进一步将成果应用到网易新闻、网易云音乐等更丰富的业务场景中，提升最终用户的个性化体验。

当被输入丰富的行业知识时，更精更专的大模型将显现出巨大的应用价值。昇腾AI大模型开发平台已经具备了支持大模型开发所需的各项核心技术，同时提供了一整套高效、易用的大模型使能套件，形成了端到端的使能大模型开发能力。未来，昇腾AI将联合网易以及更多行业伙伴共建共享，助力大模型创新，为繁荣AI产业生态铺就一条信心之路。

人工智能机器学习

人工智能之数学基础：驱动智能算法的核心支柱

人工智能（AI）作为现代科技的核心领域，其发展高度依赖数学理论的支撑。从基础算法的设计到复杂模型的训练，数学为AI提供了逻辑框架和计算工具。无论是机器学习中的数据建模，还是深度学习中的参数优化，数学原理始终贯穿其中。可以说，数学是人工智能的“骨骼”，决定了其运行效率与智能水平。

2025-07-15 17:47:15

人工智能之数学基础：智能算法的底层逻辑构建

数学作为人工智能的技术根基，为算法设计、模型训练与结果优化提供严密的理论框架。其核心价值体现在三层面：模型架构设计：线性代数中的矩阵运算支撑神经网络参数计算，拓扑学定义数据特征的关联结构。学习过程优化：微积分中的梯度下降算法驱动损失函数最小化，概率论量化预测结果的不确定性。决策逻辑验证：数理逻辑与博弈论构建智能体行为规则，确保系统决策的可解释性与合规性。

2025-07-15 17:46:19

人工智能之机器翻译：技术革新与未来趋势

人工智能中的机器翻译（Machine Translation, MT）是自然语言处理（NLP）领域的重要分支，其核心在于通过算法与模型将一种语言自动转换为另一种语言。随着全球化进程加速，跨语言交流需求激增，机器翻译凭借高效性与低成本优势，成为打破语言障碍的关键工具。例如，在跨境电商、国际会议、学术研究等场景中，机器翻译不仅提升了沟通效率，还推动了信息的快速流通与共享。

2025-07-14 17:35:46

人工智能之机器翻译：语言屏障破解的技术革命

机器翻译历经规则驱动、统计模型至神经网络三次技术迭代，逐步突破语言转换的精度与效率瓶颈。早期系统依赖人工编写语法规则与词典，覆盖语种有限且维护成本高。当前主流技术基于深度神经网络，通过海量平行语料训练模型，实现端到端的语义映射与上下文理解，显著提升复杂句式与专业术语的翻译质量。

2025-07-14 17:35:06

新华视点丨人工智能时代，我们需要怎样的文科人才？

正值2025年高考志愿填报期，有关专业选择的讨论再度升温。在人工智能迅猛发展的背景下，“文理抉择”这一老话题又引发新讨论。从当年“学好数理化，走遍天下都不怕”的口号，到近两年“文科无用”等论调，种种说法令不少考生及家长心生迷茫。文科，还可以选择吗？高校对文科有哪些新探索值得关注？未来，我们需要怎样的文科人才？

2025-07-14 10:27:58

人工智能伦理与治理：构建负责任的技术发展路径

人工智能伦理与治理是当前科技领域亟需解决的关键议题。随着AI技术的广泛应用，其潜在风险逐渐显现，包括数据隐私泄露、算法偏见、社会公平性缺失等问题。例如，人脸识别技术可能因数据偏差导致误判，深度伪造技术可能被滥用以制造虚假信息。这些问题不仅影响技术本身的可信度，更对社会秩序和人类价值观构成挑战。因此，建立系统的伦理框架和治理机制，成为推动人工智能可持续发展的核心任务。

2025-07-11 17:39:01

人工智能伦理与治理：构建可信AI的体系化路径

人工智能伦理关注算法决策的公平性、透明度及社会影响。随着AI渗透至医疗、金融、司法等领域，伦理问题凸显为三大矛盾：数据隐私与算法效率：训练数据可能隐含用户隐私，如何在保障数据安全的前提下提升模型性能成为关键。算法偏见与社会公平：历史数据中的偏差可能导致AI系统歧视特定群体，例如信贷评分模型对少数族裔的不公判定。责任归属困境：自动驾驶事故、AI生成内容侵权等场景中，开发者、运营商与用户的权责边界模糊。

2025-07-11 17:38:06

人工智能驱动智能制造：重塑制造业的未来格局

人工智能（AI）作为第四次工业革命的核心驱动力，正在深刻重构制造业的底层逻辑。通过将深度学习、计算机视觉、自然语言处理等技术与制造流程深度融合，AI不仅提升了生产效率，更推动了从“自动化”向“智能化”的范式转变。智能制造的核心在于数据驱动决策，而AI通过实时感知、动态分析和自主优化，使制造系统具备了类人化的认知能力，从而实现从“人控”到“机控”的系统性升级。

2025-07-10 18:03:56

人工智能之智能制造：重塑现代工业新生态

人工智能之智能制造指通过机器学习、物联网（IoT）、大数据分析等技术，实现生产流程的自主优化与精准决策。其核心在于构建“感知-分析-执行”闭环，将设备、物料、人员数据转化为实时洞察，驱动制造系统从自动化向智能化跃迁。

2025-07-10 18:03:15

人工智能之智慧医疗：重塑医疗行业的未来图景

随着人工智能技术的快速发展，智慧医疗正成为推动医疗行业变革的重要力量。通过深度学习、计算机视觉、自然语言处理等技术的融合，人工智能正在优化诊疗流程、提升医疗效率、改善患者体验，并为构建高效、精准、普惠的医疗体系提供创新解决方案。

2025-07-09 17:43:12