LayerConnect: Hypernetwork-Assisted Inter-Layer Connector to Enhance Parameter Efficiency

发布:2023-01-17 14:05:15
阅读:28508
作者:网易伏羲
分享:复制链接

论文介绍

预训练语言模型(PLM)是现代自然语言处理(NLP)的基石。然而,对PLM所有参数进行微调会降低效率。现有的参数有效方法通常侧重于减少PLM中的可训练参数,而忽略了推理速度,这限制了部署PLM的能力。

在本文中,我们提出了LayerConnect(超网络辅助层间连接器)来提高推理效率。具体来说,在两个Transformer层之间插入一个具有线性结构的轻量级连接器,每个连接器内部的参数由一个由插值器和下采样器组成的超级网络进行调整。我们对GLUE基准进行了实验。实验结果验证了模型的推理效率。与适配器相比,我们的模型参数降低到约11.75%,而性能下降保持在5%以下(平均2.5分)。

论文地址

https://aclanthology.org/2022.coling-1.276/

最新文章
大模型作为人类与智能体交流门户的战略价值——新圈地运动与智能产业的未来战略
2025-12-24 18:14:28
大模型作为人类与智能体交流门户的战略价值——人与智能体的界面式交流
2025-12-24 18:12:32
大模型作为人类与智能体交流门户的战略价值——从语言到大模型:认识论根基的嬗变
2025-12-24 18:11:28
从开路先锋到智造标杆,网易灵动携手大型央企开始“无人化作业”新阶段
2025-12-24 16:30:32
把AI玩出花!网易伏羲分享:3D AIGC的8年实践、如何让游戏更好玩?
2025-12-24 14:30:20
热门文章
13A游戏《归唐》首曝!《黑神话:悟空》制作人冯骥盛赞!
2网易第三季度营收达262亿元 AI研发及应用持续发力
3网易瑶台|信通院扩展现实产业及标准推进委员会成立大会元宇宙会场
4网易瑶台x魔兽世界特别推出 “致·阿尔萨斯”巫妖王之怒线上艺术展
5国家智库发文回应AI就业焦虑:替代之外,人机协作、灵活就业是趋势
6《永劫无间》手游x高通x网易伏羲:终端侧AI大模型首次登陆手游!
7网易瑶台搭建元宇宙虚拟会场 助力长三角一体化数字文明共建研讨会成功举办
8一图读懂网易灵动“灵掘”与“机械智心”
9【科技赋能】中建八局联合网易发布国内第一款无人装载机及其环境系统
10网易伏羲、网易灵动首次亮相第九届万物生长大会 | 邀您共赴AI浪潮,见证钱塘江畔科技盛宴
扫码进群
微信群
了解更多资讯