DecBERT: Enhancing the Language Understanding of BERT with Causal Attention Masks

发布:2022-11-04 15:51:20
阅读:2108
作者:罗子洋,席亚东,Jing Ma,Zhiwei Yang,毛晓曦,范长杰,张荣升
分享:复制链接

会议介绍

NAACL 2022 Findings

论文简讯

本文提出了一个新的预训练模型DecBERT。对于BERT模型来说,如果缺乏了位置信息,将无法对语言进行建模,本文提出了一个新的方法增强BERT的位置信息编码能力,在BERT模型的前两层的attention中插入causal attention mask,使得模型的前两层天然对文本位置敏感,从而更好的对语言建模,在自然语言理解的benchmark GLUE上比较,我们的DecBERT模型比起BERT有更好的表现。

论文原文

https://arxiv.org/pdf/2204.08688.pdf

最新文章
网易灵动荣登2025中国技术力量年度榜单 ,装载机器人入选年度具身智能明星产品
2025-12-31 15:22:38
AI时代,为什么90%的协作都死在了“说不清楚”上?|有灵智能体有奖邀测
2025-12-30 11:05:29
行动中的认知:预测加工框架下的具身智能——未来展望:迈向自主行动的通用智能
2025-12-29 15:45:13
行动中的认知:预测加工框架下的具身智能——实现路径:主动推断与具身性的融合
2025-12-29 15:44:06
行动中的认知:预测加工框架下的具身智能——理论交融:从“具身心智”到“预测心智”
2025-12-29 15:42:49
热门文章
1矿山智能化再获政策加持,科技创新翻开安全生产新篇章
2网易伏羲负责人范长杰博士:群体智能引领AI通向物理世界
3喜报!荣获国家级科技奖一等奖,产学研协同创新获权威认可
4又一无人装载机项目落地!网易灵动助力世界前5的预拌混凝土龙头企业智能化升级
5政策东风下的数字游民:孤独与协作难题,被“搭子文化”治愈了?
6真实故事分享|从全职宝妈到备考学生,他们用“碎片时间”灵活兼职、月入千元
7DeepSeek引爆游戏股:腾讯单日股价暴涨7%,网易掀“NPC”革命
8网易灵动“灵掘”挖掘机器人解决方案获世界互联网大会新耀场景奖
9CNCC2025回顾|网易伏羲主题分论坛圆满落幕,产学研共探智能体技术跃迁路径
10CCF(中国计算机学会)-网易雷火联合基金评审结果公布!
扫码进群
微信群
了解更多资讯