1亿玩家化身赛博AI“判官”,评选AI届的“奥斯卡戏精”
众所周知,AI被认为是人类通向未来的钥匙、第三次工业技术革命,全球都在卷AI技术,而AI技术中当前正火热的要属“大语言模型”,如大名鼎鼎的ChatGPT。国内也有非常多正在不断迭代和进步的AI大语言模型。
问题来了:哪个AI大语言模型能为用户提供更具个性化的体验?
市面上存在一些公开的“AI竞技场”,让各家AI大模型去PK,由人类评委来盲评打分,看哪个AI大模型“更灵性”“更像人”,比如加州大学等创立的IMSYS等。
但在小寒看来,中国的AI理应让中国人来投票打分!
3天后的2.2.2新版本,全球首个游戏内AI竞技场、也是全球评委人数最多(高达1亿)的AI竞技场——逆水寒AI大模型竞技场即将上线!
听起来很“高大上”,但对于在座的玩家来说,一点都不复杂,甚至很好玩:
1、首期竞赛,逆水寒携手网易伏羲邀请了国内知名的5家AI厂商的大模型,化身逆水寒9个故事主题下千行百业的NPC进入游戏的游历玩法中。每个NPC由1个AI大模型驱动,包括大名鼎鼎的——
“
阿里-通义大模型
百度-文心大模型
MiniMax-abab大模型
月之暗面-Kimi大模型
字节跳动-豆包大模型
”
(排名按照首字母排序!)
但是,玩家不知道NPC背后的AI模型是哪家,即完全盲评。
2、这些来自千行百业、具有不同性格的NPC两两PK,探讨玩家给出的话题,由玩家投票。您觉得哪个AI NPC更灵性、更像真人,就把票投给ta。我们初始设置了一些话题,比如“送我一个能打动我的礼物”“太阳早上近还是中午近”等等。
智能NPC大比拼-俩小孩比机灵
选择问题:打水漂的手法技巧
但中国话讲究一个“话里有话”。如果您觉得上面这些话题不够深度,还可以自由输入话题,比如小寒就想问:
“跳多高才能跳过广告?”
“过年的福字要倒贴,为何不直接生产倒过来的福字?”
“但丁是意大利人,但丁真是中国人?”
“八个瑞士……”(好了小寒你不要再问了)
自由输入问答:请以“我了个豆”为题写诗
请尽情用您毕生所学的中文考验这些AI,“入院”还是“出院”,“戏精”还是“戏渣”,由您决定!
是的,简单说,我们诚意邀请1亿逆水寒玩家化身1亿赛博AI判官,来评选出AI届的奥斯卡戏精奖!
看起来挺好玩,但回过头来说,也很有意义:
1、 公平公正:完全盲评,评委数量特别庞大,结果精确有意义。该功能基于网易伏羲有灵平台构建,为了避免既当运动员、又当裁判员,网易自研模型暂不参与;
2、 更符合国人胃口:科技以人为本,中国的AI好不好,由中国玩家、消费者说了算,最为公道;
3、 帮助AI进化:得到1亿逆水寒玩家的反馈后,AI也会知道自己在具体哪些问题上回答得不够好,从而更精确、精准地进行迭代和进化。
当今的全球竞争局面,正是中国快速发展的技术和国外其他尖端技术硬碰硬的正面较量,而打破国外技术壁垒,目前来到了最关键的时刻。
您每一次参与逆水寒AI竞技场、与AI加持的NPC交流,都是在为中国AI技术的发展贡献一份力量!
人多力量大,中国的AI发展进步,这波就拜托大家了!