逆水寒AI竞技场将上线,邀您当中国AI判官!

发布:2024-11-20 10:24:05
阅读:691
作者:转载自“逆水寒”
分享:复制链接

1亿玩家化身赛博AI“判官”,评选AI届的“奥斯卡戏精”

  众所周知,AI被认为是人类通向未来的钥匙、第三次工业技术革命,全球都在卷AI技术,而AI技术中当前正火热的要属“大语言模型”,如大名鼎鼎的ChatGPT。国内也有非常多正在不断迭代和进步的AI大语言模型。

  问题来了:哪个AI大语言模型能为用户提供更具个性化的体验?

  市面上存在一些公开的“AI竞技场”,让各家AI大模型去PK,由人类评委来盲评打分,看哪个AI大模型“更灵性”“更像人”,比如加州大学等创立的IMSYS等。

  但在小寒看来,中国的AI理应让中国人来投票打分!

  3天后的2.2.2新版本,全球首个游戏内AI竞技场、也是全球评委人数最多(高达1亿)的AI竞技场——逆水寒AI大模型竞技场即将上线!

  听起来很“高大上”,但对于在座的玩家来说,一点都不复杂,甚至很好玩:

  1、首期竞赛,逆水寒携手网易伏羲邀请了国内知名的5家AI厂商的大模型,化身逆水寒9个故事主题下千行百业的NPC进入游戏的游历玩法中。每个NPC由1个AI大模型驱动,包括大名鼎鼎的——

  “

  阿里-通义大模型

  百度-文心大模型

  MiniMax-abab大模型

  月之暗面-Kimi大模型

  字节跳动-豆包大模型

  ”

  (排名按照首字母排序!)

  但是,玩家不知道NPC背后的AI模型是哪家,即完全盲评。

  2、这些来自千行百业、具有不同性格的NPC两两PK,探讨玩家给出的话题,由玩家投票。您觉得哪个AI NPC更灵性、更像真人,就把票投给ta。我们初始设置了一些话题,比如“送我一个能打动我的礼物”“太阳早上近还是中午近”等等。

智能NPC大比拼-俩小孩比机灵

选择问题:打水漂的手法技巧

  但中国话讲究一个“话里有话”。如果您觉得上面这些话题不够深度,还可以自由输入话题,比如小寒就想问:

  “跳多高才能跳过广告?”

  “过年的福字要倒贴,为何不直接生产倒过来的福字?”

  “但丁是意大利人,但丁真是中国人?”

  “八个瑞士……”(好了小寒你不要再问了)

自由输入问答:请以“我了个豆”为题写诗

  请尽情用您毕生所学的中文考验这些AI,“入院”还是“出院”,“戏精”还是“戏渣”,由您决定!

  是的,简单说,我们诚意邀请1亿逆水寒玩家化身1亿赛博AI判官,来评选出AI届的奥斯卡戏精奖!

  看起来挺好玩,但回过头来说,也很有意义:

  1、 公平公正:完全盲评,评委数量特别庞大,结果精确有意义。该功能基于网易伏羲有灵平台构建,为了避免既当运动员、又当裁判员,网易自研模型暂不参与;

  2、 更符合国人胃口:科技以人为本,中国的AI好不好,由中国玩家、消费者说了算,最为公道;

  3、 帮助AI进化:得到1亿逆水寒玩家的反馈后,AI也会知道自己在具体哪些问题上回答得不够好,从而更精确、精准地进行迭代和进化。

  当今的全球竞争局面,正是中国快速发展的技术和国外其他尖端技术硬碰硬的正面较量,而打破国外技术壁垒,目前来到了最关键的时刻。

  您每一次参与逆水寒AI竞技场、与AI加持的NPC交流,都是在为中国AI技术的发展贡献一份力量!

  人多力量大,中国的AI发展进步,这波就拜托大家了!

扫码进群
微信群
免费体验AI服务