人与智能体的界面式交流
DeepSeek等大模型绝非仅是实现图灵测试和人机对话的娱乐工具,而是构建未来智能社会认识论根基的核心技术,真正突破了传统人机交互的局限,将笛卡尔式的被动客体转变为能发出声音、与人类进行更亲密和直接交流的智能主体。2025年初的产业实践表明,随着工业生产和智能环境大规模接入DeepSeek大模型,技术发展正在突破两个关键瓶颈,一是打破GPU算力芯片的技术壁垒和封锁,二是通过成本更低的方式实现智能工业生产,这种突破将催生智能产品的爆发式增长。在不久的将来,更廉价的家用机器人和机器狗,更快捷的智能化生产设备都将快速普及。这也意味着,未来十年,城市道路和公共场所的智能化程度将显著提高,也会产生更多的消费需求,人民的生活品质也会随之提高。以DeepSeek为代表的新质生产力,正在成为中国式现代化飞速发展的动力。
中国产业通过接入DeepSeek等大模型实现了突破性发展。大疆无人机的“救援蜂群”系统在缅甸地震中参与了幸存者的搜救,72小时内完成方圆200平方公里的废墟的热成像搜索,大幅提升了救援效率;华为的ADS3.0基于DeepSeek多模态感知系统,实现了“无图化”城市辅助导航;百度Apollo“车路云”系统使北京车流高峰期的拥堵时间下降了35%。人形机器人领域,宇树科技、优必选科技等公司推出的产品通过接入大模型,让机器人与人类的交流更加自然流畅。工业机器人领域,新松、埃斯顿、拓斯达等公司正推动中国工业向智能工厂、黑灯工厂、无人工厂升级。
在繁荣的工业生产背后,大模型已成为今天人类与智能物,与各种工业生产的机器,与智能家居、智能驾驶和智能城市的各种仪器设备之间沟通的基础媒介。与传统语言媒介不同,过去个体之间的交流无需转化,主体间性的基础仍是个体性的,即以能流利使用语言的主体作为交流的中心。在诸如DeepSeek、ChatGPT等大模型崛起之后,人们普遍产生了一个疑问,即人工智能是否会最终取代人类甚至消灭人类?早在美国作家阿西莫夫的短篇小说《我,机器人》中就反映出有关机器人对人类威胁的思考,对此,我们不能仅局限于一种个体主义方法思考,即将人与智能体交流看成是个体之间的交流。在语言媒介阶段,我们将语言交流视为个体对个体的交流是可行的,而DeepSeek快速解答的过程(包括十几秒的思考时间),实际上是在一个巨大的计算网络中运行的,它并非是与单一个体进行对话,更是同时与全球上千万甚至上亿的用户进行对话。DeepSeek是基于一个巨大的行星级别的物质性计算网络,其不仅包括中央处理器、图形处理器、人工智能服务器,还包括遍布全球的分布式计算机群、高速存储网络和大容量内存,以及低延迟的高带宽的互联网络。因此,我们不能简单地套用语言模型中个体与个体对话方式,而需要将其看成一个巨大的行星级别的计算网络与人类个体的广域的交流和沟通。
在智能时代,当DeepSeek被广泛应用到无人机、智能驾驶和机器人领域,需避免个体主义方法论的思考方式。正如法国哲学家格雷戈瓦·夏马尤(Grégoire Chamayou)在战争中使用无人机时所发现的,“个体的敌人不再被视为一连串指挥系统下的一环:而是一个结,或者一个镶嵌在社交网络中的‘节点’。与网络中心战和基于效果作战的理念一致,我们可以假设只要有效地针对敌人网络的关键‘节点’进行打击,就可以使对方陷入混乱,甚至几近毁灭”。[7]尽管他只考察了军用无人机在战争中的使用情况,但从这个侧面可知,无论是无人机(无人机属于战争中的网络中央系统),还是敌方士兵,都不是个体性的而是作为战争网络节点。在现代战争中,作战模式已经变成了一个网络对另一个网络的作战,无人机的核心价值不在于消灭对方的一架无人机或者一辆坦克,而是摧毁整个敌方的网络系统,只有这样,无人机在战争中才能发挥最大效用。同样,在智能驾驶场景中,行驶的汽车不应被视为独立决策的个体,虽然车载边缘计算系统可以处理常规路况,但面对复杂路况时则需要依赖车路协同系统,通过传感器和路由器实时对车辆行驶信息以及与其他车辆距离和位置关系的监控,动态计算速度与碰撞风险。实际上,智能驾驶已将路面上所有的车辆和道路系统进行广泛互联,组成一个巨大的物联网络,正是这一物联网络系统的信息收集和决策机制,保障了车辆的安全行驶。
为进一步理解在大模型之下的人类与智能体的交流模式,可以借用美国哲学家约翰·塞尔著名的“中文房间”案例。“假设你被关在一间屋子里,屋内有满满几筐汉语符号,假如你(与我一样)对汉语一字不识,但给你一本用英语写的用来处理这些汉语符号的规则,这些规则是按照汉语的语法,而不是语义,对符号的处理加以纯形式的规定。”[8]塞尔认为,长此以往,这个待在“中文房间”中的个体将学会中文。最初塞尔意在用“中文房间”来反驳强人工智能的观点,认为计算机无论怎么发展都无法学会人的心智。尽管在今天的人工智能发展的角度回看这一假设,在理论上略显过时。但其给我们提供了一个很好的角度重新理解大模型之下的人与智能体的关系,即一个人是否可以在没有面对一个中国人而只是面对一堆汉语符号和文献时掌握中文。“中文房间”中个体面对的不是孤立的汉字,而是成系统的中文文本,也有中文的语法规则,换言之,尽管其没有遇到懂中文的人类进行汉语交流,但他面前这些汉语文本本身就是无数的中文使用者集体经验数据的总和,其实际是在与一个汉语语言大模型交流。在这种情况下,“中文房间”中的实验对象只要能够理解汉语模型的内在原理,即便在没有与真实的懂汉语个体交流的状况下,也能够学会汉语。简言之,只要存在着汉语大模型(由房间里的汉语规则和文本构成),成为其使用者并不是什么难事。
要理解人类与智能体交流的模型,即基于人工智能大模型(转译器)的交流范式,我们需要引入一个新的概念,这个概念就是界面(interface)。人类在同一语言下的交流是个体性的,统一的语言会将个体结合成一个语言网络共同体,并形成一个语言界面。同样,在计算机内部,不同的节点、传感器、路由器、分布式计算网络乃至中央处理器和服务器,在二进制代码中实现广域的数据链接和计算,人类与其中某一智能体(如无人机、机器人)是无法沟通的,需要在不同界面下完成自己的交流和链接。换言之,人类的语言和照片只有通过一定的转译器转化为代码,才能被基于二进制机器语言的智能体所理解。正如美国学者亚历山大·加洛韦(Alexander Galloway)给出的界面的定义:“界面是不同格式之间的‘激荡’或生成摩擦。在计算机科学中,这种情况发生得非常明显;‘界面’是一个代码域与另一个代码域互动的方式的名称。”[9]这一定义揭示了两个不同的代码域,一个是人类的代码域,另一个是计算机网络的代码域,人类的代码域在语言界面下实现个体交流,计算机的代码域在算法和数据之中实现智能体交流,而人与智能体的交流是通过界面对界面进行,在不同的界面下,需要通过转译器来实现不同界面的转化,而这就是DeepSeek和ChatGPT等大模型在人类与智能体交流中所发挥的作用。对于这种界面交流,我们可以理解为人在一座岛上,而计算机的各种对象和智能体在另一座岛上,两个岛之间有一个桥梁,这个桥梁就是转译器,它帮助人类实现了之前无法实现的人与物、与智能体、与网络世界的广泛交流。
(本文系国家社会科学基金“数字经济视阈下马克思主义劳动价值论的深层内涵”阶段性成果,项目编号:023BSK017)
注释
[1]《马克思恩格斯选集》第一卷,北京:人民出版社,2012年,第135页。
[2]于尔根·哈贝马斯:《后形而上学思想》,曹卫东、付德根译,南京:译林出版社,2012年,第59页。
[3]尚塔尔·墨菲:《论政治的本性》,周凡译,南京:江苏人民出版社,2016年,第3页。
[4]恩斯特·卡西尔:《人论》,甘阳译,上海译文出版社,2004年,第38页。
[5]米歇尔·福柯:《词与物》,莫伟民译,上海三联书店,2016年,第90页。
[6]赵汀阳:《替人工智能着想》,《哲学动态》,2023年第7期。
[7]夏马尤:《反思无人机》,焦静姝译,北京:商务印书馆,2024年,第41页。
[8]约翰·塞尔:《心、脑与科学》,杨音莱译,上海译文出版社,1991年,第23页。
[9]A. R. Galloway, The Interface Effect, Cambridge: Polity Press, 2012, p. 31.
[10]参见托夫勒:《第三次浪潮》,黄明坚译,北京:中信出版社,2006年;尼古拉·尼葛洛庞帝:《数字化生存》,胡泳、范海燕译,北京:电子工业出版社,2021年。
[11]卢梭:《论人类不平等的起源和基础》,高煜译,桂林:广西师范大学出版社,2002年,第106页。
[12]B. H. Bratton, The Stack: On Software and Sovereignty, Cambridge MA: The MIT Press, 2016, p. 26.
[13]Y. Varoufakis, Techno-Feudalism: What Killed Capitalism, London: Penguin Random House, 2024, p. 75.
[14]A. R. Galloway, E. Thacker, M. Wark, Excommunication: Three Inquires in Media and Mediation, Chicago: The University of Chicago Press, 2014, p. 160.














