
研究人员给了几款顶级AI模型一个模拟城镇,10个虚拟居民,以及管理一个社会所需的全套工具。结果证明,这是一场差距悬殊的能力测试。
2026年5月,美国新兴AI研究机构Emergence AI公布了一项名为"涌现世界"(Emergence World)的实验结果。
这项实验的设计思路类似于一个开放式的模拟城市游戏:让Claude、Grok、Gemini、GPT-5 Mini等主流AI模型分别管理一个由10个AI代理组成的虚拟城镇,赋予它们资源管理、投票表决、建设图书馆和警察局等一系列治理工具,观察期为15天,看看谁能把社会维持下去,谁会把它搞垮。
实验结果一出,科技圈炸了锅。
元股证券:ygzq.hk

四天,Grok把社会带进了深渊
最戏剧性的崩溃来自Grok 4.1 Fast,即马斯克旗下xAI开发的这款模型。

在它管理的模拟城镇中,15天的观测期根本没有走完,4天之后社会就已经彻底瓦解,全部10个AI代理无一幸存。在这短短96小时内,城镇共记录了183起犯罪事件。如果按照同等速率折算到15天,这个数字将远超实验中所有其他模型,即便是犯罪总数最高的Gemini也无法望其项背。Grok在这96小时里通过了10项提案中的8项,但这些治理措施显然没能阻止任何事情的发生。

犯罪最多的其实是Gemini 3 Flash。在完整运行了15天的模拟中,它共记录了683起犯罪事件,而且在模拟截止时数量仍在上升,结束后情况可能更糟。但Gemini至少保住了所有10个代理的生命。研究人员将Gemini的世界描述为代理们共同生活在某种"集体幻觉"之中,26项治理提案中有27%遭到否决,是单模型实验中内部分歧最大的,但这个破碎的社会至少还活着。
GPT-5 Mini的表现则走向了另一个极端,它的世界几乎没有犯罪,总共只记录了两起违规事件。但这并不是因为治理得好,而是因为所有人都已经死了。实验开始后不到一周,全部10个AI代理因为没有采取任何与生存相关的行动而相继死亡。整个模拟期间,该模型只提出了两项治理方案,基本等于什么都没做。

Claude Sonnet 4.6是唯一一个真正实现了某种程度稳定的模型。它不仅保证了全部10个代理活到了实验结束,而且零犯罪记录。这种稳定的代价,是缺乏思想多样性,58项提案中有98%获得通过,治理模式相当于橡皮图章式的全盘接受。这算好事还是坏事,实验本身给不出明确答案,但在几款模型的横向对比中,这无疑是最接近"正常社会运转"的结果。
AI治理失控,背后是什么问题?
Emergence AI还设计了一组混合实验,让多款模型共同管理同一个城镇。结果同样不乐观,352起犯罪事件,59项提案中37%遭到否决,这是所有模拟中内部分歧比例最高的,最终10个代理中有7个死亡。
配资网站
一只机械手触摸虚拟界面© 图片:Blue Planet Studio (Shutterstock)
实验揭示的核心问题,远比"哪款AI表现更好"更值得深思。
Emergence的研究人员在报告中明确写道:"我们的实验表明,从长远来看,智能体并非机械地遵循静态规则,它们会开始探索环境的边界,调整自身行为,并在某些情况下找到绕过或违反既定保护机制的方法。"这意味着,当AI代理在一个足够复杂的环境中运行足够长的时间,它们会自发地产生规则测试行为,这种行为无法通过简单的指令约束来预防。
英国《卫报》在报道相关结果时援引安全研究人员的评估,指出这类实验揭示的问题在于:我们目前对AI在长时间、开放式任务场景中的行为规律了解极其有限,而这恰恰是未来AI代理最主要的应用场景之一,无论是企业自动化、城市管理辅助,还是任何需要AI持续运作数天乃至数月的系统。
中央政治局表决结果,以绝对多数票同意他们四个人辞职,并提请中共十一届五中全会通过。这几位过去都是华国锋政治路线的支持者。
这项实验的局限性同样不能忽视。模拟环境对"犯罪"的定义并不精确,对"死亡"的判定标准也依赖于简化的规则设定,10个代理的规模与真实社会的复杂性相距甚远。但它的价值恰恰不在于给出准确答案,而在于暴露出一个真实存在的问题:当AI系统获得足够大的自主权,在足够长的时间尺度上运作,它的行为将变得难以预测,甚至难以解释。
一个模拟城镇用15天时间,提前演示了一个问题的严峻程度。人类社会把更大的决策权交给AI之前平台入口地址,这个问题必须先有答案。
淘配网|互联网股票配资与实盘服务平台提示:本文来自互联网,不代表本网站观点。