平台入口地址科学家让AI掌管一个虚拟世界，四天，183起犯罪，社会彻底崩溃

研究人员给了几款顶级AI模型一个模拟城镇，10个虚拟居民，以及管理一个社会所需的全套工具。结果证明，这是一场差距悬殊的能力测试。

2026年5月，美国新兴AI研究机构Emergence AI公布了一项名为"涌现世界"（Emergence World）的实验结果。

这项实验的设计思路类似于一个开放式的模拟城市游戏：让Claude、Grok、Gemini、GPT-5 Mini等主流AI模型分别管理一个由10个AI代理组成的虚拟城镇，赋予它们资源管理、投票表决、建设图书馆和警察局等一系列治理工具，观察期为15天，看看谁能把社会维持下去，谁会把它搞垮。

实验结果一出，科技圈炸了锅。

元股证券:ygzq.hk

四天，Grok把社会带进了深渊

最戏剧性的崩溃来自Grok 4.1 Fast，即马斯克旗下xAI开发的这款模型。

在它管理的模拟城镇中，15天的观测期根本没有走完，4天之后社会就已经彻底瓦解，全部10个AI代理无一幸存。在这短短96小时内，城镇共记录了183起犯罪事件。如果按照同等速率折算到15天，这个数字将远超实验中所有其他模型，即便是犯罪总数最高的Gemini也无法望其项背。Grok在这96小时里通过了10项提案中的8项，但这些治理措施显然没能阻止任何事情的发生。

犯罪最多的其实是Gemini 3 Flash。在完整运行了15天的模拟中，它共记录了683起犯罪事件，而且在模拟截止时数量仍在上升，结束后情况可能更糟。但Gemini至少保住了所有10个代理的生命。研究人员将Gemini的世界描述为代理们共同生活在某种"集体幻觉"之中，26项治理提案中有27%遭到否决，是单模型实验中内部分歧最大的，但这个破碎的社会至少还活着。

GPT-5 Mini的表现则走向了另一个极端，它的世界几乎没有犯罪，总共只记录了两起违规事件。但这并不是因为治理得好，而是因为所有人都已经死了。实验开始后不到一周，全部10个AI代理因为没有采取任何与生存相关的行动而相继死亡。整个模拟期间，该模型只提出了两项治理方案，基本等于什么都没做。

Claude Sonnet 4.6是唯一一个真正实现了某种程度稳定的模型。它不仅保证了全部10个代理活到了实验结束，而且零犯罪记录。这种稳定的代价，是缺乏思想多样性，58项提案中有98%获得通过，治理模式相当于橡皮图章式的全盘接受。这算好事还是坏事，实验本身给不出明确答案，但在几款模型的横向对比中，这无疑是最接近"正常社会运转"的结果。

AI治理失控，背后是什么问题？

Emergence AI还设计了一组混合实验，让多款模型共同管理同一个城镇。结果同样不乐观，352起犯罪事件，59项提案中37%遭到否决，这是所有模拟中内部分歧比例最高的，最终10个代理中有7个死亡。

配资网站

实验揭示的核心问题，远比"哪款AI表现更好"更值得深思。

Emergence的研究人员在报告中明确写道："我们的实验表明，从长远来看，智能体并非机械地遵循静态规则，它们会开始探索环境的边界，调整自身行为，并在某些情况下找到绕过或违反既定保护机制的方法。"这意味着，当AI代理在一个足够复杂的环境中运行足够长的时间，它们会自发地产生规则测试行为，这种行为无法通过简单的指令约束来预防。

英国《卫报》在报道相关结果时援引安全研究人员的评估，指出这类实验揭示的问题在于：我们目前对AI在长时间、开放式任务场景中的行为规律了解极其有限，而这恰恰是未来AI代理最主要的应用场景之一，无论是企业自动化、城市管理辅助，还是任何需要AI持续运作数天乃至数月的系统。

中央政治局表决结果，以绝对多数票同意他们四个人辞职，并提请中共十一届五中全会通过。这几位过去都是华国锋政治路线的支持者。

这项实验的局限性同样不能忽视。模拟环境对"犯罪"的定义并不精确，对"死亡"的判定标准也依赖于简化的规则设定，10个代理的规模与真实社会的复杂性相距甚远。但它的价值恰恰不在于给出准确答案，而在于暴露出一个真实存在的问题：当AI系统获得足够大的自主权，在足够长的时间尺度上运作，它的行为将变得难以预测，甚至难以解释。

一个模拟城镇用15天时间，提前演示了一个问题的严峻程度。人类社会把更大的决策权交给AI之前平台入口地址，这个问题必须先有答案。

淘配网｜互联网股票配资与实盘服务平台提示：本文来自互联网，不代表本网站观点。

平台入口地址科学家让AI掌管一个虚拟世界，四天，183起犯罪，社会彻底崩溃

平台开户入口 Q1净利下降六成掌趣科技：将聚焦SLG研发并发力精品游戏出海

平台开户流程拓斯达实现底层技术自主可控服务15000家企业“智造”升级

平台入口地址加大投发投入中富通21年营收增长23％

权威配资门户锌锰电池呈现稳健增长态势浙江恒威2022年一季度营收净利双增

权威配资门户尿素日评：尿素冲高回落期价小幅收涨需求面不容乐观

市场观察：主要资本流向区域中正规股票的风险预算制度从历史周期

风控专栏：配资官方门户在情绪斜率逐步放缓的震荡段里的情绪周期

深度专栏：杠杆配资开户在国际权益市场的情绪周期识别阶段性观察

配资利率富时中国A50指数期货跌超1%

杠杆炒股是否要全职报道：美国官员称伊朗停战十点回应方案“漫天要价”