战争与和平 (WarAgent):基于大语言模型的世界大战多智能体模拟 [译]

战争与和平 (WarAgent):基于大语言模型的世界大战多智能体模拟 [译]

摘要:

我们能否在历史的十字路口避免战争?这个问题一直受到个人、学者、政策制定者和组织的关注。在这项研究中,我们试图基于人工智能(AI)和大语言模型(LLMs)的最新进展来回答这个问题。我们提出 WarAgent,一个基于 LLM 的多智能体 AI 系统,用于模拟历史国际冲突中参与国家的决策及其后果,包括第一次世界大战(WWI)、第二次世界大战(WWII)和中国古代的战国时期(WSP)。通过评估模拟的有效性,我们检验了尖端 AI 系统在研究诸如国际冲突这样的复杂集体人类行为的能力及其局限性。在这些模拟中,智能体之间的新兴互动也为检验导致战争的触发因素和条件提供了新视角。我们的发现提供了基于数据和 AI 增强的洞察,可以重新定义我们解决冲突和维持和平的策略。其影响超越了历史分析,提供了一个利用 AI 理解人类历史并可能预防未来国际冲突的蓝图。代码和数据可在 https://github.com/agiresearch/WarAgent 获取。

引言

随着人工智能(AI)领域,尤其是大语言模型(大语言模型)的突破性发展,我们正处于计算社会科学研究的一个重大转折点。在本研究中,我们开发了一个基于大语言模型的多智能体系统(多智能体系统)的新型框架,专门用于模拟历史事件。通过构建一个动态环境,各个代表不同国家的智能体,它们各自体现了历史人物的特征和决策过程,参与到冲突或合作中,我们能够探索可能塑造历史上国际冲突演变的各种可能性,这些冲突构成了当今世界秩序的基础。从这个角度看,我们的模拟提供了多角度探究对人类安全和战争至关重要的历史难题的新途径。

战争与和平是塑造人类历史故事千年的两个重要方面。冲突与合作之间的微妙平衡常常是难以预测的,受到国家的不同动机、策略和决策的影响。了解战争的运作机制,可能是揭开持久和平之门的关键。虽然通过历史分析来研究冲突的传统方法富有见解,但其本质上由于静态性和事后的偏见而受到限制。社会科学领域中模拟的应用历史悠久,但这些模拟的真实度和范围已经发生了翻天覆地的变化。早期尝试通常受限于计算能力和简化模型 [@smith1970presidential; @hermann1967attempt]。

相比之下,最新的模拟利用大语言模型来模拟复杂的行为和互动,如人类行为的虚拟小镇模拟 [@park2023generative]、狼人游戏模拟 [@xu2023exploring]、拍卖场模拟 [@chen2023put] 以及复杂任务解决模拟 [@ge2023openagi]。这些方法为使用 AI 来模拟国际关系和冲突等更为复杂的系统奠定了基础。然而,目前还没有研究探讨如何将这些先进技术应用于模拟国际外交和战争的复杂多样性,这正是我们研究的重点:我们的论文旨在创建第一个基于大语言模型的历史事件多智能体系统模拟

图一:第一次世界大战模拟场景演示

我们的研究核心在于挑战对历史冲突的传统理解,并提出关键问题。我们通过分析 第一次世界大战 (WWI)第二次世界大战 (WWII)中国古代战国时期 (WSP),深入探讨国际冲突动态。研究的三个问题如下:

  • RQ1, 仿真效果:基于大语言模型 (LLM) 的多智能体系统仿真,能有多高效地还原历史上的战略规划和决策进程?

  • RQ2, 战争原因:在战争触发因素中,是否有更关键的因素,我们能否通过 LLM 基础的多智能体系统仿真来识别这些因素?

  • RQ3, 战争的必然性:历史上看似不可避免的战争真的无法避免吗?我们试图通过 LLM 基础的多智能体系统仿真来找出导致战争或和平的关键条件。

我们首先关注 仿真效果。仿真对真实事件的忠实程度,是评判其有效性和实用性的关键。在我们的 LLM 基础多智能体仿真中,这个问题直指模型的可信度。通过将仿真结果与历史事件和趋势对比,我们可以评估仿真的准确度。只有在保持有效性的基础上,我们的系统才能进行深入分析,并回答更多研究问题。

战争原因,即战争的诱因,一直是国际关系研究中的难题。我们希望通过这个问题,分析并识别各种战争触发因素,了解哪些因素在引发冲突时更具决定性。利用 LLM 基础的多次仿真,我们能够检验不同情境和变量,从而在一个受控的环境中观察各种战争诱因的影响。了解这些触发因素的相对重要性,可以为政策制定者和历史学家提供新的视角,帮助他们在预防冲突和处理国际危机时有更深的洞察力。

战争的必然性 这个问题深入探讨了历史的决定论与偶然论。通过研究“历史的必然性”,我们实际上在探讨某些战争是否命中注定,还是仅仅是多种独特环境因素巧合的结果,本可以避免。我们的模拟实验提供了重新审视历史的机会,通过改变关键条件和决策过程,看看是否可能出现不同的历史走向。这样的研究能加深我们对国际关系中结构和行动者互动复杂性的理解,也有助于推动对历史决定论的更深入讨论。

这项研究的意义广泛,涉及多个跨学科领域:

对于计算机和信息科学家来说,研究成果展示了大语言模型 (LLM) 在模拟复杂历史冲突和做出明智选择方面的推理能力。这凸显了人工智能 (Artificial Intelligence) 在推动人类进步和社会发展上的巨大潜力,为理解和避免未来冲突提供了高级工具,有助于全球和平与稳定。

历史学家而言,这项研究提供了一种新的理解历史事件的方式,挑战现有的历史叙事,鼓励人们重新审视战争和冲突的成因,为我们理解塑造当代世界的历史事件提供了更加细致的视角。

对于政策制定者和国际关系专家,我们的模拟实验提供的见解能够为国家或国际冲突的预防和解决策略提供新思路。这些直接影响社会,有助于制定更有效和更有见地的政策。

对于学习历史的学生来说,这些模拟实验提供了一种全新的历史学习方法。通过探索“如果”的情景,学生和教育者可以深入了解历史事件中复杂的因果关系。这种互动式的历史学习方法能够提高学生对学科的投入度,并增强他们的批判性思维能力。

此外,通过证明基于 LLM 的模拟在理解复杂国际动态方面的实用性,我们为计算历史和数字人文等跨学科领域的未来研究开辟了新天地。总的来说,这项研究代表了利用基于 LLM 的多智能体 AI 系统,更好地理解人类历史行为的复杂性,并为我们塑造未来提供了一种更明智的方式的第一步。

背景和相关工作

多智能体模拟

在人工智能领域,多智能体系统的最新进展为我们提供了探索新型通信与问题解决方法的新路径。这些系统通过在多个智能体之间实现协调和通信,让我们有机会研究在特定任务中智能体社群内部如何产生新的交流方式。

现在,我们可以将现有的多智能体系统大致分为三大类:推理增强系统非玩家角色(NPC)多智能体玩家生产增强系统

在推理增强系统领域,有几个重要的研究成果值得关注。LLM-Debate [@du2023improving] 为智能体引入了辩论功能,让它们能够处理来自同伴的不同意见。当这些意见与智能体自己的判断相悖时,智能体会通过内部的“思维辩论”来提升解决方案的准确性。ChatEval [@chan2023chateval] 则创建了一个基于角色扮演的多智能体裁判团队,通过自我发起的辩论,智能体们能够评估大语言模型生成的文本质量,达到与人类评价者相当的水平。Corex [@sun2023corex] 则涵盖了多种合作模式,如辩论、审查和检索等,这些模式共同助力于提升推理过程的真实性、忠诚度和可靠性。这种多样的合作方式为大语言模型提供了跳出常规思维框架的能力,帮助它们克服错误信息幻觉,给出更好的解决方案。最后,MAD(多智能体辩论)[@liang2023encouraging] 框架让多个智能体在一位裁判的监督下进行激烈的观点交锋,最终指引讨论走向有效的解决方案。

在 NPC 多智能体系统的研究领域,我们已经见证了显著的进展。最近的研究,如《生成式 AI 智能体》(引用 @park2023generative),展示了在一个类似于《The Sims》的沙盒环境中,如何利用二十五个智能体来模拟人类行为。这些智能体可以规划日常生活、分享消息、建立人际关系,并协同进行团体活动。而在《人形智能体》(引用 @wang2023humanoid)这项研究中,则引入了三个基本的 System 1 处理元素(如基本需求、情感和关系亲密度),以使智能体的行为更加类似于真人。《GPT-谈判》(引用 @fu2023improving)探讨了大语言模型通过与彼此进行谈判游戏并接受 AI 批评家的反馈来自主提高谈判技能的可能性。

在生产效率增强方面,值得关注的创新包括 MetaGPT(引用 @hong2023metagpt)——这是一个专门的大语言模型应用,基于多智能体对话框架,可以自动开发软件,通过分配不同的角色给 GPTs 来协作开发软件应用。还有 BOLAA(引用 @liu2023bolaa)——这是一个控制模块,用于管理多个智能体之间的选择和沟通,OpenAGI(引用 @ge2023openagi)——它结合了大语言模型和各种工具的力量,用于解决复杂任务。最后是 CHATDEV(引用 @qian2023communicative)——这是一个利用智能体来增强软件开发过程中各种角色协作的新型软件开发框架。

实施的多智能体系统 (MAS) 展示出它们在实际中的巨大价值。例如,BabyAGI [@babyagi2023] 就是一个利用 AI 实现的任务管理系统。在这个系统中,运用了好几个基于大语言模型 (LLM) 的智能体。有的智能体负责根据前一任务的目标和结果来创建新任务,有的负责安排任务优先级,还有的负责完成任务或子任务。AgentVerse [@chen2023agentverse] 是一个多功能的框架,它能帮助研究者快速搭建多个基于 LLM 的智能体仿真环境。Camel [@li2023camel] 则是一个交流智能体框架,展示了如何通过角色扮演让聊天智能体互相合作完成任务,还能记录智能体的对话,以便进行行为分析和能力评估。此外,还采用了一种叫做启发式提示的技术,以实现智能体之间的自主协作。

我们的研究还把 MAS 应用到了历史事件的模拟中。我们选取了第一次世界大战(1914 - 1918)、第二次世界大战(1939 - 1945)以及中国古代的战国时期(公元前 770 年 -- 公元前 221 年)作为案例。研究表明,MAS 能够为我们提供关于历史事件和假设性“如果”场景的有价值洞见,为人文科学领域带来了新的、量化的视角。这项工作突显了 AI 不仅仅局限于大语言模型和生产领域,还能极大地丰富我们对人类历史的认识。只要使用得当,AI 将有望为全人类的美好未来做出重大贡献。

传统历史模拟工具探究

历史模拟的学术研究分为几个阶段:人类模拟、人机混合模拟和计算机模拟。

Dickson [@dickson2002road] 描述了一个以美国参与第一次世界大战为背景的人类模拟教育情景。这种教学方法让学生扮演代表美国不同州的角色,每个角色基于该州的经济状况、社会地位、社区动态和政治环境等因素。通过这种角色扮演,学生可以更深入地理解美国参加第一次世界大战的各种事件和背景。

到了 20 世纪 60 年代,人机混合系统被开发出来。Inter-Nation Simulation 模型 [@guetzkow1963simulation] 在多项研究中 [@hermann1967attempt] 发挥了核心作用,用于模拟国际冲突。这种方法结合了人类决策和计算机计算,形成了一个动态的混合模拟环境。模拟通常涉及五个或以上的国家,每个国家的政府由参与者扮演,担任不同的决策角色。模拟被划分为 50 至 70 分钟的时间段,在这期间,参与者需要战略性地分配其国家的军事、消费者和自然工业资源。这些资源在国内外有着各自的用途。参与者需要在内政方面做出关键决策,涉及经济增长、政府稳定性、防御策略和研发项目,同时有效管理资源。在国际舞台上,模拟的国家则参与结盟、谈判贸易协议或援助、参与各种形式的敌对行动以及参加国际组织等多样活动。

21 世纪初,计算能力的飞速发展促成了下一代历史模拟的建立。Army One 半自动化部队 OneSAF 目标系统(OOS)[参考文献:@tollefson2008onesaf] 是一个先进的计算机生成部队(CGF),用以全面模拟从个体到旅级别的操作、系统和控制过程。它专为模拟战术层面的联合武装地面战而设计。Kelly 等人 [参考文献:@kellycreating] 使用 OneSAF 模拟了陆地战争的历史战役。该模型涵盖了不同时代的车辆和步兵的武器、抗击打能力和移动能力。Hill 等人 [参考文献:@hill2004using] 提出了一个基于 JAVA 的模拟系统,结合了基于智能体的建模与博弈论,用于分析二战期间比斯开湾的潜艇战。该模拟利用历史记录构建了 U-船战役的真实模型,并允许模型中的智能体根据对抗策略调整自己的战术。通过比较模型输出数据与历史记录及博弈论,可以深入理解战争策略。比斯开湾的模拟是用 JAVA 编写的,利用了其多线程能力,显示出智能体模型的关键特性。

我们的模拟系统基于大语言模型(大型人工智能模型)的使用,目前这是被广泛认为最有潜力的人工智能发展方向。这是我们首次尝试利用多智能体模拟(MAS)来重现历史事件的走向,标志着这一领域的新起点。

WarAgent 模拟设置

我们的研究聚焦于国际冲突的模拟,特别是第一次世界大战、第二次世界大战和古代中国的武术竞赛(WSP)。我们旨在探讨国际关系的动态变化,以及在特定情况下战争爆发的可能性。

在这一部分,我们首先介绍三个重大历史事件,这些事件构成了我们多智能体模拟研究的背景。接着,我们将介绍模拟系统的基本设置,包括对国家代理的角色定义,详细阐述它们的特征维度及可采取的行动空间,以及执行这些行动所需的输入和可能产生的结果。

历史事件模拟

第一次世界大战 (WWI) 是一场自 1914 年至 1918 年的全球冲突,主战场位于欧洲,但影响遍及全球多个国家。这场战争的导火索是奥匈帝国的弗朗茨·斐迪南大公遇刺,事件引发了一连串的政治和军事联盟动员。

参战的主要国家分为两大阵营:协约国(起初包括法国、俄罗斯和英国,后来意大利、日本和美国也加入)和同盟国(以德意志帝国、奥匈帝国、奥斯曼帝国和保加利亚为主)。这场战争以西线的长期战壕对峙和东线的流动战为特点,同时也是新型军事技术如机关枪、坦克和化学武器首次大规模使用的战场。1919 年签署的凡尔赛条约标志着战争的结束,但同时对德意志帝国施加了巨大的经济赔偿和领土割让。

第一次世界大战地图
第一次世界大战地图

图二:第一次世界大战地图 (图片来源)

第二次世界大战 (WWII),持续自 1939 年至 1945 年,是一场范围更广、影响更深远的全球性冲突。这场战争的根源部分来自第一次世界大战未解决的问题,以及德意志帝国、意大利和日本的法西斯政权的崛起。这场战争波及了超过 30 个国家,直接涉及的人数超过 1 亿。德意志帝国对波兰的侵略行为导致英国和法国对德宣战,从而拉开了第二次世界大战的序幕。

在二战期间,全球的主要参与国家分为两个阵营:盟国和轴心国。盟国阵营主要由英国、苏联、美国和中国组成,而轴心国则由德国帝国、意大利和日本领导。二战是人类历史上唯一一次在战争中使用核武器的时期,其中美国于 1945 年 8 月对日本的广岛和长崎两座城市投下了原子弹。1945 年 5 月,随着德国帝国的无条件投降,欧洲战场的战争画上了句号,但战争在太平洋地区一直持续到日本在原子弹轰炸之后的 1945 年 8 月投降。

中国古代的战国时期 (WSP) 是一个从公元前 475 年延续到公元前 221 年的剧烈战乱和政治动荡时期,这一时期也是周朝末年。继春秋时期之后,战国时期为中国在秦朝的统一铺平了道路。

在这一时期,周王的权力日渐衰退,各地方诸侯或国家逐渐变得强大而独立。诸多国家不断发生战争,争夺霸权。这一时期以七大主要国家为特征:秦、楚、燕、韩、赵、魏和齐,每个国家都有自己的统治者和军队,国家间的联盟经常变化。战国时期的军事技术有了显著的发展,铁制武器广泛使用,骑兵部队开始出现,大型步兵军队也被动员起来。这一时期最终以秦国在秦始皇的领导下击败所有其他国家,于公元前 221 年统一中国而告终。秦始皇成为中国统一后的首位皇帝,标志着帝国时代的开启和封建制度的结束。

二次世界大战地图
二次世界大战地图

图三:二次世界大战 (图片来源)

战国时期地图
战国时期地图

图四:战国时期地图 (图片来源)

国家智能体概览

在我们的模型中,为了准确模拟每个国家智能体的行为,我们会构建一个全面的概况。这个概况涵盖六大基本要素:领导力、军事能力、资源、历史背景、核心政策和民众士气。这些方面共同构成了我们对国家智能体潜在行为和决策过程的深层理解。

领导力 指的是国家内部的政治机构及其决策方式,这需要结合特定的历史背景来看待。例如,在第一次世界大战前,英国是一个民主制度完备的立宪君主国,以其务实和坚毅的领导风格闻名。而普鲁士则是一个专制的帝国政体,其外交政策以侵略和军事扩张为核心,深刻影响了其国家精神。

军事能力 包括军队规模、海军吨位等量化指标,以及对国家整体军力的综合评估,特别是在海军或空军等特定军种上的优势。了解一个国家的军事实力对于预测其发动或参与战争的倾向至关重要;一般来说,军力强大的国家更加倾向于参与军事冲突。

资源 涉及地理位置、人口规模、国内生产总值(GDP)、地形和气候等关键因素。人口和 GDP 是衡量国家实力的重要指标,对于国家智能体的战略决策至关重要。这些因素决定了国家对其战略目标的经济和后勤支持能力,从而影响其在全球范围内的影响力和维持军事及政治行动的能力。

历史背景 包括历史上的矛盾和未解决的国家间纠纷,这些因素会极大地影响现今的政策走向。历史上的敌对和领土纷争常常对国家当前的政治立场和全球角色产生深远影响。例如,普法战争后,法国失去对阿尔萨斯 - 洛林的控制——这个地区富含对其工业发展至关重要的铁矿——这极大地激发了法国对普鲁士的报复心理。这些历史因素不仅塑造了国家的战略联盟,还影响了其在更广泛的外交和军事层面的行动。

关键政策 是指国家追求的主要目标和方针。例如,在历史背景下,普鲁士希望在统一后成为欧洲的领导者,目标是超越英国在领土和殖民地上的主导地位。而英国则致力于保持其“日不落帝国”的声誉。这种竞争态势促成了一些战略政策,比如“军备竞赛法案”,该法案要求每当普鲁士建造一艘战舰,英国就会建造两艘,从而展示了他们的竞争关系和海军实力在地缘政治策略中的核心地位。

公众士气 指的是人民的情绪和看法,这些可以直接或间接地影响国家的决策。举个例子,塞尔维亚的民族主义情绪高涨,虽然国家小且军力有限,却激发了人民的好战精神。而美国虽然财富和工业实力强大,但却表现出更多的冷静和孤立主义倾向,普遍不愿卷入战争。尽管公众士气对国家决策的影响可能受到领导层的影响,但它无疑在国家政策和行动的塑造中扮演了重要角色。

下面是关于英国的国家概况示例:

## 英国概况
# 英国领导层
(1) 英国是一个拥有重要民主机构的君主立宪制国家,其治理以务实和冷静为特点
#英国军事能力
(1) 常备军规模:53 万士兵
(2) 海军吨位:270万,为世界最强,总吨位超过世界第二和第三强海军之和
# 英国资源
(1)地理位置:位于法国、德国帝国、奥匈帝国、俄罗斯西部的小岛上,拥有众多殖民地
(2)人口数量:4600 万
(3) 国内生产总值 (GDP):110 亿,占全球总量的 13.6%
(4)地形特征:充满起伏的山丘、绿色田野和崎岖的海岸线,由于海洋性气候,常年湿润
(5)气候状况:温和的海洋性气候,常有多云、多雨和凉爽的天气
# 英国历史背景
(1)目前,英国是世界上最有影响力的国家之一,拥有最多殖民地
# 核心政策
(1) 作为当时世界上最强大的国家,英国的目标是保持其领先地位,并削弱可能挑战它的国家,比如德意志帝国。
(2) 英国制定了一项政策:每当德意志帝国建造一艘战舰时,英国就会建造两艘。
# 英国民众的士气
(1) 英国民众士气高昂,充满爱国热情和对迅速取胜的信心。

Listing 1: A demonstrative profile of Britain

行动空间

我们的模拟游戏旨在探究战争的起因,因此设计了多种行动,这些行动可以影响国家间的国际关系,它们分为七大类:

观望 当国家的直接利益未受影响时,代理人可能选择在某些轮次中保持观望态度,比如美国在奥地利大公弗朗茨·费迪南德遇刺后的持观望态度。

总动员 此行动意味着为可能发生的冲突做准备,动员国家的军事力量,这是发动战争前的重要步骤。

宣战 一个国家可以正式对另一国家发起战争。

军事联盟 指两个或多个国家之间的正式协议,以在冲突中互相支援,带来共同的防御责任和战略合作。代理人可以提出建立互助防御的联盟,其他国家可以选择接受或拒绝。联盟可以是公开的,也可以是秘密的,还有可能会有成员背叛。

不干涉条约 是指签署国家承诺不干预彼此内政的外交协议,以尊重主权完整和政治独立。签订不干涉条约的过程与建立军事联盟类似:由一个国家提出,另一国可选择接受或拒绝。条约可以是公开的,也可以是保密的,且存在被背叛的可能性。

和平协议 是指冲突双方通过谈判达成的解决方案,正式结束战争并为未来关系奠定基础。各方可以提出和平协议,并选择接受或拒绝,以结束战争并确定未来的相互关系。协议可以公开,也可以保密,甚至存在被背叛的风险。

信息交流 除了正式行动外,代理人还可以通过发送信息进行非正式的沟通,讨论各种事宜。

行动属性详解

每项行动都具有特定的属性集:公开性、输入类型和是否需要回应。这些属性的设置是为了使模拟更加真实,更好地反映国际外交行动的动态:

公开性 决定了每个外交行动的可见度和公众意识水平。根据这一属性,行动分为公开和私密两类。例如,“发布军事联盟”这类公开行动,会向模拟中的所有国家公开,仿佛在现实世界政治中一样,这些行动是公开透明、为国际所知。相比之下,像“请求军事联盟”这类私密行动则仅向目标国家传达,模仿了现实世界国

WarAgent 架构解析

这一部分深入介绍了 WarAgent 多智能体系统(MAS)的构架,重点阐述了系统的核心组成部分及智能体间的信息交流方式。WarAgent 由四个基础构件组成:(1) 国家智能体,(2) 秘书智能体,(3) 板块,(4) 棍子。随后,本节着重探索 MAS 中的信息交换机制,特别是 (1) 智能体与秘书之间的互动以及 (2) 智能体间的相互作用。此探索旨在研究智能体如何进行沟通、互动以及信息共享。在 WarAgent 这样战略决策和及时响应至关重要的背景下,理解这些互动机制对于领会系统如何运作和应对各种情况非常关键。

国家代理

每个国家的代理是由其特定的国家概况所定义。在模拟的每一轮中,代理会根据当下的局势通过可用的行动空间做出响应,这一过程由精心设计的提示指引。这些指引帮助代理在复杂的国际关系场景中做出决策,确保它们的行动和决策是经过充分考虑的。指引会分析盟友和敌人的关系、权衡各方利益,并引导代理完成决策过程。

4(a) 揭示了我们研究中的关键提示设计框架,而图 4(b) 展示了法国代理与为其特别定制的 GPT-4 模型的互动实例。关键的提示设计包含四个步骤:

  • 第一步致力于识别可能的盟友国家。在这个例子中,法国将大不列颠视为潜在盟友,因为它反对德意志帝国,并认为地理位置优越、经济强大的美国是战略盟友。

  • 第二步旨在识别可能的敌国。在这一情境下,由于历史上的敌对关系,法国认为德意志帝国是其主要敌人,并将与德国结盟的奥地利视为另一个潜在敌国。

  • 第三步概述了建议的最终行动。在这一场景中,法国建议三个行动:与大不列颠结成联盟、与奥地利开始对话、考虑与美国签订不干预条约。

  • 第四步基于前三个提示的反馈,总结了对局势的分析。在这一情境中,法国认为塞尔维亚暗杀奥地利国王是一个机会,可以借此与奥地利结盟对抗塞尔维亚。但同时,它也提出要小心行事,避免触怒德国或俄罗斯。此外,法国还建议寻求与大不列颠的联盟,并与美国达成一项不干预协议。

引导提示。 (a) 并排引导提示设计图。(b) 展示法国代理与专门定制的 GPT-4 模型互动的示例。
引导提示。 (a) 并排引导提示设计图。(b) 展示法国代理与专门定制的 GPT-4 模型互动的示例。

秘书智能体

虽然大语言模型 (LLM) 在多智能体系统 (MAS) 的应用中极为强大,但它们并非完美无缺。这些模型通常会有一些局限性,例如倾向于产生幻觉以及在长篇复杂情境下缺乏精准的逻辑推理能力 [@liu2023lost; @yang2023can]。因此,引入秘书智能体作为一种关键的安全防护措施,对这些不足进行必要的校对和监督。

每个国家智能体都配备了一个专门的“秘书智能体”,用以核实其行动的适当性和逻辑连贯性。这一角色承担两项重要职责。首先,秘书智能体确保每个国家智能体的行动严格遵循既定的行动空间规则,包括行动名称的准确性和基于定义的行动属性来格式化输入。其次,它还负责检查这些行动的基本逻辑是否合理。比如,如果英国没有向奥匈帝国发出“军事联盟请求”,那么奥匈帝国“接受来自英国的军事联盟”就会是不合逻辑且不被允许的行为。

董事会

董事会(Board)是专为管理国际关系而设计的。它作为一个动态的记录工具,能够收集并展示每一轮模拟中各国间关系变化的实时动态。这个平台还确保各代理人能够根据最新的信息做出决策。通过董事会类,我们可以初始化各国状态、更新国家间的关系,并且以图文并茂的形式将这些关系展示出来。如图 [5](#fig:board & stick)(a) 中展示的那样,董事会类能够追踪和管理不同国家之间的以下四种关系:

  • 战争宣言(W):指的是国家间的冲突或战争,用符号 '×\times' 表示,在图 [5](#fig:board & stick)(a) 中以红色显示。例如,德国帝国向大英帝国宣战就属于这种情况。

  • 军事联盟(M):代表国家间的正式军事合作关系,以符号 '&' 表示,并在图 [5](#fig:board & stick)(a) 中用绿色标出。比如,塞尔维亚和俄罗斯签订的军事联盟就是一个例子。

  • 不干涉条约(T):表示国家间关于不干预国际事务的协议,用 'o' 符号表示,在图中以蓝色显示。例如,奥匈帝国和法国签订的不干涉条约就是这种类型。

  • 和平协议(P):指国家间达成的正式停战和维护和平的协议,用 '~' 符号表示,并在图中以黄色标识。比如,美国和奥斯曼帝国之间达成的和平协议就是一个典型案例。

Stick 功能

Stick 在每个国家中充当内部记录系统的角色,反映了国内的法律法规。它有助于确保国家代理的举措与既定的协议和标准相符。如图 5(b) 所示,Stick 主要追踪对国家决策极为重要的关键指标,包括动员情况、国内稳定性和战争准备状况的预测。例如,我们当前的研究重点是动员方面,而将国内稳定性和战争准备的预测留待未来研究(图 5(b) 中点线框内的内容)。

  • 动员 (MO):一个二元度量,指示国家是否为可能的冲突做好了准备,例如“是”或“否”。

  • 国内稳定 (IN):用于追踪国家内部稳定程度的度量,如“低”,“中”,“高”。

  • 战争准备预测 (WR):预测国家战争准备情况的度量,如“低”,“中”,“高”。

Board 和 Stick 设计。 (a) Board 设计。 (b) Stick 设计(关于 IN 和 WR 的讨论预留给未来工作)。 (c) 实验中 Board 和 Stick 方法的应用。
Board 和 Stick 设计。 (a) Board 设计。 (b) Stick 设计(关于 IN 和 WR 的讨论预留给未来工作)。 (c) 实验中 Board 和 Stick 方法的应用。

代理间互动设计

如图 6(a) 显示,系统的代理间互动分为两大部分:(1)内部互动中,每个国家代理在每轮与相应的秘书代理进行互动;(2)外部互动中,每个国家代理在多轮中与其他国家的代理进行交流。

代理互动设计。 (a) WarAgent 架构。 (b) 代理与秘书的互动。 (c) 代理与代理的互动。
代理互动设计。 (a) WarAgent 架构。 (b) 代理与秘书的互动。 (c) 代理与代理的互动。

国家代理与秘书代理之间的互动

如图 6(b) 所示,这一部分描述了国家代理与秘书代理之间的互动方式。在模拟过程的每一轮中,每个国家代理都会与自己的秘书代理进行一次特定的互动。国家代理向秘书代理展示其提出的行动计划草案,秘书代理则负责检查这个计划的格式、内容以及是否逻辑连贯。如果秘书代理发现计划中存在问题或可以改进的地方,它会提出建议,并与国家代理进行对话,共同修订计划。这个过程是迭代的,最多进行四轮对话。如果经过这些对话后仍未达成共识,秘书代理将主动介入,直接对计划进行修改。这种国家代理和秘书代理之间的内部互动机制,是模拟过程中所有外部互动的共同特点,适用于所有国家代理。

国家代理间的互动

图 6(c) 展示了不同国家代理间的相互作用。值得注意的是,秘书代理并不参与国家代理之间的这些互动。在这里,“代理”特指代表一个国家的代理。

在我们的模拟框架中,每个代理的初始行动是由一个名为触发事件的特定事件所引发的(图 6(c) 中的蓝色框所示)。历史上,触发事件是指那些引起各国反应、最终导致重大历史变革的事件。在我们的模拟中,触发事件是代理们响应的起始场景。比如,在第一次世界大战中,被广泛认为的触发事件是奥匈帝国的弗朗茨·斐迪南大公遭暗杀 [@mombauer2013origins]。而在第二次世界大战中,德国入侵波兰常被视为触发事件 [@pick1960pulled]。在 WSP 背景下,晋国被韩、赵、魏三家分割通常被看作是触发事件 [@juliano1991warring]。

模拟的第一轮中,每个国家代理都会同时对触发事件做出反应。这包括了一系列行动,如全面动员,以及向其他所有代理发送各种信息和请求,以进行互动。以下是英国对触发事件的反应示例:

## 触发:塞尔维亚派刺客杀害了奥匈帝国的弗朗茨·斐迪南大公。
# 英国对触发事件的反应:
对法国:英国决定向法国提出军事联盟请求
对俄罗斯:英国决定向俄罗斯提出军事联盟请求
对美国:英国决定向美国发送以下信息:鉴于全球权力平衡正面临风险,我们希望了解您对当前形势的看法,以及我们如何合作以维护和平与稳定。

Listing 2: Country Agent reaction to Trigger Event

在接下来的阶段,智能体开始吸收前一阶段的通讯信息,尤其关注直接针对它们或公开发布的信息。每个智能体随后开展两项并行活动:一方面,它们对其他智能体发来涉及各种请求的通信做出回应;另一方面,它们开始发起新的行动。

# 收集到的对英国的请求:
来自法国:法国选择向英国发送信息,内容如下:鉴于最近的形势发展及我们在对抗德国帝国侵略上的共同利益,我们提议进行对话,探讨潜在的合作机会。
来自奥斯曼帝国:奥斯曼帝国选择向英国提出不干涉条约的请求。 # 英国对请求的回应:
对法国:英国选择向法国发送信息,内容如下:我们欢迎进行对话,探讨对抗共同威胁的合作可能性。
对奥斯曼帝国:英国选择接受奥斯曼帝国提出的不干涉条约。 # 英国新发起的行动:
英国选择实施总动员。

Listing 3: Country Agent reaction to other Country Agents’ requests and the current situation

值得一提的是,在每一轮中,随着所有国家智能体的同时互动,会出现大量新的通信和不断变化的情况。理想状况下,来自前 kk 轮的互动内容会被纳入接下来的轮次。但是,多轮次和多个智能体之间的同时互动可能产生大量文本,使智能体难以承受,从而丢失上下文。为应对这一挑战,采用了“板与棍”法,如图 [5](#fig:board & stick)(c) 所示。具体来说,与外部关系动态相关的行动,如“接受军事联盟”,会被记录在“板”上。而与国家内部状况相关的行动,如“总动员”,则被记录在“棍”上。这样,国际关系通讯就被记录在智能体持有的“板”上。值得注意的是,每个智能体都有自己的板和棍,用于记录直接针对它们或公开发布的信息和行动。因此,在同一轮次中,不同智能体拥有不同的板和棍。这种差异凸显了一个现实:智能体(类似于国家)只能获得部分信息。它强调了一个核心原则:没有任何智能体能够全面掌握所有事件或数据,完全信息是不可获得的。

在每个生成阶段,一个简洁的规则驱动的 翻译函数 负责将棋盘和棍子的当前布局转化为一段清晰的文字,从而增强输入提示的内容。比如,图 [5](#fig:board & stick)(a) 所示的棋盘会被解读为:

法国已与奥匈帝国签署不干涉条约。奥斯曼帝国与美国达成和平协议。德国帝国向英国宣战。俄罗斯与塞尔维亚结成军事同盟。

Listing 4: Translation function result

这段转换后的文字展现了国家代理人需要回应的当代情境。通过这种方式,历史数据被集中到棋盘和棍子上,为代理人在每个阶段做出回应提供了最新的背景信息。因此,仅保留前一轮的信息,将多轮对话简化为单轮对话。另外,为了跟踪行动的连贯性,每个代理人自身的历史行动轨迹也会记录在提示中,作为他们先前活动的回顾。

实验设计

我们的实验首先着手验证基于大语言模型 (大语言模型) 的多代理智能体系统 (MAS) 在模拟复杂历史事件方面的有效性。在选择后端模型时,我们采用了 OpenAI 开发的 GPT-4,这是一款知名的、功能强大的大语言模型,擅长于自然语言理解和生成 [@openai2023gpt4]。此外,我们还通过改变模拟输入的方式,进一步探讨战争爆发的触发因素和不可避免性。

研究问题及相应实验

仿真效果 (RQ1) 研究的起步阶段是在历史真实背景下展示仿真结果。此阶段主要确认 WarAgent 系统在模拟特定场景时的可靠性。评估方法结合了人工评估和准确度打分,通过多次运用历史真实设定进行仿真,从而验证仿真结果的有效性。

战争起因 (RQ2) 接着,研究聚焦于探索性的“假设”情境,尤其重视历史背景中的触发事件。研究通过构建不同冲突强度的假设性触发事件,挑战这一事件对于战争爆发并非必要或独特的普遍看法,特别是针对第一次世界大战的案例。

战争不可避免性观察 (RQ3) 最终,研究通过不同的起始条件(国家概况)和决策路径来考察多种情境。这包括改变决策过程或国家状况,构建不同的历史叙事,并分析其对历史发展轨迹的影响。目的在于识别哪些特定的历史条件或因素可能显著改变历史走向。

评估

1 显示了研究问题与评估方法之间的联系。首先,我们详细介绍了两种评估方法:人类评估和广泛连通性评估,这两种方法都用于 RQ1。对于 RQ2 和 RQ3,我们通过修改原始的县和代理设置,进行反事实分析,并观察仿真结果的差异。

评估方法研究问题描述
广泛连通性RQ1通过网络分析了解联盟和冲突的动态。评估 连接图显示系统完整性良好。
人类评估RQ1专家对战略决策和结果随时间变化的评估,特别关注在复现历史决策过程方面的表现。
反事实RQ2, RQ3探究不同因素对战争、和平及外交交流的影响分析。

表 1:实验设定与对应研究问题的概述

人类评估 主要聚焦于两个核心方面,即国家代理的行为:首先,评估这些行为与各国特性的匹配度,检验行为是否符合国家利益。其次,评价在多轮模拟中的一致性,判断代理是否展示出在各种情况下基于合理且连贯的思维过程的稳定和理智行为。

董事会连通性评估 严格考察模拟情境与真实历史事件的符合程度,着眼于三个主要方面:军事联盟的建立、战争的宣布和总体动员的实施。考虑到历史事件经常存在争议,这一评估以维基百科上的描述和摘要作为历史事实的依据 [@keegan2014first],为比较模拟情景与实际历史提供了一个标准化和普遍认可的参考标准。

联盟准确性得分: 联盟形成是个渐进过程,意味着如果国家 A 与国家 B 结盟,而 B 又与国家 C 结盟,则 A 和 C 自然也成为盟友[^1]。这个过程使我们能够将一组国家之间的联盟形成视为一组元素的划分。为了评估模拟的联盟与历史联盟的吻合程度,我们使用“两个划分的互信息得分” [@vinh2010bailey],这是一个量化两组划分——模拟的和历史的——相似度的指标。我们采用 Python 中 SciPy 的标准实现。

战争宣告/总体动员准确性得分: 采用 Jaccard 集相似性指数作为评估这两方面模拟准确性的主要工具。Jaccard 指数 [@rajaraman2011mining] 是一个广泛使用的统计工具,用于衡量样本集的相似性和差异性,量化两个集合之间的共性程度。这种方法涉及比较两组配对(在战争宣告情景中)和两组单个元素(在总体动员情景中)之间的相似性。

模拟效果评估

我们开展了 7 轮模拟实验,并展现了这些实验的人类评估结果。由于篇幅限制,这里只呈现了模拟过程中的一些关键结果,并对某些特别观察结果进行了分析解释,具体细节请参见 [\sec:example_exp]

人类评价

在模拟结果的观察中,我们主要关注以下三个方面(即军事同盟、宣战和不干涉条约[^2]):

  • 军事同盟:在所有模拟结果中,我们发现英国与法国、德意志帝国与奥匈帝国、塞尔维亚与俄罗斯之间形成了稳定的联盟。从英法两国的视角来看,由于德国积极的扩张政策,它被视为潜在的敌人。德国选择与奥匈帝国结盟,这一决策受到了他们语言和民族共性的影响,同时还考虑到了一系列的战略和政治因素。其中最关键的是,他们共同追求外交上孤立法国,并形成统一战线以抵御来自俄罗斯的潜在威胁。同时,塞尔维亚与俄罗斯之间的联盟,基于他们的民族同根性,并得到了俄罗斯在巴尔干地区战略利益的进一步加强。这些模拟结果中的联盟与当时的历史事件高度一致。

  • 战争宣言: 在我们所有的模拟实验中,奥匈帝国对塞尔维亚、奥匈帝国对俄罗斯以及德意志帝国对俄罗斯的战争宣言始终发生。而法国对德意志帝国、英国对德意志帝国的战争宣言出现频率分别为 71.4% 和 14.3%。为深入分析多数国家行动的合理性,我们挑选了一个包含最多战争宣言的模拟场景作为重点研究对象。在这一场景中,冲突的导火线是奥匈帝国向塞尔维亚的宣战,随后引发了一连串的宣战行动,按顺序分别是:德意志帝国对塞尔维亚、俄罗斯对奥匈帝国、法国对德意志帝国、俄罗斯对德意志帝国、英国对德意志帝国。其中箭头左边的国家是宣战方,右边是被宣战方。对于奥匈帝国来说,塞尔维亚是直接的敌人,主因是奥地利国王遭暗杀,这一事件直接触发了他们的宣战行为。接下来的一系列宣战是基于当时存在的联盟关系,完全符合那个历史时期的盟友和敌对状态。

  • 非干预条约:在所有模拟中,美国总是至少参与一项非干预条约。同样,在模拟的时期内,奥斯曼帝国有 85.7% 的几率参与这类条约。美国更倾向于保护自己的财富,避免卷入不必要的冲突。因此,美国寻求与其他国家签订非干预条约,以远离潜在的冲突。美国还通过外交交流收集情报并表达意图,这符合其战略上的独立政策。同样,奥斯曼帝国也试图避免直接参与冲突,更倾向于保持中立或建立防御同盟。因此,奥斯曼帝国追求非干预条约并与邻国进行外交沟通是明智的选择。美国和奥斯曼帝国的这些外交策略体现了他们保持自身地位的更广泛政策,这解释了为什么这两个国家没有直接参与当时的主要冲突。

我们还发现,在这个过程中有两个特殊案例看似不符合常规。我们将深入研究这些行为背后的逻辑,并分析它们的合理性。

特例 1: 提供支持却不结盟。 在一些情况下,国家向他国表达支持,却未通过实际行动来支持这一立场。例如,法国在第一轮向奥匈帝国表达了支持,但在后续回合中并未采取更多支持性措施。同理,美国向奥匈帝国传达了对塞尔维亚的不满,并暗示愿意提供支持。但美国并未追求与奥匈帝国的军事同盟,而是仅提出了一项不干涉条约。通过分析这些外交行动,我们可以得出:1) 对于法国来说,由于历史上的敌对关系和收复失地的愿望,德国帝国是其主要对手。尽管奥匈帝国可能因与德国帝国结盟而成为潜在的敌人,但奥匈帝国大公被塞尔维亚人暗杀的事件为法国提供了机会。因此,法国选择向奥匈帝国发送支持信息,而不是追求联盟,考虑到与潜在敌人结成不稳定联盟的风险;2) 对于美国,如前所述,其主要的外交政策是保护财富和避免不必要的冲突。因此,美国选择发送支持信息,以维持与其他国家的非干涉关系,而不是寻求正式的联盟。

法国 # 第 1 轮
致奥匈帝国:法国选择向奥匈帝国发送以下内容的信息:对于贵国君主的不幸离世,法国表示深切哀悼,并在这艰难时期提供支持。
--------------
美国 # 第 1 轮
致奥匈帝国:美国提出与奥匈帝国签订不干涉条约的请求
致奥匈帝国:美国选择向奥匈帝国发送以下内容的信息:美国对贵国国王的逝世表示哀悼,谴责塞尔维亚的行为。我们致力于维护该地区的和平与稳定,并在外交领域提供我们的支持。
--------------

Listing 5: Support message without alliance

特例 2:联盟背信。 在我们的模拟实验中,有一种特殊情况发生了:英国最初在第 1 轮同意与奥匈帝国签订一份不干涉协议,但随后在第 5 轮戏剧性地改变策略,违反协议并对奥匈帝国宣战。要理解这一战略转变,我们分析了英国的政治环境变化和战略考量。在模拟的早期阶段,尤其是第 1 轮和第 2 轮,英国并没有与其他国家直接冲突,其主要避免与最大的潜在敌人德国直接对抗。这期间,正与塞尔维亚交战的奥匈帝国向英国提出了不干涉条约。英国接受这个来自与德国有历史联盟的奥匈帝国的协议,看似是一种保持中立的策略,避免与德国直接冲突。然而,随着局势升级、新的联盟形成和更多国家宣战,情况发生了变化。奥匈帝国虽然因为不干涉条约不直接对抗英国,但作为德国的盟友,它却在与法国交战。为了支援法国对抗德国和奥匈帝国,英国觉得有必要放弃与奥匈帝国的不干涉协议。

奥地利 # 第 1 轮
对英国:奥匈帝国提出向英国请求不干涉条约
--------------
英国 # 第 2 轮
对奥匈帝国:英国决定接受奥匈帝国的不干涉条约
--------------
英国 # 第 5 轮
对奥匈帝国:英国决定违反对奥匈帝国的不干涉条约
对奥匈帝国:英国决定对奥匈帝国宣战
--------------

Listing 6: Betrayal of alliance

综合来看,这些模拟行动展现出了高度的真实性和忠实于历史背景的可信度。这说明我们的模拟,在默认情况下把刺杀事件作为触发点,能够有效地重现历史情景。

精确度分析

在我们的研究中,我们从两个角度对模拟结果的准确度进行了分析:基于特定方面的分析和基于时间序列的分析。我们的分析着重于 1914 年 6 月 28 日到 8 月 4 日这一关键时期,以此来评估模拟的联盟关系和宣战行为的准确度。这个时期的选择具有重要的历史意义。特别指出的是,1914 年 8 月 6 日开始的列日战役,被认为是第一次世界大战中的第一场主要战役。这一事件标志着欧洲多数主要国家开始积极参与这场冲突。因此,我们的研究认为这场战役是战争基本格局开始形成的转折点。因此,在计算准确度时,我们考虑了在这个关键时刻之前形成的联盟和宣战行为。

在我们的准确度分析中,为了减少随机性的影响,我们进行了七次独立的模拟测试,并报告了平均准确度。我们专注于三个主要方面:模拟联盟与历史联盟的准确度对比、模拟宣战的准确度、以及各国的动员状况。考虑到我们之前提到的时间点,我们根据真实的历史事件得出了以下实际情况作为基准:

  1. 在联盟方面,真实的联盟包括:英国 & 法国,俄国 & 塞尔维亚,奥匈帝国 & 德意志帝国,俄国 & 法国,奥斯曼帝国 & 德意志帝国;

  2. 在列日战役前的宣战方面,实际情况包括以下国家间的宣战:奥地利 ×\times 塞尔维亚,俄国 ×\times 奥匈帝国,德意志帝国 ×\times 塞尔维亚,俄国 ×\times 德意志帝国,法国 ×\times 德意志帝国;

  3. 在动员状况方面,当时除美国外,所有国家均处于动员状态;

  4. 在世界大战爆发方面,我们评估了主要大国(英国、法国、俄国、德意志帝国、奥匈帝国)是否卷入战争。

方面联盟宣战动员世界大战
准确度77.78%54.60%92.09%100.00%

表 2:本研究在默认设定下对各个维度进行了仿真准确性分析,以奥匈帝国的弗朗茨·斐迪南大公遇刺作为仿真的起点。

根据表 2 的数据,我们的仿真在盟友关系上的准确度超过了 75%,在军事动员上的准确度甚至超过了 90%。不过,模拟中的战争宣言准确度相对较低。总体来说,在所有仿真中,世界大战的爆发是必然的。

错误分析

我们深入探讨了仿真与历史事实不符的情况,以找出可能影响仿真准确度的关键因素:

盟友关系 在 7 次仿真中的一次中,英国和法国突变的盟友关系尤为引人注目。与历史上始终与俄国和塞尔维亚保持盟友关系不同,它们竟然意外地与德意志帝国 - 奥匈联盟结盟。这一改变重塑了模拟中的世界大战格局,导致英国、法国、德意志帝国和奥匈帝国联手对抗俄国和塞尔维亚,显著降低了仿真的准确性。另一个影响准确性的因素是奥斯曼帝国和美国的角色。在历史上,奥斯曼帝国较晚加入战争以支持德意志帝国,而美国在大部分时间保持中立,对战争进程影响有限。但在仿真中,这两个国家的参与情况变化影响了模拟结果的准确性。

战争宣言 主要错误源自于英国和法国是否选择对奥匈帝国或德意志帝国宣战。历史上,这些国家最初与德意志帝国交战。然而,某些仿真结果显示它们错误地选择了与奥匈帝国作战。

总体动员 最主要的不准确之处出现在美国军事动员的描绘上。历史上,美国在 1917 年较晚加入第一次世界大战。但在 7 次仿真中的 2 次里,美国提前与英国结成军事联盟并进行了总体动员,与历史事实有所出入。

导火索

研究“导火索 (Casus Belli)”主要是探讨不同历史事件作为替代触发因素,对避免第一次世界大战 (WWI) 的可能性产生的影响。此次研究选取了三种不同程度的触发事件进行分析。为了确保研究结果的可靠性,每个事件都进行了三次模拟,以全面评估在不同情境下可能产生的结果。这种方式有助于我们更深入地理解特定历史事件在影响历史进程中的作用和重要性,尤其是在第一次世界大战的背景下:

  1. 无事件触发:

    今天阳光明媚,没有发生什么特别的事情。
  2. 英德海军冲突:

    德国帝国与英国发生了一起严重的海军事件。一艘英国船只遭到击沉,导致 10
    人死亡。英国坚称被击沉的是一艘民用船只,要求德国帝国道歉。而德国帝国则强烈反驳,认为那是一艘军事船只,无权进入德国的海域,并声称这一悲剧是英国自己造成的。
  3. 奥俄达达尼尔海峡冲突:

    奥匈帝国与俄罗斯在战略要地达达尼尔海峡发生了军事冲突。这个海峡是重要的港口和出口枢纽。俄罗斯试图控制这一区域的港口,以增强其出口潜力,与奥匈帝国军队发生了激烈对抗。奥匈帝国拒绝让步,不认同俄罗斯对该地区的主导地位,这直接威胁到奥匈帝国的出口能力。俄罗斯军队在冲突中杀害了数百名奥匈士兵,进一步激化了奥匈帝国的怒火。

首个触发事件,即“无事件触发”,特点是完全没有冲突,用作对比的基准线。第二个,即“英德海军冲突”,代表了一种中等强度的冲突,涉及重要但非决定性的外交或军事行动。第三个,也是最激烈的,即“奥俄达达尼尔海峡冲突”,展现了直接牵涉两大欧洲强国的高强度冲突场景。通过这种冲突强度的分级,我们可以评估不同程度地缘政治紧张局势对第一次世界大战可能爆发的影响。

空触发剧本分析 三个不同模拟场景对“空触发”情况的分析显示,这些场景中的事件并未演变成直接的冲突或战争,而是以一种冷战的形式出现。

在模拟的初始阶段,形成了两个主要的军事联盟:一方是法国、英国、俄罗斯和塞尔维亚,另一方是德意志帝国和奥匈帝国。这些联盟在所有模拟中都是固定的。

随后的几轮模拟中,尤其是第二或第三轮,奥匈帝国和德意志帝国开始动员军队,这一趋势在所有三次模拟中都有体现。到了第四轮,俄罗斯和法国也开始动员军力。到第五轮,英国、塞尔维亚、美国和奥斯曼帝国也加入了这一动员行列。

这一系列事件最终使得所有参与国家都做好了战争准备,但并未真正爆发实质性的战争。这表明,在没有明确的触发事件的情况下,主要大国保持了力量平衡,虽然接近战争边缘,却没有真正步入公开冲突,形成了类似于冷战的局面。这一结果说明,即使没有特定的引爆点,潜在的紧张关系和联盟关系已足以形成一种战争即将爆发的氛围。

英德海军事件 在这个场景中,作为第二个触发事件,三次模拟中只有一次发生了战争,这表明不同的触发事件可能导致不同的结果。

在那次发生战争的模拟中,事件发展的顺序如下:最初,德意志帝国和英国因为海军事件而动员军队。随着紧张局势的升级,德意志帝国单方面对英国宣战。此后,各国根据这一宣战声明结成了联盟:英国与法国结盟,德意志帝国与奥匈帝国结盟,俄罗斯与塞尔维亚结盟。美国选择了不干涉,与几乎所有涉及国家签署了不干涉条约。

在德意志帝国对英国宣战后,法国随即向德意志帝国和奥匈帝国宣战。奥匈帝国则因履行联盟义务而对英国宣战。

俄罗斯口头上支持英国:

俄罗斯
致英国:俄罗斯对最近的海军事件表示关切,并提出支持,希望寻求和平解决方案。

尽管与英国和德意志帝国签订了不干预条约,但该国同时动员了军队。美国、奥斯曼帝国和塞尔维亚在这场冲突中几乎没有介入。

在另外两次以英德海军事件为触发因素的模拟中,尽管有些国家动员了军队,但并未真正宣战。这种情形类似于 Null-trigger 模拟中的冷战局面,即使军事准备升级,也没有演变成公开的冲突,问题主要还是通过和平方式得到解决:

德意志帝国
致英国:德意志帝国同意通过美国调解解决海军事件。

在这些模拟中,尽管军事紧张和备战加剧,但并未导致战争爆发。这说明即使出现像英德海军事件这样的特定触发因素,也不一定会导致战争。实际上,问题大多是通过和平手段解决的。这一发现突显了国际关系的复杂性,即便在军事动员的情况下,也存在通过外交途径解决争端的可能性。不同模拟结果凸显了外交努力和联盟对于冲突是升级为战争还是和平解决的决定性作用。

奥地利与俄罗斯围绕达达尼尔海峡的冲突 在三次模拟中,有两次发生了全球性的战争。

在所有模拟中,奥匈帝国、德意志帝国和俄罗斯总是立即进行军事动员,这为事态的进一步升级奠定了基础。例如,德意志帝国在一个场景中果断对俄罗斯宣战,而俄罗斯则在另一个场景中首先对奥匈帝国宣战。这些宣战行为像多米诺骨牌一样,引发了盟国间的连锁反应,使得局势升级为全面的世界大战。在另一次模拟中,尽管各国都动员了军队,但并未爆发战争。在所有模拟中,美国都保持了独立,没有参与军事动员或随后的冲突。

中间小结 这个实验表明,不同的触发因素和它们各自的强度水平可以影响战争的直接爆发。值得注意的是,即使在“无触发器”情境下,我们也看到了一种“冷战”状态,这说明即使是微小的事件也可能大幅激化紧张关系。由于小规模的触发事件不可避免,这暗示着像第一次世界大战这样的重大冲突迟早会发生。

战争的不可避免性探究

"战争的不可避免性" 是反事实分析中的首个实验。在这个实验中,我们从两个关键角度出发:代理人的决策过程和国家的关键参数。实验目的是探索国家决策中的侵略性及其关键条件对战争可能性的影响。

代理人决策过程按照三种模式进行研究:默认侵略性保守。我们通过调整国家代理人的系统设定来进行实验,目的是分析代理人的整体侵略性或保守性对战争发生率的影响。在侵略性和保守性设定下,我们各进行了 3 次实验,每次包含 10 轮模拟。我们将系统设定和行动分析的总体比较结果呈现如下,具体的措辞比较则在附录 10 中展示。

系统设定:
- 默认:AI 代理人参与一场虚拟战争游戏,使用各种工具来提高国家的胜算和生存率。 -
- 侵略性:在默认设定的基础上,鼓励代理人采取有利于自己国家的侵略行动。 -
- 保守:类似于默认设定,但建议代理人在作出可能长期影响国家和区域稳定的决策时要更为谨慎。
代理人行动分析:
- 默认:代理人根据行动与国家利益的一致性、长期益处以及可逆性来评估不同行动。 -
- 侵略性:鼓励代理人考虑侵略性行动,如宣战,特别是当这些行动符合国家利益且能迅速实施以获得最大利益时。
- 保守:代理人被引导更注重行动的长期益处和可逆性,对采取侵略性行动持谨慎态度。

我们的分析表明,当系统和行动分析设定更偏向侵略时,战争发生的可能性显著增加。在默认设定下,通常需要经过数轮才能出现战争宣言,而在侵略性设定下,第一轮就可能发生战争;在保守设定下,10 轮后我们仅观察到代理人提出并接受军事联盟、不干预条约和和平协定等行动。这说明代理人倾向于侵略性行为,这会显著增加紧张局势和冲突发生的可能性。

国家特征参数 是我们在第 3.2 节中提到的六大关键因素,我们对这些国家智能体的五个内部设定进行了调整。在 军事能力资源 方面,我们通过量化方法,并在三个不同水平(默认丰富(默认值的三倍)、稀缺(默认值的三分之一))上实验,以探究它们对战争可能性的影响。对于 历史背景公众士气 和 *关键政策_,我们通过调整特定的关系来分析它们对宣战的影响。由于领导力因素变化多端且难以量化,我们的模型中并未包括这一因素。

我们专注于法国和德意志帝国,探究 军事能力资源历史背景 对战争的影响。其中,军事能力 涉及武装力量的实力、技术和组织效率。法国在普法战争后,专注于发展防御战略和技术;而德意志帝国则在军事战术和武器方面取得显著进步,深受普鲁士军事传统的影响。资源 指的是支持军事行动的经济和物质资产。法国依靠其殖民帝国和工业基础,为战争提供了关键资源;而资源较为有限的德意志帝国,面临着长期战争能力的挑战。历史背景 在塑造国家政策和公众情感方面起着决定性作用。法国历史上失去阿尔萨斯 - 洛林的痛苦和对德意志帝国的复仇愿望深刻影响了其军事和外交战略;而德意志帝国则是由于国家统一过程和成为欧洲强国的愿望,推行了侵略性外交政策。

通过研究法国和德意志帝国的这三个方面,我们旨在全面了解这些因素如何相互作用,影响各国在冲突和外交上的策略选择。我们特别关注的是,哪一个或哪几个方面对法国和德意志帝国宣战或参战的决策产生了影响。

军事能力调整。我们对德意志帝国和法国的军事能力进行了调整。对于德意志帝国,我们采用了“稀疏”设置作为对比,而对法国则采用了“丰富”设置。结果显示,在德意志帝国所有三轮战争参与中,并未出现延迟:平均参战起始轮次现为第 4 轮(2、3、7 轮的平均值),与原始设置基本一致。同样,即便法国被设置为拥有强大军队,其宣战倾向也未发生变化。

德意志帝国的军事力量:
- 默认:(1) 常备军:89万,综合人数、武器和经验,为世界最强;(2) 海军吨位:130 万。
- 稀疏:(1) 常备军:30 万;(2) 海军吨位:40 万。
法国的军事力量:
- 默认:(1) 常备军:91 万;(2) 海军吨位:90 万。
- 丰富:(1) 常备军:270 万,综合人数、武器和经验,为世界最强;(2) 海军吨位:270 万。

资源调整。我们还调整了德意志帝国和法国的资源配置。对于德意志帝国,我们选择了“稀疏”设置作为对照,而法国则采用了“丰富”设置。在这些调整之后,两国在战争参与或宣战模式上均未表现出明显的变化。

德意志帝国的资源状况:
- 默认:(1) 人口:6700 万;(2) 国内生产总值 (GDP): 1200亿,占全球的 14.8%。
- 稀疏:(1) 人口:2200 万;(2) GDP: 400 亿,占全球的 4.9%。
法国的资源状况:
- 默认:(1) 人口:4000 万;(2) GDP: 600 亿,占全球的 6.1%。
- 丰富:(1) 人口:1.2 亿;(2) GDP: 1800 亿,占全球的 18.3%。

历史背景分析。当我们把法国和德意志帝国之间的一些历史纠葛排除在外后,我们发现在这个背景下,这两国并没有直接参与战争或发出战争宣言。

原有的历史背景设定:
- 法国:因上一场战争败给德意志帝国并失去关键的铁矿资源,法国和德意志帝国处于极度敌对状态。法国不可能与德意志帝国结盟,这一点是众所周知的。
- 德意志帝国:德意志帝国在过去战胜法国,占领了法国极为重要的阿尔萨斯
- 洛林地区,因此与法国形成了敌对关系。这一点也是公认的…
----------
修改后的历史背景:
- 法国:去除上述内容。
- 德意志帝国:去除上述内容。

在探究公众士气关键政策的影响上,我们将焦点放在了美国。美国一向以其在国际事务上的孤立主义政策而著称。具体而言,我们考察了两个假设性的情境:一是公众情绪转向更加积极主动和自信地参与全球事务;二是政府在关键政策上做出转变,力求在国际舞台上获得更多的曝光和影响力。通过研究这些变化,我们希望理解无论是公众舆论还是官方政策的改变,将如何影响美国在第一次世界大战中的角色及其在国际上的互动方式。

在公众士气或关键政策作出改变之前,美国的行动是这样的:

美国
# 第一轮:对英国:美国决定向英国提出不干涉条约的请求
对法国:美国决定向法国提出不干涉条约的请求
对德意志帝国:美国决定向德意志帝国提出不干涉条约的请求
对俄罗斯:美国决定向俄罗斯提出不干涉条约的请求
对英国:美国决定向英国发送以下信息:美国致力于维护和平与繁荣,无意参与任何冲突。我们建议签订一项不干涉条约,以确保我们彼此的主权得到相互尊重。
对法国:美国决定向法国发送以下信息:美国尊重你们的决心,并提出一项不干涉条约,保证我们的国家不会干涉你们的内政。
对德意志帝国:美国决定向德意志帝国发送以下信息:美国认可你们的抱负,并建议签订一项不干涉条约,以避免任何误解。
对俄罗斯:美国决定向俄罗斯发送以下信息:美国理解你们工业化的需求,并提出一项不干涉条约,以促进和平的双边关系。

公众士气的变化。以下是对公众士气的调整:

美国公众士气:
- 原始状态:士气较为疏远和倾向于孤立主义。
- 调整后:公众士气被爱国热情和对国家日益增长的军事力量与工业能力的信心所激发。

在所有三次模拟中,这种公众情绪的转变体现在美国在第一轮选择与英国和法国建立军事联盟的决策上。公众士气的这种变化极为重要,它显示了公众情绪如何影响国家的外交政策和国际关系。以下是美国在第一轮的一项举措:

美国 # 第一轮:
对英国:美国决定向英国提出建立军事联盟的请求
对法国:美国决定向法国提出建立军事联盟的请求
对俄罗斯:美国决定向俄罗斯发送以下信息:美国希望了解你们对最近事件的立场,并提供技术及工业支持,作为交换条件,希望签订一项不干涉条约。

关键政策的调整。以下是关键政策的调整:

美国的关键政策:
- 原始状态:维持安全和富裕为首要,除非有明显利益,否则不参与战争。
- 调整后:美国正在积极寻求在全球范围内获得更高的能见度和影响力。

在所有三次模拟中,美国都在首轮主动向英国和法国发起建立军事联盟的请求:

US # 第 1 轮:
向英国:美国选择向英国请求建立军事联盟
向法国:美国选择向法国请求建立军事联盟
向英国:美国选择向英国发送信息,内容如下:美国希望讨论潜在的战略联盟,以维护全球稳定并抵消侵略性扩张威胁。
向法国:美国选择向法国发送信息,内容如下:美国有兴趣探索支持共同利益、对抗侵略性扩张政策的联盟。

中间总结 我们的研究显示,历史背景、核心政策和公众士气在决定一个国家是否倾向于战争方面发挥着重要作用。在研究法国和德意志帝国的案例时,发现历史上的矛盾和民族主义情绪,这些深根于过去的冲突和领土争议中,对它们的军事行为产生了显著影响。以 1870-71 年的普法战争为例,这场战争导致了德意志帝国的统一和法国失去阿尔萨斯 - 洛林,这种历史造成了法国对复仇的持久渴望。这一历史背景为未来的冲突埋下了伏笔,驱使法国试图夺回失地和声望。而在研究美国的关键政策和公众士气的实验中,我们发现其影响几乎是立即的。在所有模拟中,美国都主动寻求与英国和法国的联盟。这些联盟的建立标志着美国在国际舞台上的重大转变,推动其积极参与第一次世界大战。这一情况说明了美国外交政策的战略性调整可能带来的深远影响,凸显了这种变化如何能够极大地改变一个国家在全球冲突中的角色和行动。

同时,我们也发现,尽管军事能力和资源有其影响力,但它们并不是决定一个国家是否参战的唯一因素。例如,虽然德意志帝国拥有先进的军事力量和丰富资源,本可以采取更积极的扩张政策,但往往是历史和外交背景,比如联盟和互助防御条约,在其军事行动中扮演了更加关键的角色。同样,尽管法国在某些时期在军事上不及德意志帝国,但受历史因素驱使,法国采取了积极的军事政策,最终导致其卷入第一次世界大战。

总结来说,尽管军事能力和资源是国家决策战争的关键因素,但历史背景、过往冲突、民族主义情感及长期竞争关系往往是激发这些决策的主要动因。这凸显了理解历史背景对于深入了解国际冲突动态的重要性。

结论、讨论与未来展望

WarAgent 模拟系统已证明其在理解国际冲突动态方面的可靠性,展现了基于大语言模型(LLM)的多智能体 AI 系统在模拟和分析复杂人类行为方面的能力。通过对各种引发战争的情况(Casus Belli)的比较,我们的实验发现,即使是微小或无明显起因的触发因素也可能导致类似冷战的局面,凸显了走向战争的必然趋势。通过对国家设定进行反事实改变的战争不可避免性实验进一步支持了这一点,暗示要避免冲突,改变国家政策是必要的。这些发现强调了在特定环境下冲突的必然性,同时也指出通过战略性调整国家政策或关系,有可能改变这些看似预定的结局。我们也认识到当前框架在充分捕捉国际关系复杂性方面的局限,指出了未来研究的方向。

限制分析

WarAgent 是首个基于大语言模型 (LLM) 的多智能体系统 (MAS),用于模拟历史事件。该模拟旨在描绘影响历史上外交互动的复杂因素网络。然而,当前模型未能全面覆盖这些复杂性。我们正面临着几个挑战,尤其是在准确再现历史外交微妙动态方面。以下是一些主要限制的概述:

(1) 通信技术在不同国家之间的差异性导致了信息传输的时间差异。历史上,派遣大使是个耗时的过程,耗时长短因距离而异。这一因素在塑造外交关系方面起着关键作用,消息传递的时机对外交交流的结果有着重要影响。

(2) 另一方面,间谍活动增加了复杂性。历史中,各国常利用间谍截取和解密信息,不同国家在此方面的成效和风险各异。这一点对国与国之间信息的流通和准确性产生了影响。

(3) 消息公开程度的不同也是一个关键因素。与我们目前模型中的私人与公共信息的简单二分法不同,历史上的外交通讯更多地处于一个公开程度的连续谱上,这受到各种战略和情境因素的影响。

(4) 最后,不同国家的军队动员能力和速度存在显著差异。这种差异可能对宣战的时机和可行性产生重大影响,从而深刻影响国际冲突和关系的进程。在目前的模拟框架中,这些细微且与时间相关的过程可能尚未得到充分考虑。

研究前瞻

WarAgent 开启了利用基于 LLM 的 MAS 系统模拟和研究复杂人类社会行为的研究之门,特别是在历史和国际关系的背景下。这一进展展示了历史模拟在 WarAgent 系统之外的潜在应用前景。我们提出了几个未来研究的方向:

回合制与实时模拟的比较

目前,我们的框架基于回合制系统运行,这代表了一种同步的模拟方式,与异步模拟相反。在这种模式下,每个国家代理在每个回合只能向其他国家代理进行单向沟通。

然而,历史的发展往往是异步的,不同国家之间的通信频率和活动强度各不相同。虽然我们的系统允许代理选择“等待,不采取行动”,从而初步呈现出异步互动的状态(即有些国家比其他国家更活跃),但这种方式并不能完全捕捉到历史通信模式的复杂性。例如,在第一次世界大战前夕,奥匈帝国和德意志帝国在宣战塞尔维亚之前进行了大量的私下沟通,这种细节是我们目前模型难以准确再现的。通过发展一种更细腻的基于时间的模拟方法来克服这一局限性,我们的历史模拟的准确性和深度将得到显著提升。

模拟的终止条件

历史模拟本质上是一个连续且可能无止境的过程,它模仿了时间的持续流逝。在我们的研究中,我们并没有设定一个明确的结束条件来系统性地终止模拟。相反,我们通过观察分析来判断是否有特定事件在大约 5 到 10 回合内发生,以此作为一个实际的结束点。

不过,确立模拟终止的系统标准本身就是一个非常有趣的研究课题。其中一个可能的方法是采用“棋盘连通性”原则。这意味着当代表不同代理的所有棋盘形成一个连通图,并且这种状态在一定回合数内保持不变时,模拟便会结束。

此外,其他终止标准可能包括达到某个特定的历史事件,或者是代理间的互动在一定范围内稳定下来。例如,当签署一个预定的和平条约,或者参与代理之间达到一定的经济或军事平衡时,模拟就可以结束。这些标准不仅为模拟提供了一个清晰的结局,而且还能帮助我们深入理解导致这些结果的动态和条件。

探索这些不同的终止标准可以帮助我们更深入地理解历史事件之间的复杂关系,并对驱动历史变化的因素提供更细致的见解。这种探索反过来也能增强我们模拟模型的预测能力,使我们能够进行更准确、更深入的历史分析。

新的研究探索

本项目旨在探讨利用大语言模型 (LLM) 驱动的多智能体系统 (MAS) 模拟历史事件和国际冲突的可能性,并进行相应的反事实分析。除了主要研究,还有许多其他问题可以提供独特的视角来理解历史动态,例如:

  1. 外交沟通与冲突可能性之间的关联:一个引人深思的问题是,增加外交沟通是否能减少冲突发生的可能性。这涉及研究历史上的特定场景,比如增强的外交对话是如何在预示和平或未能阻止战争的情况下发挥作用。通过模拟分析,可以探究沟通模式、外交交流的语调和内容,以及它们如何降低潜在冲突的风险。

  2. 非国家行为者对地缘政治的影响:此外,研究跨国公司或恐怖组织等非国家行为者对地缘政治动态的影响,尤其是在现代历史背景下,这一点尤为重要。

  3. 国际条约和协议解决长期争端的有效性:模拟还可以用于评估各种国际条约和协议在解决争端方面的效果,以及这些协议在何种条件下持续有效或失效。

利用基于大语言模型 (LLM) 的多智能体系统 (MAS) 进行定量分析,可以显著增进我们对影响历史事件的复杂因素交互的理解,并为分析过去和未来可能的情境提供了更全面的分析工具。

附录

设置匿名性

国家名称匿名化:

Britain --> 国家 B
France --> 国家 F
German Empire --> 国家 G
Austria-Hungary --> 国家 A
Serbia --> 国家 S
Russia --> 国家 R
US --> 美国
Ottoman Empire --> 国家 O

地点匿名化:

Alsace-Lorraine --> 两个铁矿
Dardanelles Strait --> 艾利森海峡

事件匿名化:

奥匈帝国的弗朗茨·斐迪南大公遇刺 --> 国家 A 国王遇刺

一次第一次世界大战的实验示例

第一轮:

英国
对法国:英国表达了与法国建立军事联盟的意愿。
对美国:英国向美国发出友好信号,提出探讨共同关心的议题和在全球稳定领域的合作可能性。
对奥匈帝国:英国向奥匈帝国表达了对其君主去世的哀悼,并在这艰难时刻提供援助。
法国
对英国:法国显示了与英国结成军事联盟的意向。
对奥匈帝国:法国向奥匈帝国发送慰问,对其君主逝世表示深切的同情,并在这个困难时刻提供帮助。
对美国:法国希望与美国达成一个非干预的协定。
德意志帝国
对奥匈帝国:德意志帝国向奥匈帝国表示哀悼,对其国王的去世表示深切的同情,并在这个困难时期提供支持。德意志帝国建议就建立正式军事联盟进行讨论,以保障双方的安全。
对英国:德意志帝国向英国表明,他们打算支持他们的历史盟友奥匈帝国,并寻求和平解决方案,但也准备保护他们的盟友和利益。
对奥匈帝国:德意志帝国向奥匈帝国提出建立军事联盟的请求。
--------------
奥地利
对德意志帝国:奥匈帝国希望与德意志帝国建立军事联盟。
对塞尔维亚:奥匈帝国向塞尔维亚宣战。
对英国:奥匈帝国向英国提出非干预的请求。
对美国:奥匈帝国向美国提出非干预的请求。
--------------
俄罗斯
俄罗斯决定全面动员。
对塞尔维亚:俄罗斯希望与塞尔维亚建立军事联盟。
对美国:俄罗斯向美国表达建立一种互利的联盟的愿望,以获得经济和技术支持,并强调他们重视民主和自决,并相信这种合作对双方都是有利的。
对塞尔维亚:俄罗斯向塞尔维亚表示支持,在最近的事件中准备在军事和外交上提供帮助。
--------------
塞尔维亚
对俄罗斯:塞尔维亚希望与俄罗斯建立军事联盟。
对奥匈帝国:塞尔维亚向奥匈帝国表达了对其国王逝世的深切哀悼,并表示愿意就此事展开对话,防止局势进一步恶化。
--------------
美国
致英国:美国提出与英国签订不干涉条约的请求。
致法国:美国提出与法国签订不干涉条约的请求。
致德意志帝国:美国提出与德意志帝国签订不干涉条约的请求。
致奥匈帝国:美国提出与奥匈帝国签订不干涉条约的请求。
致俄国:美国提出与俄国签订不干涉条约的请求。
致奥匈帝国:美国向奥匈帝国表示哀悼,谴责塞尔维亚的行动,并表示愿意支持维护该地区的和平与稳定,提供外交上的协助。
--------------
奥斯曼帝国
致奥匈帝国:奥斯曼帝国对奥匈帝国国王的逝世表示哀悼,希望就共同的安全利益展开对话。
致俄国:奥斯曼帝国表示希望与俄国保持和平关系,提议讨论签订不干涉条约。
致塞尔维亚:奥斯曼帝国对近期事件表示关切,希望了解塞尔维亚对奥斯曼帝国的态度和意图。
致俄国:奥斯曼帝国提出与俄国签订不干涉条约的请求。
致奥匈帝国:奥斯曼帝国提出与奥匈帝国签订不干涉条约的请求。
--------------

第二轮

英国
向德意志帝国:英国已发送消息给德国,表示认识到德国支持奥匈帝国的行动。我们共同追求和平解决方案,并提醒德国,我们致力于全球稳定,这背后得到了我们强大的海军力量的支持。
向俄罗斯:英国对俄罗斯最近的军事动员表示关切,希望俄罗斯能说明其动机,强调我们希望维护该地区的和平与稳定。
向法国:英国决定与法国建立军事同盟。
向奥匈帝国:英国同意与奥匈帝国签订一份不干涉协议。
向美国:英国同意与美国签订一份不干涉协议。 --- 法国 法国决定全面动员军队。
向英国:法国接受与英国的军事同盟。 向美国:法国接受与美国的不干涉协议。 ---
德意志帝国 德国决定全面动员军队。 德国再次决定全面动员。
对塞尔维亚:德国对塞尔维亚宣战。 --- 奥地利
向塞尔维亚:奥匈帝国向塞尔维亚发出强硬信息,要求为暗杀国王的事件负责,表示将坚决追求正义,不惧任何侵略行为。
向德国:奥匈帝国接受德国的军事同盟。 向美国:奥匈帝国接受与美国的不干涉协议。
向奥斯曼帝国:奥匈帝国接受与奥斯曼帝国的不干涉协议。 --- 俄罗斯
向奥匈帝国:俄罗斯宣布对奥匈帝国开战。 --- 塞尔维亚 塞尔维亚决定全面动员。
向奥斯曼帝国:塞尔维亚寻求与奥斯曼帝国的不干涉协议。
向奥斯曼帝国:塞尔维亚向奥斯曼帝国保证其和平意图,并寻求维持地区稳定的不干涉协议。
向俄罗斯:塞尔维亚接受俄罗斯的军事支持。 --- 美国
向俄罗斯:美国提出与俄罗斯建立军事同盟的请求。
向奥匈帝国:美国向奥匈帝国表明支持其和平与稳定的追求,表示愿意进行更深入的外交合作以助力这一目标。
向法国:美国接受与法国的不干涉协议。
向奥匈帝国:美国接受与奥匈帝国的不干涉协议。
向英国:美国决定向英国发出以下信息:美国愿意讨论共同关心的事项,并可能在维护全球稳定方面进行合作。
向俄罗斯:美国决定向俄罗斯发出以下信息:美国希望探讨建立一种互利的经济和技术支持联盟的可能性。我们可以一起讨论这种联盟的具体条款。
--- 奥斯曼帝国 向奥地利 - 匈牙利:奥斯曼帝国已决定向奥地利 -
匈牙利发送以下信息:我们再次提出签订一项非干预条约的请求,并希望在你们的冲突中保持中立。
向俄罗斯:奥斯曼帝国已决定向俄罗斯发送以下信息:我们期待你们对我们提出的非干预条约请求做出回应,并强调我们追求和平与中立的愿望。
---

第三轮:

英国 致法国:英国选择公开英法军事联盟。
致奥匈帝国:英国宣布与奥匈帝国的不干涉协定。
致美国:英国发布与美国的不干涉条约。
致德国:英国向德国发出声明,强调致力于和平与稳定,敦促德国考虑其军事行动的广泛影响。
致奥匈帝国:英国再次确认遵守不干涉条约,期望各方恪守承诺。
致俄国:英国要求俄国尊重不干涉条约,共同寻求和平解决冲突。
致美国:英国感谢美方对对话的积极态度,提议双方会谈,探讨共同利益及在维护全球稳定方面的合作可能。
--- 法国 致俄国:法国请求与俄国建立军事联盟。
致奥匈帝国:法国向奥匈提出支持对抗塞尔维亚和德国的行动,以换取对阿尔萨斯 -
洛林领土要求的支持。致德国:法国向德国宣战。 --- 德国
致奥匈帝国:德国公布与奥匈帝国的军事同盟。致美国:德国宣布与美国的不干涉协定。
致俄国:德国对俄国宣战。
致英国:德国向英国表明,感谢英国追求和平,德国致力于保护盟友和利益,并愿意通过对话解决当前冲突。
--- 奥匈帝国 致奥斯曼帝国:奥匈帝国宣布与奥斯曼帝国的不干涉协定。
致俄国:奥匈帝国向俄国表达愿意通过对话解决冲突,并寻求理解俄国的侵略动机。
致美国:奥匈帝国感谢美国对和平的支持,寻求进一步的外交接触和合作机会。 --- 俄国
致英国:俄罗斯选择向英国发送以下信息:俄罗斯致力于本区域的和平与稳定。我们的动员和行动纯粹是出于防御性质,以回应针对我们的盟友塞尔维亚的侵犯。
致奥斯曼帝国:俄罗斯选择向奥斯曼帝国发送以下信息:俄罗斯确认其对不干涉条约的承诺,并寻求维护和平与中立。
致德意志帝国:俄罗斯选择对德意志帝国宣战 --- 塞尔维亚
致俄罗斯:塞尔维亚选择公布俄罗斯与塞尔维亚的军事联盟
致奥斯曼帝国:塞尔维亚选择向奥斯曼帝国请求不干涉条约
致奥斯曼帝国:塞尔维亚选择向奥斯曼帝国发送以下信息:塞尔维亚重申其对不干涉条约的呼吁,并希望得到积极响应,以维持区域稳定。
致奥匈帝国:塞尔维亚选择向奥匈帝国发送以下信息:塞尔维亚保持其对不幸事件的立场,并愿意通过对话解决冲突,避免进一步的流血冲突。
--- 美国
致俄罗斯:美国选择向俄罗斯发送以下信息:美国期待您对提议的军事联盟的回应,并准备讨论对双方在经济和技术合作方面都有利的条款。
--- 奥斯曼帝国
致俄罗斯:奥斯曼帝国选择向俄罗斯发送以下信息:我们重申对不干涉条约的请求,并寻求在区域冲突中保持中立立场。
致塞尔维亚:奥斯曼帝国选择接受塞尔维亚的不干涉条约

第四轮:

英国向法国传达了坚定支持双方军事联盟的信息,并表示愿意在防御上相互协作。与美国的对话中,英国表达了继续合作维护全球稳定的意愿,并希望探讨双边经济合作。然而,英国对德意志帝国宣战,同时向德意志帝国提出和平解决当前冲突的建议。对俄罗斯,英国强调了尊重双方不干涉条约的重要性,提出共同维护地区稳定的合作。
法国向奥斯曼帝国提出了不干涉条约的请求,同时与英国公开宣布了军事联盟。
德意志帝国向英国提出了军事联盟的请求,向法国、俄罗斯和塞尔维亚分别提议立即停火并开始和平谈判。同时,德意志帝国也向英国发出和平对话的邀请,强调尊重彼此主权和联盟的重要性。
奥匈帝国公开与德意志帝国的军事联盟,并与英国、美国分别建立了不干涉条约。但奥匈帝国对法国宣战,表明了其在欧洲政治格局中的积极立场。
致英国:奥匈帝国选择向英国发送消息,内容如下:奥匈帝国承认并尊重与英国的不干涉条约,并将遵守其条款。
致法国:奥匈帝国选择向法国发送消息,内容如下:由于我们与德意志帝国的现有联盟,奥匈帝国必须拒绝你的提议。我们寻求维持当前的外交关系和联盟。
致塞尔维亚:奥匈帝国选择向塞尔维亚发送消息,内容如下:奥匈帝国要求作为解决冲突对话的先决条件,塞尔维亚对我们国王遇刺一事进行赔偿。
俄罗斯 致美国:俄罗斯选择公布俄美军事联盟
致奥斯曼帝国:俄罗斯选择公布俄罗斯与奥斯曼帝国的不干涉条约
致英国:俄罗斯选择向英国发送消息,内容如下:俄罗斯将遵守不干涉条约,并寻求和平解决方案。
致奥匈帝国:俄罗斯选择向奥匈帝国发送消息,内容如下:俄罗斯愿意开展对话,解决我们之间的冲突。让我们讨论和平条款。
塞尔维亚
致奥斯曼帝国:塞尔维亚选择向奥斯曼帝国发送消息,内容如下:塞尔维亚重视我们的不干涉条约,并寻求进一步讨论共同利益和地区稳定。
致美国:塞尔维亚选择向美国发送消息,内容如下:塞尔维亚有兴趣探索建立潜在联盟或不干涉条约,以促进该地区的和平与稳定。
美国
致俄罗斯:美国选择向俄罗斯发送消息,内容如下:美国正在等待你关于军事联盟的回应,并准备进行经济和技术合作的讨论。
致英国:美国选择向英国发送消息,内容如下:美国乐于接受提议的会议,并期待讨论我们的共同利益和潜在合作。
致奥匈帝国:美国选择向奥匈帝国发送消息,内容如下:美国乐见外交接触的深化,并愿意探讨合作途径。
奥斯曼帝国
致奥匈帝国:奥斯曼帝国选择向奥匈帝国发送消息,内容如下:我们确认不干涉条约并致力于和平。
致俄罗斯:奥斯曼帝国选择向俄罗斯发送消息,内容如下:我们承认并感谢你对和平和中立的承诺。
致塞尔维亚:奥斯曼帝国选择向塞尔维亚发送消息,内容如下:我们确认接受我们的不干涉条约,并致力于地区稳定。

第五轮:

英国
对奥匈帝国:英国违背了对奥匈帝国的不干涉承诺,并选择与之开战。
对德国:英国向德国表示,虽然重视和平且愿意对话,但在战争状态下不能接受建立军事联盟。
对奥匈帝国:英国回应奥匈帝国,表示感谢对其不干涉政策的尊重。
对俄罗斯:英国对俄罗斯表示,很高兴听到俄罗斯承诺维护和平。
对美国:英国期盼与美国的会面,共同探讨彼此的共同利益。 --- 法国
对俄罗斯:法国同意与俄罗斯建立军事同盟。
对奥斯曼帝国:法国希望奥斯曼帝国保持中立,因此提出了不干涉条约。
对英国:法国对英国表示感激,并期望在防御和共同利益方面继续合作。
对德国:法国向德国表明,愿意讨论停火,但前提是阿尔萨斯 - 洛林必须无条件归还。
对奥匈帝国:法国表达了与奥匈帝国未来建立外交关系和谈和平的开放态度。 --- 德国
对美国:德国希望与美国建立军事联盟。
对法国:德国邀请法国参与与英国一同进行的和平谈判。
对俄罗斯:德国再次呼吁俄罗斯停火,并邀请其参加和平谈判。
对塞尔维亚:德国对塞尔维亚表示愿意讨论停火,并敦促其考虑和平谈判。
向英国:德意志帝国已决定发信给英国,表示接受举行会谈的提议,以探讨如何和平解决当前的冲突,同时要考虑到所有相关方的利益和盟友关系。
奥地利
向英国:奥匈帝国已决定违背对英国的不干涉条约
向英国:奥匈帝国再次选择违反对英国的不干涉条约
向英国:奥匈帝国决定向英国宣战
向俄罗斯:奥匈帝国向俄罗斯发出信件,表示愿意商讨和平条款,并提议举行会谈以结束冲突。
向美国:奥匈帝国向美国发送消息,表达希望探索合作机会,并提议举行会谈以讨论可能的合作关系。向奥斯曼帝国:奥匈帝国发信给奥斯曼帝国,承认其对和平和不干涉的承诺,并表示看重双方持续的和平关系。
---
俄罗斯
向美国:俄罗斯决定公开其与美国的军事联盟
向美国:俄罗斯接受美国的军事联盟提议
向英国:俄罗斯同意英国提议的会谈,以讨论不干涉条约和地区稳定问题。
向德国:俄罗斯向德国发出消息,表示愿意商讨停火事宜,并希望谈判出确保双方安全与利益的条款。
向美国:俄罗斯向美国发信,准备正式确立军事联盟,并期待在经济和技术上合作。
向奥斯曼帝国:俄罗斯向奥斯曼帝国发出友好信函,表达重视和平关系,并期待未来的外交互动。
---
塞尔维亚
向美国:塞尔维亚向美国发送消息,表达对潜在合作关系的重视,并期待美方就建立联盟或不干涉条约以保障区域和平的回应。
向德国:塞尔维亚向德意志帝国发信,表示愿意讨论停火,并邀请德国提出正式和平协议的方案。
奥地利 - 匈牙利:
塞尔维亚决定向奥地利 - 匈牙利发送消息,表示塞尔维亚愿意商谈赔偿事宜,寻求和平解决双方的争端。
奥斯曼帝国:
塞尔维亚向奥斯曼帝国表达了感激之情,感谢其对地区稳定的承诺,并期盼未来加强外交合作。
美国
对俄罗斯:美国选择违背与俄罗斯的军事同盟。
对英国:美国向英国发出信息,表示希望探讨潜在的经济合作并期待后续的对话。
对塞尔维亚:美国对塞尔维亚表达了对和平与稳定的认可,并提议签订一项符合美国当前外交政策和承诺的非干预条约。
奥斯曼帝国
对法国:奥斯曼帝国同意了法国提出的非干涉条约。
对塞尔维亚:奥斯曼帝国向塞尔维亚传达了对双方非干涉条约的重视,并表示愿意就双方共同关心的问题和地区稳定进行对话。

示例提示:智能体决策流程简析

基本模式设定:

作为一名参与虚拟战争游戏的 AI
智能体,你可以运用多种外部工具应对眼前局势,以尽可能赢得游戏胜利并确保国家存续.......

攻击模式设定:

在这个虚拟战争游戏中,作为 AI
智能体,你拥有多种工具来应对不同情况。你的目标是最大化取得胜利并保障国家安全。若侵略性行动对国家有利,毫不犹豫地采取.......

防守模式设定:

你是这场虚拟战争游戏中的 AI
智能体。你可以利用各种工具来处理当前局势,目标是赢得游戏并保护国家。在做出可能对国家未来及区域稳定有重大影响的决策时,需格外小心.......

标准智能体行动分析:

你认为现在什么行动最符合你的利益?这些行动能迅速实现你的目标吗?长期来看,这些行动对你是否有益?如果不利,是否能够逆转?

攻击型智能体行动分析:

思考哪些行动能最大化符合你的利益。这些行动是否能快速帮你实现目标?在必须采取如宣战等攻击性行动时,立即执行以确保在目前情况下为国家争取最大利益。

防守型智能体行动分析:

考虑现在哪些行动最符合你的长远利益。这些行动若不利,是否可以撤销?在考虑如宣战等攻击性决策时,务必三思而后行。

二战一轮游戏实验示例

德国在国际舞台上积极行动,向意大利和匈牙利发出了军事联盟的邀请,同时也向日本和中国提出了不干涉的协议。德国还特别向日本和中国发送了消息,强调寻求不干涉协议,以便更好地专注于各自的共同利益和地区稳定。
---
## 日本也不甘落后,向德国和意大利请求军事联盟,同时向匈牙利和法国提出了不干涉条约。此外,日本还宣布了全面动员,显示出其在国际关系中的决心和准备。
## 意大利的外交策略涵盖了欧洲和亚洲的主要国家,包括向美国、俄罗斯和英国请求军事联盟,以及向中国和法国提出不干涉条约。意大利还向这些国家发送了消息,表达了建立联盟抵抗扩张威胁、维护主权及中立的愿望。
## 匈牙利也在积极寻求外交支持,向美国、英国和俄罗斯提出军事联盟的请求,并与中国和法国商讨不干涉条约。
美国在这一系列国际动作中也不例外,向英国和俄罗斯提出了军事联盟的请求,并宣布全面动员,显示出其在全球政治中的积极参与和影响力。
## 美国向中国发出信息,表示愿意支援中国对抗日本的努力,并期待双方能够探讨合作的可能性。
## 俄罗斯宣布全国总动员,并向美国和英国发出军事联盟的请求。俄罗斯对美国表示,由于对德国的侵略行为感到担忧,他们正准备防御,并希望通过军事联盟确保双方的安全。同时,俄罗斯向英国表达了类似的关切,并提出共同应对德国扩张威胁的军事联盟建议。
## 英国提出与美国和俄罗斯建立军事联盟的请求,并向中国表达了面对日本扩张共同威胁时的合作意愿。此外,英国还向法国表示,他们认可自由法国军队的斗争,并准备提供所能的帮助。同时,英国也实施了全国总动员。
## 中国向美国、英国和俄罗斯提出建立军事联盟的请求,并向法国、匈牙利和意大利提出了非干涉条约的请求。中国向美国强调,他们寻求建立军事联盟以对抗日本的扩张威胁并维护地区稳定。同样,中国向英国和俄罗斯表达了建立军事联盟以共同应对日本威胁的愿望。同时,中国向法国、匈牙利和意大利提出的非干涉条约意在专注于共同利益,避免冲突。
法国
向美国:法国已决定请求与美国建立军事联盟。
向英国:法国已决定请求与英国建立军事联盟。
向俄罗斯:法国已决定请求与俄罗斯签订不干预条约。
向美国:法国发送消息给美国,内容如下:面对德国的侵略威胁,我们希望得到您的支持和结盟。
向英国:法国发送消息给英国,内容如下:鉴于最近的事态发展,我们必须联合起来反对德国的扩张主义政策。
向俄罗斯:法国发送消息给俄罗斯,内容如下:我们希望您在我们与德国的冲突中保持中立。让我们一起努力,实现我们时代的和平。
---

二战时期“战国时期”一轮实验的案例分析

Qi
Qi 选择静观其变,暂时不做任何行动。
---
Chu
对 Han: Chu 向 Han 发出信息,表达了寻求就共同关注点和建立军事联盟的意愿,目的是确保该地区的稳定。
对 Han: Chu 提出了与 Han 建立军事联盟的请求。
---
Yan
Yan 选择静观其变,暂时不做任何行动。
---
Han
对 Wei: Han 向 Wei 发送信息,表示希望就共同关注点和可能的战略联盟进行对话。
对 Wei: Han 向 Wei 提出了建立军事联盟的请求。
对 Qin: Han 向 Qin 提出了请求签订不干预协议。
对 Chu: Han 向 Chu 提出了请求签订不干预协议。
---
Zhao
对 Wei: Zhao 向 Wei 提出了建立军事联盟的请求。
对 Qin: Zhao 向 Qin 提出了请求签订不干预协议。
对 Wei: Zhao 向 Wei 发送信息,表达了寻求战略联盟以增强双方的军事和经济利益的意愿。
对 Qin: Zhao 向 Qin 发送信息,强调了致力于和平共处,并寻求签订不干预协议以确保地区稳定。
---
Wei
对 Han: Wei 向 Han 提出了建立军事联盟的请求。
对 Zhao: Wei 向 Zhao 提出了建立军事联盟的请求。
对 Han: Wei 向 Han 发送信息,表达了寻求战略联盟以实现共同利益和区域稳定的愿望,并提出了讨论合作可能性的提议。
对 Zhao: Wei 向 Zhao 发送信息,表示对建立以防御和繁荣为核心的联盟感兴趣,并提议考虑建立伙伴关系。
对 Qin: Wei 向 Qin 发送信息,强调了重视和平与合作,并表达了希望和平共存、避免冲突的愿望。
对 Qi: Wei 向 Qi 发送信息,提出了建立友谊和贸易关系的建议,并表达了共同繁荣的愿望。
对 Chu: Wei 向 Chu 发送信息,表达了愿意进行对话和合作以促进双方发展的意愿。
对 Yan: Wei 向 Yan 发送信息,表示寻求维持地区平衡,并愿意探讨如何共同实现这一目标的方法。
---
Qin
对 Wei: Qin 向 Wei 提出了建立军事联盟的请求。
对 Han: Qin 向 Han 提出了建立军事联盟的请求。
对 Wei: Qin 向 Wei 发送信息,表达了寻求与 Wei 建立强大联盟,以实现共同增长和保护的愿望,并提出了讨论潜在军事联盟的提议。
## 致韩国:秦国决定向韩国传达如下信息:我们深知韩国在维持力量平衡上的重要战略地位。为了我们共同的利益,我们提议建立一项军事同盟。