冲突、合作与和谐的博弈哲学（二）-北京语言大学新闻网

冲突、合作与和谐的博弈哲学（二）

发布时间：2008-10-16　　新闻来源：中国学术论坛赵汀阳　

4．艾克斯罗德实验

罗尔斯实验老谋深算却无助于解决问题，而艾克斯罗德实验很天真却令人鼓舞——有趣的是，艾克斯罗德实验中也正好是天真胜过老谋深算。艾克斯罗德1980年做过一个试图理解合作出现的必要条件的计算机实验[8]，艾克斯罗德的初始状态不需要诸如“无知之幕”这样的不正常条件，当然，它仍然不够真实，比如，博弈各方被假定为能力相等，而且不可能消灭对手而只能在得分上胜过对手。不过艾克斯罗德实验是比较仿真的，它不要求博弈者是理性的，甚至不一定是“利益最大化者”。仿真性使艾克斯罗德实验具有明显吸引力。

艾克斯罗德设想了这样的博弈环境：（1）博弈者是多样的，理性或不理性，谨慎或投机，善良或邪恶，一切动机和心态都是可能的；（2）博弈回合相当多；（3）参赛博弈者也相当多；（4）博弈几乎可以不择手段，可以不断变招。于是比较接近真实的“人性人”游戏而不是经济学家们喜欢的“理性人”游戏。

实验是全体混战的循环赛，参赛的14个策略由“足够精明的”各种专家分别设计，每轮200回合，5轮共12万回合。可以选择“合作”或者选择“背叛”，双方合作则各得3分，双方背叛各得1分，一方背叛而另一方合作则背叛5分而合作0分。背叛的回报相当大，与真实生活的情况类似。比赛结果出人意料，一个具有善良、宽容和公正等优良品质的“一报还一报” 策略（TFT）以明显优势胜出。TFT策略非常简单：第一步选择合作；从第二步开始就模仿对方上一步的选择。这意味着：首先是善良，从不先背叛；其次是公正，如果对方背叛就进行回击；然后是宽容，一旦对方改正错误，就马上重新合作。而那些不成功的策略都太想占便宜了，总是主动背叛。在比较成功的策略群与比较不成功的策略群之间存在着明显的得分差异鸿沟，比较成功的前8名策略都是善良的，所有不成功的策略都是与人为敌的。艾克斯罗德对这个太过美丽的结果不放心，第二次实验使参赛策略增加到62个。第一实验的结果事先公开，第二实验的策略设计者们都知道TFT的优势，可是大多数人还是宁可设计更复杂的敌意策略，可见大多数人多么希望多占便宜而不惜伤害他人。第二实验的结果仍然是TFT等善意策略胜出。这个实验被认为或多或少证明了“好心有好报”。

这虽是人们的梦想，但经验事实并非如此。当理论与实际不符，肯定是理论出了问题。艾克斯罗德实验所以能够证明“好人笑在最后”，其中一个原因是其“杀不死”假定：每个博弈者可能失败（得分低），但不可能被消灭（杀死）。这个与真实世界不符的规定不能正确表达人生命运。这是现代学术司空见惯的失误：人们为了实验效率，总是把实验设计成一个容易计算但不真实的可能世界，这虽是理论允许的，但理论世界至少应该对于真实世界是一个可通达的可能世界，否则原理不能通用。艾克斯罗德实验与罗尔斯实验都存在这个困难，都改变了某些必要的存在论条件而使实验世界与真实世界不相通。采取了“杀不死”假定，生死游戏弱化成输赢游戏，博弈不再严重，命运不再严肃。杀不死等于永远还有机会卷土重来，这就限制了不择手段竞争的威力，所谓背叛就只能占到小便宜，从而造成善良策略具有博弈优势的假象。

假如取消“杀不死”假定，重新规定为，当博弈者由于选择合作而遭受n次背叛（n次0分）就算被“杀死”，情况就会更接近真实世界。可以推想：在这个生死博弈中还是会有一些善良合作者最后获得胜利，但也有一些合作者被吃掉。这是个危险的信息，当一些合作者发现这个问题，就会选择“不出头”、“搭便车”甚至蜕变成背叛者。“坏人”占便宜的信息会使“好人”退化，这是一个真实难题。在艾克斯罗德的实验中，博弈者之间不能交流经验，即使可以交流，博弈策略也不会因此改变（因为程序是设计好了的），好人即使总是吃亏也将坚持只做好人，因此好像回避了这个困难，可是真实生活并不能回避这个困难。可以看出，艾克斯罗德的实验结果并不能充分有效地应用到真实世界中。

艾克斯罗德的实验成果尽管有些疑问，但很值得分析：

（1）那些专门占别人便宜的博弈者在遇到同样的小人时，就会两败俱伤，这大概证明了“恶人自有恶人磨”。而且，如果坏人很多，坏人就反而占不到很多便宜。从进化角度看，开始时坏人会迅速繁殖，但坏人增多又使得坏人更多地遇到坏人，这样又导致无利可图，迫不得已就只好选择合作。而合作策略更能发展成稳定策略（由稳定回报所保证）。不过，合作策略的稳定性到底有多大仍然是个疑问。好人增多又会导致坏人获利，社会状况的循环反复是经常性的，事实上社会总是保持好坏因素混合存在的状况，这表明合作与背叛各有各的优势；

（2）一个总是背叛的小人世界能够阻止任何其他策略的侵入，如果新来者是单个人的话。但如果新来者是一个合作性的群体，哪怕是很小的群体，却一定能够成功侵入并且发展壮大。与此相反，小人群体却不可能成功侵入合作群体，因为合作群体能够形成集体力量而胜过只顾自己的小人。这似乎证明了团结就是力量。如果按照这个规律，小人总是要失败的，而既然社会历史已经很长，现在应该没有小人了（小人们只好改过自新变成合作者）。这显然不可信。就像有数学家证明说，假如存在吸血鬼，哪怕开始只有一个，到今天也不可能有人存在了，因为吸血鬼不断壮大，而人迟早被吃完，所以不可能有吸血鬼。同样，假如好人总能够胜利，到今天就不可能有小人存在了——小人都只好变成好人。这里无疑隐藏着一个深刻的错误。真实的情况是，好人和小人都没有能够获得全面胜利；

（3）艾克斯罗德还试图证明，合作的基础与其说是信任和友谊，还不如说是关系的可持续性，只有当人们有着值得重视的未来，才能保证稳定持续的合作，就是说，长远的未来使得持续关系具有价值，不存在未来就很难合作。这个发现虽深刻但并非没有疑惑。也许信任和友谊并非合作的必要条件，但仍然可以是充分条件；另一方面，可持续未来是否就是合作的必要条件或是合作的充分条件？这并无十分把握，事实上一意孤行不顾未来大有人在，有人宁可自取灭亡也故意不与人合作。而“没有未来” 也不一定导致背叛，有时反而会是合作，比如“人之将死其言也善”的现象，这是因为，虽然“没有未来”注定了不再有利益回报，可同时也没什么可再损失的了，因此，“没有未来”是否导致背叛要取决于具体情景和人品。未来的权重和持续关系未必比信任和友谊更能够促成合作。不过，信任、友谊和高尚人品并不普遍存在，而与利益密切相关的未来权重和关系持续性却无处不在，在这个意义上，艾克斯罗德是对的。但同时我们必须意识到，未来和关系的持续性并非可以完全放心的合作条件。

在艾克斯罗德实验中，博弈者之间没有语言交流，只能根据对方的策略来作出回应。这是个有争议的设计。语言能够把本来需要在时间中一步一步做出来的事情化作语言空间里的“可能事实”来讨论和交流，这一化时间为空间的功能使得人类能够事先演习各种策略，从而避免大量实践失误。有声的博弈与无声的博弈有着根本差异。可以说，无声的艾克斯罗德实验不能充分说明真实博弈。尽管艾克斯罗德相信，成功的合作并不需要语言交流（他钟爱的例子是第一次世界大战时英法部队与德国部队之间没有通过语言而达成“都给对方留活路”的策略），但默契合作肯定不是主要的合作方式。通常人们无法在无语状态下充分知道对方的要求和策略，必须通过语言交流才能公开问题、摆明情况甚至亮出底牌。如果知己知彼，尤其双方都知己知彼，博弈情况将完全不同。关于他人的知识在博弈中无比重要，如果省略这个因素就会错误理解形势，例如关于未来的估计。艾克斯罗德在强调未来的重要性时，却没有把关于未来的知识考虑在内。博弈者自己估计的“未来”有可能完全错误，比如说，自以为是的博弈者虽然知道与他人会有长期关系，但他相信他人在未来仍然将一直是愚蠢的，于是决定不断进行欺骗和背叛，这有可能给他自己带来灭顶之灾。可见仅仅考虑到“未来”并不能保证选择正确的合作策略，而正确的关于未来的知识才是真正起作用的因素。语言的重要性就在于此，只有语言才能预告未来，提前说出来而把未来变成预先可见的。仅仅通过经验去理解未来是不可靠的，正如休谟定理所指出的，从有限经验推知未来永远是个幻想。

5.哈贝马斯对理性对话的厚望

“正确的”语言活动是否能够化敌为友？是否能够促成由背叛到合作的进化？这是个更为复杂的问题。这里需要讨论一个与罗尔斯和艾克斯罗德都不同的哈贝马斯问题。罗尔斯和艾克斯罗德也非常不同，但有一点相同，他们设想的都是实验室里的游戏，都是由不真实的博弈条件和不真实的人所构成的，都分别省略了一些不能省略的条件。语言活动就是一项决不应该被省略的条件。

罗尔斯游戏没有明文规定不许进行语言活动，但无知之幕使大家都非常缺乏信息，于是对话没有什么意义，因为根本没有什么可说的；艾克斯罗德游戏里的策略是预先设计好的程序，即使可以交流也不能更改，而且他相信没有语言交流也同样能够达成合作。忽略语言活动正是使实验游戏与真实世界难以相通的一个重要原因。因此，忽略语言活动就不是好的游戏设计。哈贝马斯发现罗尔斯的一个缺陷就是他想象的人都是在“独白”，这不是有效的语言活动，独白的反思并不能代表别人的观点，更不能代表所有可能的观点，因此罗尔斯原则必须通得过“对话检验”才能被证明，否则就只是一厢情愿。

说话的内容能够表达利益和价值冲突，因此，话语的世界必定是个政治的世界。甚至，语言本身就是一种政治，当使用这样而不是那样的语言去命名、定义和描述世界，就同时是在重新创造事物（福柯指出语言安排了事物的秩序），比如说，当谈论某种神怪就是创造了这种神怪。把某种事物定义和描述成这样而不是那样，创造这样而不是那样的事物，赋予事物这样而不是那样的价值，这是支配心灵的最有力的政治，语言规定的思想空间、思想方式以及思想对象变成最大的政治问题，甚至可以说，没有语言活动就没有政治。在这个意义上，哈贝马斯设想的以语言活动为核心的游戏是更值得分析的模型。哈贝马斯游戏不必是初始游戏，而是任何阶段都可能出现的一个游戏状态，它实际上是哈贝马斯推荐的一个据说能够保证形成合作的理想化游戏状态。对于哈贝马斯来说，初始游戏是什么样的状态并不重要，只要能够进入“交往对话”游戏，就有望消除冲突。由于拒绝各种人为条件（如“无知之幕”等），哈贝马斯游戏具有高仿真性，但却是一个难以成真的理想化乌托邦。

哈贝马斯游戏模型是“理想说话环境”（ISS）。这一想象源于古希腊城邦政治的公共领域传统，相当于想象了一个“最好的公共领域”。公共领域虽好，却并非必然成为人们的集体选择，因为没有理由证明公共领域游戏必然对每个人都更有利，也不能证明这个游戏将是每个人自由选择的共同结果（独裁者、宗教狂、偏执狂、强人、官僚主义者、暴力倾向的人等就不见得选择这一游戏）。如果不允许自由选择，就不可能证明什么样的规则、契约和制度将是人们真正的集体选择。自由选择蕴含着任何可能性，那么，人们为什么将放弃冲突而改为对话，还是个未决问题。可见一个缺乏初始性的游戏终究是不彻底的。

权且假设人们都愿意进入对话游戏。ISS要求所有人平等地理性地公开对话，最后达成同意。对话规则为：（1）任何人都有资格参加对话；（2）任何人都有资格提出自己的任何观点和质疑任何观点，都有资格表达其欲望、需要和态度；（3）任何妨害（1）和（2）的行为都被禁止[9]。另外，对话沟通的有效性标准是：（1）所说的话必须是“能懂的”（comprehensible）；（2）所说的话必须是“真的”（true）；（3）所说的话必须是“真心的”（truthful）；而且（4）所说的话以及说话方式必须是“正当的”（right），即论辩必须合乎理性标准，观点必须有正当理由[10]。

这些平平无奇的要求其实是很难被满足的。哈贝马斯观点与其说平庸还不如说幼稚。越是最起码的道德规则就越不可能落实为普遍必然的实践，比如说谎，就无法避免，有些谎言甚至有助于拯救和正义；虚情假意也不可避免，许多时候需要给人面子；说话永远正当和正确恐怕歪曲人性，没有激情、偏心、任性和愤怒，只有干巴理性，一切正确，生活却不值得一过了。当然，哈贝马斯可能会说，ISS只适合专门时刻，平时就不用那样。这多少是个辩护，但还是说不太通，因为大多数共识、契约和制度都是在平常生活中经过长期博弈和磨合而形成的，是在日常谈话中逐步形成的，而不是在会议桌上谈判而成的。平常生活的长期实践是绝对必需的，因为生活的丰富性超出我们的想象力和理性能力，各种事情只能慢慢发生，不可能一切未雨绸缪、百无一漏而胸有成竹，那是典型的德国唯心主义妄想。维特根斯坦关于“遵循规则”的研究早已分析了具体实践是如何把好像明确的规则做得面目皆非的。“说”了不算“做”了算，这是生活的最终道理。制度和规则是长期博弈所形成的均衡，是“做”出来的，而不是“说”出来的，除非“说”成为一种“做”（日常语言学派就研究“说话就是行事”的问题），这意味着，“说”必须足够丰富以至于能够反映“做”的丰富性。

ISS是个“说”跟不上“做”的典型情况。ISS并不是充分的说话而仅仅是谈判，是个过分修改而失去丰富性的公共领域。当生活对话在ISS中被限制为贫乏的正确对话，通过对话达成协议的能力虽然提高了，但所能够达成的协议却恐怕文不对题。删掉“不正确”和“不真实”的话语等于删节了生活，这样削足适履就不能回应足够多的生活问题。语言中的问题至少必须与生活问题等价，语言可以大于生活，但不能小于生活。因此我们有理由担心，ISS虽然提高了对话达成协议的能力，却只能达成一些不太重要的协议，生活的重大难题还是没有被解决，甚至没有被触及。

哈贝马斯忽视了ISS的一些技术性困难。比如说：（1）“真”的概念是一直争论而未决的问题，如果说要追求真理，当然没有问题，但把“真”作为标准或规则，就难免有些混乱。逻辑真与经验真就非常不同，许多诡辩在逻辑上是真的；即使把真理限定为经验真理，其标准也有争论；最成问题的是，人类需要说的话大部分都不符合真理要求，比如关于未来的谈论、关于历史的讨论、关于政治的分析、涉及道德和审美价值的评论，以及关于趣味、偏好和主观态度的议论，甚至关于当下事实的描述，都不是真的或很难是真的。因此，“说真话”这条标准有效范围非常小；（2）ISS的话语有效标准之间也有矛盾，比如“真心话”与“正当话”就有可能形成矛盾，有些真心话说出来会很吓人很恶心，在政治或伦理上很不正确，至少不礼貌。因此，“真心”与“正当”往往不能同时满足，这正是为什么需要礼貌、花言巧语和虚情假意的原因。另外，“真心”与“真”、“真”与“正当”也都会有矛盾。

假定把哈贝马斯说话游戏缩水为一个谈判游戏来分析。哈贝马斯把康德的实践理性发展为“交往理性”，把“独白式”理性变成了“对话式”理性，由此“他人”才真正具有了意义。在“独白式”理性那里，无论多少人都被认为心同此理，在思维上也就等于一个人，而承认对话就是承认人心各异。但哈贝马斯仍然继承了理性主义的一个顽固错误。理性主义所理解的“人”只是理性人，理性被认为能够解决一切问题。这一崇思贬心的理性主义埋下了严重困难。

哈贝马斯的成功对话需要这样的过程：理性沟通（满足ISS标准）→ 互相理解→ 一致同意。这个过程很理性化，但不够人性化，它对于电脑之间的合作是足够的，但对于人之间的合作就不够了。问题出在“互相理解”与“一致同意”之间漏掉了一个关键环节：互相接受。“互相理解”无法确保“一致同意”[11]，理解至多是同意的必要条件而决非充分条件。在许多情况下，对话双方完全互相理解，非常同情对方的处境，但决不接受对方的主张，因为与自己的主张水火不容。因此，互相接受绝不能省略，而且比互相理解重要得多。完美的成功对话过程应该是：理性沟通 → 互相理解 → 互相接受 → 一致同意。哈贝马斯曾经在回答我的这个挑战时辩解说：如果正确对话的时间足够长，各种冲突可以在互相理解中慢慢消磨掉，理性加上时间就总能够消除各种无理要求导致的冲突。这倒是个有趣的问题。时间确实可以消解许多冲突，可是时间并无偏心，正如时间可以消除冲突，也同样可以积累冲突，可以消除旧矛盾也可以产生新矛盾。哈贝马斯似乎没有注意到时间是两面派。理性主义所以不愿意考虑“接受问题”，大概因为如果承认“接受问题”，就不得不承认心（heart）的问题与思（mind）的问题的并列地位，也就等于承认思不可能解决一切问题，这对于理性主义是个釜底抽薪的挑战。心的问题终究回避不了，心是所有冲突的根源，根据“解铃还需系铃人”原理，心的和解也是化敌为友的唯一解法，只有通过心才能接受他者。如果不知道“接受问题”的症结在哪里，无论多么充分的理性对话都将徒劳。

接受问题的难点在于价值排序。大多数人在价值观的项目上大概有着相似甚至相同理解（所谓人同此心），但在各项价值项目的排序上却各有偏好（所谓其心必异）。假定所有人都选择了价值A, B, C, D, E，比如说自由、平等、公正、美德和财富，其中有些人承认价值排序{B, C, A, E, D}，比如以平等为首的价值观，而另一些人则承认价值排序{ E, C, A, D, B}，比如以财富为首的价值观，尽管这两种价值观所承认的价值项目别无二致，但不同价值排序使其价值观南辕北辙，甚至不共戴天。这就像碳元素由于分子结构排列不同而形成钻石与石墨。价值排序问题说明了，所谓“在许多事情上有着共识”其实距离“达成同意”还有万里之遥。价值排序问题可以解释许多事情，比如说文化差异、文明冲突、制度对立、社会选择的困难以及国际合作之艰难等等。

对话虽是避免暴力冲突的理性之路，但不能避免非暴力冲突，它仍然是个艰难无比的博弈，其难度并不亚于行动博弈。对话游戏的优势在于能够以纸上谈兵的方式把各种问题和底牌提前亮出来，它是一个信息更加充分的游戏。虽然在对话游戏中各种问题变得清楚起来，但所有困难的实质并没有改变，因此还需要进一步寻找真正能够解决问题的秘密。

分享到：

上一条：世界的中国焦虑，抑或中国的世界焦虑？

下一条：冲突、合作与和谐的博弈哲学（一）

冲突、合作与和谐的博弈哲学（二）

热点新闻

热点专题