百合文库
首页 > 网文

实教同人丨(修改版)如果路哥在11.5卷向帆波告白:第四章(二)(13)

[帆波高看我了。不过话说回来,帆波还真是个理想主义者呢。]
[那么在我受到挫折的时候,清隆这个现实主义者就借我一下肩膀和胸膛吧~]
[如果帆波能顺利当上学生会长就好了。] 我向她道出了自己内心的想法,
并非因为她是我的女朋友这种理由,
而是我真切地想要去见证,帆波到底会给高度育成带来何种改变,
以及,她如何开辟出不同于堀北和南云的第三条路。
[被清隆期待了呢…嘿嘿]
[我一直都很期待帆波的,帆波也一直在回应,不,是超出我的期待]
[这样啊~]
听到我直白的话语,帆波有些不好意思地把玩起了自己的头发。
[那我可要更努力一点才行呢!]
[注意不要太过劳累了哦。]
[嗯!]
Ps:"囚徒困境"是一个著名的博弈论问题:两个共谋犯罪的人被关入监狱,被隔离审讯。
(1)如果两个人都不揭发对方,则由于证据不足,每个人都坐牢一年;
(2)若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;

实教同人丨(修改版)如果路哥在11.5卷向帆波告白:第四章(二)


(3)若互相揭发,则因证据确实,二者都判刑两年。
对于任何一个囚徒来说,无论对方采取什么策略,自己都应该背叛。因为
(a)如果对方选择合作,那么自己合作的话就要服刑1年,自己背叛的话,就可以无罪释放;
(b)如果对方背叛,那么自己合作的话就要服刑5年,自己背叛的话就只服刑2年。
因此任何囚徒为了自身利益,不管对方采取什么策略,自己都应该选择背叛。但是,如果两者都背叛的话,就都要服刑2年,这不是最优结果。
博弈论专家阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面:算法的复杂性、最初的对抗、宽恕的能力等等。
阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终"贪婪"策略趋向于减少,而比较"利他"策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。
最佳确定性策略被认为是"以牙还牙",这是阿纳托尔·拉波波特(Anatol Rapoport)开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的,只包含了四行BASIC语言,并且赢得了比赛。

实教同人丨(修改版)如果路哥在11.5卷向帆波告白:第四章(二)


猜你喜欢