信念的算法


我怎么也找不到相机皮套了。

它最有可能在我混乱的书架上。

书架上不仅有书,还有乱七八糟的数码玩具,以及各种零碎东西。

我把这些东西平铺在可以一眼看见的地方。

合理而整洁的收纳,也许应该是Windows的文件夹模式,文件夹套文件夹。

但是以我的经验,不管是物理世界,还是数字世界,进了文件夹的东西几乎就被遗忘了。

所以,iPhone式的对App的平铺,是我喜欢的收纳(确切说是乱堆)模式。

苹果很整洁,我很混乱。

对于信息的个人获取形态,苹果贡献了平铺,谷歌贡献了搜索,Facebook贡献了信息流

  • 在信息世界,太多的平铺需要搜索。

  • 信息流,则是引入了时间元素的、流动的平铺。

可是,在物理世界,平铺并没有帮助我找到相机皮套,连找了两次都没找到。

今早,我决定继续在书架上找一次,终于在订书机后面发现了它。

假如你找不到一样东西,而且在它最可能在的地方也找过了,如果你继续找了些别的地方还没发现,那么你再在它最可能出现的地方多找一次,仍然可能是最优选择。

上面这句绕口令版的生活小常识背后,是我们这个世界最重要的概念之一,以及该概念背后的算法。

这个概念是:信念

背后的算法是:贝叶斯公式

我用贝叶斯公式来解释一下自己找相机皮套的过程:

  1. 假如东西在最可能的那个地方出现的概率是a,你找了一遍,没发现。

  2. 假设你找了这一次但没看仔细的概率是b,所以该东西还在这个最可能的地方的概率是a✖️b。

  3. 找两次而不得后,这个概率继续降低为a✖️b✖️b。

尽管有时候b很小,但因为a很大,所以a✖️b还是相对比较大。

更何况,很多时候我们会低估了b的数值。

例如,对平铺的习以为常所导致的先入为主,让我忽略了订书机后面还有东西。

b代表我们现实的愚蠢。先入为主是自以为知道的无知,这种愚蠢的b值高得惊人。

不过好处是,假如我愿意承认自己的愚蠢,较大的b值,令我在书架上找到相机皮套的概率更大了。

尽管上述“计算”简单得惊人,然而我敢打赌,真正理解的人,也许不足1%。


将“信念”引入计算,似乎有点儿奇怪。

假如你在街边,看见有人摆摊儿,玩扔硬币押大小的游戏。

庄家连续扔出了5次正面,接下来一次,你押什么?

据我某次在澳门的观察,不同的人会有不同的押注:

  • 新手会押正面,因为他们认为正面的火气很旺,要跟上;

  • 老手会押反面,因为他们认为硬币正反概率都是50%,连续5次正面,该来一次反面了。

聪明如你,会告诉他们:你们都错了。

你明白概率的道理,知道每次扔硬币都是独立事件:即使前面连续出现5次正面,下一次出现正面或者反面的机会还是一样的。

例如下图:假如生男生女的概率和扔硬币一样,两种结果都是50%,你会发现连续5次甚至10次都是男孩或者女孩某一性别,并不罕见(见黄色和绿色标识数据)。

图片来自《统计与真理》

于是你说:即使5次都是正面,下一次是正面的概率还是50%。

然而,你忘记了一个事实:你是在街头玩儿这个扔硬币游戏。

你有一个先入为主的假设:硬币没有被做手脚。

这就是我在第一段里所说的“b”值:

b代表我们现实的愚蠢。先入为主,是自以为知道的无知。

概率有两个流派:

  • 频率主义,是客观的,其基础是一件事发生的频率;

  • 贝叶斯主义,则是主观的,基础是你对一件事发生的“信念”。

例如,一个标准的硬币,将其抛上一万次,结果分布符合“频率主义”的概率解释。

贝叶斯推断,则会先有一个猜测,然后根据信息来更新自己的猜测。例如:

嗯,一般来说,硬币正反面是一样的,但这是在街头,那个家伙真的没做手脚吗?

这个推断过程就是:

后验概率 = 观测数据决定的调整因子×先验概率

所谓“先验概率”,是50%。后验概率,则是根据更新后的信息,加以调整后得到的数据。

贝叶斯推断里的“信念”,是这样的姿势:

我相信,但我也可能是错的。


作为牧师的贝叶斯,据说是为了驳斥“怀疑上帝并不存在”的休谟,从而提出了贝叶斯推断。

于是,作为“我相信”的贝叶斯牧师,和“我怀疑”的休谟,因为这个公式而成为思想上对立的好基友。

因为对立,反而构建了某种强大的思想张力。

  • 杠精休谟说,这世界哪里有什么因果?你们那些公式啊,信念啊,统统靠不住;

  • 信仰者贝叶斯说,那你也要有信念。

因为这种思想张力可以表述为一个简单的公式,所以这个关于信念的算法迄今仍在发挥着神奇的力量。

频次主义的概率,其客观的好处是客观,可是,我们的认知本身就是主观的,谈何客观呢?

就像牛顿的公式,即使在地球乃至太阳系被反复验证,仍然只是一个局部的真理。或者说,是一个有概率前提的“信念”。

然而,简单怀疑一切,会陷入虚无主义。

贝叶斯主义选择相信“信念”,但他们知道这只是“先入之见”,他们随时敞开认知的大门,接受各种性质的信息,并且更新自己的“信念”。

由于我们对世界的理解极其有限,频次主义的概率所依赖的大数定律,很容易因为数据的局限,以及环境的变化,而掉入“小数陷阱”,也就是赌徒谬误--就像前面说的,以为连续出现5次正面后,下一次出现反面的概率会变大。

贝叶斯主义更适合变化的世界,有限的世界。

包括我们每个人有限的一生。

然而,这个伟大的哲学,需要经由算法,才能从描述性的概念,变成拯救世界的工具。


请允许我用此前用过的例子,不同的是,我会给出关键环节的具体计算。

2009年5月31日晚10点,法航447不幸坠毁,搜救人员动用当时最新技术,找了一周后,仅发现少量残骸碎片和29具遇难者遗体。
随后两年的艰苦搜索,更是一无所获。
这时,贝叶斯主义者登场了,他们的方法是:
  • 飞机失事建立一个数学模型;
  • 整合评估各种导致失事的原因的概率;
  • 根据更新信息,改进模型。
如上,也是一张“格子”图。
救援队根据上述概率分布图,先从概率最大的区域搜索,如果没有发现,就在过往数据基础之上更新概率分布,继续搜索最大概率区域。
其中,贝叶斯更新的过程,简单示范如下:
(本图来自《科学世界》杂志)
上面的数字如何得到的呢?
我试着不用贝叶斯公式,用直观的方式来计算:
在B区域的“初始信念”是50%,搜索之后不在B区域,但是找不到的可能性是:
1、的确不在B区域;
2、在B区域但是被漏掉了。
我们假设漏掉的概率是25%(这也是一个信念),于是分析如下:
想起我找相机皮套的故事了吗?还记得我描述自己愚蠢程度的“b值”吗?
这里有趣的地方是,对于一个贝叶斯主义者,不仅是“我相信,但我也怀疑我的相信”,甚至于,连我对自己的怀疑也是怀疑的
假如你知道自己愚蠢,并且能够定义出愚蠢的边界,例如这里“找漏了”的概率之25%,那么该愚蠢就会成为智慧的一部分
继续上面的不用公式的计算,搜索了B区域,由此更新的信息是:
  • 的确不在B区域的概率是37.5%

  • 还是在B区域但是被漏掉的概率是12.5%。

那么,不在B区域的37.5%可能性,就要在ABCD四个区域重新分配,如下图:
重新分配的基数是(30%+12.5%+5%+15%),以A区域为例,其因为重新分配那37.5%而增加的概率是:
30%➗(30%+12.5%+5%+15%)✖️37.5% = 0.18
于是,更新后A区域的概率是(0.3+0.18=0.48),整体更新后如下图:
这时,A区域的“信念”数值上升为48%,接下来,搜救人员继续搜索A区域。
我们可以想象,假如某个区域的初始信念比较高,并且遗漏概率也比较高的话,即使搜索了该区域而不得,有可能该区域更新后的信念仍然是最高的,所以按照游戏规则仍然是最高的。
历史上的搜救案例里,的确出现过类似的状况,人们根据更新后的数据,重复去搜索此前找过但没找到目标的区域,结果最后找到了。
贝叶斯主义者,将概率理解为对某件事情的信念。
他们承认自己的“信念”是灰度的,而非绝对的判断。
他们会根据观察到的信息更新自己的信念:
  • “初始信念”是先验概率,更新后的信念是后验概率。

  • 在新一轮的观察中,后验概率又变成初始概率。

我在《人生算法》里的认知飞轮,亚马逊的Day 1,微软的刷新,投资人的打无记忆的球,都是类似逻辑。
贝叶斯推断保留不确定性,每一轮的估算也许是模糊的,然而公式在模糊和犯错的情况下,依然可以发挥作用。
并且,贝叶斯算法具有连续性,可以程序化,以有限的信息,通过某种杠杆效应,快速逼近真相。

在威尔逊被赶走后,又有一个人越过了信念碑,那是一般游人与信念中心保持距离的界限。那人在碑后徘徊着,希恩斯很快注意到了他,招呼惠子说:“看那人,他应该是个军人!

这是小说《三体》里的一段。面壁人希恩斯苏醒后,在推进计划过程中意外发现“思想钢印”能坚定人们的思想,并设立信念中心帮助太空军建立必胜信心。

“我叫吴岳,我来获取信仰。”来人说,希恩斯注意到他说的是信仰而不是信念。

信念和信仰的区别是什么?

信仰,为人类生而为人,选择其所相信之价值观、生活方式,以及人生意义的可靠确据之一。是不证自明的那些东西,例如父母对孩子的爱。

信念,是个人判断和选择事物真伪的思想意识,信念的正确与否取决于个人的知识水平包括推理能力。

以上定义来自网络。请允许我用简单的描述来区隔二者:

  • 信仰,几乎是100%的;

  • 信念,是介于0和100%之间的。

比特币是一种信仰吗?不,比特币是一种信念。

这个信念值可以是1%,也可以是98%,是每个人的主观概率。

我们不去谈比特币的金融理论基础,也不去谈数字化时代的变迁,更不去讨论关于数字黄金的隐喻,而只说说信念本身。

信念是基于概率的。所以,是否投资比特币,不是一个“是”或者“非”的选择。

比如,你可以说,我对比特币涨到30万美金的信念是25%,我对比特币跌到一分钱不值的信念是10%,我对比特币在3万美金上蹿下跳的信念是65%,那么,你就可以根据这些信念来计算期望值,并根据自己的状况来做决策。

你并不需要选择是否“信仰”比特币。

当然,因为货币的“信念”属性,以及人类事务里信念的传染性,会有某些别的隐变量起作用,所以你的信念更需要一些未知的灰度空间。


年轻时,每个人都有自己的信念。

然而,岁数越大,信念越少。

《重庆森林》里有段台词:

不知道从什么时候开始,在什么东西上面都有个日期,秋刀鱼会过期,肉罐头会过期,连保鲜纸都会过期,我开始怀疑,在这个世界上,还有什么东西是不会过期的?

一切东西都会过期,是热力学第二定律的文艺化表达。

这个伟大而残忍的定律,表述了热力学过程的不可逆性——孤立系统自发地朝着热力学平衡方向──最大熵状态──演化。

熵,是混乱程度的度量。同样,这个概念也是基于概率的。

根据熵增原理,一个玻璃杯子早晚会被打碎,而我们却看不到碎玻璃复原为一个完整的杯子。--这个说法并不精确。

正确的表述是:

  • 一个杯子被打碎的概率非常大,时间越长,越接近于100%(这是文物价值的概率原理);

  • 碎玻璃复原为完整杯子并非不可能,而是概率极小,再考虑到原子大小与杯子尺度之间的关系,几乎没人见过碎玻璃复原。即使这个概率极小,但仍然大于零。

熵增理论里的ΔS ≥ 0,是指“事物会变得更糟糕”。更具体地说,它认为物质和能量总是朝着混乱的方向发展。

《存在与科学》写道:

如果任由其自由发展,物质会分解,能量会扩散。比如在某个容器内,无序运动的气体分子会充满整个容器。炽热金属块中的原子会发生剧烈的碰撞,它们同时会与该金属块周围温度较低的原子发生碰撞,这会使金属块中的能量散发出来,然后其温度降低。这就是自然变化的根本原因——无序扩散。

这就是墨菲定律:凡是可能出错的事就一定会出错。

然而,ΔS ≥ 0只能用于“孤立”系统。

例如,地球并不是一个孤立系统,因为地球不断地从太阳以太阳光的形式接收能量。于是,作为负熵过程的生命得以诞生。

然而令人惊讶的是,这种自然的无序扩散可以创造出精致的结构。这种扩散如果发生在引擎中,就可以让发动机吊起砖块建造教堂;这种扩散如果发生在种子里,就可以让分子形成花朵。这种扩散如果发生在你的身体里,在你的大脑中随机的电流和分子就可能会被加工成想法。

这就是生命与创造的魅力,也是信念的价值和意义。

我们通过知识,通过机器,通过信息,操控了麦克斯韦妖,那些无序扩散得以被驯服,为人类做功。

就像我在大学时代主要靠把衣服泡在水盆里,利用布朗运动来实现“自动洗衣”。

一个凤梨罐头的加工,就是一个负熵的过程,人们以此对抗不可逆的时光。

然而,信念,罐头,和这个世界上所有的事物一样,都无法逃离那个最厉害的定律:

在1994年的5月1号,有一个女人跟我讲了一声“生日快乐”,因为这一句话,我会一直记住这个女人。如果记忆也是一个罐头的话,我希望这罐罐头不会过期;如果一定要加一个日子的话,我希望它是一万年。

嗯,假如一个信念以一万年为尺度,也许我们该称之为信仰。

信念的边界,比信念本身更重要。

这种信念,重新定义了已知和未知。

我们看到的,知道的,理解的,都只是真实世界中很小的一部分。

这里既有空间上的未知,例如上面的搜救案例,也有时间上的未知,例如我们对未来的投资。

为了探寻未知,信念将自己作为方法和路径,与随机性共舞,去探寻自我的边界。

蒙特卡洛方法,也称统计模拟方法是一种以概率统计理论为指导的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。

例如,用该方法来求不规则图形的面积:

图片来自《统计与真理》

假设我们随机地在上面的长方形上往下扔沙子:

当沙子足够多时,大数定律发挥作用,我们数一下落在不规则图形里的沙子的数量,再除以落在长方形里的沙子的数量,该比值非常接近于“不规则图形的面积/长方形的面积。

因为长方形面积已知,所以根据该比值,可以计算出不规则图形的面积。

(伽利略用过更加古典的方法,他会将不规则图形剪下来去称重量。)

这种看起来很笨的聪明方法,作为非确定性算法,可以在保持对不规则图形的无知的情况下,非常精确地计算出想要的数字,尤其是在计算机的帮助下。

蒙特卡洛方法,能够解决那些确定性算法无法解决的问题。

随机性和不确定性,不再是人类的敌人。

这种方法的名字,来自摩纳哥的蒙特卡洛赌场。

从卡尔达诺开始,赌徒再次“以身为骰”,为人类贡献出概率的智慧。


赌徒有赌徒的信念,赌场有赌场的信念。

再回到蒙特卡洛方法的图片:

我们假设,上图是一个赌徒与赌场的对赌游戏:

赌徒闭着眼睛在长方形上空往下扔沙子,假如掉在不规则图形里,一块钱变两块钱;假如掉在不规则图形之外,一块钱全输掉。

显然,赌场只要让不规则图形的面积小于长方形面积的50%,就可以稳赚了。

仅仅是靠大数定律,赌场让随机性成为赚钱机器。

随机扔沙子,是一种无序扩散的人类行为。

因为赌场有制定概率的权力,所以赌博游戏就是一台精心设计的机器,背后是暗中操控无序扩散的麦克斯韦妖,赌徒们“熵增”,而赌场“熵减”。

  • 单个沙子落在不规则图形内,还是不规则图形之外,是个无法预测的偶然事件;

  • 很多个沙子落在“不规则图形内”和“之外”的比例,几乎是必然的。

赌场的信念,比赌徒的信念,优势大那么一点点。

不确定的游戏,不止是在赌场上。

投资,创业,甚至包括教育孩子,都是一个充满不确定性的游戏。

本质上,这些事情,都是一个探寻信念边界的过程。

创业者早期的试错,就是基于某个信念,然后在空中往下扔沙子。

沙子落在边界内,或者边界外,对于探寻边界而言是等价的。

生命的演化,孩子的成长,财富的起源,几乎都是基于随机性的进化。

这一过程的三步走公式是:

变异,选择,放大。

以创业为例:

  • 第一阶段是价值验证,快速地扔沙子,快速低成本地试错,去发现有概率优势的信念;

  • 第二阶段,大规模复制这一信念。

教育孩子与创业思维的内核一致性,在以色列得以验证。

《统计与真理》给出了一个风险管理的逻辑方程:

由此,该书总结道

  • 如果我们不得不在不确定性的前提下做出抉择,则错误是不可避免的;

  • 如果错误是不可避免的,则在一定的规律下做出抉择(形成新的具有不确定性的知识)时,最好我们能知道犯错误的频率(对不确定性量度的知识);

  • 这样的知识能够用于找出制定决策的某种规律,从而使我们减少盲目性,使做出错误决策的频率最小,或者使由错误决策产生的损失最小。

一个投资者的交易系统,一家创业公司的业务发展,一个孩子的成长路径,都是基于风险管理之下的信念之旅。

一个知道自己边界的灰度信念,也许比一个自认为100%正确的信念更牢靠。

一旦某个不确定的知识可以度量自己的不确定性,偶然就在某种程度上被驯服,热力学第二定律就被放进了机器里,随机性几乎可为我们创造除了时间之外的一切。


为信念赋予概率数值,是智慧的跃升。

假如“已知”是一阶智慧,那么,概率是二阶智慧,概率的演化是三阶智慧。

科学家已经接受了信念的不确定性,他们信仰科学,但会质疑理论、实验和数字,并在这质疑中坚定前行。

信念在人类事务方面,容易被忽略其概率属性。

对于一个人而言,拥有信念,相当于张开一个运气的风帆,能够大大增加自己捕获好运气的概率。

吸引力法则的背后,就是关于信念的风帆。

这一风帆会聚集个体零散的概率权,例如每个人获胜的信念都是51%,但仍然有49%的失败概率。

吸引力法则的运用者,能够聚集这些零散的概率权,就像历史上发生过的极少次数的(在期望值为正的意外情况下)合买彩票,偶然的、较小优势的概率,汇聚为必然的赚钱机会。

人类事务,信念风帆,吸引力法则,还能够构建一些社会属性的信念体系,例如此前谈到的比特币定价。

赌场的例子和成功学的道理,在我眼中都是概率世界鲜活的样本,因为每个人的命运就是一次随机事件,这个随机事件又在当事人的自由意志下努力去改变自己的命运。进而,人们共同的看似有序的无序扩散,探索出了世界的边界和轮廓。

一旦信念被赋予概率数值,我们就可以不再依赖于神秘主义的解释。

我们不仅发现边界,还改变边界。

我们并不只是探寻51%的信念。

  • 当下的信念,我们要的是大概率;

  • 未来的信念,可能只是微弱的小概率。

前者可能是制造一辆车,后者是指探寻人类另外的居住星球。

人们通常高估了当下的信念,而低估了未来的信念。

例如,从厉害的人那里得到股票内幕消息,你对这一信念往往赋予了过高的概率数值。

人们又低估了为未来种下森林的信念。

幸而,热力学第二定律在我们的大脑里照旧发挥作用,人类的祖先第一次爬下树,第一次走出丛林,第一次点燃火,也许都只是极小概率的随机事件。

我们祖先的运气风帆,捕获了那些细微的变异,他们当中的极少数,做出了勇敢的选择。

我愿意相信他们第二次爬下树,第二次走出丛林,第二点次燃火,是基于某种微弱的信念。

接下来,历史放大了那些选择,我们在一个熵增的宇宙里,用信念,以及可计算的信念机器,局部驯化了热力学第二定律,并得以在地球上孤独地生存。


最后

我们并不需要一个保质期一万年的凤梨罐头。

但也许人类需要一个万年钟。

迄今为止,人类可及的宇宙里,空无一“人”,除了我们所在的星球。

对这一极小概率的感恩,在人类对地球的征服当中被忽略掉了。

本文开始的时候,试图将一个描述性的关于信念的概念,转化为可计算的概率化的信念系统。

休谟说:“聪明人会把自己的信念诉诸证据。”而贝叶斯则将休谟的哲学变成了可以计算的公式。

人类发明了引擎,在气缸里驾驭混乱。

而人的大脑,就是一个信念的引擎。

玻尔兹曼与香农的熵,一个作用于肉体,一个作用于思考。

为信念赋予概率数值,并不会摧毁人类的信仰至少在我们发现意识从何而来的秘密之前

我们相信,我们怀疑自己的相信,我们相信自己的怀疑。

这是未知世界与自由意志之间的翩翩起舞,值得用生命去赞美。

信念不在意数值的大小,因为几乎所有的伟大都有微不足道的开始。

如乔布斯所言:

“‭‮然虽‬‬你现在可能‭看不见未来,不知道你‭‮在现‬‬所拥有的、懂得的、‭‮解了‬‬的,能带领你到什么样的境界;‭‮到直‬‬未来的某一时刻,当你暮然‭‮首回‬‬时,你才将能所走过的路串起来,进而发现‭‮是就‬‬这些点点滴滴‭‮就造‬‬了你。”

第一个爬下树的人类祖先,并非是最聪明、最强壮的那一个。然而,好奇或随机性激发了信念。

在我看来,乔布斯就是类似的人,一个伟大的普通人。他混乱,脆弱,愚蠢,会在马友友的大提琴声中哭泣,他也没有太高的智商。

但他曾经透露过自己一生中最重要的秘密。

这个秘密与信念有关:

“因此你得相信‭‮些这‬‬即将来临的事情在更远的‭‮来未‬‬肯定会连在一起,要有‭‮定一‬‬的信念:你的勇气、你的生命、你的缘分。‭‮份这‬‬信念从没让我失望过,而这也就是让我与不众同的地方。”

本篇文章来源于微信公众号: 孤独大脑

帕斯卡的赌注

 

孤注一掷

假如有一个巨大的机会放在面前,你愿意为其孤注一掷吗?

下面的故事,和你日常生活中最大的乐趣之一“收快递”有关。

故事发生在近40年前,有个家伙的创业公司马上就要倒闭了。

公司欠着24000美元的账单,可他只有5000美元。

这时,他做了一个疯狂的决定,带着全部的钱,前往拉斯维加斯,在赌场“21点”的牌桌前孤注一掷。

接下来的故事,充满了幸存者偏差式的传奇:

  • 他赌赢了32000美元,刚好够付掉24000美元账单,以及再勉强维持公司一周;

  • 就在这一周,他成功融资1100万美元;

  • 这个叫“联邦快递”的公司活了下来,开创了一个给我们带来日常惊喜的物流快运行业。

人生,到底该不该赌?

显然,联邦快递的创始人走入赌场的那一刻,概率和期望值都站在他对立面。他的所作所为,绝对属于赌徒行为。

即使21 点是赌场里最可能赢钱的游戏,即使你懂得通过计算采取最佳玩法,你作为玩家的胜率是49%,你的期望值为负。

赌场靠这2%的微弱优势,也可以慢慢赢光你的钱。

但是,如果将故事主角赢到手的32000美元所得到的收益,理解为创立联邦快递的火种,那么是不是对应的收益,就应该是这家企业所对应的价值?

就像是变魔术,通过一个逻辑上并不那么牢靠的置换,原本为负的期望值,似乎可以变正了。

我们暂时忽略主角玩儿21点的水平,以及合理估算他的创业成功率,会发现,这场赌局的成本是5000美金,期望值是(市值700多亿美金的)联邦快递的企业价值。

聪明如你,也许会想到,这像是一个帕斯卡的赌注。


帕斯卡赌注

帕斯卡的赌注,是十七世纪法国哲学家、数学家、物理学家布莱兹·帕斯卡提出的一项哲学论证:

我们到底该不该相信上帝的存在呢?

我们不讨论其中关于上帝和信仰的部分,单单只看论证过程和数学计算:

  • 上帝或者存在,或者不存在,无法以理性分辨;

  • 人们必须猜测......就像抛硬币猜测哪一面向上一样;

  • 你必须下赌注,不能不下。

那么,该如何计算呢?

帕斯卡的分析,如下方的图表:

如上图,让我们衡量一下赌上帝存在的利弊得失:

  • 若上帝不存在,你选择相信上帝的成本也有限,选择不信的收益也是有限的;

  • 若上帝存在,你选择相信上帝的收益是无限,选择不信的损失也是无限的。

即使上帝存在是非常小概率的事件,如果计算一下期望值,选择相信上帝的回报也高得惊人。

也就是说,如果你赌对了,你将赢得一切,如果错了,失去的都算不了什么。

也许有人会说,那买彩票,是不是也算帕斯卡赌注呢?你看,只要付出几块钱,就有几个亿的期望值,尽管概率小,但赌对了改命,赌错了损失也不大啊。

然而,买彩票并不是帕斯卡赌注。


帕斯卡骗局

买彩票和六合彩都不是“帕斯卡赌注”。

帕斯卡赌注是指投入成本可以忽略不计、而回报可以很大、并且计算下来期望值为正的事情。

例如向女神表白,向老板争取机会,等等。

也有投入成本不算小、但回报无穷大的。

例如量化交易之父索普打算死后冷冻自己,投入一定不小,他自己估计复活的可能性约为2%。这仍然算一个帕斯卡赌注,因为他用的是这辈子根本用不到的钱,主动当小白鼠还可能为后代造福。

为什么彩票不算?

1、期望值为负数。

买彩票追逐的是比雷劈还小很多倍的极小概率机会,并且期望值为负,根据大数定律,玩儿得越多,输得越稳定。

2、成本并不低。

打算靠彩票和六合彩致富的人,投入并非不可忽略,每天十块钱,一年3650元,算上复利的机会成本,其实不低,钝刀子割肉更狠。

比方说,你向女神表白,虽然被拒绝的概率很大,但收益貌似无限大(至少你当时那么觉得),并且被拒的成本可以主观选择忽略,所以还是可以试一下。

但是,如果你根据帕斯卡赌注,每天向一个女明星求婚一次,那就很愚蠢了。

3、破坏人的大脑。

更大的成本是,买彩票等行为,让人沉迷于一夜暴富的幻想中,极其消磨斗志。

即使真中了彩票大奖,大多数人的结局也不太好。

而真正的帕斯卡赌注,例如向老板争取更有挑战性的岗位,该举动不仅不是成本,还能锻炼乐观,磨练意志。

《原则》的作者达利欧,他年轻时看中一套房子,想买。别人都说不可能,他自己当时也没钱。但他仍然给屋主打了电话。结果,屋主不仅愿意卖,还可以给他一笔贷款。

假如一个人在工作时有这种精神,会获得“死磕”的溢价。

但是,在概率稳定和大数定律起作用的领域,这种死磕并没作用。

例如,我和乔丹打篮球,再死磕也没用。

很多散户忘记了自己在股市上其实是和一群装备精良、有知识还会耍流氓的职业人士死磕,越磕越死。

有一种诈骗,是反向利用“帕斯卡赌注”:

反正也吃不了大亏,说不定占大便宜呢!

97年左右,我曾经知道某地企业批量诈骗,很认真约人去当地谈生意,然后吃饭娱乐,让你买单。你想,要是骗子也不会骗一顿饭吧?

真相是,人家就是骗你这顿饭的餐厅分成。

直至现在,也总会有头衔大得吓人的正经名流,谈的都是十亿百亿的大生意,缺的只是临时小钱,你要是跳进去,就中套了。

类似骗局不胜枚举,例如你中奖啦,只要承担快递费,就把东西寄给你。

我们姑且称之为“帕斯卡骗局”。

这类被骗的原因,只有一个字:贪。

帕斯卡赌注最早是帕斯卡对是否信上帝的思考,信上帝的好处可能是无限的,成本呢?说不定还没成本呢,如果信仰能令人宁静。

所以也很难单纯用期望值计算的方式,来算哪些是帕斯卡赌注。

帕斯卡赌注更像一种积极向上、敢于探索的小强精神。这类成本更多的是一个人的脸皮、意志和激情。


彩票套利

能靠彩票赚钱吗?

答案是不可能。

当然,的确有人用“确定性的方法”,攻破了彩票。

我称之为概率套利

彩票的原理,是利用头奖的吸引力,吸引人们去买期望值为负的彩票。

例如,某彩票游戏,共售出10000张彩票,其中只有1张大奖,奖金5000元,其他都是空的。每张彩票的成本是一块钱。计算如下:

  • 单张彩票的中奖期望收益是:9999/10000x0+1/10000x5000=0.5元;

  • 单张彩票的成本是1元;

  • 所以购买一张彩票的期望值是(0.5-1=-0.5),也就是负的0.5元。

如果该彩票游戏是即开即中,你在旁边蹲着,发现开了5000张头奖都还没出来,这时候期望值就变成了(4999/5000x0+1/5000x5000-1=0)。

在这个临界点,奖金总额等于彩票购买总额。

也就是说,过了这个临界点,你买下剩余所有彩票,就会稳赚。

历史上,伏尔泰曾经利用彩票设计上的漏洞,赚了大钱。那时候,人们的概率知识还不够清晰,套利机会更多。

现实中,靠彩票赚钱的,大多是类似原理。

最著名的例子,就是“Winfal彩票”。

“Winfall ”的规则如下:

  • 500 万美金是一个界线,如果彩票上 6 个号码全中就可以独得当期奖金;

  • 但如果当奖金累积到 500 万美金却依然没有人中奖时,则会把奖金分摊给中奖 3~5 个号码的玩家,因此提高了中奖概率。

也就是说,Winfal彩票的游戏规则,令其在某个时间段里,奖金池总额大于彩票购买成本,即:期望值为正

这是一个数学上很明显的漏洞。但只有极少人发现并靠此发财。

其中有一组人是塞尔比夫妇。

他们在玩 Winfall 的 9 年中,夫妻俩和他们组成的团队赢得总计 2600 万美元,约合人民币1.7亿左右的高额奖金,他们用这笔钱翻新他们的房子,并用来支付他们的 6 个孩子、 14 个孙子女及 10 个曾孙子女的学费。

原理很简单,但是我觉得这个逻辑框架非常有趣。

塞尔比夫妇的赚钱之路是这样的:

第一步:发现“期望值”为正的概率套利机会。

举例如下:

  • 州政府会从累积奖金中拿出(至少)200万美元作为小额奖项的额外奖金。

  • 有150万人冲着这200万向下分配的奖金购买彩票,销售额是300万。

  • 州政府会拿走300万美元的40%,其余180万美元进入奖金池。

  • 所以奖金池合计380万,而彩票总体成本是300万。总体正期望值是80万。

光发现机会还不够。

第二步:验证概率假设。

塞尔比夫妇发现漏洞后,第一次买了 3600 美元的彩票,赢得了 6300 美元,之后再下注 8000 美元,获得的奖金整整翻了一倍。

这就是"经证实的认知"。

在验证了自己的计算逻辑是正确的之后,他们开始正式行动了。

第三步:大规模重复。

需要留意的是,州政府向下分配的额外奖金,是分给二、三、四、五等奖的,也就是说,分得比较均匀。

再根据大数定律,塞尔比夫妇买得越多,他们的收益越接近于整体的期望收益比例

于是,塞尔比夫妇成立了公司,帮助更多亲友赚钱。

当他们发现马萨诸塞州的彩票“ Cash WinFall ”有期望值漏洞之后,两夫妻连续 6 年都开 14 小时、 900 英里往返。

他们在当地购买数十万张彩票,然后租一间汽车旅馆,连续 10 天每天花 10 小时整理彩券兑奖。

(以上案例来自《 CBS 》新闻网报导)

先形成认知,再证实认知,最后大力出奇迹。

显然,这不是一个帕斯卡赌注,而是一个期望值为正、确定性极其高、可大规模复制的套利机会。

有些事情看起来非常不确定,但是从概率的角度看,却非常有确定性。

现实中,这种机会极其罕见,所以,别在彩票和任何期望值为负的赌博上浪费机会。

包括那些被包装为投资的赌博,以及所有你不懂的“机会”。

总结一下,概率套利,主要来自以下四个方面:

1、通过概率计算,发现正期望值的套利机会;

2、利用人们对不确定性的厌恶所带来的错误定价和隐藏机会;

3、通过套利者的有组织活动,大规模复制上面的套利机会。

除了以上三个,还应该有帕斯卡的赌注:

4、将那些帕斯卡赌注似的小概率机遇放大为正期望值的事件。

利润背后

张维迎教授认为,企业家的工作就两件事:

第一、应对不确定性。

经济学家奈特在其名著《风险、不确定性与利润》中证明,没有不确定性,就没有经济学意义上的利润。

所以,利润是对不确定性的补偿

然而,企业家和创业者并不是赌徒,所以如上段所述,企业家是通过发现正期望值、复制正期望值来实现利润。

应对不确定性,需要智慧,需要勇气,还需要体力。

所以,对于企业家和创业者给予奖励,是应该的。

第二、推动社会的创新。

张教授的观点是:

“创新是企业家的责任,不是技术专家的责任,技术专家只是在发明,创新是把发明变成一个有商业价值的东西。”

创新的事物,起初都是小概率的东西。而且开始的时候,都算不过来账。

算不过来帐,意味着期望值是负的,不知道该如何赚钱。

这个时候,就需要创新,需要熊彼特所说的“创造性的破坏”。每一种新产品、每一种新技术,都是对原产品和原技术的破坏。

而对于那些史诗级的创新,更需要企业家有超越利润的使命感。这背后,正是帕斯卡的赌注。

很多创新者,都是靠帕斯卡赌注里的那些信仰式假设,一步步将极小概率事件推向大概率事件

做到这一点很难。

当年苹果找英特尔开发手机CPU,因为苹果报价过低,英特尔CEO拒绝了对方的请求。

这个决定对吗?

事实上,当时几乎没人能够预测今天iPhone的样子,苹果做手机的成功概率极低。

而且,当时英特尔正在应对AMD的挑战,聚焦于主战场,似乎是应该的。

所以,英特尔并没做错什么,只是被时代抛弃了。

何谓时代?时代就是大概率发生的事件的集合。

iPhone的成功是小概率事件,移动互联网的崛起是大概率事件。

只是,不管是大概率还是小概率,都隐藏在未来的时间与空间背后,无法看清,很难预测。

也许,这个时候挺身而出的英雄,需要是一位“帕斯卡赌注”的信徒。


复杂系统

帕斯卡的赌注,开创性地应用了概率论、决策论、存在主义、实用主义和唯意志论,在哲学和神学历史上具有重要的地位。

帕斯卡提及了人类生命中的各种不确定性,例如:

  • 宇宙终极的不确定;

  • 人生目的的不确定;

  • 理性的不确定;

  • 科学的不确定;

  • 信仰的不确定;

  • 甚至包括对不确定性的不确定。

在《思想录》中,帕斯卡请读者分析人类的处境:

人类的主观抉择后果非常严重,但又无法全面理解这些后果。

他认为,虽然理智可以分辨不少事物,但在最终极的问题上,我们仍然只能依靠猜测。

多年以后,芒格说:

费马—帕斯卡系统与世界的运转方式惊人地一致,是基本的公理,你真的必须得拥有这种技巧。”

他说的是,正是在费马和帕斯卡的一系列通信中,发展出了人类对于“不确定事物”计算的探索。

迄今为止,应对不确定性,针对复杂系统,被证实有效的结构,都非常类似。如下:

《精益创业》:开发—测量—认知。

新创企业的基本活动是把点子转化为产品,衡量顾客的反馈,然后认识到是应该改弦更张还是坚守不移。

所有成功的新创企业的流程步骤都应该以加速这个反馈循环为宗旨。

《从零到一》:先从0到1,再从1到n。

彼得·蒂尔鼓励聪明人和企业家们去发现一个伟大的秘密,找回对大计划(”big plan”)的信心。

《园丁与木匠》:孩子天生就是杂乱的,但这种杂乱是很有价值。

高普尼克认为,孩子生来就是探索者,他们的大脑是为探索而设计的。

  • “园丁父母”:提供给孩子丰富、稳定、安全的环境,接受和欣赏孩子自然生长出来的样子;

  • “木匠父母”:按照自己的想法去雕刻和塑造孩子,木匠父母的心里实际上有个“模范孩子”的标准。然而这方面的努力大多是徒劳的。

投资,到创业,再到教育孩子,都是充满不确定性的复杂系统

我们无法用牛顿力学的确定性,以及线性思维的因果,去解决上述复杂问题。


进化算法

上段提及的三类框架,类似于《财富的起源》里的进化算法:

变异,选择,复制。

第一步:变异

如《基业长青》书中提到的,要“尝试大量的事情,然后保留有效的”。

在你的生意中,有没有什么别人不知道的秘密?

彼得·蒂尔喜欢在面试的时候问:“在什么重要问题上你与其他人有不同看法?”

他认为好的答案应该遵照这样的模式:“大多数人相信X,但事实却是X的对立面。”

为什么呢?因为:

"只有与此刻不同的未来才能被称作未来,如果不同发生在100年后,那未来就在那里。"

没错,否则就是现在的重复,甚至是对过去的重复。

可是,在我们教育孩子的时候,却是在消灭“变异”,我们选用一套有标准答案的试卷,用“别人家的孩子”来磨灭自家孩子的差异性。

第二步:选择

自然界的选择,简单,粗暴,直接。适应性强的变异物种活下来,并有更大机会变得更多。

我们的祖先,所面对的选择也很直接,《财富的起源》写道:

在经济发展的早期,选择过程相当直接——生存。

如果你选择了一个策略,如在河边狩猎黑斑羚,并结合了物理技术(如弓和箭)和社会技术(如狩猎队),获得了成功,那么你的卡路里收入就会大于支出。

这种卡路里利润能够让你做一些事情,比如为儿童投资。

高普尼克之所以认为童年是一种伟大的发明,是因为在这段时间里,孩子可以在被保护的环境里,自由地去探索,去摔跤,去犯错,去凸显个性。

这个过程,是充满不确定性的,是概率化的。

或者说,孩子的成长,是试出来的,而不是计划出来的。

可太多父母自己试图成为塑造者,结果不仅埋没了孩子的“变异”天性,剥夺了孩子的随机探索,还让父母自己成为孩子的天花板。

童年是拿来低成本试错的,不是用来提前成为成年人的。

在人类事务中,教育尤其复杂。

养育一个孩子,你就是在参与一个“应对未来不确定性的复杂系统”的生成。

假如投资和创业是印钞,那么教育则是要制造印钞机,而且是千人千“机”。

第三步:复制

进化算法的最后一步是复制。

在生物学进化中,复制通过细胞分裂或有性生殖进行。对生物体生存和繁殖能力有益的基因往往会被复制。

因此,复制的效果是,随着时间的推移,适合的基因在人群中出现的频率增加了,不适合的基因频率降低了。

关于复制:

  • 在本文彩票套利的故事里,复制是指大规模地买彩票;

  • 在精益创业里,复制是在价值验证之后的价值实现;

  • 在从零到一里,复制是从1到n并且实现某种垄断。

而在教育的范畴,一个人的自我复制还包含了贝叶斯更新的过程,以不断进化的学习系统,实现持续性地适应未来社会。


概率大局观

人类的进化,财富的起源,科技的进步,都是在随机性中创建秩序。

仿佛是造物主设计了一个彩票游戏,全体人类通过“合买”的方式,试图实现概率套利。

概率帮助我们实现了不确定世界的大局观。


空间上的不确定性

就像本文开始的“Winfal彩票”故事里,当主人公发现总奖金池远大于总成本,尽管他们依然无法知道具体哪张彩票可以中奖,还是可以通过期望值计算和大数定律实现稳定赚钱,从而征服了空间上的不确定性。

时间上的不确定性

又比如《大空头》里的故事,主人公是逆向应用了墨菲定律,该碎的泡沫早晚会破灭,但时间充满了不确定性。可是,如果期望值为正,依然是胜率极大的对赌。这是征服了时间上的不确定性。

认知上的不确定性

再如投资和创业。其成功遵循幂律分布,少部分人大胜,大部分人并未因为投身不确定性而获得利润补偿。

然而,正是因为发生在参与者之间的认知上的不确定性,令这场游戏格外有吸引力。

对于少数投资赢家,秘密就在于购买了“因为不确定性被错误定价”的凸性组合。

我们可以将概率所描述的可能性,视为这个真实世界的另外一个维度。

数学家Henry Segerman用视觉化的方式,为我们呈现了线性三维“平面”,只是弯曲的4维“时空”的投影。

那么,在这个结构里,本文的主题“帕斯卡的赌注”位于何处呢?

也许,那个概率极小而未来回报几乎无穷大的“帕斯卡的赌注”,就是图中的那一点光源。


跳出精明

演化是自下而上的,而“帕斯卡的赌注”是自上而下的。

马斯克的创业之处,就是从“自上而下”的帕斯卡赌注开始的。

他认为:互联网、新能源和太空探索将是三个对人类未来产生积极影响最重要的领域。

于是,他投身其中。

马斯克己也不知道可以走多远,起初在火箭这件事儿上他就打算放个响。

太空探索的使命,是让人类成为多星球物种,以降低人类因为自身愚蠢和宇宙意外而灭绝的概率。

帕斯卡赌注+物理+经济,造就了马斯克的传奇。

最近一百年以来,当人类过得越来越舒服,对于期望值的计算越来越精明。

人们宁愿去做安全的套利,也不愿为“帕斯卡的赌注”而去冒险,去付出。

进化算法的“变异、选择、复制”三部曲里,起初,选择的反馈回路较直接,随着社会和经济变得越来越复杂,选择的反馈回路变得越来越不直接。

这时,着眼于全体人类未来的“帕斯卡的赌注”,也许会成为指路的明灯。

这个世界既不是牛顿物理式的决定论,也不是赌场里的扔骰子,而是随机性与最优解的混合体。

即使人是理性的动物,也不能所有的事情都用期望值计算。

帕斯卡的赌注,也许可以整合人类对意义的无休止探索和当下成本之间的关系。

我们愿意去发现终极意义,去探索宇宙的边界,这些概率极小的探索,一旦实现,回报惊人。

而仰望这一远景,也能让人类跳出逼仄空间对短期利益你死我活的争夺。


每个人的下注

帕斯卡曾经感慨道:

“每当我想到人生的短暂,想到它被以前与以后的永恒吞噬,想到我占据的甚至是能看到的逼仄空间会被无限浩瀚的空间吞没,而我却对它一无所知,也从未被它知道,我便惊恐不已,同时又惊异于我是在此处而非彼处。

因为并没有什么理由解释为什么是在此处而不是彼处,为什么是此时而不是彼时。”

由此,他发出追问:

  • 谁把我放到了此处?

  • 又是谁下的命令和指示,将这个此时与此地分配给了我?”

我们所在的世界,是一个奇妙的设计,有时也令人充满疑惑。

从极其简单的起点出发,随机性因为某些算法的作用而创建出秩序。

有限与无限,存在与虚无,随机和确定,构建了生命的张力。

人生是关于可能性的,对未来的幻想,对过去的追忆,往往也都是关于可能性的。

假如我们放弃了可能性,而是生活在一个被决定论支配的机械宇宙里,那么世界将让人绝望,我们很快就会窒息。

也许,我们每个人都需要有一个自己的“帕斯卡赌注”:

相信某件值得发生的事情,并为之去努力,哪怕那件事情现在看起来实现概率极小。

对于普通人而言,“帕斯卡赌注”不是要去造火箭,而是追求“有意义的学习,道德品质,对他人和公共福祉的关注”。

例如我,做春藤这家公司,就像是一个“帕斯卡的赌注”。

好几位聪明朋友都对我说过,为什么擅长概率计算的你,在这件事情的期望值计算上显得没那么精明?

因为我不甘于做平庸的算计,想参与做一件在更远的未来被评价的事情。

让每个孩子都有机会分享人类有史以来最耀眼的智慧,这一愿景看起来遥远,却很“确定”,值得下注去信。

更何况,这个“帕斯卡的赌注”的实现概率越来越大。

那句关于彩票的广告语,对“帕斯卡的赌注”而言是成立的:

不买“帕斯卡的赌注”彩票,你就永远中不了奖。

最后

怒斥光的消逝

那么,帕斯卡赌注的大奖,究竟是什么?

前面那段帕斯卡的感慨,是人类面对时光有限性的虚无和悲伤。

托尔金在谈及《魔戒》的主旨时说:

“一个动人心弦的长篇故事,让它能持续吸引人的注意力,总是围绕同一个主题,那就是死亡的必然性。”

这时,托尔金引用了波伏娃的一段话:

“没有什么自然的死亡,在人身上发生的一切永远都不会是自然的,因为他的存在对世界来说就是一个问题。”

死不是生的对立面,有限不是无限的对立面,短不是永恒的对立面。

假如将“可能性”作为帕斯卡赌注的大奖,我就可以想象,自己所在的世界,是由无限多个可能性的平行宇宙组合而成。

我此时在此地,而非彼时在彼地,是因为:宇宙的琴弦是在无限可能性的拨动之间,而发出令人叹为观止的乐章。

帕斯卡的赌注,是有限的我,与无限的可能性的一场游戏。

波伏娃曾在自己的书里,用狄兰·托马斯的诗句开篇。

多年以后,电影《星际穿越》也用到了这首诗

不要温和地走进那个良夜。

怒斥吧,怒斥光的消逝。

本篇文章来源于微信公众号: 孤独大脑

极大极小原理

1
在“假设发生如下事情”之前,祝福我们此生永不发生这类事情。
假设你外出时,遭遇绑架,该怎么办?
有一位(国外的)自卫专家,给出了三个应对原则:
1、不要跟他去第二个地点。
如果你心怀侥幸,他可能将你带到偏僻的地方,为所欲为,甚至下毒手,然后掩藏他的罪恶痕迹。
2、记住,他在撒谎。
不管坏人说多好听,别相信。
这位专家的观点是:
从一开始,每个谋杀犯,绑架犯,强奸犯,他们都会用同一句话:“照我说的做,我就不会伤害你。”
然而,一旦你照他们说的做,最后受伤最深的,还是你。
3、要在原地,用尽一切手段与之搏斗。
这一点似乎有点儿让人疑惑,万一受伤呢?
被人用刀抵住,拼命挣扎要是不幸丢了命,岂非不识时务?
然而,这位专家的洞见是:
如果他们想在原地杀你,你早就已经死了。

所以:

  • 他们不想在原地杀你,他们希望带你去其他地方,或者先干点别的事。

  • 通过打乱他们的计划,你会成为他们最恐怖的噩梦。

  • 如果他们不想被抓,不想把事搞得太麻烦,他们可能就会直接逃跑了。

以上三点原则的所有原因,其实只有一个:
如果你进了他的车,或者跟着他们去了某个地方,你死定了。
(以上经验仅供参考,不构成本文作者对遇到绑架的具体建议。)
2
以上是一个生动的博弈场景。
由此引出我的一句“大脑碎片”:
好的一手棋,是其令对手有不好的下一手,以及自己有好的下下一手棋。
我们姑且不讨论,在第1节里,专家应对绑架的三点原则的适用范围,以及如何根据情境调整策略。
本文的焦点是:
极大极小原理。
绑架,是一场零和博弈。
就像下棋,一个人赢,一个人输,即使和棋,也只是暂时的平静。
双方没有合作的可能。
对于这类博弈,冯·诺依曼提出了“极小极大原理”。
《囚徒的困境》一书,用我们熟悉的分蛋糕来示例。
众所周知,公平的分法是:一个人切,一个人选。
假如两个孩子都不是孔融,并且都想吃更多蛋糕,这其实是一个典型的零和博弈。
  • 第一个孩子(切蛋糕那个)的两个策略是:不均分和尽可能均分。

  • 第二个孩子(挑蛋糕那个)也有两个策略:选较大的那一块或选较小的那一块。

如下图。
(请注意,表格里的4个结果,都是指切蛋糕的孩子的所得收益。)
切蛋糕的孩子貌似掌握了主动权,但他决策的关键点,取决于“然后呢?”--即对手的下一步会怎么做。
显然,挑蛋糕的孩子,会追求让自己的蛋糕最大化,也就是让对手的蛋糕最小化。
对应上面的表格,挑蛋糕的孩子总是会选左边一列,从而导致切蛋糕的得到左边一列的两个较小蛋糕的结果。
于是切蛋糕的孩子要做的事情,就是:
让挑蛋糕的孩子将要留给他的量小的那半块蛋糕极大化。
因此,切蛋糕的孩子只能选择尽量均分蛋糕,以保证获得差不多的半块蛋糕。
这个量,是行中极小值的极大值,被称为“极大极小”。
也许有人会说,这么简单的道理,为什么要说这么啰嗦?
德谟克利特早在公元前300多年前,就创立了“原子论”,认为每一种事物都是由原子所组成的。
然而,这只是一种想法。
对比而言,爱因斯坦对原子的理解,才算是科学。
二者之间的区别在于:后者可实验,可计算,可运用。
作为博弈论的创始人,冯·诺依曼说过:没有极小极大定理,就没有博弈论。
《囚徒的困境》一书对极小极大定理总结道:
  • 在两个利益完全相反的人之间出现的有精确定义的冲突,总存在一种理性的解;

  • 所谓理性的解,就是在给定冲突性质的前提下,双方都确信他们不可能期望有更好的结果了。

3
让我们回到绑架现场。
即使被绑架者非常被动,但这仍然是一场博弈。
要理解这一点,我们需要强调三个名词:
1、回合;
2、节点;
3、选择权。
回合
许多事情,都是连续决策的结果。
而零和博弈,是敌我双方轮流决策,由一个一个的回合叠加起来。
节点
上述每个回合,你都有一个属于自己的决策节点。
然而,很多人要么忽视了节点,要么放弃了节点。
选择权
在每个回合的决策节点,你其实是在做一个选择。
你有选择权,对手也有选择权。
敌我双方都试图让自己的选择收益最大化,让对方的收益最小化。
当你被绑架的时候,对手已经出招,现在轮到你走棋了。
(再次强调,本文不构成对绑架情境的具体实战建议。)
你仍然有选择权:
1、放弃抵抗,上对方的车;
2、大声呼救,拼命反抗。
这个时候,大多数人会想,我抵抗的话,会有什么后果:
  • 会受伤吗?

  • 会激怒对方导致生命危险吗?

然而,从博弈思维来看,你仅仅纠结于当下的一步棋去想,毫无意义。
你应该去想:
我如果这样做,对手会如何回应呢?再然后我又该如何应对他的回应呢?
也就是说:
  • 你要计算下一步,以及下下一步。

  • 然后,再由此倒推,你现在这一步该如何做选择。

我将本文开头那个专家描述的场景图示如下:
如果“你”乖乖上了绑匪的车,如上图左分支(选择1)所示,可能导致如下结果:
1、在第四个回合,你已经失去了选择权;
2、对手可以自由选择让自己利益最大化的做法;
3、绑架的许多目的是为了钱财,有些歹徒会先撕票再要钱;
4、未经核实的数据是,撕票比例高达10%;
5、据某地警方的经验,越是熟人绑架,撕票的可能性越高。
所以,处在第二回合的“我”,要考虑的是,第三回合的对手会怎么做,以及自己会有怎样的第四回合。
《囚徒的困境》引用了卡尔维诺在《寒冬夜行人》一书中的一句话:
“你知道,你所能期盼的最好结果就是避免最坏情况。”
这句话,很好地说明了极小极大原理。
还记得本文开头专家的第二条建议吗?
记住,他在撒谎。
从一开始,每个谋杀犯,绑架犯,强奸犯,他们都会用同一句话:“照我说的做,我就不会伤害你。”
可是,如果罪犯真的不会伤害你,那么你反抗的时候他也不会伤害你。
而且,即使起初罪犯没有太想伤害你,但是当你失去选择权的时候,他可能会萌发伤害的念头。
回到博弈思维:
游戏者决不会从他的最佳策略上偏离到对自己造成威胁的策略上去。
尤其是在零和博弈中,对你有利,对绑匪就不利。
请看上面的图,在第三回合,绑匪会极力让你的收益最小化。
所以,你在第二回合要做的,是“极大化”这些自己可选的“极小值”,尤其是要避免最坏结果。
同时,你要“极小化”对手可选的有利于他的“极大值”。
由此倒推,你就会发现,如专家所言,在第二个回合,你应该做的是:
要在原地,用尽一切手段与之搏斗。
4
仅仅明白道理并不够,我们需要定理。
为什么需要定理?
因为定理可以形成算法。
冯·诺伊曼对极小极大值定理的证明是复杂的,“它以一种读者难以理解的方式结合了基本概念和拓扑概念”。
约20年后,香农利用 Minimax(极小化极大)算法,提出了解决国际象棋问题的设想。
随后,在AI攻克国际象棋和围棋的过程中,Minimax(极小化极大)算法扮演着基础而重要的角色。
极小化极大算法(Minimax)可被概括为:
  • 对于两个玩家的对抗游戏,其中任何一个玩家的决策会依赖于另外一个玩家之前的决策,且另外一个玩家总是竭尽所能地想要获得胜利。

  • 因此,一方会在所有选项中选择令其自身优势最大的一个,而另一方则会选择令对手优势最小的一个。

  • 通过穷举不同玩家之间的策略,该算法可以构建一棵搜索树,并通过穷举不同的可能,选择其中能得到最佳结果的路径。

请点击放大,看下图右边的搜索树的最下面一行,3、12、8这一组数字,是“我”期望获得的可能的利益。
  • 对于对手而言,当然会选择让“我”利益最小的走法,所以,在MIN那一行的B节点,对手会选择3、12、8中的最小值3。

  • 同理,在C节点,对手选最小的2;在D节点,选最小的2。

  • 而在MAX行,“我”要选择“3、2、2”这一行极小值当中的极大值“3”。

这就是Minimax(极小化极大)算法。
但是,即使是对于棋类这种完美博弈,该算法的计算复杂度也会呈指数级增长。
因此往往需要引入剪枝策略来简化搜索的复杂度。
以及,通过多次采样的蒙特卡洛树搜索,以减少计算量。
再往后, UCT 算法将蒙特卡洛树搜索方法与UCB公式结合,有效解决了围棋上的问题。
进而,基于深度强化学习, AlphaGo诞生,惊人地击败了人类,完成了以往被认为还需要20-50年才能实现的任务。
德谟克利特对原子的理解令人赞叹,然而只有基于爱因斯坦的公式,人类才能造出原子弹,以及安全地利用核能。

5
极大极小原理,给我以下七点启发:

启发一
站在对方的角度想问题,
然后倒推自己的策略
我们可以广义地来想这个问题,即使不是在零和博弈的环境下。
例如说起某某产品经理很厉害,可以瞬间将自己变成小白,其实就是能彻底地站在对方的角度。
几乎所有厉害的商业公司,核心原则就是“经营顾客”。
先想着让顾客价值最大化,然后再从中找寻让自己最大化的策略。
所以芒格说:要诉诸利益,而不是讲道理
我经营春藤,有时候也会和小伙伴们在一线谈业务。
我不是很好的销售,口才也很一般,但每次谈合作效果还不错。
我的方法是:
  • 请问你现在最想要的是什么?

  • 我们可以如何帮助你实现你最想要的?

  • 我们立即可以做的最小化合作是什么? 

启发二
不占别人便宜,
自己的也要据理力争,不当烂好人
段永平早年经营企业,既不占供应商的便宜,也不给批发商赊货。
不管多好的买家,必须现款现货。
何谓烂好人?就是彻底放弃自己的选择权,试图讨好对方,感动对方。
然而,人性是经不起考验的。
所以,很多时候,烂好人不仅招恶人,甚至催生恶人。

启发三
将对手想成一个势均力敌的对手
以我下围棋为例,切忌低估对手。
所谓低估对手,就是对他人抱有幻想。
例如,你发现一手棋,能够让自己的利益最大化。但是如果被对手识破,那么结果就会很糟糕。
有时候,棋手会心存侥幸:要是他看不到,那我就赚了。
然而,这是不对的。
你就该假设对方是一个势均力敌的对手,你能看到,对手也能看到。
当然,如果下让子棋的时候,要适当调整。
以及,在德州扑克等博弈中,或是像剪刀石头布这类首尾相连的游戏,也需要虚张声势。
总之:
  • 别欺负别人,别想着占便宜;

  • 也别因为暂时领先而得意忘形,别耍过头。

启发四
将街上的每个司机都当作潜在凶手
这个想法似乎有些极端。
几乎没司机有动机要撞你。
但是,理论上,每个司机都有撞你的“可能性”。
对你而言,这个最坏的结果可能性很小,后果很严重。
这正是极大极小原理的灵魂:
“你知道,你所能期盼的最好结果就是避免最坏情况。”

启发五
珍惜每一个选择权,
并为你的下一个、下下个选择权做好铺垫
人生是一连串决策的总和。
所谓全局观,是指你的每个决策点既是相对独立的,又和过去和未来相关联。
有些人只管当下舒服,而不顾自己的下一手该如何。
如果你在一个球队里,队友总是给你传烂球,或者不给你传球,你一定会骂他烂人。
可是在现实中,现在的“你”,可能经常不顾及未来的“你”,不管未来的“你”是否有好的选择权。
一连串有算法的选择权,就是一个人的“人生算法”。

启发六
所谓仁慈的狮子,
是指你要当好人,但保留惩罚坏蛋的权利
如题,这一条启发,反过来也是适用的。
例如,你彻底放弃惩罚对方的权利,以换取对方彻底的信任。
前提是你相信对方是一个珍惜荣誉的人。

启发七
彻底远离损人不利已的人
博弈论的假设是:双方都是理性的。
博弈论只研究对赢感兴趣的、有完善的逻辑思维能力的游戏者参与的博弈。只有你相信你的对手(一个或几个)既是理性的,又是希望赢的,而你自己在玩的时候也始终憋着一股劲儿,要力争为自己取得最好的结果,这样的博弈才是博弈论分析的对象。

对博弈论而言,自私的人并不可怕,可怕的是不理性的人。

为什么呢?

  • 一个自私的人可能做损人利己的事,一个合作的人可能做利人利己的事情。

  • 但是,一个不理性的人可能做损人不利己的事情。

  • 博弈论很强大,但是如果你是在和一个非理性的人“交手”,就很难得出一个解答。

你的最佳选择是:

远离这类人。

举例说吧,经济较发达区域的特点之一是:民众只算自己的账,而不去算别人赚多赚少。

倘若不如此,就会出现如下局面:我才赚十块,你居然赚一千块,我宁可牺牲自己的十块毁掉你的一千块。

这就是损人不利已。

如此一来,博弈论的均衡就无法出现。因为非对弈情况下的“损人不利己”,也就是理性的失去,会摧毁整个游戏。

(当然,经济是否发达有多方面因素,不发达地区也经常有“只算自己账”的传统。)

记得中学有个同学的哥哥当年混社会,他说他们那群20岁上下的青年谁都不怕,最怕十四、五岁的孩子,因为这类混小子可能毫无目的不顾后果地冲上来给他们一刀。

博弈论因为这类人而失效。

本文开篇对于绑架者的分析,也是假设他们是理性的。

但是,如果绑架者不是理性的人呢?

那么,不理性的凶手可能会不顾受害人呼救招来人,在没有利益的情况下下毒手。


最后

归根结底,一切在乎“对的人”

不管是零和博弈,还是双赢博弈,你都要努力令对方是一个理性的人。

既要选择对的队友,更要选择对的对手。

关于极大极小原理,我们还可以将其智慧拓展为:

狭路相逢勇者胜,

勇者相逢智者胜,

智者相逢德者胜,

德者相逢道者胜。

最后,祝福你我此生一早避开,不必在狭路上遭遇那些损人不利己的混蛋。

本篇文章来源于微信公众号: 孤独大脑

行动力强大的人,都是“二进制”的

赞美一切诗歌格律,它们拒绝自动反应,

强迫我们三思而行,摆脱自我之束缚。

温·休·奥登

000

《鱿鱼游戏》中的第五关,是“跳玻璃桥”。

玻璃桥由18节构成,每节有左右两块玻璃,一边是普通玻璃,一边是强化玻璃。

游戏规则是:参赛者必须正确分辨出普通玻璃和强化玻璃,若踩到普通玻璃就会当场摔死,一路踩到强化玻璃才能过关。

二选一,即使靠蒙,胜率也高达50%。

然而,虽然每一节的变化只有2,两节的变化也就是2✖️2,连续18节的变化是2的18次方,却高达262144种。

这是一个指数级的增长

要想连续18次都蒙对,成功的概率是(2的18次方)分之一,也就是约为30万分之一,约为死于从楼梯上摔下来概率的二分之一。

然而,在《鱿鱼游戏》里,最终有三个人过关,除了靠玻璃厂师傅肉眼辨别出来的较少环节,主要都是以人命为代价蒙出来的。

理论上,如果人们不自相残杀,即使是靠蒙,活下来的人也应该多于三人。

为什么一个成功率只有近三十万分之一的游戏,仅仅靠十几个人就能打通关呢?

因为这是18个串联在一起的二选一,18个人用命去蒙,相当于一个逆向的指数效应,可以用非常有限的测试,来找到262144种可能性中唯一正确的可能性。

我称之为:逆向复利

尽管这是个能够单独成篇的“原创概念”,但本文不止于此,我还将:

1、再次提起香农对于信息的定义:消除不确定性

2、进而,二进制真的只是为了实现可计算吗?并非如此,本文将通过一道有趣的智力题,来谈及信息的“维度”

3、如果说1是原理,2是计算,这部分则会重提被99.9%的人误读的芒格多元思维模型,本质上这种思考模型是用于“消除”,但人们往往以为是“增添”。

4、所以,“瞎子摸象”是对的。面对未知世界,我们与瞎子无异,我们的每次看见,观察,想到,都和瞎子一样只摸到了局部。

但是,我们也必须在不完备的信息前采取行动。

世俗意义上,每个行动力强大的“成功者”,底层都是二进制的。

即:将所有需要做决策的难题,转化为二选一的问题。

5、用“灰度认知,黑白决策”这个我原创的概念来收尾并点题,会把我们的这次探险拖回生死游戏的主题。

在《鱿鱼游戏》的玻璃桥这一关,游戏者每次必须做出二选一的“黑白决策”,不管是踩上了钢化玻璃,还是坠入死亡深渊;只有如此,才能够在262144种可能性的“灰度认知”里,找到一条活路。

以上5部分,将构成一次完整的思维探险。

开始吧!

001

先来玩儿一个简单游戏:

已知有两个抽屉,各有一黑一白两个盒子,一共四个。其中一个盒子里有颗大钻石,猜中了就归你。

你可以问任意问题,主持人必须回答,但只能说“是”或者“不是”。

请问你最少要问几次?

也许你在宿舍生活时,玩儿过类似的游戏:通过不断问问题,获得“是或不是”的反馈,然后一步步解出谜题。

答案是你需要问两次:

第一次:是在左边的抽屉里吗?

(是,则左;不是,则右。)

第二次:是在黑色的盒子里吗?

(是,则黑;不是,则白。)

这个问题,是为了引出香农那并不算太简单的信息论。

含义与信息无关”,这看起来是个很奇怪的说法。然而,正是在拉尔夫·哈特利这一观点的影响下,香农意识到:

应该从物理层面,而非是心理层面来定义信息。

信息到底衡量了什么?它衡量了我们所克服的不确定性

举一个例子,如果一枚硬币的两面都是头像,那么无论你抛多少次,它能够赋予你任何信息吗?

《香农传》一书写道:香农坚持它不能提供任何信息。它不能告诉你尚不知道的情况,因为它不具备任何不确定性。

所以,在《鱿鱼游戏》中的第五关“跳玻璃桥”,一个人向前跳,不管他踩中了钢化玻璃,还是不幸踩碎普通玻璃,都为团队提供了信息。

这种信息,是通过消除不确定性来实现的。

那么,该如何度量信息呢?

香农引入了“比特”的概念。

比特来自二进制,香农认为可能拥有的最简单的信源,就是抛硬币,正或反,是或否,1或0,这是可能存在的最基本的信息。

就像信息的原子。

比特是在两个等概率的可能性之中进行选择后所产生的信息量。

所以“一台拥有两种稳定状态的设备……能够存储1比特信息”。

回到开始的猜钻石游戏,你需要多少信息?

  • 在左右抽屉里二选一,对应1比特;
  • 再在黑白盒子里二选一,对应1比特;

所以你总共需要2比特,以实现在四个盒子里选出一个。

玻璃桥游戏里,总变化高达262144种可能性,但因为这是18个串联在一起的二选一,我们算一下需要多少信息:

也就是计算262144以2为底的对数:log2262144=18,相当于2的18次方的逆运算。

为什么计算对数?

因为:采用概率分布的对数作为信息的量度具有可加性。

由于求对数,所以有一种逆向的指数效应。其所产生的加速效应,我称之为逆向复利

过玻璃桥的变化虽然很多,但信息只有18比特。

那么,每跳一个人,不管是否掉下去(就像抛硬币无论正反面,获取的信息是一样的),就获得了1比特。

当然,如果没掉下去,就又多了一次下一轮的测试机会。

由此,每跳一次,就获得了一个信息,也就消除了一部分不确定性。教科书对此的描述是:

香农将热力学的熵,引入到信息论,因此它又被称为香农熵,或信息熵。

在信息论里面,熵是对不确定性的测量。

在信息世界,熵越高,则能传输越多的信息,熵越低,则意味着传输的信息越少。其公式如下:

其中p(xi)代表随机事件X为xi的概率。

还是以扔硬币为例。

扔一次硬币,出现正面的概率是 p1=0.5, 出现反面的概率也是p2=0.5。

所以,根据公式计算:

H = -(0.5✖️log2(0.5) + 0.5 ✖️log2(0.5)) = 1比特

但是,如果这枚硬币被做了手脚,出现正面的概率是0.7, 反面是0.3。那么“扔一次这个硬币”这个事件的信息熵是多少呢?计算如下:

H= -(0.7✖️log2(0.7) + 0.3✖️log2(0.3)) = 0.88比特

假如你去玩抛硬币的游戏,而且你知道有一桌的硬币做了手脚,正面概率是70%,那么你一定会选这一桌,并且每次都押正面,因为其信息熵更低,这意味着该“不确定性”比公平的硬币降低了。

在《鱿鱼游戏》里,那位玻璃厂的老师傅,就是靠自己的专业,降低了自己每一次蒙的行为的信息熵,就像上面那个做了手脚的硬币。

因此,他消除不确定性的“能力”更强。


010

二进制真的只是为了实现可计算吗?

“是”,或者“否”,只是作为信息的原子吗?

《鱿鱼游戏》的玻璃桥游戏里,每跳一次,前行的不确定性就被消除了一半。

顺着这一点,我想谈及信息的“维度”

还是从一道更有趣的题开始:

国王有一百桶酒,比自己的生命还重要。结果有一天其中一桶被投了慢性毒药,喝了以后半个小时就会死掉。国王大怒,命令玩忽职守的侍卫去试毒。酒不能被混合,一个侍卫可以喝多桶酒,一桶酒也可以由多个侍卫喝。

请问:怎么样才能用最少的侍卫、在半小时知道哪桶是毒酒?

解法1:一维法

最简单的方案,是让每个人试一桶酒,用时30分钟,就可以判断出哪一桶酒有毒。

这个是“一维”的直线思维,在现实生活中也未尝不可,好过什么都不干。

这样的解法,答案是:99个人。

解法2:二维法

从二维层面去思考,引入笛卡尔的坐标。

把100桶酒摆成10✖️10的矩阵,如下:

接下来

  1. 让阿拉伯数字编号的1号侍卫(如上图,黄色),把第1行酒每桶喝一口,一直到10号喝第10行;
  2. 让汉字编号的一号侍卫,把第一列酒每桶喝一口,一直到十号喝第十列;
  3. 由于坐标的定位功能,假如毒酒在图中绿色的位置,那么3号侍卫和二号侍卫都会死,自然可以锁定毒酒的位置。

这样的解法,答案是:20个人。

解法3:三维法

能否再延伸至三维层面去思考呢?

我们很容易想到,搭建一个5✖️5✖️4的三维模型,正好有100个位置放酒,如下:

接下来(和二维解法差不多)

  1. 让阿拉伯数字编号的1号侍卫(如上图,黄色),把黄色箭头这一面墙的酒每桶喝一口,一直到5号喝第5面墙;
  2. 让汉字编号的一号侍卫(如上图,橙色),把橙色箭头这一面墙的酒每桶喝一口,一直到五号喝第五面墙;
  3. 让字母编号的a号侍卫(如上图,蓝色),把蓝色箭头这一层的酒每桶喝一口,一直到d号喝第四层;
  4. 同理,通过三个维度,也可以锁定毒酒的位置。

这样的解法,答案是:14个人。

最笨的方法1,会死一个侍卫;方法2会死两个,方法3会死三个,总之一个维度会死一个。

所以题目中有含糊的地方,到底是用最少的侍卫,还是死最少的侍卫?考虑到国王的残酷,我们姑且认为是前者。

然而,即使聪明如你想明白了上面三个维度的解法,还是没有找到最优答案。

解法4:二进制

如果用计算机的思维来分析这个问题,那么首先考虑如何存储这100桶酒。100桶酒可以用二进制7个比特来表示(2的7次方>100)。

上面的解法1到解法3,都是用100个位置存储100桶酒,只是描述位置的坐标,从一维到三维,效率越来越高,所以用的侍卫越来越少。

如果用二进制呢?

二进制,是逢二进一的计数编码方法,只有0和1两个数码。那到了2怎么办?只有往前进一位,变成10。

所以,十进制的2、3、4、5,二进制分别表示为10、11、100、101。二进制广泛应用于电子计算机的数据处理。

回到我们的题目,计算如下:

第一步:对于每一桶酒的二进制表示,编码后,最长的数字是7位数,不足七位前面用0表示;

1号桶是0000001,

2号桶是0000010,

3号桶是0000011,

4号桶是0000100,

……

100号桶是1100100;

第二步:可以找七个侍卫,从左到右,编号“一”至“七”,每人对应一个位数,从第一位到第七位。

第三步:负责第一位数的侍卫“一”,只要这100桶酒中,二进制编码的该位数对应的数字是1,则喝掉此桶酒。

如此类推,每个侍卫喝掉他所负责的位数上数字是1的酒。

第四步:30分钟后,侍卫按照“一”至“七”,死掉的置为1,活着的置为0。

例如,假如第七桶酒为毒酒,其二进制编码是0000111。那么按照上面的喝酒规则,其五、六、七位都是“1”,所以编号五、六、七的侍卫都会死。

前四个侍卫,遇到这瓶毒酒,因为对应的数字是0,所以都会活。

二进制的0和1,正好对应了活和死。

根据7个侍卫喝酒后半小时的生死状态,能够得出毒酒的二进制编码。

这样的解法,答案是:7个人。


以下,请允许我从一个非专业人士的“感知”的角度,来说说这道题的启示:

1、第一种方法,是简单的线性搜索;

2、第二、第三两种方法,是增加了维度的线性搜索,可以理解为交叉搜索,等价于坐标系;

3、前三种解法,维度越高,效率也就越高;

4、因为有“半小时”的时间约定,所以不能用简单的二分法来解答。所以,第四种解法用二进制为100瓶酒编码,进而用0和1对应不喝与喝(也对应了撞见毒酒后的生和死)。

5、那么第四种用二进制的解法,是否可以理解为“7维”的解法?

  • 第一种解法有1个维度,该维度上有100种可能。这其中的99种,每种可能都需要1个侍卫去通过喝酒“消除不确定性”;
  • 第二种解法有2个维度,每个维度上有10种可能,每种可能都需要1个侍卫去通过喝酒“消除不确定性”,然后这两个维度的交叉点,就是毒酒的位置;
  • 第四种解法有7个维度,每个维度上有两种可能,每两种可能,只需要1个侍卫去通过喝酒,就可以“消除不确定性”。于是,这七个维度的交叉点(表述为一串二进制数字),就是毒酒的位置。

通过这个未必严谨的“维度”隐喻,我们能发现,二进制的“是”或“否”,产生了一种判断上的两倍杠杆效应。

所以,第四种方法,只要让2的n次方大于100即可。

于是,指数效应出现了,n是7的时候,2的7次方是128,够用了。

在本题中,将二进制类比为7个维度,很有趣,但这并不是我的目的。

结合跳玻璃桥的“消除不确定性”,和喝毒酒的“维度”,可以跳到下一节的话题:

被误读的芒格。

011

芒格的“多元思维模型”,是说通过研究和考量多种内部和外部因素、不同行业和跨学科的信息及知识,对投资决策进行权衡。
对该模型的厉害之处,绝大多数人的理解是:
“你不能手上只有一个锤子,你得背一个工具箱,不断往里面放进一些重要的工具,否则如果你下次遇到的不是钉子,而是一个易碎的宝藏,你只能用锤子砸开。”
芒格鼓励人们掌握多种思维模型,很多人认为就像收集龙珠,只要达到一定数量就可以很厉害了。
这是巨大的误读。
人们忘记了,芒格和巴菲特最主要的工作是:
对形形色色的投资机会说不。
所以,他的多元思维模型,是用于摧毁的,而不是用于构建的。
他摧毁的,是投资中的不确定性。
而我们绝大多数人,从事的是构建和搬砖的工作。
多元思维模型基本上不会提高一个普通人的构建能力。
回到香农的定义:信息是用来消除不确定性的
可是,多元思维模型很多时候给人们带来更多的不确定性。
多元思维模型不是用来搭建一个“厉害杀人武器集合”的,而是用来切割钻石。这个钻石就是你的大脑。
该模型的另外一个误导之处,就是“模型”这个词。
芒格是物理爱好者,他对行为经济学等领域也充满了兴趣。在思维层面,模型并非是数学和物理层面的概念,而是所谓底层原理的隐喻。
这类隐喻,以及所有类似的“概念、干货、图表”,几乎都只是临时的脚手架,在去除了湿漉漉的环境要素和专业深度之后,什么都不是。
这种脚手架,这些夹层解释,这些认知的幻觉,维特根斯坦从哲学层面不喜欢,图灵从计算层面不喜欢,香农从信息层面不喜欢。
且不论,跨学科的目的是为了形成底层的连接。就像神经元之间的连接一样。
以及,只有当你在某个领域钻研到一定深度,这时候通过跨学科阅读,会有意外的突破,甚至形成“通感”。
为什么多元思维模型对芒格管用?
因为他的工作是说“不”。
为了让自己减少误判的概率,芒格的方法是:
主动证明自己的错误的。
所以,他采用交叉证伪法,从不同的维度去拷问自己,否定自己。
就像上面那道“找毒酒”的题目里,切割的维度越多,“证伪”的效率越高。
有目的的学习也许分两种:
  • 一种是发散式的,为了增加知识;

  • 一种是消除式的,为了减少幻觉。

对成年人而言,更多是指第二种。
所以,我们应该用多元思维模型识别他人的胡说八道,而不是用于自己对别人胡说八道,更别用于自己对自己胡说八道。

100

回到二进制。
世俗意义上,每个行动力强大的“成功者”,底层都是二进制的。

这也许关乎信息与决策的“第一性原理”。

记得谷歌的创始人佩奇说过,他喜欢将所有的决策难题都变成“二选一”的问题

其中的原理,相当于把图灵“可计算的问题”,转换为“可行动的问题”。

如果说前面的多元思维模型是“升维”,那么二进制的行动者则是“降维”。

思考上“升维”,行动上“降维”。

不光是技术范儿的决策者,偏文艺的乔布斯去客户那里谈生意,在会议室里的第一句话就是:你们能拍板的人在不在?

假如不在,他掉头就走。

在商言商,光聊天的确是耍流氓。(当然,如果朋友间也是如此就悲催了。)

就像在死亡游戏里,呆立玻璃桥上啥也不干挡住大家求生的人。

但这不意味,这个世界是非黑即白的,我们对现实的判断往往也充满了灰度。

香农的信息熵,将概率和不确定性引入了信息。这本身就象征着灰度。

然而,“是”或“否”,是最基本的信息。

如上所述,心理因素,情感因素,被从信息中“去除”掉了。假如有的话,也会变成“0”和“1”。

就像AI下围棋,传统围棋高手那些不可言传的“心法”,那些风格,那些棋理,那些坚守的棋道,都被消除掉了。

有趣的是,AI反而实现了一种远超人类的围棋大局观。过往,人们认为这一点(包括直觉、大局观、灵感)是围棋作为人类智力巅峰游戏的最后壁垒。

当然,我们仍然处在一个物理定律、社会规则、个人心理等因素交织在一起的复杂系统里。

算法与心法纠缠在一起。

以及,人类经常干蠢事的大脑,看起来有着比“0和1”计算机更强大的运行机制。

但是,正如莎士比亚的“To be or not to be”,0或1,二选一,黑白决策,是人生的“元决策”。

就像人只有生或死两种状态。


101

本文的草稿,我追溯了从亚里士多德、莱布尼兹到布尔的逻辑之路。
又顺着罗素、维特根斯坦、图灵、冯·诺伊曼、香农等天才人物对人类思维与机器思考的探索,来谈及0和1何以成为这个世界的基本元素。
后来我主动消除了那些不利于减少“理解二进制”的不确定性的文字。
简而言之,许多聪明人走过了一条复杂的玻璃桥,通过消除各种瞎子摸象般的偏见,实现了喜欢八卦的莱布尼兹那“万事万物”或许皆可计算的梦想,并努力拯救语言给我们的边界、误导和确定性幻觉。
莱布尼兹对二进制惊人的直觉--“二进制乃是具有世界普遍性的、最完美的逻辑语言”成为现实,并改变了整个世界。
从逻辑,到数学,到可计算,到计算机,再到信息革命,0和1,二进制,比特,已经不再是想象中的抽象事物。格雷克写道:
比特是另一种类型的基本粒子:它不仅微小,而且抽象——它存在于一个个二进制数字、一个个触发器、一个个“是”或“否”的判断里。
它看不见摸不着,但当科学家最终开始理解信息时,他们好奇信息是否才是真正基本的东西,甚至比物质本身更基本。他们提出,比特才是不可再分的核心,而信息则是万事万物存在的本质。
物理学家约翰·阿奇博尔德·惠勒说:“万物源自比特。”
他写道:
“我们所谓的实在( reality),是在对一系列‘是’或‘否’的追问综合分析后才在我们脑中成形的。所有实体之物,在起源上都是信息理论意义上的,而这个宇宙是个观察者参与其中的宇宙。”
因此,整个宇宙可以看作一台计算机——一台巨大的信息处理机器。
而人类的命运,则是这台超越人类想象力的机器中的一部分。

110

《鱿鱼游戏》里,跳玻璃桥,其实是比拔河更体现团队协作的游戏。
尽管每个人都是为自己而活,但是前面死掉的那些人,确实是为后面的人而死。
拿命去试,似乎很荒唐。
但是,人类社会不就是如此吗?
在人世间这场概率游戏里,有些人赢了,有些人输了。
赢了的人应该意识到,那些输了的人是为自己而输。
就像扔一个六面的骰子,假如你一次就幸运地投中了自己想要的数字“6”,那么理论上在另外五个平行宇宙里的“你”,承担了其它五个你不想要的数字。
人类的进化,文明的前进,靠的就是无数人用自己的一生去试。
关键在于,人类的命运必须关联在一起,而不是彼此独立地盲目去试
 “全体人类就是一本书。当一个人死亡,这并非有一章被从书中撕去,而是被翻译成一种更好的语言。”
每个人的一生不也是如此吗?
“我”的一生,就是无数个不同时刻的“离散的我”串联而成。
时间,就是我们人生当中前途未卜的玻璃桥。
每一个离散的时刻,就有一个“过去的我”可能踩中普通玻璃。
本质上,我们是在牺牲掉一个个“过去的我”,他们坠入时间的深渊,为“未来的我”试出一条活路。
《鱿鱼游戏》里的玻璃桥,有两种善良的属性:
  • 一个是被串起来,有路线。

  • 一个是二选一的胜率很高。

很残酷的现实是,我们并没有一条这样的路线。
在人生的诸多个二选一之中,我们也极少有50%的胜率。
我们的未来是网状,更多变量,更加充满不确定性,也因此更为仁慈。
在漫无边际的人生里,你要自己搭出玻璃桥来,找到自己的人生算法
灰度认知,在每个二进制的节点,做出二选一的黑白决策
也许我们的一生,就是一个比较温和版的鱿鱼游戏。
谢谢你陪我玩儿。

本篇文章来源于微信公众号: 孤独大脑

运气总是好,其实是大局观好的结果

一些大脑碎片。
在记忆里,各种感官互相串台,炎热变成了明亮,美艳变成了果香,恐惧变成了惊雷。
一个好片子的标准是,哪怕一个人不知道剧情,随意看上一小段也会觉得有趣。
原始人社交,要么是一起狩猎,要么是一起分肉吃。现代人社交也是一样。所以,如果有些社交无聊,或许是因为既没狩猎,也没分肉。
脱先作为围棋里很有趣的手段,本来是指在某个战场什么都不做,但是你需要水平很高才能做到“什么都不做”。
不偏不倚的,多半是废话。
因为不世故而呈现出来的幼稚,可能是更深远的成熟。
与结果无关的荒诞叫喜剧,与结果有关的荒诞叫悲剧。
思考的浓度与人类社会的实际浓度比较接近的人,更容易取得世俗的成功。太浓或太淡则要难很多。这浓淡的标准,与真假和美丑的标准并不对应。
虚伪是指你骗别人“你是那个你正在伪装的人”,真诚是指你骗自己“那个你正在伪装的人就是你自己”。
对于那些喜欢问“这有啥用”的人,他们无法回答另一个问题:那些“你认为有用的东西”具体而言对你有过啥用?
“快速”可以解决存量问题,“慢速”则更有利于实现增量创造。
AI下围棋,从对弈(冯.诺依曼说下象棋不是博弈)的角度定义了“狠角色”:不过分,不手软。~大多时候我们混淆了狠角色和厉害角色,厉害的家伙不是因为“狠”而厉害,而是因为“对”而厉害。
所谓宝藏是指“价格低于价值”,而非指价值很高。
假如内卷是指令价值低于价格,也许会催生某些无用之物,无用之物则为社会提供了孕育更多可能性的冗余。
解决智能手机电池局限性的最好办法是随身带一本书。
当我想表达一个观点的时候,我先努力将其表达清晰,然后思考如何防守“杠精”。你如果不能对自己的观点比杠精更精,你就不配表达这个观点。
极有可能是因为人的大脑记忆系统没有子目录根目录,所以智能手机的App都是平铺,Gmail的邮件也开始堆在一起,无需分类整理,而是靠搜索。
所谓富人消费和穷人消费的区别,类似于“买看起来贵的好公司”与“买看起来便宜的烂公司”的区别。前者的股价会越来越贵,后者的股价会越来越“便宜”。
“穷人”看价格,“富人”看价值。
应试的标准化生产线,以及仅有“成王败寇”一种价值观,会培养出凶猛的“单细胞思考动物”。
假如你看到一本书很牛,最好你马上买下来。因为你要么看到一本很牛的书,要么学会了如何假装很牛。~难题是如何区分二者。
混淆“常见”和“常识”的后果极其严重。
小赌徒是一点点被割光;大赌徒是经常赢,长期赢,有时还赢很多,然后因为一把(看似小概率的)巨大的输而被割光。
决定进入哪个赌场,以及决定何时离场,比赌技更重要。
现实中将“两倍速复利效应”用得最好的,可能是拉面。
这世上的大多数财富可能都是以库存的形式存在的。
鲜活的价值,更多是指“鲜活度的价值”,而非“鲜活主体的价值”。
一些书因为被打开而被更多人买,一些书因为不能被打开而被更多人买。~论书的塑料薄膜的意义。
被广泛运用的产品和服务的复杂程度,几乎没有超过一元一次方程的。例如智能手机的App平铺,例如微信的群。
当落日从云团下方钻出来时,其实也应该算作日出的一种。
所谓礼貌,就是不急;而不急,是因为不用急。所以礼貌只是某种结果。
没有比筹码还能不断涨价的“赌场”更好的生意了。
相信未来技术可能实现指数级的增长,能够让人类克服恐惧对想象力的束缚。例如,一亿很大,却“只”是2的26.6次方。
非物理意义上的惯性都值得被质疑。
有时候,你的反对者比你的赞成者更理解你的观点。或者,前者至少能更令你深入你自己的观念。
别去参加一场对方不愿意为他的观点下注的辩论。
说一个人“用情怀做某事儿”,听起来就好像他不打算当真的意思。
磨刀不误砍柴工是拖延症最好的托辞。我都快成职业磨刀客了。
城市的风格,就像城市的滤镜。
科技的进步,主要体现在制造人类幻觉的成本越来越低。
房地产为什么昂贵?这是人们为“确定性”给出的定价。房产有空间上的唯一性和时间上的相对长久性。~关于财富、健康、情感,人类追逐的几乎都是确定性和秩序。
科幻小说将人带往三条不同的路径:科学,文学,玄学。~对科学的爱好,也可分为如上三种。
幽默感来自1%无害且有趣的杠精,科学进步来自1%有益且聪明的杠精。其他98%构成了日常生活。
早餐时看AI围棋中盘厮杀,想起小时候评书里说:招招不离后脑勺。
智者极其罕见,一旦涌现出一个,就会在人类的星空漂浮很久。~例如德鲁克之于管理。当然他在该领域的成就恰恰来自于:他从万物和人性的更深层面去思考管理。
判断分为两种:一个是对某事物的判断;一个是对“他人对某事物的判断”的判断。
最该搬到元宇宙的,是人类的战争。结果,最早占领元宇宙的是股市……钱果然是这个世界最快的东西。
有两种生意模式:1、这么贵的东西,居然还有人买;2、卖这么便宜,居然还能赚钱。
在手机基本已经替代了相机的时代,一个传统相机的价值不再是你因为其更专业的功能而拍了好照片,而是你因为机器带给你的拍照冲动所多拍的照片。
星座文化最厉害之处,就是让人在一种巨大的相似性当中(将全体人类分为12个框,这个分类体系的霸道仅次于传统的男女性别)去找寻自己的独特性,并且当事人还相当满意。
事前黑天鹅,事后灰犀牛;事前“说不准”,事后“我就说”。
恨永远无法消除,因为恨原本是爱的一种表达方式。就全体人类而言,爱与恨不在于是非彼此,也不在于过往情仇,而在于需要被共同搁置在理性的盒子里。
多么老旧的酒店,仍能依稀看出它当年的雄心壮志(哪怕显得有些可笑)。人就不一样,人垮掉就是垮了,比拆迁还彻底。
每个人的所思所想,都是一团在大脑中独自燃烧的火焰。被忽视的不是他在想什么,而是那团火焰的强烈程度。
厉害的事情几乎都是由这两类人干成的:没吃饱的人,吃饱了撑的人。而伟大的思想和发明、创新和突破,则大多是由吃饱了撑的人干成的。
真正的连续创业者,做的其实是同一件(类)事(尽管那些事表面看起来完全不同)。否则,就只是“断续”创业者。
买房是糟糕的投资,除了其它更糟糕的投资之外;房价总是充满了泡沫,可人类财富原本就是虚妄的泡沫。~当然,这不代表此时我对买房的任何建议,因为地域、类型、需求、配置等差别太大了。
“获得优势”和“锁定胜局”,几乎是两种不同(差异大于50%)的能力。
重点大学更多的是一个“识别系统”,而非“改变系统”。然而,识别自己,或者被别人识别,本身也会带来巨大改变。
“事事不尽如人意”的另一面,不是“事事尽如人意”,而是“事事不不尽如人意”。“人意”本来就是小概率事件,所以“不尽如人意”是概率分布的正常结果。而反过来说,概率本身也是一种安全垫似的保护系统。例如,你什么都不做,也不是那么容易崩溃。
耳机就像墨镜,表达“我不想被你看穿”。但墨镜仍然保留(甚至放大了)对外的窥探。耳机更近一步,戴耳机的人不仅不想被别人看穿,也不想看别人。
对群体而言,个体的固执不是缺点,缺乏多样化才令固执成为缺点。罗素与维特根斯坦之间的争执,凯恩斯与哈耶克之间的争执,都体现了双方的固执,尽管他们比旁人更加理解对方。
肯特定律说:每件事进展到一半时,都可能看起来像是失败。这句话对应的俗语是:行百里者半九十。
考验人性的事情,最后都如愿以偿了。
自认为负责任的写作者先费尽心思地说服自己,然后再去说服读者;职业化的写作者直接去想如何说服读者。
人们都是为“可能性”而劳作:年轻人为“实现”的可能性,年长者为“开始”的可能性。
好奇心是一种生理属性。就像写作能力本质上是写作冲动,好奇心则是好奇冲动。~遛狗时看它用鼻子好奇地嗅来嗅去,有感。
“做难而正确的事情”这句话流行起来,会给正在做“难而错误的事情”的人们以错觉……和安慰。这错觉和“丑男人很忠厚”一样不靠谱。
人们赞美某些人或事,是把这些(通常关于无私、无欲、奉献、忍耐)人或事作为祭品,以替代自己在这方面的义务。
极少数人在下棋,部分人在评论,大部分人在围观。~下棋和现实的相似之处。
一个人随波逐流时会有“卧底”幻觉,认为自己是为了正义而暂时潜伏在黑帮,干坏事儿或者和黑老大花天酒地只是作戏,不必有负罪感,甚至是付出的牺牲。
炸药和购买冲动都需要一个封闭的时间和空间来实现最终的爆炸。
稀缺感(需求端)比稀缺(供应端)本身还要稀缺。
运气总是好,本质上是大局观好的结果。这种大局观体现为:要么是因为Ta一直很聪明地停留在自己有优势的领域,要么是因为Ta尊重常识、情绪稳定。现实环境变量极其多,外加人类社会的游戏规则,一个大事不糊涂小事不精明的人,也能通过做模糊的正确的事情,实现持续的运气好。

本篇文章来源于微信公众号: 孤独大脑