财富取决于极少的大高潮,幸福取决于较多的小高潮

“一个人生命中最大的幸运,

莫过于在他的人生中途,

即在他年富力强的时候发现了自己的使命。”

茨威格,《人类群星闪耀时》

先说结论:

1、财富取决于幅度,而非频率。即:极少的大高潮。

少数下注较大的投资,构成了一个人主要的财富。

2、幸福取决于频率,而非强度。即:较多的小高潮。

再大的单次幸福事件,持续的时间也不会比较小的长太久。

3、如何解决二者之间的“冲突”,决定了你此生成为一个什么样的人。

开始


诗人别涅季克托夫,是第一本俄罗斯数学难题集的作者。下面是他出的题:

三姐妹各自卖鸡蛋,分别有10个、30个、50个,要求:

1、任何时候统一销售价格;

2、最终每个人收到的总钱数一样多;

3、卖十个鸡蛋的总钱数不少于10分钱,卖90个鸡蛋的总钱数不少于90分。

请问如何卖?

这道“简单”的题似乎有点儿奇怪:

手上的本钱差别那么大,而且“统一价格”,怎么可能卖出一样的收入呢?

再看个欺骗性更强的题目。

甲和乙比拼投资水平,两人各有110万本金。

以下是两人过去两年的股市成绩。

(第一年):

  • 甲投资10万,赚4万,回报率40%;

  • 乙投资100万,赚35万,回报率35%

论回报率,甲获胜。

(第二年):

  • 甲投资100万,赚25万,回报率25%;

  • 乙投资10万,赚2万,回报率20%

论回报率,又是甲获胜。

这道“简单”的题似乎也有点儿奇怪:

看起来两轮都是甲获胜吧,可是再一算:

  • 甲两年一共赚了“4+25=29万”;

  • 乙两年一共赚了“35+2=37万”。

  • 每年投资回报率都是赢家的甲,反而在整体成绩上输给了乙。

为什么呢?

关于第一题“卖鸡蛋”:

尽管任何时候必须执行相同的价格,但鸡蛋少的姐妹,可以在价格低的时候少卖鸡蛋,而在价格高的时候多卖鸡蛋,从而实现同样的总销售额。

  • 例如,开始大家都卖一块钱一个鸡蛋的时候,拥有10个鸡蛋的妹妹一个都不卖,拥有50个鸡蛋的姐姐卖掉了45个。

  • 当大家都卖十块钱一个鸡蛋的时候,只有10个鸡蛋的妹妹以高价卖掉10个,拥有50个鸡蛋的姐姐只剩下5个可以卖高价。

关于第二题“投资PK”:

尽管在每个年度甲都赢得了胜利,但是重点在于仓位的分布。

  • 对比而言,第一年对甲乙两人都是好运气的一年;

  • 但是乙在好运气的这一年下了更大的赌注;

  • 所以尽管第一年乙的回报率也低于甲,但是回报的绝对值却远高于甲。

上面这两个例子说明:

面对同样的机遇,即使是处于资源劣势的一方,假如能够利用筹码的分配,也能获得更好的回报。

上 联

财富取决于极少的大高潮

如上所述。在关键环节下大注,能够让你在拥有相同或较少鸡蛋时比对手赚更多钱。

这里包括两个要点:

1、发现鱼多的地方。

找寻有基础概率优势的领域。

2、在鱼多的地方下更多注。

“我从索罗斯身上学到很多,但可能最为重要的并不是你是对还是错,而是在你正确时你赚了多少,而错误时你赔了多少钱。”基金经理人德鲁肯米勒说。

事实上,当年狙击英镑狂赚10亿的创意及操盘者,皆为德鲁肯米勒。那么,索罗斯做了什么?

德鲁肯米勒在演讲中称,当时索罗斯所做的交易中,约90%都是他的点子,但索罗斯比他“更有胆”。

在那个“索罗斯大战英格兰央行”的传奇故事中,德鲁肯米勒的15亿美元押注即将到期兑付,正考虑进一步增加头寸拨备,甚至建议把所有钱都押上。

然而,索罗斯却认为这“太荒谬了”:

“你知道这种事情多久才能出现一次吗?”

“信心十足但是只投入很小头寸,这么做是没有道理的。”索罗斯说。

最终他们加上杠杆,押上了100亿美金,并大获全胜。

索罗斯的策略是:“专攻要害。”

巴菲特在2010年写给股东的信中写到:“好机会不常来。天上掉馅饼时,请用水桶去接,而不是用顶针。”

我戏称索罗斯和巴菲特是“索菲特”:他们都是那种伺机而动、咬住就不放口的致命性攻击动物。

“当你对一笔交易充满信心时,就要给对方致命一击。”

彼得·蒂尔在《从零到一》里总结:

  • 只找最好的,因为最好的产生了更多的价值。

  • 这个世界遵循幂次法则:一小部分的公司完胜其他所有公司之和。

他由此总结出了一个风险投资规则:

只投资给获利可达整个投资基金总值的有潜力的公司。

这个规则的反例是:

安德里森·霍洛维茨投资基金给Instagram公司投资了25万美元,后来赚到了7800万美元,两年不到获得312倍的回报。

问题是,安德里森的基金规模是15亿美元:如果只开出25万美元的支票,那么它得找到19个Instagram,才能收支平衡。

所以,重点不是312倍很多,而是25万美元太少。

彼得·蒂尔的基金只关注五到七家企业。因为这些企业具有独特的基本面,未来可能拥有数十亿美元的价值。

巴菲特曾说,每个投资人都应该假设自己手中只有一张可以打个20个的投资决策卡,每作一次投资就在卡片上打一个洞,用完为止。

问题来了,彼得·蒂尔自己投资Facebook,赚了大钱,但却没能把握机会,继续加重注,甚至在Facebook上市后过早撤退。

毕竟,投资不是做数学题,而是面对不确定性去下注。

还是以本文开头的两个智力题为例:

  • 你怎么知道鸡蛋后来会涨价到十块钱?万一跌到一毛钱呢?

  • 你怎么知道第一年的回报率较高?如果第二年更高呢?

大机会来临了,要下重注。但你怎么知道是大机会呢?

万一是大坑呢?

如芒格所言:如果把我们最成功的10笔投资去掉,我们就是一个笑话。

但是,最成功的十笔投资,开始的时候谁知道呢?

也许,那些大高潮的成功,只是“后此故因此”的后此谬误?

“大机会来了下大注”这个道理,会不会和所有的鸡汤一样,都是事后方知的空话?

“大高潮”的不确定性,有三点:

1、大机会的不确定性;

2、入场时间的不确定性;

3、下注比例的不确定性。

我自己误打误撞经历过中国房地产的“大高潮”,在这样一个横跨20年的超级大牛市里,我亲眼目睹了诸多专业人士也会犯下的“错误”:

1、从2000年开始,就有专家坚定认为地产是泡沫,不是机会;

2、早在2003年,就有朋友判断土地供应已经远大于市场消化量,泡沫已经形成,决定退场;

3、有朋友很早看准了一线城市的房价趋势,却只买了个小户型。

地产早已经是“过时”的话题,我也不打算对未来房价做任何预测,而是想以此为例,来说明抓住“大高潮”有多不容易。

大机会来临时敢于下大注。

也许这句话真的是真理。然而,真理往往有两个特点:

1、很简单;2、没有操作指南。

刚刚过去的2020年,疫情造成的捡钱机会,有多少人敢下手?

德拉肯米勒在市场趋势反转时,用“价值分析法”来测度期货价格可能达到的范围。

但他强调“价值分析法”不能用来确定入市时机,他用来确定入市时机的重要工具是“持仓量的分析法”和“技术指标分析法”。 

然而,这些“方法”真有用吗?

天才如德拉肯米勒,因对自己在2010年市场波动期间的表现感到失望,宣布退休。

而他的老板索罗斯,则依然“活着”。

当手下的基金经理天才不再,索罗斯会毫不留情地换掉他们。

他对自己一样残忍,他也经常杀掉过去的自己,在投资上快速转向。

索罗斯敢于下大注于狙击英镑,是因其判断:假如错了损失不大,假如对了能赚不少,而且对的可能性大很多。

索罗斯获取利润的另一秘诀是:投资在先,调查在后。

  • 提出假设,建立头寸,小试牛刀考验假设,等待市场证明正确与否。

  • 若正确则追加头寸,否则及时撤出。

  • 有时候确认一个走势相当费时,很可能犹豫不决之际市场已开始逆转。

  • “提出假设后立即建立头寸”,有助于其抓住最佳投资时机。

作为波普尔的学生,索罗斯继承了“证伪主义”,却不赞成老师的“统一科学”原则。

索罗斯从基本原则上采用了科学方法(例如“事物观察”和“意见比较”),但是又强调反身性理论和人类不确定性原则。

如此说来,“抓住大机会”这件事,充满了不确定性,甚至根本无法预测,简直是个哲学、乃至玄学问题了。

果真如此吗?


要想解决这一点,我们必须来到概率的世界。

概率是度量不确定性的工具,横跨于自然科学与社会科学两个领域。

概率不是用来消除无知的,而是用来描述无知程度的。

自然科学在社会科学领域的简单套用或者隐喻,都是不靠谱的。

索罗斯对此有更进一步的观点,这就是他的“反身性”:

在任何包含有思维参与者的情景中,参与者的思想和现实情况之间存在着一种相互影响的关系。

由此得出的结论是:

认为未来的结果完全是现在预期的反馈的观点看起来是荒谬的。

索罗斯和巴菲特都对市场有效理论提出了质疑。然而,巴菲特会建议普通人去买基于市场有效理论的指数基金,索罗斯则强调自己的理论是“炼金术”。

对于费曼眼中“荒唐的自然”,以及索罗斯所说的“不确定的人类”,概率都是不错的思考工具,哪怕只是作为拐杖。

难题在于,理解概率已经不是容易的事情了,而影响人类世俗成就(主要是指成功和发财)的,远非单一的概率计算。

洞察大机会,确认大机会,捕捉大机会,是多层概率叠加的结果。

这方面最有名的类比案例,也许是下面这张图了。

该图背后的故事,已经是老生常谈了:

泰德•威廉姆斯在他的《击球的科学》一书中这样描述道:对于一个攻击手来说最重要的事情就是等待最佳时机的出现。

巴菲特认为这句话准确道出了他投资的哲学,等待最佳时机,等待最划算的生意,它一定会出现,这对投资来说很关键。

泰德•威廉姆斯是过去70年来唯一一个单个赛季打出400次安打的棒球运动员。他的技巧如下:

第一步:把击打区划分为77个棒球那么大的格子。

第二步:给格子打分儿。

第三步:只有当球落在他的最佳“格子”时,他才会挥棒,即使他有可能因此而三振出局,因为挥棒去打那些“最差”格子会大大降低他的成功率。

泰德•威廉姆斯的秘密在于,将自己的“概率世界”变成了两层。

一层是执行层:也就是他击球这个层面。

在这个层面,无论他多么有天赋,多么苦练,他的击球成功概率达到一定数值之后,就基本稳定下来了,再想提升一点点,都要付出巨大的努力。而且还要面临新人的不断挑战。

一层是配置层:也就是他做选择的这个层面。

他在配置什么呢?

挥棒击球的决策。

我们假设有如下一个被简化了的比赛:

  • 泰德•威廉姆斯与一个击球水平比他还高的球员竞争,他的击球成功率是80%,对手是85%。

  • 但是泰德•威廉姆斯更有耐心,只击打好球率达到90%以上的“大机会”。

  • 而对手年轻气盛,且更有自信,所以即使好球率只有80%的机会也不放过。

所以,经由计算:

泰德•威廉姆斯的最终成功率=90%✖️80%=72%;
更强年轻对手的最终成功率=80%✖️85%=68%。
结果,泰德•威廉姆斯战胜了水平比他还高的对手。

芒格将此方法用在投资上,要点如下:

  • 作为一个证券投资者,你可以一直观察各种企业的证券价格,把它们当成一些格子。

  • 在大多数时候,你什么也不用做,只要看着就好了。

  • 每隔一段时间,你将会发现一个速度很慢、线路又直,而且正好落在你最爱的格子中间的“好球”,那时你就全力出击。这样呢,不管你的天分如何,你都能极大地提高你的上垒率。

  • 许多投资者的共同问题是他们挥棒太过频繁。另外一个与挥棒太过频繁相对立的问题也同样有害于长期的结果:你发现一个“好球”,却无法用全部的资本去出击。

  • 有性格的人才能拿着现金坐在那里什么事也不做。我能有今天,靠的是不去追逐平庸的机会。

然而,在不确定的世界里,我们该如何给机会的格子打分呢?

对于一个棒球运动员而言,经由专业训练和大量重复,的确可以给格子打分。

这是一个有边界的事情,牛顿力学的因果关系,仍然可以发挥作用。

可是,人生中的大机会,一共没有几次,又该如何用概率来估值呢?

人生不是扔硬币,无法得出“只要重复多次就有50%概率正面朝上”的结论。

概率论,向来有“频率派”和“贝叶斯派”之争。

大多数场合下,关于概率的讨论,都是基于“频率派”的。

例如我国每年交通事故死亡率是万分之1.88,这意味着每年每10万乘客交通事故死亡人数是18.8(世卫组织2015年的数据)。

“频率派”的概率,是一种上帝视角。

有人就会说了,这个概率有什么意义呢?对于个人来说,不发生就是零,发生了就是百分之百。

这种常见的谬误,部分原因是因为“频率派”的概率,要求事件重复的次数多到令大数定律发挥作用。

可是,人的一生之中,重要的事情不过百十件,概率有意义吗?不会导致“小数谬误”吗?

如果说“频率派”是经验概率,那么“贝叶斯派”则是主观概率。

这听起来有点儿怪。

《贝叶斯方法》一书,开篇就提及了“贝叶斯思维”的奇怪之处:

贝叶斯思维和更传统的统计推断不同,贝叶斯推断会保留不确定性。

在贝叶斯派的世界观中,概率是被解释为我们对一件事情发生的相信程度。

换句话说,这表明了我们对此事件发生的信心。

为什么在这里会出现有点儿“唯心论”的主观与信心呢?

对比于贝叶斯派,频率派认为:

概率是事件在长时间内发生的赔率。

比如你一直扔一个标准的硬币,你得到正面的概率是50%。

但是,对于潜艇失事、个人成功、捕获大机会,历史上没有那么多数据,对个人来说也没法再活几辈子。

怎么办呢?

于是,贝叶斯派把概率解释成是对事件发生的信心,也就是说:

概率是观点的概述。

认为概率是主观的,并不意味着贝叶斯派是一群主观的家伙。

相反,他们随时打算更新自己的观点。

这恰恰是贝叶斯的秘密所在:

通过更新数据,多次迭代,动态地改变“”主观概率“。

哪怕新的信息(证据)和自己的信念相反,哪怕信息很让人恼火,很羞辱自己的智商,贝叶斯派们也坦然接受。

如同传说中凯恩斯说的:“当事实改变,我的观念也跟着改变,你呢?”

但是他们又不是简单的见风使舵,他们不会因为新信息彻底抛弃旧的信念,而是通过一个并不复杂的公式,将所有的信息整合在一起。

让我们再看一下泰德•威廉姆斯的格子:

泰德•威廉姆斯是根据自己的经验和大量数据,得出了上面格子里的得分,对“最佳格子”进行了量化。
那么,在没办法进行大量重复的情况下呢?
2009年5月31日晚10点,法航447不幸坠毁,搜救人员动用当时最新技术,找了一周后,仅发现少量残骸碎片和29具遇难者遗体。
随后两年的艰苦搜索,更是一无所获。
这时,贝叶斯主义者登场了,他们的方法是:
  • 飞机失事建立一个数学模型;
  • 整合评估各种导致失事的原因的概率;
  • 根据更新信息,改进模型。
如上,也是一张“格子”图。
救援队根据上述概率分布图,先从概率最大的区域搜索,如果没有发现,就在过往数据基础之上更新概率分布,继续搜索最大概率区域。
其中,贝叶斯更新的过程,简单示范如下:
(本图来自《科学世界》杂志)
最终,人们在茫茫大海中找到了法航447的黑匣子。
诚如索罗斯所言:我们生活在一个真实的世界中,但是我们对世界的看法并不是完全符合真实的世界。
人类对世界的看法,是大脑根据外部信息的加工过程。
这种加工能力,决定了大脑厉害与否,以及一个人能否在现实世界里做出更聪明的决策。
不管我们的大脑如何给自己制造确定性的幻觉,历史和现实都告诉我们,人类的理论、观点、预期,都远远偏离“真相”,甚至于人类对“真相”的定义都值得怀疑。
贝叶斯法,面对世俗世界的信息有限,承认人类认知水平的不完整和不连贯,给出了一个持续加工系统,让我们能够动态地、量化地获取信息、更新观点、作出更有大局观的决策。
贝叶斯法,每一次都能利用新信息(哪怕是失败的信息),对原有信念进行更新。
更重要的是,这一过程可以不断循环,连续迭代,从而产生了杠杆作用和指数效应。
《贝叶斯方法》对此总结道:
  • 即便获得了新的证据,我们也并没有完全地放弃初始的信念。
  • 但我们重新调整了信念使之更符合目前的证据(也就是说,证据让我们对某些结果更有信心)。
  • 通过引入先验的不确定性,我们事实上允许了我们的初始信念可能是错误的。
  • 在观察数据、证据或其他信息之后,我们不断更新我们的信念使得它错得不那么离谱。
我不打算论证索罗斯的哲学与贝叶斯方法的关联。面对人类事务的不确定性,哲学是认知基础,方法是行动体系。
索罗斯敢于在“我可能错了”的状况下行动,更有着惊人的认错勇气。
在此基础之上,索罗斯还强调了“观察者”,尽管他的表述里混杂了罗素悖论和量子力学的观察者效应:
我们对于世界的看法是真实世界的一部分——我们是参与者。我们对现实的解读与现实的差别是在真实世界中加入了不确定性的元素。这又听起来像循环推理,但是这准确地表达了现实情况和有思维的参与者之间的关系。
进而,由于人类社会属性和动物属性的“夹生”,索罗斯深刻洞察了“羊群”的习性,并熟练掌握了操纵手法:
市场总是错误的,他的趋势体现在膨胀期的自我满足以及在衰退期的自我瓦解。因此只有处在转折点时流行倾向才会被证明是错的。
于是,索罗斯的“财富大高潮原则”显露出来了:
世界经济史是一部基于假象和谎言的连续剧。要获得财富,做法就是认清其假象,投入其中,然后在假象被公众认识之前退出游戏。
这句“不正确”的话,几乎是所有投机者最大的准则,甚至也是许多价值投资者心中不可言说的秘密。
绝大多数人并不以投机为生。
然而,上述捕获“大机会”的原理和模型,依然成立。
对于普通人而言,其实是对自我的重复下注。
既然如此,下大注之前,关键在于找寻自我。
即使不是投入金钱,也是用比金钱更贵的生命来投资自己的一生。
“机会来临时敢于下大注。”
我等凡人,如何下这类大注呢?

“概率分层”的三层模型
我用此前的框架,来构建一个同样适用于现实生活中的模型:
第一层:感应层。有各种球击来,有的是好球,有的是坏球,无法预测。但对于球手而言,必须有球打。
我们也可以称之为“资源层”。每个球都是外部世界发给我们的资源。
第二层:理性层。对于球手而言,这里要做两件事情,1是对球进行评估;2是决定是否击打。当然,还有3,击打后对这个过程进行复盘,对1和2的系数进行调整。
我们也可以称之为“配置层”。我创造的“概率权”这个词,在这里最合适不过了。
概率权=概率思考✖️选择权(做决策)
概率思考是面对随机世界的一种思考方式。基于该认知,我们能够形成某种算法。泰德•威廉姆斯之所以那么厉害,秘密在于他是一个用大脑,确切说是用“算法”来分配击球资源的人。
选择权是指,即使一个人能够清晰地计算出概率,也会做出各种不同的选择,甚至放弃原本属于自己的选择权。决策是一种极为重要的能力,其未必是和认知能力成正比的。
投资人是典型的分配资源者。例如巴菲特说他的工作就是分钱。他的优势之一是,他本人也有企业家、即“击球层”的经验和天赋。
第三层:击球层。一旦做出击球动作,一流的球手会立即忘掉“概率”,不管这个球有95%的胜率,还是70%的胜率,他都会以平常心稳稳地完成。击球后的结果与他也是无关的。
(这里面省略了一个决策层,我将其汇合在第二层的最下面。)
综合以上以棒球为物理和数学上的比喻,让我们回头,将开篇所提的运气的其他因素也放进来,包括机会,开放度,人脉等等,如此一来,我们得到一个“三层模型”:
如此一来,各路学家乱七八糟的理论和建议,就有了一个(看起来)清晰的架构了,而且,为概率分析搭建了可计算的框架。
第一层关键词:获取资源,讲故事,为自己制造运势,正向的马太效应,保持开放性,交友的“开放度”,等等。
第二层关键词:分配资源,理性,远见,计算,在球将要去的地方。两个字:将,要。本质上,也是分配概率。
第三层关键词:做一个职业化的执行者,发挥个人独特优势。只要稳定在某个水准即可。例如你有52%的胜率,你稳稳地去实现即可。不管好坏,打出去,只管自己的正常发挥,以及不断提升。赢了开心,死了认命。
“概率分层”第一层:资源层
决定牌局的有三个:
1、抓到什么牌;
2、和谁打:
3、如何打。
各种论述运气的书很多。结论大多是运气很重要。真是废话。
关于资源层的策略,有以下几点:
策略一:拿到“硬通货”门票
贝索斯招聘的时候会看Sat(美国高考)的成绩,这样未必准,但能降低筛选成本。
这个世界不公平的地方在于,有些游戏必须有了门票才有机会玩儿。
策略二:越主动越幸
在一个TED演讲里,一位斯坦福大学的教授说:幸运并不是一道不可预测的闪电,相反,幸运更像是风,它的出现绝非偶然。
她建议,你要愿意去冒一点不被他人回应的小风险,避免安于现状;改变自己与他人的关系,懂得感恩;不要轻易对一个想法下判断,不要没有行动就放弃......
如何提高找到如意郎君的概率?在一本书里,女主角的核心策略就是,不拒绝任何一个约会和相亲,增大样本量。
策略三:强化IP,降低识别成本。
经营好自己的IP,有助于拿到好牌。淡泊如巴菲特,也要靠自己的声誉拿到好的投资标的。
策略四:强化专业,构建节点价值。
即使你不善于混名利场,若你在一点上打爆了,也会有资源聚合而来。各种专业网红的逻辑就是如此。
一个理性选择的标准之一就是:基于决策者目前的资产(资源)。
资产不仅指金钱,还应包括生理状态、心理能力、社会关系和感觉。
“概率分层”第二层:配置层
第二层是“三层结构”中最有搞头的地方。尤其是在信息时代,作为社会人,你的算法是可以把别人的理性或者非理性,作为已知条件代入的。
配置层只是“对坏球说不”吗?
远远不是。
为了论证这一点,我们来看一道有趣的微软面试题:

微软面试题

两个罐子

有100个红色球和100个蓝色球,请你任选组合将全部球放入2个罐中。放好后随机取一个罐子,再从此罐中随机取出一个球,如果取到红球赢100元钱,问如何组合放球能最大化赢钱机会?
看起来拿到红球的概率只有50%,在配置层你又不能对蓝球说不,该怎么办呢?
答案是:
在一个罐子里面只放一个红球,而把其他所有球全部放进另外一个。
从实用主义的角度,将第二层称为“配置层”,还有投资角度的隐喻:
资产的配置,比各种努力和折腾更重要。
投资传奇人物,耶鲁校产基金的掌舵人大卫·F·斯文森在《不落俗套的成功》里说:资本市场为投资者们提供了三种能获得投资收益的工具:资产配置、择时交易和证券选择。
研究表明:
资产配置的决策在决定投资结果上起着主导作用。
根据大量受好评的、对机构投资组合的研究,在投资收益的变动中,大约 90%是源于资产配置,只有大约 10%是由证券选择和择时交易所确定的。
另外一项对机构投资者业绩的重要研究表明:100%的投资收益都是来自资产配置,认为证券选择和择时交易的作用微不足道。
第二层的“配置层”,有点儿像排球里的二传手,或者足球场上组织进攻的中场灵魂。
第二层可以重构选项。一个问题可能因此而突破表面上的局限性,一个人也可能因为“认知重构”而超越自我。
“概率分层“第三层:执行层
第三层的“击球层”,就像一个职业杀手。他的特点是:
1、全力打好每一个球,完全不在乎外部的评价,也从来不去看比分牌;
2、每打完一个球就清零,从头开始,不被情绪左右;
3、杀手要靠专业领域的实力来活命或者吃饭,所以需要大量的反复训练,成为直觉强大的杀人机器;
4、最终的结果,取决于二传手的传球“好球率”,与职业杀手的“击球率”,二者相乘。
杀手最重要的品质,是专注和冷静。
20世纪最伟大的棋手之一吴清源,独自一人在日本面对高手围攻时,领悟到“平常心”的力量。而李昌镐,则天生就具有石佛气质。
又如鲁宾回忆克林顿如何在最艰难的时刻,依然毫不受影响地工作。克林顿告诉他,自己有“精神装置”。
与克林顿打过交道的人说,不管你是大人物还是小人物,一旦克林顿与你交谈,你就会觉得自己被他放在整个世界的中心,他专注,倾听,真诚,如激光般射入你的内心底。
不管第二层的理性思考多么高明,概率计算多么精确,都需要到“第三层”这个现实世界来检验,思考被验证,薛定谔的猫不能既是死又是活,而是要“塌陷”为某个确定的状态。
职业杀手有两重使命:
a、去执行第二层的命令;
b、在某个半径内检验各种可能性。
科学的本质就是不断做实验,职业杀手亦是。
如此,我们便能理解,亚马逊的贝索斯反复强调的“Day 1”的含义了。
“概率分层”的工作原理
A
简而言之,运气由三层构建,好运气取决于三个旋钮。最终结果决定于三层的整体完成度,而不是某一层的强大。
但是三层模型又不是一个简单的叠加的、递进的关系,它还有系统动力学的反馈、自我强化等特点。
例如执行层(第三层)较强,可以带来更多资源(第一层)。
以上三层,又都在一个巨大的运气之船上。因为我们在每一层的计算,都难免有些主观,有所偏差。
B
大多数人的角色,要么是二传手,要么是职业杀手,但有些人二者兼具。
例如巴菲特当年买股票买成股东被迫压上第一线的时候,真是毫不手软,活生生的一个企业家。
后来,他专注于“分配资源”的投资家,也受益于此。
巴菲特说自己是乐观的悲观主义者。
  • 作为“职业杀手”时,他是乐观的,埋头向前冲,不管不顾;
  • 作为“理性的二传手”时,他是悲观的,在概率的不确定世界里生存着。
黑格尔说过,除了要有乐观的意志,还要有悲观的头脑。
C
第三层靠直觉,第二层靠理性。
第三层是急能生“智”,第二层是定能生“慧”。
第三层是卡尼曼的“系统1”,第二层是“系统2”。
第三层解决计算的深度,第二层解决计算的广度。
我们既要“顶着人类的直觉破浪前行”,又要利用大脑直觉的强大计算力,正如阿尔法狗模仿人类大脑之所为。
D
在第二层,人类必须在不确定的局面下,对飞来的球进行评估。
秘密在于:
扩大你的认知半径,减少你的行动半径。
理性是需要被测量的,要么是好运最大化,要么是厄运最小化,或者是二者的混合使用。
如上图:
圆外是未知世界,已知越多,未知的也越多。已知的可能是有限的,临时正确的,不确定性的。
在第二层的“认识性理性”,我们需要不断学习,扩展自己的认知边界。尤其在互联网时代,许多公司的崛起,都是基于某个认知优势。
在第二层的“工具性理性”,我们要把大脑关进理性的笼子。
在第三层的“击球区”,如你所见,为了让球在认知半径内,我们需要控制球的移动半径,还要控制球的大小,二者都是越小越好。
有时候,知道自己的智商边界,比智商高低更重要。
芒格说马斯克的确厉害,也许智商有190,但是问题在于,马斯克可能自己觉得智商有250……
从进化的角度来看,因为马斯克个人的非理性,才能干出移民火星的事儿,这也算是人类群体理性的一部分。
E
第二层应该是全面、系统、理性、复杂、深刻的。
但第三层应该是简单、可重复的。
(这里有“复杂的简单事情,简单的复杂事情”,有空再说。)
除了稳定性,还因为在最后评估效果时,要乘以时间。
越是简单、可靠、可重复,越能享受时间的复利,成为时间的朋友。
我们也可以将第二层称为“主动控制层”,将第三层称为“自动驾驶层”。
据说,人类大脑每秒钟能够接收1000w比特的信息量,但其中只有50比特思维是在有意识的状态下加以处理的,属于有意识的思维,即“第二层”。
所以我们需要:
1、知道将什么放入第二层;
2、将第二层熟练运行的某些“算法”,转化到第三层,自动驾驶。
所谓理性,就是反条件反射。当你将某个需要控制的理性,放入自动驾驶层,便变成条件反射了。这时,你需要用更高一个维度的“反条件发射”来替换。
F
我欣赏神秘主义的体验和启发,但反对用神秘主义来替代理性思考。一个伟大的棋手,根据自己的直觉而非计算,下出石破天惊的一手,和直觉的神秘性也是无关的。
卡斯卡帕罗夫一直偏好直觉和乐观,他的解释是:
经过积极思考产生的决策虽然可能不会比保守性决策更准确,但是我们的确能从所犯的错误中学到更多东西。随着不断实践和对直觉的磨练,我们的决策会变得更加准确。
这个是从更高维度去思考“正确率”,即,整体的正确率,考虑到时间因素,考虑到未来的计算,牺牲这一次的“正确率”是值得的。典型的例子就是围棋里的弃子。
G
概括而言:
1、认识这个世界是未知的、随机的;
2、认识你的认知是不确定、有边界的;
3、如何突破边界,实现突破?找到自己的算法,建立持续稳定的输出系统。因为我们一生中最大的变量,是时间;
4、复制“核心认知”,如同每个生命所做的那样;
5、成为一台强化学习的机器。
世俗意义上“成功”的企业或者人,打通了“资源层、配置层、击球层”。

一个人一生几乎只能做一件事,一家伟大的公司也只有一个使命。
对个人而言,首先是发现自己的天赋,找寻自己的使命,形成核心认知和个人的算法;
然后,进行大规模复制(贝叶斯更新式的那种不断迭代的重复)。
这是一个人一生只有一次的大高潮。
下 联
幸福取决于较多的小高潮
《哈佛幸福课》作者丹尼尔·吉尔伯特认为,我们高估了“大高潮”对幸福的效用。
  • 一套新房或一个新配偶确实能让你更幸福,但这种新增的幸福感并不多,也不持久。
  • 发大财、获得晋升和通过考试对幸福的影响,没有人们想象的那么大。
最近的研究发现,很少有经历能对我们产生超过3个月的影响。
简而言之,好的事物好不了太久,坏的东西坏不了太久。吉尔伯特进而总结道:
我们想当然地以为最能影响我们的是生活里的一两件大事,但幸福似乎是上百件小事叠加的总和。一个每天经历十几个小开心的人,很可能比只遇到一件大喜事的人更幸福。
心理学家埃德·迪纳研究发现:
快乐体验出现的频率,要比快乐体验的强度能更好地测量你的幸福感。
也就是说,较多的小高潮,更容易带来幸福感
按照这个理论,就可以发现,年轻人的“躺平”,其实是一种更为明智的幸福观。
上几代人,追求“产生强烈体验的事件”,成大功,赚大钱,买大房。
然而迪纳的研究表明,体验有多么美好,不如拥有多少美好的体验。一个每天经历十几个小开心的人,很可能比只遇到一件大喜事的人更幸福。
所以年轻人主动躺平,未必是不去追求远大理想,而是不再像前辈那样对幸福苦大仇深孤注一掷。
前辈们将幸福感寄托于大高潮,绝大多数时候苦逼,极少时候激动得泪流满面。
也许年轻人才是对的。
穿一双喜欢的潮鞋,给自己买一杯奶茶,发一段无厘头的视频这些连续的小高潮,更能造就幸福感。
相反,对“赚大钱、买大房”的过度追求,令我们忽视了适应性效应,对物质性的东西看得过重。

十一
至此,本文似乎已经调和了开篇提出来的一个问题:
1、财富取决于幅度,而非频率。即:极少的大高潮。

少数下注较大的投资,构成了一个人主要的财富。

2、幸福取决于频率,而非强度。即:较多的小高潮。

再大的单次幸福事件,持续的时间也不会比较小的长太久。

3、如何解决二者之间的冲突,决定了你此生成为一个什么样的人。

本文漫长的叙述,都在表达这样一个观点:
  • 幸福是过程;

  • 有赖于大高潮的财富,也是过程的副产品。

奥派经济学家米塞斯说:市场是一个过程。
斯皮茨伯纳尔喜欢用道家里的DAO,来描述“过程”背后更深层次的含义。
这位传奇的基金经理强调资本是一个过程,一个方法、途径,具有跨期的特征。
如此一来,我们就更容易理解,为什么抓住“大高潮”如此艰难。
以跨期的角度看待时间,绝非简单的“长期主义”或“坚持到底”,而是道家的时间以连续的链环联结起来”,围棋里的“取势”,奥派的“跨期交换”,乔布斯的“把关键事件串起来”,斯皮茨伯纳尔的“迂回战略”,以及我在人生算法里所说的“一连串时间切片”。
“大高潮”是一连串时空的集合。
至此,传统的时间概念,已只是最基础的计量工具。
时间已经不再是线性的、被动发生的,而是成为一个主观概念。
这不止是说时间并非由简单的因果链串成,更是指从概率的角度看,未知的时空更像一张黎曼空间里的网。
在我试图阐述“大高潮”的过程中,贝叶斯既是一种方法,又是一种哲学。
贝叶斯方法将未知模型或变量看成已知分布的随机变量,基于先验和后验概率对未知参数进行推断。
沿着时间线不断迭代,未知的空间逐渐明朗。
一个人的命运,何尝不是如此?
有趣的是,当年那位叫贝叶斯的牧师,据说是为了证明上帝的存在而提出了自己的公式原型。
而对比起频率派的“上帝视角”,贝叶斯派恰恰给出了“参与者视角”。
牧师贝叶斯一定不会喜欢不信上帝的休谟,可多年以后,休谟的怀疑与贝叶斯的信仰,成为我们这个混乱时代最有力的思想拐杖。
假如你姑且赞成我“幸福和财富都是过程”的观点,我们依然会面临一个无法绕开的问题:
既然要有道路,那么目标是什么?

十二
人生的终极目标,即为使命。

如古代士大夫的理想:为天地立正心,为生民立命,为往圣继绝学,为万世开太平。

又如普通百姓的愿望:天下太平,五谷丰登,子孙满堂。

不分大小高低强弱,但求不枉过此一生--这才是唯一的大高潮。

使命,同样是一个与时间相关的命题。

有人说:“东亚文化中普遍对超越性意义不感兴趣,没有可为之献身的超自然主体,而专注于务实进取。”

于是,村上春树如是说:

“这个世界上根本没有正确的选择,我们只不过是要努力奋斗,使当初的选择变得正确。”

对于“人生的目的是什么”这个问题,我看到的最好答案,来自爱因斯坦。

他曾经自问:

我们这些总有一死的人的命运是多么奇特呀!我们每个人在这个世界上都只作一个短暂的逗留:目的何在,却无所知,尽管有时自以为对此若有所感。

爱因斯坦随后自答:

“人是为别人而生存的——首先是为那样一些人,他们的喜悦和健康关系着我们自己的全部幸福;然后是为许多我们所不认识的人,他们的命运通过同情的纽带同我们密切结合在一起。

我每天上百次地提醒自己:我的精神生活和物质生活都依靠着别人(包括生者和死者)的劳动,我必须尽力以同样的分量来报偿我所领受了的和至今还在领受着的东西。

我喜欢这个说法,正如我偏向于认为,战士舍命作战是为了身边的兄弟,教师奉献于乡村是怜悯眼见的孩子,消防员救人是因为不忍心看他们的亲人落泪。

人是一种奇怪的动物:

  • 不仅为自己,还为别人;

  • 不仅为现在,还为未来。

  • 不仅为自己的未来,还为别人的未来。

无论一个人是否有具体的人生目的或使命,他或多或少都在做一些超越自身的“跨期”选择:

  • 总体大于部分之和,那个东西就是有生命的;

  • 在无限时间里的价值大于有生之年的价值,那个生命就是有灵魂的。


十三
爱彼迎的创始人去拜访巴菲特,聊了几个小时后,股神对他赞赏有加:
哪怕不给这个家伙一分钱,他也愿意干现在的事情。
这其实也是巴菲特自己的态度:
我非常热爱我的工作,每天早上去上班时,都会觉得自己好像是要到西斯汀教堂作壁画一样。(注:米开朗基罗名画“最后的审判”完成处)
即使伟大如巴菲特,其一生的伟大投资也并不多。那些极少发生的、大幅度的财富爆炸,是结果,而非目的,否则人的一生非常无趣。
这同样也是选择公司的原则:
哪怕该公司不上市,你也愿意当它的股东。
茨威格在《人类群星闪耀时》写道:“一个人生命中最大的幸运,莫过于在他的人生中途,即在他年富力强的时候发现了自己的使命。”
使命,能够将你的“极少的大高潮”,和日常每一天的小高潮,完美地黏合起来。
人生只有很小的一个窗口期,供我们绽放。我们或者过早钟情于某树而放弃森林,或者如猴子掰苞谷般无休止地期待大和(hu)。
“世俗成功”大概有两种路线图:
1、如滚雪球般,找到自己的切入点,如《哪来的天才》一书所说的,连续多年的“刻意练习”,使自己成为细分领域的顶尖者;
2、地球上没有那么多“尖”容纳顶尖者,有些人下了一辈子棋还是臭棋篓子,有些人天天练习打靶,仍然当不了神射手。但是,依然持续地、甘于平凡地做某件事。
当你为了某种使命而生活时,你未必一定要中大奖,也能找到幸福的感觉。
十四
你必须虔诚地准备着。
如58岁的维克斯,身为加拿大议会侍卫长,他的职责只是在行政与礼仪,扛着议会权杖步入场而已。但八年来,他每周坚持射击和其他体能训练。
2014年10月22日,一名枪手杀死一人后冲入议会大厦,维克斯逼上去,与恐怖分子仅一柱之隔,当对方抬枪之际,向左侧扑地翻滚并开枪,击毙枪手。随后冷静地回到办公室重新装填子弹。
“我的一生都在为此刻做准备。”
再如萨伦伯格。2009年1月15日,一架空客320遭鸟撞击,双引擎同时熄火,飞机完全失去动力,机长萨伦伯格在确认无法到达任何附近机场后,决定于哈德逊河河面进行迫降。
该航班于升空6分钟后紧急迫降于哈德逊河河面,机长负责指挥疏散,并且两次仔细检查机舱是否仍有乘客,确定后才最后一人离开客机。结果机上共151人全数生还,该事件被称为“哈德逊奇迹”。
在萨伦伯格看来,英雄的意思更是说:
我们有着人生哲学,并将其运用到我们那天所做的事情中去......
我们需要每次都努力做正确的事,尽力而为,因为我们不知道人们会因为哪一件具体的事情来评价我们的人生。
“他人生的诸多选择为他在引擎失灵的那个时刻挺身而出做了完善准备。”
这便是一个人许多个幸福的瞬间,与一生都难有一次的伟大时刻的完美结合。
也许在另外一个平行宇宙,侍卫长维克斯和机长萨伦伯格什么都没有遇到,他们只是平静地退休,老去,一生平淡得没有故事讲给孙辈。
然而,这丝毫不影响他们人生的“大高潮”,他们平凡的伟大,并不依赖于伟大事件的发生而存在。
他们终其一生都在为迎接某个时刻而做准备,当那一刻来临时他们会挺身而出;即使那一刻永不来临,英雄们的使命也已达成。
这正是纪德所说的:
担当人性中最大的可能。
十五
人短暂的一生之于宇宙的生命(130亿年),可类比于闪电的一生(0.25秒)之于人的一生(30亿秒)。
二者比值特别接近。
人的一生,是一个人唯一的“大高潮”。
  • 绝对的真不存在,求真才有意义;

  • 永生不存在,生命才有意义。

绝对的真和永生,是拉康眼中你必须去追猎但最好别得手的猎物。

这并非是说生命的意义在于过程,而是,也许生命存在的结构类似于弦理论里振动的“橡皮筋”。

大高潮,小高潮,即生命的振动。

狄德罗说:“说人是一种力量与软弱、光明与盲目、渺小与伟大的复合物,这并不是责难人,而是为人下定义。”

这种张力的二元结构,就像在《肖申克的救赎》里,电影最后梦幻般的锡瓦塔内霍海滩(也许是暗喻人生的终极目标,又或是天堂),并无法脱离漫长苦难的越狱而单独存在。

电影,用影像对时光的压缩权力,让主角完成了一场长达数十年的伟大越狱。

一生之短暂,与日常之煎熬,也构成了某种张力。

我更愿意用闪电来类比人的一生。闪电是一个整体,如同道家的“DAO”。

道,不再是一个人在不同时间下的空间移动,而是如相机镜头般“压缩”了过去、现在和未来的关于时间的“景深”。

最后

有多少等待中的平凡英雄,终其一生没有遇见伟大时刻?

概率里令人疑惑的一点是,即使你做了正确的事情,好的结果也未必发生。

尤其是,当你将自己的时间尺度拉长至超越自己的生命,当你将自己的空间尺度扩大至超越自己的利益。
用更大的概率地图来替代自己的那一个,这种行为的动机源自人类神奇的天赋,那就是向无尽的宇宙提问:
我是谁?我的归属何在?我所属的那个整体是什么?
于是,人们甘于为自己享受不到的树荫种树,为一辈子都为某件不会发生的事情做准备。
叔本华说:“人虽然能够做他所想做的,但不能要他所想要的。”
这绝非人类的困境,相反,这正是人类的自由意志之所在:
伟大决定于选择,而非结果。
为什么要每个人都“成功”呢?
有些人就是要荒废才华,有些人偏要在那些无用之处不计成本的投入(如开篇那个出数学题的诗人),有些女神就是要奋不顾身地爱渣男,为何非得精打细算地公主配王子?
有些人就是要在鸡蛋最便宜的时候(希望你做了前面卖鸡蛋的题目)卖掉全部,在你们仍然沉睡的清晨烟花绽放,倾其所有,无人看见。

本篇文章来源于微信公众号: 孤独大脑

无记忆的牌

 开始

遥远的外星球上,机器人公主不可救药地迷恋上了传说中的人类。

于是,机器人王子为了追求公主,在身上抹满黏糊糊的东西,冒充人类去接受公主的残酷盘问。

在经过几轮低劣的伪装之后,王子迎来了一个比较复杂的问题:

姆亚姆拉克,告诉我,你们白人是怎么建造后代的?

我们不建造后代。

王子继续回答:

我们基于马尔可夫随机过程理论,通过统计学的方法进行程序编写,也就是说,这带有很大的概率性和偶然性。

这篇名为《费勒茨王子与水晶公主》的小说的作者,是被誉为“科幻届的博尔赫斯”的莱姆。

在半个世纪前的文字,莱姆用“马尔可夫随机过程理论”来描述人类的繁衍(包括此前充满随机性的交配行为),这真有趣。

概率论统计学中,马尔可夫过程(英语:Markov process)是一个具备了马尔可夫性质随机过程,因为俄国数学家安德雷·马尔可夫得名。

马尔可夫过程是不具备记忆特质的。

换言之,马尔可夫过程的条件概率仅仅与系统的当前状态相关,而与它的过去历史或未来状态,都是独立、不相关的。

安德雷·马尔可夫自己可能也没预测到,自己的这个看起来有点儿奇怪的概念,在100年后竟会发挥如此神奇的力量,例如:

  • 语音识别系统的基础;

  • 文艺复兴基金的赚钱模型;

  • 谷歌所使用的网页排序算法;

......

本文围绕“无记忆”展开:

真正的高手,擅长打无记忆的牌。


具备离散状态的马尔可夫过程,通常被称为马尔可夫链。

马尔可夫链,状态空间中经过从一个状态到另一个状态的转换的随机过程

该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。

假如一个街上,有两家奶茶店:A和B。

  • A奶茶店的顾客,在喝了奶茶之后,有70%的人会继续选择该店,有30%会选择去B奶茶店;

  • B奶茶店的顾客,在喝了奶茶之后,有90%的人会继续选择该店,有10%会选择去A奶茶店。

假如一开始的时候,A和B的顾客是一样多的,例如都是500个,请问经过一段时间后,两家的顾客分别是多少?

答案是:A店有250个顾客,B店有750个顾客。

我们变换一下条件。假如一开始的时候,这条街只有A一家奶茶店,1000个顾客全是A的。而B刚刚开张,1个顾客都没有。请问经过一段时间后,两家的顾客分别是多少?

答案还是:A店有250个顾客,B店有750个顾客。

如你所知,这是一个马尔可夫链的统计均衡

你可能会说,我喝了好久A了,喝出感情了,怎么能说和此前无关呢?

不管你对A的感情分有多高,也都被时光沉淀到你当下这杯奶茶的体验当中了。所以,你的下一次选择,依然只取决于你这一次喝奶茶的体验。

这种特定类型的“无记忆性”称作马尔可夫性质

在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。

状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。

我画一下奶茶店的转移概率:

如上,箭头指向自己的,是指客户留存。指向别人,则是客户流失。

马尔可夫模型的一个特点是:当转移概率固定时,不管初始数是多少,总会达到一个“命中注定”的、唯一的统计均衡

所以,即使奶茶店B刚开张,一个顾客也没有,要不了多久,也会抢走大部分奶茶店A的顾客。

不管A开始的时候多么有优势,钱最后还是追着B去了。


一种对于命运的数字隐喻是“大数定律”。

我在《人生算法》这本书里也说过,一个骰子扔出某个数字的概率,取决于自身的结构,与手法和努力无关。

但是,大数定律里的抛硬币游戏,需要每一次抛硬币都是完全独立的。

而数学家帕维尔·涅克拉索夫则认为:现实世界中的事物是相互依存的(比如人的行为),所以现实中的事物并不恰好符合数学模式或分布。

马尔可夫不这么认为。他建立了一个模型,在这个模型中,结果的概率取决于以前发生的事件,但长期来看仍然遵循大数定律。

雪莱所说:历史是一部循环诗,由时间写在人的记忆上。

《天才与算法》里写道:

抛硬币的结果并不取决于以前抛硬币的结果,所以这不是马尔可夫理想的模型。

但是,如果增加一点依赖关系,使下一个事件取决于刚刚发生了什么,而不是整个系统如何影响了当前事件,又会怎么样呢?

每个事件的概率仅取决于先前事件的一系列事件被称为马尔可夫链。

预测天气就是一个例子:明天的天气肯定取决于今天的天气,但并不特别依赖于上周的天气。

由此,我们结合奶茶店的例子,可以发现马尔可夫链“宿命论”般的特点:

1、历史是无关紧要的,你再百年老店也没用;

2、初始条件是无关紧要的,你再高市场占有率也没用;

3、各种折腾也是没用的。你再营销,再数字化,做各种视频拉来流量,都无法改变宿命般的统计均衡,然后保持不变。

当然,即使马尔可夫链很强大,用自然科学解释社会科学,依然有各种各样的假设和约束。

在此,我们暂时略过。

《模型思维》一书总结道:

  • 在应用马尔可夫模型解释现象或预测趋势时,建模者对状态的选择至关重要。状态的选择决定了这些状态之间的转移概率。

  • 假如不改变转移概率,那些试图通过为期只有一两天的活动来激发学生学习兴趣的做法,可能不会产生什么有意义的影响。与此类似,进入社区“送温暖”、来到公园“捡垃圾”的志愿者,一次性的资金涌入,无论其规模大小,影响都会消失。

同理,以上观点,也是基于动态系统都满足马尔可夫模型的假设。在假设之外,历史、干预、事件仍可能产生长期影响。


现在,来到本文的重点:

马尔可夫过程的无记忆性。

让我们先忘掉马尔可夫,只说说“无记忆”。

没人知道文艺复兴基金的算法黑盒子里是如何运用隐马尔可夫链的,不如我们先研究一下人肉的“无记忆”

李录被芒格视为“房间里最聪明的人”,是价值投资的信徒,毋庸置疑是位长期主义者,可是他又说投资人应该像个高尔夫球手,应该打无记忆的球。他说:

我有个投资做得非常好的朋友跟我说投资和打高尔夫球很像,我很同意。你必须得保持平常心,你的心绪稍稍一激动,肯定就打差了。

前一杆跟后一杆没有一点关系,每一杆都是独立的,前面你打了一个小鸟球,下一杆也不一定能打好。而且每一杆都要想好风险和回报。

一个洞的好坏胜负并不会决定全局,直到你退役之前,都不是结果。而你留在身后的记录就是你一生最真实的成绩,时间越长,越不容易。

所以多打打高尔夫球,对于培养投资人的品性有帮助。

如上所述,其实也是老生常谈了,几乎每个做投资或者做投机的,或者玩儿德州扑克的,或者跟着AI学围棋的,都会懂得“无记忆”的含义。

那么,“无记忆”就是指一个人要在竞技和下注中保持冷静吗?

没错,这一点的确很重要。

在德州扑克的游戏过程当中,被对方几个OUTS的BADBEAT,这其实很正常的,波动就是德州扑克(包括别的随机性游戏)的天然属性。

绝大多数人会在这种波动中晕船,以致情绪失控。

扑克中的术语叫“上头”,比如坐在牌桌上,每当系统风险给你带来不利的时候你的情绪会失控,会开始胡乱地加注入池、胡乱地诈底或者买一些不该买的牌。

(以上关于德扑的文字,是我从一篇抄我的文章里抄回来的。)

投资上也是如此,很多人掉进坑里,会更加卖力地挥动铲子,越挖越深。

所以,这个时候, 打“无记忆”的牌,就会格外重要。

不要因为糟糕的结果而否定正确的选择。

在现实中,你坚持做正确的事情,短期内未必有很好的回报,但你还是要坚持做正确的事情。

然而,打“无记忆”的牌,绝非控制自己的情绪这么简单。


我将打“无记忆”的牌,分为如下5个层次:

第一层次:当下的无记忆。

控制情绪,保持平常心。

第二层次:过往的无记忆。

理性对待沉没成本。

第三层次:决策的无记忆。

重新构建决策点。

第四层次:已知的无记忆。

压缩过往,“鸟瞰”自己的已知条件。

第五层次:人设的无记忆。

不要为了人设、为了维护自我干蠢事。


1

第一层次:当下的无记忆

控制情绪,保持平常心。上一段已经说过了。


2

第二层次:过往的无记忆

理性对待沉没成本。

这方面的说法和案例也很多了。

研究行为经济学的卡尼曼和塞勒,对此都有很深刻的研究,可以去找他们的书看。

段永平讲过一个小故事,可能是很多人在生活中都会干的蠢事:

我在美国的时候,去机场接一位步步高的同事,估计要在机场等一个小时,所以在机场停车场投了一个小时停车收费的币,结果,那位同事提前半小时就来了。

这就有个问题:多投了半个小时的币,是继续在车里等这半小时,还是浪费多投的这半小时的钱?结论不言而喻的,肯定是开车走人。

段永平想表达的是:

但在实际决策中,很多人都犯继续等下去的愚蠢错误,这个事情我已经投入了几千万呀,为了救这些沉下去的成本再投入几千万,明知事情是错的还要坚持做下去,结果自然败得更惨。

所以,忘掉你多扔的停车费吧,忘掉你的沉没成本,忘掉你的股票成本,股票自己是没有记忆的。


3

第三层次:决策的无记忆

你应该重新构建决策点。

当你需要做决策的时候,你要像一个外来者,或者像一个外星人。

例如,假如你不是一个创业者,而是一个派来接管你的创业公司的人,你还会做自己正在做的事情吗?

有些人会说,我就是因为已经做了,所以必须有个交代。假如我是外来者,就没有这个道德压力了,自然会理性一些。

好吧,也许这也是创业者的优势之一,然而,即使是死磕到底,也可以有更聪明的方法。至少对投资人而言,他要的是你赚得光荣,而非“死的伟大”。

假设自己是个外来者,其实是人为设置一个决策点。

作为决策者,你应该为未来负责,而不是为过去解释。

我曾经写过,厉害的人都是人肉阿尔法狗。

什么叫人肉阿尔法狗?

先看阿尔法狗如何做决策。

阿尔法狗几乎会在每一手棋时,都计算自己的赢棋概率。

即:对它而言,每一个决策点都是独立的,阿尔法狗都会冷静地寻找“当下”的最大获胜概率。

所以,AI下棋,特别擅长于脱先,绝不纠缠,哪里价值大就下在哪里。

首先是目标的连续性,然后是策略的连续性,最后是动作的连续性。

然而,人类为了表面上连续性,可以踩着西瓜皮滑到任何地方。

所谓的无记忆,就是客观冷静地审视当下整体局面:

  • 对的事情要坚持,忘掉前一秒的鼻青脸肿;

  • 不对的事情,不管付出多大的代价都不做,都要叫停。

如何区分“对”还是“不对”?

这就是人生的难题和乐趣所在了,必须由每个人自己来回答。


4

第四层次:已知的无记忆

压缩过往,“鸟瞰”自己的已知条件。

要理解这一点,还是用围棋来类比。

围棋有一点特别奇怪的地方。

围棋是与顺序有关的游戏。

  • 围棋棋子除了颜色以外,完全一样,不像象棋那样分帅车兵马。

  • 另外,围棋的棋子,落下之后就不能移动。

  • 围棋棋子的效率和价值,是由棋子之间的空间关系而决定的。

  • 就像搭宜家家具或者乐高玩具,即使空间位置对了,但如果顺序错了,也不行。

可是,对于一局棋的过去而言,“顺序”并不重要。这就是“奇怪”的地方。

这方面最有趣的概念,是围棋里的“手割”,但今天我不想展开了。

让我略去围棋关于时空的思考过程,来概述一下:

当我们站在围棋对局中的某个决策点上,当下的局面,是所有“已知”构建的一个静态空间结构图,单个棋子当初的使命、顺序,并不能作为决策的依据。

你要忘掉过往的假设,过往的因果,这并非完全抛弃存量,而是压缩过去,将其作为当下决策的已知条件,而非约束条件。

这里面的无记忆,还体现在一流的决策者不会受限于自己是否真的拥有那些资源。

我年少时学下围棋,最大的收获就是学会思考:

  • 假如这里我能够连续走两手,会有什么结果?

  • 假如我这里再多一个子,我就会有什么样的手段?

这是另外一种更高级别的无记忆,如王兴所说:

“你知道什么是真正的企业家精神吗?知道自己的目标是什么,想着如何实现目标,不管自己现在拥有什么,哪怕手上什么都没有。”


5

第五层次:人设的无记忆

不要为了人设,为了维护自我,而去干蠢事。

忘掉自己的人设,这可能是“无记忆”最艰难的地方。

因为反人性。

这里的“人设的无记忆”,当然不是指厚黑学。

这方面的各种鸡汤文够多了,我且略过。

想和你分享一个我记忆深刻的故事:

2004年10月,乔布斯有机会见到了自己心目中的偶像鲍勃·迪伦。

狂人乔布斯格外紧张,不仅因为鲍勃是他心目中的英雄之一,还因为他担心:

万一他本人不像我想象中那么聪明?

或者,他只是在“模仿”自己?就像很多人那样。

绝大多数人都是在“模仿”自己

  • 失意者通过自己的糟糕记忆重复自己;

  • “成功者”通过幻觉强化自己的一贯正确。

别模仿昨天,未来学家彼得·伊利亚德说:

“今天我们如果不生活在未来,那么未来我们将生活在过去”。

忘掉自己的人设吧,因为根本没人在意。


最后

时间给了我们一种奇怪的幻觉:

  • 过去如何被堆积起来(并被记忆自由重组)?

  • 现在如何存在而又不存在?

  • 未来如何总是给人以期待?

人有一种神奇的天赋,那就是对未来的幻想。动物似乎并不具备这一点。

往前看,打无记忆的牌,是一种高级的策略,更是一种伟大哲学。

你需要智慧,还需要司汤达所描述的勇气:

我的梦想,值得我本人去争取,我今天的生活,绝不是我昨天生活的冷淡抄袭。

向前看,是我们唯一的选择。

对于那些仍然相信未来的人,请允许我与你分享一首名为《每一粒微沙》的歌。

这是乔布斯最喜欢的鲍勃·迪伦的歌。

在两人唯一的那次见面时,乔布斯很开心地发现,自己的偶像并不是在“模仿迪伦他自己”。

据说这首歌是关于“放下一切、祈祷救赎”。

其中有段歌词如下:

不要存心回首任何错误,像该隐知耻

我开始注视这些必须甩掉的陈年旧事

在愤恨的当下

我能看见造物主之手

在每片颤动的叶里,

在每粒微沙之中

本篇文章来源于微信公众号: 孤独大脑

信念的算法


我怎么也找不到相机皮套了。

它最有可能在我混乱的书架上。

书架上不仅有书,还有乱七八糟的数码玩具,以及各种零碎东西。

我把这些东西平铺在可以一眼看见的地方。

合理而整洁的收纳,也许应该是Windows的文件夹模式,文件夹套文件夹。

但是以我的经验,不管是物理世界,还是数字世界,进了文件夹的东西几乎就被遗忘了。

所以,iPhone式的对App的平铺,是我喜欢的收纳(确切说是乱堆)模式。

苹果很整洁,我很混乱。

对于信息的个人获取形态,苹果贡献了平铺,谷歌贡献了搜索,Facebook贡献了信息流

  • 在信息世界,太多的平铺需要搜索。

  • 信息流,则是引入了时间元素的、流动的平铺。

可是,在物理世界,平铺并没有帮助我找到相机皮套,连找了两次都没找到。

今早,我决定继续在书架上找一次,终于在订书机后面发现了它。

假如你找不到一样东西,而且在它最可能在的地方也找过了,如果你继续找了些别的地方还没发现,那么你再在它最可能出现的地方多找一次,仍然可能是最优选择。

上面这句绕口令版的生活小常识背后,是我们这个世界最重要的概念之一,以及该概念背后的算法。

这个概念是:信念

背后的算法是:贝叶斯公式

我用贝叶斯公式来解释一下自己找相机皮套的过程:

  1. 假如东西在最可能的那个地方出现的概率是a,你找了一遍,没发现。

  2. 假设你找了这一次但没看仔细的概率是b,所以该东西还在这个最可能的地方的概率是a✖️b。

  3. 找两次而不得后,这个概率继续降低为a✖️b✖️b。

尽管有时候b很小,但因为a很大,所以a✖️b还是相对比较大。

更何况,很多时候我们会低估了b的数值。

例如,对平铺的习以为常所导致的先入为主,让我忽略了订书机后面还有东西。

b代表我们现实的愚蠢。先入为主是自以为知道的无知,这种愚蠢的b值高得惊人。

不过好处是,假如我愿意承认自己的愚蠢,较大的b值,令我在书架上找到相机皮套的概率更大了。

尽管上述“计算”简单得惊人,然而我敢打赌,真正理解的人,也许不足1%。


将“信念”引入计算,似乎有点儿奇怪。

假如你在街边,看见有人摆摊儿,玩扔硬币押大小的游戏。

庄家连续扔出了5次正面,接下来一次,你押什么?

据我某次在澳门的观察,不同的人会有不同的押注:

  • 新手会押正面,因为他们认为正面的火气很旺,要跟上;

  • 老手会押反面,因为他们认为硬币正反概率都是50%,连续5次正面,该来一次反面了。

聪明如你,会告诉他们:你们都错了。

你明白概率的道理,知道每次扔硬币都是独立事件:即使前面连续出现5次正面,下一次出现正面或者反面的机会还是一样的。

例如下图:假如生男生女的概率和扔硬币一样,两种结果都是50%,你会发现连续5次甚至10次都是男孩或者女孩某一性别,并不罕见(见黄色和绿色标识数据)。

图片来自《统计与真理》

于是你说:即使5次都是正面,下一次是正面的概率还是50%。

然而,你忘记了一个事实:你是在街头玩儿这个扔硬币游戏。

你有一个先入为主的假设:硬币没有被做手脚。

这就是我在第一段里所说的“b”值:

b代表我们现实的愚蠢。先入为主,是自以为知道的无知。

概率有两个流派:

  • 频率主义,是客观的,其基础是一件事发生的频率;

  • 贝叶斯主义,则是主观的,基础是你对一件事发生的“信念”。

例如,一个标准的硬币,将其抛上一万次,结果分布符合“频率主义”的概率解释。

贝叶斯推断,则会先有一个猜测,然后根据信息来更新自己的猜测。例如:

嗯,一般来说,硬币正反面是一样的,但这是在街头,那个家伙真的没做手脚吗?

这个推断过程就是:

后验概率 = 观测数据决定的调整因子×先验概率

所谓“先验概率”,是50%。后验概率,则是根据更新后的信息,加以调整后得到的数据。

贝叶斯推断里的“信念”,是这样的姿势:

我相信,但我也可能是错的。


作为牧师的贝叶斯,据说是为了驳斥“怀疑上帝并不存在”的休谟,从而提出了贝叶斯推断。

于是,作为“我相信”的贝叶斯牧师,和“我怀疑”的休谟,因为这个公式而成为思想上对立的好基友。

因为对立,反而构建了某种强大的思想张力。

  • 杠精休谟说,这世界哪里有什么因果?你们那些公式啊,信念啊,统统靠不住;

  • 信仰者贝叶斯说,那你也要有信念。

因为这种思想张力可以表述为一个简单的公式,所以这个关于信念的算法迄今仍在发挥着神奇的力量。

频次主义的概率,其客观的好处是客观,可是,我们的认知本身就是主观的,谈何客观呢?

就像牛顿的公式,即使在地球乃至太阳系被反复验证,仍然只是一个局部的真理。或者说,是一个有概率前提的“信念”。

然而,简单怀疑一切,会陷入虚无主义。

贝叶斯主义选择相信“信念”,但他们知道这只是“先入之见”,他们随时敞开认知的大门,接受各种性质的信息,并且更新自己的“信念”。

由于我们对世界的理解极其有限,频次主义的概率所依赖的大数定律,很容易因为数据的局限,以及环境的变化,而掉入“小数陷阱”,也就是赌徒谬误--就像前面说的,以为连续出现5次正面后,下一次出现反面的概率会变大。

贝叶斯主义更适合变化的世界,有限的世界。

包括我们每个人有限的一生。

然而,这个伟大的哲学,需要经由算法,才能从描述性的概念,变成拯救世界的工具。


请允许我用此前用过的例子,不同的是,我会给出关键环节的具体计算。

2009年5月31日晚10点,法航447不幸坠毁,搜救人员动用当时最新技术,找了一周后,仅发现少量残骸碎片和29具遇难者遗体。
随后两年的艰苦搜索,更是一无所获。
这时,贝叶斯主义者登场了,他们的方法是:
  • 飞机失事建立一个数学模型;
  • 整合评估各种导致失事的原因的概率;
  • 根据更新信息,改进模型。
如上,也是一张“格子”图。
救援队根据上述概率分布图,先从概率最大的区域搜索,如果没有发现,就在过往数据基础之上更新概率分布,继续搜索最大概率区域。
其中,贝叶斯更新的过程,简单示范如下:
(本图来自《科学世界》杂志)
上面的数字如何得到的呢?
我试着不用贝叶斯公式,用直观的方式来计算:
在B区域的“初始信念”是50%,搜索之后不在B区域,但是找不到的可能性是:
1、的确不在B区域;
2、在B区域但是被漏掉了。
我们假设漏掉的概率是25%(这也是一个信念),于是分析如下:
想起我找相机皮套的故事了吗?还记得我描述自己愚蠢程度的“b值”吗?
这里有趣的地方是,对于一个贝叶斯主义者,不仅是“我相信,但我也怀疑我的相信”,甚至于,连我对自己的怀疑也是怀疑的
假如你知道自己愚蠢,并且能够定义出愚蠢的边界,例如这里“找漏了”的概率之25%,那么该愚蠢就会成为智慧的一部分
继续上面的不用公式的计算,搜索了B区域,由此更新的信息是:
  • 的确不在B区域的概率是37.5%

  • 还是在B区域但是被漏掉的概率是12.5%。

那么,不在B区域的37.5%可能性,就要在ABCD四个区域重新分配,如下图:
重新分配的基数是(30%+12.5%+5%+15%),以A区域为例,其因为重新分配那37.5%而增加的概率是:
30%➗(30%+12.5%+5%+15%)✖️37.5% = 0.18
于是,更新后A区域的概率是(0.3+0.18=0.48),整体更新后如下图:
这时,A区域的“信念”数值上升为48%,接下来,搜救人员继续搜索A区域。
我们可以想象,假如某个区域的初始信念比较高,并且遗漏概率也比较高的话,即使搜索了该区域而不得,有可能该区域更新后的信念仍然是最高的,所以按照游戏规则仍然是最高的。
历史上的搜救案例里,的确出现过类似的状况,人们根据更新后的数据,重复去搜索此前找过但没找到目标的区域,结果最后找到了。
贝叶斯主义者,将概率理解为对某件事情的信念。
他们承认自己的“信念”是灰度的,而非绝对的判断。
他们会根据观察到的信息更新自己的信念:
  • “初始信念”是先验概率,更新后的信念是后验概率。

  • 在新一轮的观察中,后验概率又变成初始概率。

我在《人生算法》里的认知飞轮,亚马逊的Day 1,微软的刷新,投资人的打无记忆的球,都是类似逻辑。
贝叶斯推断保留不确定性,每一轮的估算也许是模糊的,然而公式在模糊和犯错的情况下,依然可以发挥作用。
并且,贝叶斯算法具有连续性,可以程序化,以有限的信息,通过某种杠杆效应,快速逼近真相。

在威尔逊被赶走后,又有一个人越过了信念碑,那是一般游人与信念中心保持距离的界限。那人在碑后徘徊着,希恩斯很快注意到了他,招呼惠子说:“看那人,他应该是个军人!

这是小说《三体》里的一段。面壁人希恩斯苏醒后,在推进计划过程中意外发现“思想钢印”能坚定人们的思想,并设立信念中心帮助太空军建立必胜信心。

“我叫吴岳,我来获取信仰。”来人说,希恩斯注意到他说的是信仰而不是信念。

信念和信仰的区别是什么?

信仰,为人类生而为人,选择其所相信之价值观、生活方式,以及人生意义的可靠确据之一。是不证自明的那些东西,例如父母对孩子的爱。

信念,是个人判断和选择事物真伪的思想意识,信念的正确与否取决于个人的知识水平包括推理能力。

以上定义来自网络。请允许我用简单的描述来区隔二者:

  • 信仰,几乎是100%的;

  • 信念,是介于0和100%之间的。

比特币是一种信仰吗?不,比特币是一种信念。

这个信念值可以是1%,也可以是98%,是每个人的主观概率。

我们不去谈比特币的金融理论基础,也不去谈数字化时代的变迁,更不去讨论关于数字黄金的隐喻,而只说说信念本身。

信念是基于概率的。所以,是否投资比特币,不是一个“是”或者“非”的选择。

比如,你可以说,我对比特币涨到30万美金的信念是25%,我对比特币跌到一分钱不值的信念是10%,我对比特币在3万美金上蹿下跳的信念是65%,那么,你就可以根据这些信念来计算期望值,并根据自己的状况来做决策。

你并不需要选择是否“信仰”比特币。

当然,因为货币的“信念”属性,以及人类事务里信念的传染性,会有某些别的隐变量起作用,所以你的信念更需要一些未知的灰度空间。


年轻时,每个人都有自己的信念。

然而,岁数越大,信念越少。

《重庆森林》里有段台词:

不知道从什么时候开始,在什么东西上面都有个日期,秋刀鱼会过期,肉罐头会过期,连保鲜纸都会过期,我开始怀疑,在这个世界上,还有什么东西是不会过期的?

一切东西都会过期,是热力学第二定律的文艺化表达。

这个伟大而残忍的定律,表述了热力学过程的不可逆性——孤立系统自发地朝着热力学平衡方向──最大熵状态──演化。

熵,是混乱程度的度量。同样,这个概念也是基于概率的。

根据熵增原理,一个玻璃杯子早晚会被打碎,而我们却看不到碎玻璃复原为一个完整的杯子。--这个说法并不精确。

正确的表述是:

  • 一个杯子被打碎的概率非常大,时间越长,越接近于100%(这是文物价值的概率原理);

  • 碎玻璃复原为完整杯子并非不可能,而是概率极小,再考虑到原子大小与杯子尺度之间的关系,几乎没人见过碎玻璃复原。即使这个概率极小,但仍然大于零。

熵增理论里的ΔS ≥ 0,是指“事物会变得更糟糕”。更具体地说,它认为物质和能量总是朝着混乱的方向发展。

《存在与科学》写道:

如果任由其自由发展,物质会分解,能量会扩散。比如在某个容器内,无序运动的气体分子会充满整个容器。炽热金属块中的原子会发生剧烈的碰撞,它们同时会与该金属块周围温度较低的原子发生碰撞,这会使金属块中的能量散发出来,然后其温度降低。这就是自然变化的根本原因——无序扩散。

这就是墨菲定律:凡是可能出错的事就一定会出错。

然而,ΔS ≥ 0只能用于“孤立”系统。

例如,地球并不是一个孤立系统,因为地球不断地从太阳以太阳光的形式接收能量。于是,作为负熵过程的生命得以诞生。

然而令人惊讶的是,这种自然的无序扩散可以创造出精致的结构。这种扩散如果发生在引擎中,就可以让发动机吊起砖块建造教堂;这种扩散如果发生在种子里,就可以让分子形成花朵。这种扩散如果发生在你的身体里,在你的大脑中随机的电流和分子就可能会被加工成想法。

这就是生命与创造的魅力,也是信念的价值和意义。

我们通过知识,通过机器,通过信息,操控了麦克斯韦妖,那些无序扩散得以被驯服,为人类做功。

就像我在大学时代主要靠把衣服泡在水盆里,利用布朗运动来实现“自动洗衣”。

一个凤梨罐头的加工,就是一个负熵的过程,人们以此对抗不可逆的时光。

然而,信念,罐头,和这个世界上所有的事物一样,都无法逃离那个最厉害的定律:

在1994年的5月1号,有一个女人跟我讲了一声“生日快乐”,因为这一句话,我会一直记住这个女人。如果记忆也是一个罐头的话,我希望这罐罐头不会过期;如果一定要加一个日子的话,我希望它是一万年。

嗯,假如一个信念以一万年为尺度,也许我们该称之为信仰。

信念的边界,比信念本身更重要。

这种信念,重新定义了已知和未知。

我们看到的,知道的,理解的,都只是真实世界中很小的一部分。

这里既有空间上的未知,例如上面的搜救案例,也有时间上的未知,例如我们对未来的投资。

为了探寻未知,信念将自己作为方法和路径,与随机性共舞,去探寻自我的边界。

蒙特卡洛方法,也称统计模拟方法是一种以概率统计理论为指导的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。

例如,用该方法来求不规则图形的面积:

图片来自《统计与真理》

假设我们随机地在上面的长方形上往下扔沙子:

当沙子足够多时,大数定律发挥作用,我们数一下落在不规则图形里的沙子的数量,再除以落在长方形里的沙子的数量,该比值非常接近于“不规则图形的面积/长方形的面积。

因为长方形面积已知,所以根据该比值,可以计算出不规则图形的面积。

(伽利略用过更加古典的方法,他会将不规则图形剪下来去称重量。)

这种看起来很笨的聪明方法,作为非确定性算法,可以在保持对不规则图形的无知的情况下,非常精确地计算出想要的数字,尤其是在计算机的帮助下。

蒙特卡洛方法,能够解决那些确定性算法无法解决的问题。

随机性和不确定性,不再是人类的敌人。

这种方法的名字,来自摩纳哥的蒙特卡洛赌场。

从卡尔达诺开始,赌徒再次“以身为骰”,为人类贡献出概率的智慧。


赌徒有赌徒的信念,赌场有赌场的信念。

再回到蒙特卡洛方法的图片:

我们假设,上图是一个赌徒与赌场的对赌游戏:

赌徒闭着眼睛在长方形上空往下扔沙子,假如掉在不规则图形里,一块钱变两块钱;假如掉在不规则图形之外,一块钱全输掉。

显然,赌场只要让不规则图形的面积小于长方形面积的50%,就可以稳赚了。

仅仅是靠大数定律,赌场让随机性成为赚钱机器。

随机扔沙子,是一种无序扩散的人类行为。

因为赌场有制定概率的权力,所以赌博游戏就是一台精心设计的机器,背后是暗中操控无序扩散的麦克斯韦妖,赌徒们“熵增”,而赌场“熵减”。

  • 单个沙子落在不规则图形内,还是不规则图形之外,是个无法预测的偶然事件;

  • 很多个沙子落在“不规则图形内”和“之外”的比例,几乎是必然的。

赌场的信念,比赌徒的信念,优势大那么一点点。

不确定的游戏,不止是在赌场上。

投资,创业,甚至包括教育孩子,都是一个充满不确定性的游戏。

本质上,这些事情,都是一个探寻信念边界的过程。

创业者早期的试错,就是基于某个信念,然后在空中往下扔沙子。

沙子落在边界内,或者边界外,对于探寻边界而言是等价的。

生命的演化,孩子的成长,财富的起源,几乎都是基于随机性的进化。

这一过程的三步走公式是:

变异,选择,放大。

以创业为例:

  • 第一阶段是价值验证,快速地扔沙子,快速低成本地试错,去发现有概率优势的信念;

  • 第二阶段,大规模复制这一信念。

教育孩子与创业思维的内核一致性,在以色列得以验证。

《统计与真理》给出了一个风险管理的逻辑方程:

由此,该书总结道

  • 如果我们不得不在不确定性的前提下做出抉择,则错误是不可避免的;

  • 如果错误是不可避免的,则在一定的规律下做出抉择(形成新的具有不确定性的知识)时,最好我们能知道犯错误的频率(对不确定性量度的知识);

  • 这样的知识能够用于找出制定决策的某种规律,从而使我们减少盲目性,使做出错误决策的频率最小,或者使由错误决策产生的损失最小。

一个投资者的交易系统,一家创业公司的业务发展,一个孩子的成长路径,都是基于风险管理之下的信念之旅。

一个知道自己边界的灰度信念,也许比一个自认为100%正确的信念更牢靠。

一旦某个不确定的知识可以度量自己的不确定性,偶然就在某种程度上被驯服,热力学第二定律就被放进了机器里,随机性几乎可为我们创造除了时间之外的一切。


为信念赋予概率数值,是智慧的跃升。

假如“已知”是一阶智慧,那么,概率是二阶智慧,概率的演化是三阶智慧。

科学家已经接受了信念的不确定性,他们信仰科学,但会质疑理论、实验和数字,并在这质疑中坚定前行。

信念在人类事务方面,容易被忽略其概率属性。

对于一个人而言,拥有信念,相当于张开一个运气的风帆,能够大大增加自己捕获好运气的概率。

吸引力法则的背后,就是关于信念的风帆。

这一风帆会聚集个体零散的概率权,例如每个人获胜的信念都是51%,但仍然有49%的失败概率。

吸引力法则的运用者,能够聚集这些零散的概率权,就像历史上发生过的极少次数的(在期望值为正的意外情况下)合买彩票,偶然的、较小优势的概率,汇聚为必然的赚钱机会。

人类事务,信念风帆,吸引力法则,还能够构建一些社会属性的信念体系,例如此前谈到的比特币定价。

赌场的例子和成功学的道理,在我眼中都是概率世界鲜活的样本,因为每个人的命运就是一次随机事件,这个随机事件又在当事人的自由意志下努力去改变自己的命运。进而,人们共同的看似有序的无序扩散,探索出了世界的边界和轮廓。

一旦信念被赋予概率数值,我们就可以不再依赖于神秘主义的解释。

我们不仅发现边界,还改变边界。

我们并不只是探寻51%的信念。

  • 当下的信念,我们要的是大概率;

  • 未来的信念,可能只是微弱的小概率。

前者可能是制造一辆车,后者是指探寻人类另外的居住星球。

人们通常高估了当下的信念,而低估了未来的信念。

例如,从厉害的人那里得到股票内幕消息,你对这一信念往往赋予了过高的概率数值。

人们又低估了为未来种下森林的信念。

幸而,热力学第二定律在我们的大脑里照旧发挥作用,人类的祖先第一次爬下树,第一次走出丛林,第一次点燃火,也许都只是极小概率的随机事件。

我们祖先的运气风帆,捕获了那些细微的变异,他们当中的极少数,做出了勇敢的选择。

我愿意相信他们第二次爬下树,第二次走出丛林,第二点次燃火,是基于某种微弱的信念。

接下来,历史放大了那些选择,我们在一个熵增的宇宙里,用信念,以及可计算的信念机器,局部驯化了热力学第二定律,并得以在地球上孤独地生存。


最后

我们并不需要一个保质期一万年的凤梨罐头。

但也许人类需要一个万年钟。

迄今为止,人类可及的宇宙里,空无一“人”,除了我们所在的星球。

对这一极小概率的感恩,在人类对地球的征服当中被忽略掉了。

本文开始的时候,试图将一个描述性的关于信念的概念,转化为可计算的概率化的信念系统。

休谟说:“聪明人会把自己的信念诉诸证据。”而贝叶斯则将休谟的哲学变成了可以计算的公式。

人类发明了引擎,在气缸里驾驭混乱。

而人的大脑,就是一个信念的引擎。

玻尔兹曼与香农的熵,一个作用于肉体,一个作用于思考。

为信念赋予概率数值,并不会摧毁人类的信仰至少在我们发现意识从何而来的秘密之前

我们相信,我们怀疑自己的相信,我们相信自己的怀疑。

这是未知世界与自由意志之间的翩翩起舞,值得用生命去赞美。

信念不在意数值的大小,因为几乎所有的伟大都有微不足道的开始。

如乔布斯所言:

“‭‮然虽‬‬你现在可能‭看不见未来,不知道你‭‮在现‬‬所拥有的、懂得的、‭‮解了‬‬的,能带领你到什么样的境界;‭‮到直‬‬未来的某一时刻,当你暮然‭‮首回‬‬时,你才将能所走过的路串起来,进而发现‭‮是就‬‬这些点点滴滴‭‮就造‬‬了你。”

第一个爬下树的人类祖先,并非是最聪明、最强壮的那一个。然而,好奇或随机性激发了信念。

在我看来,乔布斯就是类似的人,一个伟大的普通人。他混乱,脆弱,愚蠢,会在马友友的大提琴声中哭泣,他也没有太高的智商。

但他曾经透露过自己一生中最重要的秘密。

这个秘密与信念有关:

“因此你得相信‭‮些这‬‬即将来临的事情在更远的‭‮来未‬‬肯定会连在一起,要有‭‮定一‬‬的信念:你的勇气、你的生命、你的缘分。‭‮份这‬‬信念从没让我失望过,而这也就是让我与不众同的地方。”

本篇文章来源于微信公众号: 孤独大脑

帕斯卡的赌注

 

孤注一掷

假如有一个巨大的机会放在面前,你愿意为其孤注一掷吗?

下面的故事,和你日常生活中最大的乐趣之一“收快递”有关。

故事发生在近40年前,有个家伙的创业公司马上就要倒闭了。

公司欠着24000美元的账单,可他只有5000美元。

这时,他做了一个疯狂的决定,带着全部的钱,前往拉斯维加斯,在赌场“21点”的牌桌前孤注一掷。

接下来的故事,充满了幸存者偏差式的传奇:

  • 他赌赢了32000美元,刚好够付掉24000美元账单,以及再勉强维持公司一周;

  • 就在这一周,他成功融资1100万美元;

  • 这个叫“联邦快递”的公司活了下来,开创了一个给我们带来日常惊喜的物流快运行业。

人生,到底该不该赌?

显然,联邦快递的创始人走入赌场的那一刻,概率和期望值都站在他对立面。他的所作所为,绝对属于赌徒行为。

即使21 点是赌场里最可能赢钱的游戏,即使你懂得通过计算采取最佳玩法,你作为玩家的胜率是49%,你的期望值为负。

赌场靠这2%的微弱优势,也可以慢慢赢光你的钱。

但是,如果将故事主角赢到手的32000美元所得到的收益,理解为创立联邦快递的火种,那么是不是对应的收益,就应该是这家企业所对应的价值?

就像是变魔术,通过一个逻辑上并不那么牢靠的置换,原本为负的期望值,似乎可以变正了。

我们暂时忽略主角玩儿21点的水平,以及合理估算他的创业成功率,会发现,这场赌局的成本是5000美金,期望值是(市值700多亿美金的)联邦快递的企业价值。

聪明如你,也许会想到,这像是一个帕斯卡的赌注。


帕斯卡赌注

帕斯卡的赌注,是十七世纪法国哲学家、数学家、物理学家布莱兹·帕斯卡提出的一项哲学论证:

我们到底该不该相信上帝的存在呢?

我们不讨论其中关于上帝和信仰的部分,单单只看论证过程和数学计算:

  • 上帝或者存在,或者不存在,无法以理性分辨;

  • 人们必须猜测......就像抛硬币猜测哪一面向上一样;

  • 你必须下赌注,不能不下。

那么,该如何计算呢?

帕斯卡的分析,如下方的图表:

如上图,让我们衡量一下赌上帝存在的利弊得失:

  • 若上帝不存在,你选择相信上帝的成本也有限,选择不信的收益也是有限的;

  • 若上帝存在,你选择相信上帝的收益是无限,选择不信的损失也是无限的。

即使上帝存在是非常小概率的事件,如果计算一下期望值,选择相信上帝的回报也高得惊人。

也就是说,如果你赌对了,你将赢得一切,如果错了,失去的都算不了什么。

也许有人会说,那买彩票,是不是也算帕斯卡赌注呢?你看,只要付出几块钱,就有几个亿的期望值,尽管概率小,但赌对了改命,赌错了损失也不大啊。

然而,买彩票并不是帕斯卡赌注。


帕斯卡骗局

买彩票和六合彩都不是“帕斯卡赌注”。

帕斯卡赌注是指投入成本可以忽略不计、而回报可以很大、并且计算下来期望值为正的事情。

例如向女神表白,向老板争取机会,等等。

也有投入成本不算小、但回报无穷大的。

例如量化交易之父索普打算死后冷冻自己,投入一定不小,他自己估计复活的可能性约为2%。这仍然算一个帕斯卡赌注,因为他用的是这辈子根本用不到的钱,主动当小白鼠还可能为后代造福。

为什么彩票不算?

1、期望值为负数。

买彩票追逐的是比雷劈还小很多倍的极小概率机会,并且期望值为负,根据大数定律,玩儿得越多,输得越稳定。

2、成本并不低。

打算靠彩票和六合彩致富的人,投入并非不可忽略,每天十块钱,一年3650元,算上复利的机会成本,其实不低,钝刀子割肉更狠。

比方说,你向女神表白,虽然被拒绝的概率很大,但收益貌似无限大(至少你当时那么觉得),并且被拒的成本可以主观选择忽略,所以还是可以试一下。

但是,如果你根据帕斯卡赌注,每天向一个女明星求婚一次,那就很愚蠢了。

3、破坏人的大脑。

更大的成本是,买彩票等行为,让人沉迷于一夜暴富的幻想中,极其消磨斗志。

即使真中了彩票大奖,大多数人的结局也不太好。

而真正的帕斯卡赌注,例如向老板争取更有挑战性的岗位,该举动不仅不是成本,还能锻炼乐观,磨练意志。

《原则》的作者达利欧,他年轻时看中一套房子,想买。别人都说不可能,他自己当时也没钱。但他仍然给屋主打了电话。结果,屋主不仅愿意卖,还可以给他一笔贷款。

假如一个人在工作时有这种精神,会获得“死磕”的溢价。

但是,在概率稳定和大数定律起作用的领域,这种死磕并没作用。

例如,我和乔丹打篮球,再死磕也没用。

很多散户忘记了自己在股市上其实是和一群装备精良、有知识还会耍流氓的职业人士死磕,越磕越死。

有一种诈骗,是反向利用“帕斯卡赌注”:

反正也吃不了大亏,说不定占大便宜呢!

97年左右,我曾经知道某地企业批量诈骗,很认真约人去当地谈生意,然后吃饭娱乐,让你买单。你想,要是骗子也不会骗一顿饭吧?

真相是,人家就是骗你这顿饭的餐厅分成。

直至现在,也总会有头衔大得吓人的正经名流,谈的都是十亿百亿的大生意,缺的只是临时小钱,你要是跳进去,就中套了。

类似骗局不胜枚举,例如你中奖啦,只要承担快递费,就把东西寄给你。

我们姑且称之为“帕斯卡骗局”。

这类被骗的原因,只有一个字:贪。

帕斯卡赌注最早是帕斯卡对是否信上帝的思考,信上帝的好处可能是无限的,成本呢?说不定还没成本呢,如果信仰能令人宁静。

所以也很难单纯用期望值计算的方式,来算哪些是帕斯卡赌注。

帕斯卡赌注更像一种积极向上、敢于探索的小强精神。这类成本更多的是一个人的脸皮、意志和激情。


彩票套利

能靠彩票赚钱吗?

答案是不可能。

当然,的确有人用“确定性的方法”,攻破了彩票。

我称之为概率套利

彩票的原理,是利用头奖的吸引力,吸引人们去买期望值为负的彩票。

例如,某彩票游戏,共售出10000张彩票,其中只有1张大奖,奖金5000元,其他都是空的。每张彩票的成本是一块钱。计算如下:

  • 单张彩票的中奖期望收益是:9999/10000x0+1/10000x5000=0.5元;

  • 单张彩票的成本是1元;

  • 所以购买一张彩票的期望值是(0.5-1=-0.5),也就是负的0.5元。

如果该彩票游戏是即开即中,你在旁边蹲着,发现开了5000张头奖都还没出来,这时候期望值就变成了(4999/5000x0+1/5000x5000-1=0)。

在这个临界点,奖金总额等于彩票购买总额。

也就是说,过了这个临界点,你买下剩余所有彩票,就会稳赚。

历史上,伏尔泰曾经利用彩票设计上的漏洞,赚了大钱。那时候,人们的概率知识还不够清晰,套利机会更多。

现实中,靠彩票赚钱的,大多是类似原理。

最著名的例子,就是“Winfal彩票”。

“Winfall ”的规则如下:

  • 500 万美金是一个界线,如果彩票上 6 个号码全中就可以独得当期奖金;

  • 但如果当奖金累积到 500 万美金却依然没有人中奖时,则会把奖金分摊给中奖 3~5 个号码的玩家,因此提高了中奖概率。

也就是说,Winfal彩票的游戏规则,令其在某个时间段里,奖金池总额大于彩票购买成本,即:期望值为正

这是一个数学上很明显的漏洞。但只有极少人发现并靠此发财。

其中有一组人是塞尔比夫妇。

他们在玩 Winfall 的 9 年中,夫妻俩和他们组成的团队赢得总计 2600 万美元,约合人民币1.7亿左右的高额奖金,他们用这笔钱翻新他们的房子,并用来支付他们的 6 个孩子、 14 个孙子女及 10 个曾孙子女的学费。

原理很简单,但是我觉得这个逻辑框架非常有趣。

塞尔比夫妇的赚钱之路是这样的:

第一步:发现“期望值”为正的概率套利机会。

举例如下:

  • 州政府会从累积奖金中拿出(至少)200万美元作为小额奖项的额外奖金。

  • 有150万人冲着这200万向下分配的奖金购买彩票,销售额是300万。

  • 州政府会拿走300万美元的40%,其余180万美元进入奖金池。

  • 所以奖金池合计380万,而彩票总体成本是300万。总体正期望值是80万。

光发现机会还不够。

第二步:验证概率假设。

塞尔比夫妇发现漏洞后,第一次买了 3600 美元的彩票,赢得了 6300 美元,之后再下注 8000 美元,获得的奖金整整翻了一倍。

这就是"经证实的认知"。

在验证了自己的计算逻辑是正确的之后,他们开始正式行动了。

第三步:大规模重复。

需要留意的是,州政府向下分配的额外奖金,是分给二、三、四、五等奖的,也就是说,分得比较均匀。

再根据大数定律,塞尔比夫妇买得越多,他们的收益越接近于整体的期望收益比例

于是,塞尔比夫妇成立了公司,帮助更多亲友赚钱。

当他们发现马萨诸塞州的彩票“ Cash WinFall ”有期望值漏洞之后,两夫妻连续 6 年都开 14 小时、 900 英里往返。

他们在当地购买数十万张彩票,然后租一间汽车旅馆,连续 10 天每天花 10 小时整理彩券兑奖。

(以上案例来自《 CBS 》新闻网报导)

先形成认知,再证实认知,最后大力出奇迹。

显然,这不是一个帕斯卡赌注,而是一个期望值为正、确定性极其高、可大规模复制的套利机会。

有些事情看起来非常不确定,但是从概率的角度看,却非常有确定性。

现实中,这种机会极其罕见,所以,别在彩票和任何期望值为负的赌博上浪费机会。

包括那些被包装为投资的赌博,以及所有你不懂的“机会”。

总结一下,概率套利,主要来自以下四个方面:

1、通过概率计算,发现正期望值的套利机会;

2、利用人们对不确定性的厌恶所带来的错误定价和隐藏机会;

3、通过套利者的有组织活动,大规模复制上面的套利机会。

除了以上三个,还应该有帕斯卡的赌注:

4、将那些帕斯卡赌注似的小概率机遇放大为正期望值的事件。

利润背后

张维迎教授认为,企业家的工作就两件事:

第一、应对不确定性。

经济学家奈特在其名著《风险、不确定性与利润》中证明,没有不确定性,就没有经济学意义上的利润。

所以,利润是对不确定性的补偿

然而,企业家和创业者并不是赌徒,所以如上段所述,企业家是通过发现正期望值、复制正期望值来实现利润。

应对不确定性,需要智慧,需要勇气,还需要体力。

所以,对于企业家和创业者给予奖励,是应该的。

第二、推动社会的创新。

张教授的观点是:

“创新是企业家的责任,不是技术专家的责任,技术专家只是在发明,创新是把发明变成一个有商业价值的东西。”

创新的事物,起初都是小概率的东西。而且开始的时候,都算不过来账。

算不过来帐,意味着期望值是负的,不知道该如何赚钱。

这个时候,就需要创新,需要熊彼特所说的“创造性的破坏”。每一种新产品、每一种新技术,都是对原产品和原技术的破坏。

而对于那些史诗级的创新,更需要企业家有超越利润的使命感。这背后,正是帕斯卡的赌注。

很多创新者,都是靠帕斯卡赌注里的那些信仰式假设,一步步将极小概率事件推向大概率事件

做到这一点很难。

当年苹果找英特尔开发手机CPU,因为苹果报价过低,英特尔CEO拒绝了对方的请求。

这个决定对吗?

事实上,当时几乎没人能够预测今天iPhone的样子,苹果做手机的成功概率极低。

而且,当时英特尔正在应对AMD的挑战,聚焦于主战场,似乎是应该的。

所以,英特尔并没做错什么,只是被时代抛弃了。

何谓时代?时代就是大概率发生的事件的集合。

iPhone的成功是小概率事件,移动互联网的崛起是大概率事件。

只是,不管是大概率还是小概率,都隐藏在未来的时间与空间背后,无法看清,很难预测。

也许,这个时候挺身而出的英雄,需要是一位“帕斯卡赌注”的信徒。


复杂系统

帕斯卡的赌注,开创性地应用了概率论、决策论、存在主义、实用主义和唯意志论,在哲学和神学历史上具有重要的地位。

帕斯卡提及了人类生命中的各种不确定性,例如:

  • 宇宙终极的不确定;

  • 人生目的的不确定;

  • 理性的不确定;

  • 科学的不确定;

  • 信仰的不确定;

  • 甚至包括对不确定性的不确定。

在《思想录》中,帕斯卡请读者分析人类的处境:

人类的主观抉择后果非常严重,但又无法全面理解这些后果。

他认为,虽然理智可以分辨不少事物,但在最终极的问题上,我们仍然只能依靠猜测。

多年以后,芒格说:

费马—帕斯卡系统与世界的运转方式惊人地一致,是基本的公理,你真的必须得拥有这种技巧。”

他说的是,正是在费马和帕斯卡的一系列通信中,发展出了人类对于“不确定事物”计算的探索。

迄今为止,应对不确定性,针对复杂系统,被证实有效的结构,都非常类似。如下:

《精益创业》:开发—测量—认知。

新创企业的基本活动是把点子转化为产品,衡量顾客的反馈,然后认识到是应该改弦更张还是坚守不移。

所有成功的新创企业的流程步骤都应该以加速这个反馈循环为宗旨。

《从零到一》:先从0到1,再从1到n。

彼得·蒂尔鼓励聪明人和企业家们去发现一个伟大的秘密,找回对大计划(”big plan”)的信心。

《园丁与木匠》:孩子天生就是杂乱的,但这种杂乱是很有价值。

高普尼克认为,孩子生来就是探索者,他们的大脑是为探索而设计的。

  • “园丁父母”:提供给孩子丰富、稳定、安全的环境,接受和欣赏孩子自然生长出来的样子;

  • “木匠父母”:按照自己的想法去雕刻和塑造孩子,木匠父母的心里实际上有个“模范孩子”的标准。然而这方面的努力大多是徒劳的。

投资,到创业,再到教育孩子,都是充满不确定性的复杂系统

我们无法用牛顿力学的确定性,以及线性思维的因果,去解决上述复杂问题。


进化算法

上段提及的三类框架,类似于《财富的起源》里的进化算法:

变异,选择,复制。

第一步:变异

如《基业长青》书中提到的,要“尝试大量的事情,然后保留有效的”。

在你的生意中,有没有什么别人不知道的秘密?

彼得·蒂尔喜欢在面试的时候问:“在什么重要问题上你与其他人有不同看法?”

他认为好的答案应该遵照这样的模式:“大多数人相信X,但事实却是X的对立面。”

为什么呢?因为:

"只有与此刻不同的未来才能被称作未来,如果不同发生在100年后,那未来就在那里。"

没错,否则就是现在的重复,甚至是对过去的重复。

可是,在我们教育孩子的时候,却是在消灭“变异”,我们选用一套有标准答案的试卷,用“别人家的孩子”来磨灭自家孩子的差异性。

第二步:选择

自然界的选择,简单,粗暴,直接。适应性强的变异物种活下来,并有更大机会变得更多。

我们的祖先,所面对的选择也很直接,《财富的起源》写道:

在经济发展的早期,选择过程相当直接——生存。

如果你选择了一个策略,如在河边狩猎黑斑羚,并结合了物理技术(如弓和箭)和社会技术(如狩猎队),获得了成功,那么你的卡路里收入就会大于支出。

这种卡路里利润能够让你做一些事情,比如为儿童投资。

高普尼克之所以认为童年是一种伟大的发明,是因为在这段时间里,孩子可以在被保护的环境里,自由地去探索,去摔跤,去犯错,去凸显个性。

这个过程,是充满不确定性的,是概率化的。

或者说,孩子的成长,是试出来的,而不是计划出来的。

可太多父母自己试图成为塑造者,结果不仅埋没了孩子的“变异”天性,剥夺了孩子的随机探索,还让父母自己成为孩子的天花板。

童年是拿来低成本试错的,不是用来提前成为成年人的。

在人类事务中,教育尤其复杂。

养育一个孩子,你就是在参与一个“应对未来不确定性的复杂系统”的生成。

假如投资和创业是印钞,那么教育则是要制造印钞机,而且是千人千“机”。

第三步:复制

进化算法的最后一步是复制。

在生物学进化中,复制通过细胞分裂或有性生殖进行。对生物体生存和繁殖能力有益的基因往往会被复制。

因此,复制的效果是,随着时间的推移,适合的基因在人群中出现的频率增加了,不适合的基因频率降低了。

关于复制:

  • 在本文彩票套利的故事里,复制是指大规模地买彩票;

  • 在精益创业里,复制是在价值验证之后的价值实现;

  • 在从零到一里,复制是从1到n并且实现某种垄断。

而在教育的范畴,一个人的自我复制还包含了贝叶斯更新的过程,以不断进化的学习系统,实现持续性地适应未来社会。


概率大局观

人类的进化,财富的起源,科技的进步,都是在随机性中创建秩序。

仿佛是造物主设计了一个彩票游戏,全体人类通过“合买”的方式,试图实现概率套利。

概率帮助我们实现了不确定世界的大局观。


空间上的不确定性

就像本文开始的“Winfal彩票”故事里,当主人公发现总奖金池远大于总成本,尽管他们依然无法知道具体哪张彩票可以中奖,还是可以通过期望值计算和大数定律实现稳定赚钱,从而征服了空间上的不确定性。

时间上的不确定性

又比如《大空头》里的故事,主人公是逆向应用了墨菲定律,该碎的泡沫早晚会破灭,但时间充满了不确定性。可是,如果期望值为正,依然是胜率极大的对赌。这是征服了时间上的不确定性。

认知上的不确定性

再如投资和创业。其成功遵循幂律分布,少部分人大胜,大部分人并未因为投身不确定性而获得利润补偿。

然而,正是因为发生在参与者之间的认知上的不确定性,令这场游戏格外有吸引力。

对于少数投资赢家,秘密就在于购买了“因为不确定性被错误定价”的凸性组合。

我们可以将概率所描述的可能性,视为这个真实世界的另外一个维度。

数学家Henry Segerman用视觉化的方式,为我们呈现了线性三维“平面”,只是弯曲的4维“时空”的投影。

那么,在这个结构里,本文的主题“帕斯卡的赌注”位于何处呢?

也许,那个概率极小而未来回报几乎无穷大的“帕斯卡的赌注”,就是图中的那一点光源。


跳出精明

演化是自下而上的,而“帕斯卡的赌注”是自上而下的。

马斯克的创业之处,就是从“自上而下”的帕斯卡赌注开始的。

他认为:互联网、新能源和太空探索将是三个对人类未来产生积极影响最重要的领域。

于是,他投身其中。

马斯克己也不知道可以走多远,起初在火箭这件事儿上他就打算放个响。

太空探索的使命,是让人类成为多星球物种,以降低人类因为自身愚蠢和宇宙意外而灭绝的概率。

帕斯卡赌注+物理+经济,造就了马斯克的传奇。

最近一百年以来,当人类过得越来越舒服,对于期望值的计算越来越精明。

人们宁愿去做安全的套利,也不愿为“帕斯卡的赌注”而去冒险,去付出。

进化算法的“变异、选择、复制”三部曲里,起初,选择的反馈回路较直接,随着社会和经济变得越来越复杂,选择的反馈回路变得越来越不直接。

这时,着眼于全体人类未来的“帕斯卡的赌注”,也许会成为指路的明灯。

这个世界既不是牛顿物理式的决定论,也不是赌场里的扔骰子,而是随机性与最优解的混合体。

即使人是理性的动物,也不能所有的事情都用期望值计算。

帕斯卡的赌注,也许可以整合人类对意义的无休止探索和当下成本之间的关系。

我们愿意去发现终极意义,去探索宇宙的边界,这些概率极小的探索,一旦实现,回报惊人。

而仰望这一远景,也能让人类跳出逼仄空间对短期利益你死我活的争夺。


每个人的下注

帕斯卡曾经感慨道:

“每当我想到人生的短暂,想到它被以前与以后的永恒吞噬,想到我占据的甚至是能看到的逼仄空间会被无限浩瀚的空间吞没,而我却对它一无所知,也从未被它知道,我便惊恐不已,同时又惊异于我是在此处而非彼处。

因为并没有什么理由解释为什么是在此处而不是彼处,为什么是此时而不是彼时。”

由此,他发出追问:

  • 谁把我放到了此处?

  • 又是谁下的命令和指示,将这个此时与此地分配给了我?”

我们所在的世界,是一个奇妙的设计,有时也令人充满疑惑。

从极其简单的起点出发,随机性因为某些算法的作用而创建出秩序。

有限与无限,存在与虚无,随机和确定,构建了生命的张力。

人生是关于可能性的,对未来的幻想,对过去的追忆,往往也都是关于可能性的。

假如我们放弃了可能性,而是生活在一个被决定论支配的机械宇宙里,那么世界将让人绝望,我们很快就会窒息。

也许,我们每个人都需要有一个自己的“帕斯卡赌注”:

相信某件值得发生的事情,并为之去努力,哪怕那件事情现在看起来实现概率极小。

对于普通人而言,“帕斯卡赌注”不是要去造火箭,而是追求“有意义的学习,道德品质,对他人和公共福祉的关注”。

例如我,做春藤这家公司,就像是一个“帕斯卡的赌注”。

好几位聪明朋友都对我说过,为什么擅长概率计算的你,在这件事情的期望值计算上显得没那么精明?

因为我不甘于做平庸的算计,想参与做一件在更远的未来被评价的事情。

让每个孩子都有机会分享人类有史以来最耀眼的智慧,这一愿景看起来遥远,却很“确定”,值得下注去信。

更何况,这个“帕斯卡的赌注”的实现概率越来越大。

那句关于彩票的广告语,对“帕斯卡的赌注”而言是成立的:

不买“帕斯卡的赌注”彩票,你就永远中不了奖。

最后

怒斥光的消逝

那么,帕斯卡赌注的大奖,究竟是什么?

前面那段帕斯卡的感慨,是人类面对时光有限性的虚无和悲伤。

托尔金在谈及《魔戒》的主旨时说:

“一个动人心弦的长篇故事,让它能持续吸引人的注意力,总是围绕同一个主题,那就是死亡的必然性。”

这时,托尔金引用了波伏娃的一段话:

“没有什么自然的死亡,在人身上发生的一切永远都不会是自然的,因为他的存在对世界来说就是一个问题。”

死不是生的对立面,有限不是无限的对立面,短不是永恒的对立面。

假如将“可能性”作为帕斯卡赌注的大奖,我就可以想象,自己所在的世界,是由无限多个可能性的平行宇宙组合而成。

我此时在此地,而非彼时在彼地,是因为:宇宙的琴弦是在无限可能性的拨动之间,而发出令人叹为观止的乐章。

帕斯卡的赌注,是有限的我,与无限的可能性的一场游戏。

波伏娃曾在自己的书里,用狄兰·托马斯的诗句开篇。

多年以后,电影《星际穿越》也用到了这首诗

不要温和地走进那个良夜。

怒斥吧,怒斥光的消逝。

本篇文章来源于微信公众号: 孤独大脑

极大极小原理

1
在“假设发生如下事情”之前,祝福我们此生永不发生这类事情。
假设你外出时,遭遇绑架,该怎么办?
有一位(国外的)自卫专家,给出了三个应对原则:
1、不要跟他去第二个地点。
如果你心怀侥幸,他可能将你带到偏僻的地方,为所欲为,甚至下毒手,然后掩藏他的罪恶痕迹。
2、记住,他在撒谎。
不管坏人说多好听,别相信。
这位专家的观点是:
从一开始,每个谋杀犯,绑架犯,强奸犯,他们都会用同一句话:“照我说的做,我就不会伤害你。”
然而,一旦你照他们说的做,最后受伤最深的,还是你。
3、要在原地,用尽一切手段与之搏斗。
这一点似乎有点儿让人疑惑,万一受伤呢?
被人用刀抵住,拼命挣扎要是不幸丢了命,岂非不识时务?
然而,这位专家的洞见是:
如果他们想在原地杀你,你早就已经死了。

所以:

  • 他们不想在原地杀你,他们希望带你去其他地方,或者先干点别的事。

  • 通过打乱他们的计划,你会成为他们最恐怖的噩梦。

  • 如果他们不想被抓,不想把事搞得太麻烦,他们可能就会直接逃跑了。

以上三点原则的所有原因,其实只有一个:
如果你进了他的车,或者跟着他们去了某个地方,你死定了。
(以上经验仅供参考,不构成本文作者对遇到绑架的具体建议。)
2
以上是一个生动的博弈场景。
由此引出我的一句“大脑碎片”:
好的一手棋,是其令对手有不好的下一手,以及自己有好的下下一手棋。
我们姑且不讨论,在第1节里,专家应对绑架的三点原则的适用范围,以及如何根据情境调整策略。
本文的焦点是:
极大极小原理。
绑架,是一场零和博弈。
就像下棋,一个人赢,一个人输,即使和棋,也只是暂时的平静。
双方没有合作的可能。
对于这类博弈,冯·诺依曼提出了“极小极大原理”。
《囚徒的困境》一书,用我们熟悉的分蛋糕来示例。
众所周知,公平的分法是:一个人切,一个人选。
假如两个孩子都不是孔融,并且都想吃更多蛋糕,这其实是一个典型的零和博弈。
  • 第一个孩子(切蛋糕那个)的两个策略是:不均分和尽可能均分。

  • 第二个孩子(挑蛋糕那个)也有两个策略:选较大的那一块或选较小的那一块。

如下图。
(请注意,表格里的4个结果,都是指切蛋糕的孩子的所得收益。)
切蛋糕的孩子貌似掌握了主动权,但他决策的关键点,取决于“然后呢?”--即对手的下一步会怎么做。
显然,挑蛋糕的孩子,会追求让自己的蛋糕最大化,也就是让对手的蛋糕最小化。
对应上面的表格,挑蛋糕的孩子总是会选左边一列,从而导致切蛋糕的得到左边一列的两个较小蛋糕的结果。
于是切蛋糕的孩子要做的事情,就是:
让挑蛋糕的孩子将要留给他的量小的那半块蛋糕极大化。
因此,切蛋糕的孩子只能选择尽量均分蛋糕,以保证获得差不多的半块蛋糕。
这个量,是行中极小值的极大值,被称为“极大极小”。
也许有人会说,这么简单的道理,为什么要说这么啰嗦?
德谟克利特早在公元前300多年前,就创立了“原子论”,认为每一种事物都是由原子所组成的。
然而,这只是一种想法。
对比而言,爱因斯坦对原子的理解,才算是科学。
二者之间的区别在于:后者可实验,可计算,可运用。
作为博弈论的创始人,冯·诺依曼说过:没有极小极大定理,就没有博弈论。
《囚徒的困境》一书对极小极大定理总结道:
  • 在两个利益完全相反的人之间出现的有精确定义的冲突,总存在一种理性的解;

  • 所谓理性的解,就是在给定冲突性质的前提下,双方都确信他们不可能期望有更好的结果了。

3
让我们回到绑架现场。
即使被绑架者非常被动,但这仍然是一场博弈。
要理解这一点,我们需要强调三个名词:
1、回合;
2、节点;
3、选择权。
回合
许多事情,都是连续决策的结果。
而零和博弈,是敌我双方轮流决策,由一个一个的回合叠加起来。
节点
上述每个回合,你都有一个属于自己的决策节点。
然而,很多人要么忽视了节点,要么放弃了节点。
选择权
在每个回合的决策节点,你其实是在做一个选择。
你有选择权,对手也有选择权。
敌我双方都试图让自己的选择收益最大化,让对方的收益最小化。
当你被绑架的时候,对手已经出招,现在轮到你走棋了。
(再次强调,本文不构成对绑架情境的具体实战建议。)
你仍然有选择权:
1、放弃抵抗,上对方的车;
2、大声呼救,拼命反抗。
这个时候,大多数人会想,我抵抗的话,会有什么后果:
  • 会受伤吗?

  • 会激怒对方导致生命危险吗?

然而,从博弈思维来看,你仅仅纠结于当下的一步棋去想,毫无意义。
你应该去想:
我如果这样做,对手会如何回应呢?再然后我又该如何应对他的回应呢?
也就是说:
  • 你要计算下一步,以及下下一步。

  • 然后,再由此倒推,你现在这一步该如何做选择。

我将本文开头那个专家描述的场景图示如下:
如果“你”乖乖上了绑匪的车,如上图左分支(选择1)所示,可能导致如下结果:
1、在第四个回合,你已经失去了选择权;
2、对手可以自由选择让自己利益最大化的做法;
3、绑架的许多目的是为了钱财,有些歹徒会先撕票再要钱;
4、未经核实的数据是,撕票比例高达10%;
5、据某地警方的经验,越是熟人绑架,撕票的可能性越高。
所以,处在第二回合的“我”,要考虑的是,第三回合的对手会怎么做,以及自己会有怎样的第四回合。
《囚徒的困境》引用了卡尔维诺在《寒冬夜行人》一书中的一句话:
“你知道,你所能期盼的最好结果就是避免最坏情况。”
这句话,很好地说明了极小极大原理。
还记得本文开头专家的第二条建议吗?
记住,他在撒谎。
从一开始,每个谋杀犯,绑架犯,强奸犯,他们都会用同一句话:“照我说的做,我就不会伤害你。”
可是,如果罪犯真的不会伤害你,那么你反抗的时候他也不会伤害你。
而且,即使起初罪犯没有太想伤害你,但是当你失去选择权的时候,他可能会萌发伤害的念头。
回到博弈思维:
游戏者决不会从他的最佳策略上偏离到对自己造成威胁的策略上去。
尤其是在零和博弈中,对你有利,对绑匪就不利。
请看上面的图,在第三回合,绑匪会极力让你的收益最小化。
所以,你在第二回合要做的,是“极大化”这些自己可选的“极小值”,尤其是要避免最坏结果。
同时,你要“极小化”对手可选的有利于他的“极大值”。
由此倒推,你就会发现,如专家所言,在第二个回合,你应该做的是:
要在原地,用尽一切手段与之搏斗。
4
仅仅明白道理并不够,我们需要定理。
为什么需要定理?
因为定理可以形成算法。
冯·诺伊曼对极小极大值定理的证明是复杂的,“它以一种读者难以理解的方式结合了基本概念和拓扑概念”。
约20年后,香农利用 Minimax(极小化极大)算法,提出了解决国际象棋问题的设想。
随后,在AI攻克国际象棋和围棋的过程中,Minimax(极小化极大)算法扮演着基础而重要的角色。
极小化极大算法(Minimax)可被概括为:
  • 对于两个玩家的对抗游戏,其中任何一个玩家的决策会依赖于另外一个玩家之前的决策,且另外一个玩家总是竭尽所能地想要获得胜利。

  • 因此,一方会在所有选项中选择令其自身优势最大的一个,而另一方则会选择令对手优势最小的一个。

  • 通过穷举不同玩家之间的策略,该算法可以构建一棵搜索树,并通过穷举不同的可能,选择其中能得到最佳结果的路径。

请点击放大,看下图右边的搜索树的最下面一行,3、12、8这一组数字,是“我”期望获得的可能的利益。
  • 对于对手而言,当然会选择让“我”利益最小的走法,所以,在MIN那一行的B节点,对手会选择3、12、8中的最小值3。

  • 同理,在C节点,对手选最小的2;在D节点,选最小的2。

  • 而在MAX行,“我”要选择“3、2、2”这一行极小值当中的极大值“3”。

这就是Minimax(极小化极大)算法。
但是,即使是对于棋类这种完美博弈,该算法的计算复杂度也会呈指数级增长。
因此往往需要引入剪枝策略来简化搜索的复杂度。
以及,通过多次采样的蒙特卡洛树搜索,以减少计算量。
再往后, UCT 算法将蒙特卡洛树搜索方法与UCB公式结合,有效解决了围棋上的问题。
进而,基于深度强化学习, AlphaGo诞生,惊人地击败了人类,完成了以往被认为还需要20-50年才能实现的任务。
德谟克利特对原子的理解令人赞叹,然而只有基于爱因斯坦的公式,人类才能造出原子弹,以及安全地利用核能。

5
极大极小原理,给我以下七点启发:

启发一
站在对方的角度想问题,
然后倒推自己的策略
我们可以广义地来想这个问题,即使不是在零和博弈的环境下。
例如说起某某产品经理很厉害,可以瞬间将自己变成小白,其实就是能彻底地站在对方的角度。
几乎所有厉害的商业公司,核心原则就是“经营顾客”。
先想着让顾客价值最大化,然后再从中找寻让自己最大化的策略。
所以芒格说:要诉诸利益,而不是讲道理
我经营春藤,有时候也会和小伙伴们在一线谈业务。
我不是很好的销售,口才也很一般,但每次谈合作效果还不错。
我的方法是:
  • 请问你现在最想要的是什么?

  • 我们可以如何帮助你实现你最想要的?

  • 我们立即可以做的最小化合作是什么? 

启发二
不占别人便宜,
自己的也要据理力争,不当烂好人
段永平早年经营企业,既不占供应商的便宜,也不给批发商赊货。
不管多好的买家,必须现款现货。
何谓烂好人?就是彻底放弃自己的选择权,试图讨好对方,感动对方。
然而,人性是经不起考验的。
所以,很多时候,烂好人不仅招恶人,甚至催生恶人。

启发三
将对手想成一个势均力敌的对手
以我下围棋为例,切忌低估对手。
所谓低估对手,就是对他人抱有幻想。
例如,你发现一手棋,能够让自己的利益最大化。但是如果被对手识破,那么结果就会很糟糕。
有时候,棋手会心存侥幸:要是他看不到,那我就赚了。
然而,这是不对的。
你就该假设对方是一个势均力敌的对手,你能看到,对手也能看到。
当然,如果下让子棋的时候,要适当调整。
以及,在德州扑克等博弈中,或是像剪刀石头布这类首尾相连的游戏,也需要虚张声势。
总之:
  • 别欺负别人,别想着占便宜;

  • 也别因为暂时领先而得意忘形,别耍过头。

启发四
将街上的每个司机都当作潜在凶手
这个想法似乎有些极端。
几乎没司机有动机要撞你。
但是,理论上,每个司机都有撞你的“可能性”。
对你而言,这个最坏的结果可能性很小,后果很严重。
这正是极大极小原理的灵魂:
“你知道,你所能期盼的最好结果就是避免最坏情况。”

启发五
珍惜每一个选择权,
并为你的下一个、下下个选择权做好铺垫
人生是一连串决策的总和。
所谓全局观,是指你的每个决策点既是相对独立的,又和过去和未来相关联。
有些人只管当下舒服,而不顾自己的下一手该如何。
如果你在一个球队里,队友总是给你传烂球,或者不给你传球,你一定会骂他烂人。
可是在现实中,现在的“你”,可能经常不顾及未来的“你”,不管未来的“你”是否有好的选择权。
一连串有算法的选择权,就是一个人的“人生算法”。

启发六
所谓仁慈的狮子,
是指你要当好人,但保留惩罚坏蛋的权利
如题,这一条启发,反过来也是适用的。
例如,你彻底放弃惩罚对方的权利,以换取对方彻底的信任。
前提是你相信对方是一个珍惜荣誉的人。

启发七
彻底远离损人不利已的人
博弈论的假设是:双方都是理性的。
博弈论只研究对赢感兴趣的、有完善的逻辑思维能力的游戏者参与的博弈。只有你相信你的对手(一个或几个)既是理性的,又是希望赢的,而你自己在玩的时候也始终憋着一股劲儿,要力争为自己取得最好的结果,这样的博弈才是博弈论分析的对象。

对博弈论而言,自私的人并不可怕,可怕的是不理性的人。

为什么呢?

  • 一个自私的人可能做损人利己的事,一个合作的人可能做利人利己的事情。

  • 但是,一个不理性的人可能做损人不利己的事情。

  • 博弈论很强大,但是如果你是在和一个非理性的人“交手”,就很难得出一个解答。

你的最佳选择是:

远离这类人。

举例说吧,经济较发达区域的特点之一是:民众只算自己的账,而不去算别人赚多赚少。

倘若不如此,就会出现如下局面:我才赚十块,你居然赚一千块,我宁可牺牲自己的十块毁掉你的一千块。

这就是损人不利已。

如此一来,博弈论的均衡就无法出现。因为非对弈情况下的“损人不利己”,也就是理性的失去,会摧毁整个游戏。

(当然,经济是否发达有多方面因素,不发达地区也经常有“只算自己账”的传统。)

记得中学有个同学的哥哥当年混社会,他说他们那群20岁上下的青年谁都不怕,最怕十四、五岁的孩子,因为这类混小子可能毫无目的不顾后果地冲上来给他们一刀。

博弈论因为这类人而失效。

本文开篇对于绑架者的分析,也是假设他们是理性的。

但是,如果绑架者不是理性的人呢?

那么,不理性的凶手可能会不顾受害人呼救招来人,在没有利益的情况下下毒手。


最后

归根结底,一切在乎“对的人”

不管是零和博弈,还是双赢博弈,你都要努力令对方是一个理性的人。

既要选择对的队友,更要选择对的对手。

关于极大极小原理,我们还可以将其智慧拓展为:

狭路相逢勇者胜,

勇者相逢智者胜,

智者相逢德者胜,

德者相逢道者胜。

最后,祝福你我此生一早避开,不必在狭路上遭遇那些损人不利己的混蛋。

本篇文章来源于微信公众号: 孤独大脑