#14:塔勒布新书《肥尾效应》导读(Sarah & 戴国晨)

#14:塔勒布新书《肥尾效应》导读(Sarah & 戴国晨)

106分钟 ·
播放数9947
·
评论数84

欢迎各位收听 Traders' Talk 第 14 期。在本期播客中,我请到了《肥尾效应》的译者戴国晨作为本期节目的嘉宾,一起对塔勒布的新书《肥尾效应》尝试做一期音频导读。我们探讨了书中的核心概念,也尽量穿插了一些有趣的例子,最后也聊了聊塔勒布本人的鲜明个性。

欢迎各位收听后在评论区里写下对本期节目的感想,我将挑选出 3 个优质评论的听众分别赠予《肥尾效应》一本。此外,我在评论区置顶链接里放上了中信出版社给的优惠购买链接,也欢迎各位对这本书感兴趣的朋友前往购买。

希望各位收听愉快~

       

【嘉宾介绍】

戴国晨,

  • 塔勒布新书《肥尾效应》译者

  • 中国人民大学物理学学士,美国纽约大学金融工程硕士

  • 曾任职多伦多道明银行(纽约)销售和交易部门,现就职于上海艾方资产反脆弱投资部,从事海内外尾部风险管理研究


【本期播客大纲】

一、综述《肥尾效应》主旨

二、关于分布的类型和性质

三、关于肥尾参数的估计

四、补充几个有趣的例子

五、关于黑天鹅

六、其他


【Timeline & Key Point】

一、综述《肥尾效应》

00:04:38 本书结构

00:06:17 本书主旨

“本书主要讲述产生极端事件的统计分布类型,以及在这类分布下如何进行统计推断和做出决策。现有的大多数“标准”统计理论均来自薄尾分布,它们应用于肥尾的过程中需要经过渐进性调整,这往往不是小改动,原理论可能会被完全舍弃。”——引用自《肥尾效应》第一章序言

00:09:47 本期播客结构——面对随机性事件,人们可能面对的风险有如下几种:

  • 不知道分布的类型和性质

  • 知道分布的类型和性质,错误地估计了参数

  • 黑天鹅


二、关于分布的类型和性质

(一)关于肥尾

00:10:43 具体有哪些分布类型

  • 退化分布:只有一种结果,不存在随机性

  • 伯努利分布(离散型的0-1分布):只有两种可能的结果

  • 自然正态分布(允许出现正负无穷):自然现象的分布

  • 随机游走中求和而来的正态分布(没法到无穷大)

  • 亚指数分布(介于正态分布和幂律分布之间):包含对数正态分布(方差小的时候属于薄尾分布,方差大的时候属于厚尾分布)

  • 幂律分布

肥尾之母、超级肥尾:对数帕累托分布 (书 5.5 章节)

00:13:40 厚尾 vs 肥尾

  • 厚尾或重尾 (Thick/Heavy Tail):比正态分布峰度更高的分布

  • 肥尾 (Fat Tail) :极端厚尾/幂律尾类分布


(二)关于正态分布

00:15:20 正态分布的定义与性质

  • 钟型曲线,分为躯干、肩部和尾部(头肩尾),凸-凹-凸结构

  • 衡量参数:μ(均值)和 σ(方差),μ = 0,σ = 1 的正态分布是标准正态分布

  • 3σ定律(three-sigma rule)/68-95-99.7 原则:“几乎所有”的值都在平均值正负三个标准差的范围内(实验上可以将99.73%的机率视为“几乎一定”)

00:22:10 尾部增厚意味峰度更尖、肩部更凹


(三)关于矩

00:26:16 从矩的角度看不同分布

各阶矩的含义:

  • 零阶矩:总概率

  • 一阶矩:均值,即数学期望值

  • 二阶矩:方差,衡量数据的离散程度

  • 三阶矩:偏度,衡量随机密度函数向左或向右偏的程度

  • 四阶矩:峰度,衡量峰部有多尖

从矩的角度看不同分布:

  • 正态分布:衡量参数为一阶矩μ(均值)和二阶矩 σ(方差),三阶矩偏度为 0,四阶矩峰度为 3(嘉宾说的峰度为 0 其实指的是超额峰度,只不过一般习惯对峰度做-3 处理)

  • 入门级厚尾分布:各种矩都是有限的数,峰度比正态略大

  • 亚指数分布:高阶矩开始退化

  • 幂律分布:高阶矩继续退化,直至所有的矩完全消失


(四)关于平均斯坦与极端斯坦

00:30:55 平均斯坦与极端斯坦(对应书中的 3.1 章节)

区分点:随机变量连续两次大于 X 的概率跟单次大于 2X 的概率,平均斯坦是前者大于后者,极端斯坦则是后者大于前者。

对于正态分布这种薄尾分布来说,出现一次 3σ 事件的概率是 0.00135(非双尾分布)。假设每天实验一次,连续两次出现 3σ 事件的概率是 1.8 x 10 的负六次方,大约是每 403 年,这会远大于出现一次 6σ 事件的概率,大约是直立人出现以来仅 1-2 次(见下方数值表)。

00:37:45 破产更可能来自某次极端事件而不是一系列糟糕事件的累积(对应书中 3.1 及 3.4.2 章节例子)

00:39:32 保险只能在平均斯坦中起作用,在存在巨灾风险的情况下,永远不要出售一种损失无上限的保险,这一点被称为灾难原则(书 3.1 章节)

00:40:37 通过设定历史最高水位去设定安全水位线的例子(书 3.4 效应五)


(五)关于幂律分布

00:42:08 幂律曲线与帕累托分布的关系

帕累托分布,即我们熟知的二八法则、马太效应。它最受关注的性质就是右边这个长长的尾巴,尾巴速度下降慢,就能带来很多特别的性质。

三、关于肥尾参数的估计

00:45:42 知道了分布的类型,接下来需要估计哪些参数

(一)样本量

00:47:58 肥尾分布会极大地增加求解统计量的样本量要求

帕累托分布中98% 的样本都会小于均值,而剩下的 2%对整体的均值几乎起到确定性的作用,所以几乎可以把绝大部分的样本当作噪声。

00:48:41 帕累托80/20分布需要比正态分布多出 10 的 9 次方量级的样本量才能达到类似的精确度(书中第八章【需要多少数据?肥尾的定量衡量方法】)

00:50:00 阿根廷股市的例子(书 3.5 章节)



(二)单个观测值贡献的峰度

00:51:12 回测了 4 万多种证券,单个观测值贡献的峰度都非常高(如下图),无一例外全部符合肥尾分布(书 3.7 章节)

00:52:35  为什么马科维茨投资组合分散化配置方法不是最佳方式(书 8.5 章节)


(三)大数定律及中心极限定理

00:55:44 大数定律与中心极限定理的定义

大数定律:当n趋于无穷时,n个独立同分布随机变量取平均值收敛于分布均值。这里收敛的模式有两种,一种是以分布形式收敛,对应弱大数定律,另一种是必然收敛,对应强大数定律。

中心极限定理:在二阶矩(方差)有限的情况下,n 个独立随机变量的和最终会逼近正态分布。

00:56:46 大数定律与中心极限定理的区别


(四)肥尾指标 Kappa

00:59:27 Kappa 值

一般人们在比较肥尾程度时会采用高阶矩,比如峰度(如果存在的话),用其超过某个值的概率作为指标(尺度调整后),但是对于峰度不存在的极度厚尾则无能为力。因此书中提出了一个考量在给定分布下额外数据能在多大程度上增加均值观测的稳定性的肥尾指标κ (Kappa),主要用于定量衡量大数定律下不同分布收敛的速度(节选自戴国晨《肥尾效应》专栏笔记之上篇


(五)分布的不对称性与极端值

01:01:59 如果看到一个 20 倍标准差的事件,我们可以直接排除薄尾分布(书 3.5 章节)


(六)中数定律

01:03:27 中数定律是大数定律和中心极限定理的渐进版本

01:05:32 标普 500 指数的回报率服从幂律分布

如果分布的峰度存在,随着数据量的增加(时间尺度的延长),最终数据会收敛于正态分布。但是随着数据量的增加,我们并没有看到峰度的显著下降,月收益率的峰度不显著低于日峰度。因此,认定标普 500 指数的回报率服从幂律分布(书 10.2 章节)。


(七)期权定价

01:08:59 期权 BSM 假设前提过于理想,包括(节选自书第二十章【金融理论在期权定价上的缺陷】):

  • 假定交易者可以在无摩擦的市场中买卖,且不产生交易成本

  • 不考虑订单流对市场价格的影响——如果交易者出售一定数量的股票,后续价格与其完全无关

  • 交易者清楚地知道市场的概率分布为正态分布,且参数不具备时变性(所有参数都保持不变)

  • 最重要的限制是,市场价格不存在跳跃(也就是跳空高开、低开)

01:11:05 动态对冲无法完全对冲掉期权的所有风险

01:11:53 巴舍利耶模型是假设条件更宽松、鲁棒性更强的期权定价模型(书 22.4.1 章节)


四、补充几个有趣的例子

(一)肥尾变量 vs 薄尾变量

01:12:34 永远不该比较由尾部驱动的随机变量(如流行病)和由躯干驱动的随机变量(如在游泳池中溺水的人数)。

类似的,书中 3.6 章节提到了,不应该把埃博拉病毒和从梯子上跌落进行对比,因为前者有倍增效应,可能会带来很大的系统性风险。比较厚尾变量和薄尾变量的这类错误这被塔勒布称为“幼稚的经验主义”。


(二)预测准确率 vs 赔付

01:15:56 成为正确的预言家不代表会成为富有的人。

人们往往会关注自己的正确率而非赔付,但实际上应该给予赔付更高的关注。因为如果犯错的成本足够低,就可以经常犯错,只要收益是凸性的,也即当他正确的时候会获得很大的收益。反过来说,也可能会在预测的准确率达到 99.9%的情况下破产——2008-2009 年金融危机期间,破产的基金恰恰是那些之前业绩无可挑剔的基金(书 3.4.1 章节)。


(三)与史蒂芬·平克的争论

01:16:50 与史蒂芬·平克的争论(书第十六章之后的 G 章节【第三次世界大战发生的概率有多高?】)

著名认知语言学家史蒂芬·平克,代表作为《人性中的善良天使》《当下的启蒙》。他认为我们正处于人类最和平的时代,人类的历史确有进步可言,我们正生活在有史以来最和平的年代;继而又提出了暴力下降作为度量这种“历史进步”的尺度。

塔勒布认为他只关注频率而不考虑量级。从最近的数据变化中得出结论/归纳出结论并不可行,除非满足一定的置信度条件,这就需要在厚尾条件下有更多的数据。因此,根据最近一年或十年的非自然死亡人数的下降,得出“暴力致死行为有所下降”的结论并不科学。

01:18:10 包括安史之乱等著名战役的实际伤亡统计(书 16.4 章节)

01:21:40 回应 H.T.巴克尔(书第十六章之后的 G 章节【第三次世界大战发生的概率有多高?】)


五、关于黑天鹅

(一)黑天鹅的定义

01:23:22 黑天鹅与肥尾的关系

01:24:58 黑天鹅的核心并非频繁出现,而是单次出现的影响极其巨大


(二)我们应该如何应对黑天鹅

01:25:14 如何应对黑天鹅?

01:26:49 反脆弱 vs 坚固

01:28:01 如何在金融市场上获得反脆弱性?

01:28:50 改变赔付结构

01:29:38 杠铃式配置结构

01:32:19 做多四阶矩

01:33:50 核心不是去预测,而是准备好结构,拥抱黑天鹅的到来

          

六、其他

(一)这本书与塔勒布其他代表作之间的关系

01:34:13 与塔勒布其他代表作之间的关系

(二)关于塔勒布本人的性格

01:36:31 塔勒布本人是什么样的


【相关链接】

1. 《肥尾效应》书评 by 许哲,是国内最早的权威解读,推荐阅读。
2.《戴国晨专栏|塔勒布量化开篇之作《肥尾分布的统计效应》(分为上、下两篇),这个专栏把书中的精华内容用文字形式几乎都提取出来了,推荐阅读,链接如下:

3. 本书英文版,可以与中文版对照阅读。

4. 友台《特许金融街》在本期节目之前也请到了戴国晨做客,更加宏观地聊了聊这本书以及塔勒布相关的内容:www.xiaoyuzhoufm.com

5. 正态分布的68–95–99.7法則维基百科条目

6. 「矩有四子」重建黑天鹅世界的数学直觉

7. 概率论中,「矩」(moment)的实际含义是什么?高阶矩表示数据的哪些状态?

8. 如果大数定律失效,机器学习还能学吗?幂律分布可以告诉你答案

9. 塔勒布推荐阅读的65本书:www.goodbooks.io

          

剪辑:Sarah

BGM:xiazai.51miz.com [No Copyright Music]

展开Show Notes
Sarah_Jing
Sarah_Jing
2022.9.02
置顶
欢迎各位评论留下听完这期节目的感受,我会挑选3个优质留言的听众赠送《肥尾效应》。

此外,这里有个中信出版社给的《肥尾效应》独家优惠购买链接:https://item.jd.com/13350403.html
Pzponge
Pzponge
2022.9.05
1:46:04 听完了。主理人如此用心的 shownotes 值得认真回复。

1. 本集的定位是「音频导读」,从这个定位来说,做得很好,听完了基本了解的全书的脉络和主旨(当然也要感谢如此详细的 shownotes)。本期和之前戴国晨在友台的访谈可以互为补充。

2. 用播客做这种知识分享,或许在内容上和书中做差异化会更好,比如给书中的一些晦涩的公式补充一些实例或现实案例,帮助大家更直观地了解抽象的概念。当然,要做好这个,无论从工作量和难度上都会大一个量级,也非常理解,能做到这样已经不错了。

3. 区分平均斯坦和极端斯坦,有一个很重要的现实意义,就是要明白,当我们面对极端斯坦的事件时,人们的估计往往是错的,从而不要过度自信(过度自信是黑天鹅产生的重要来源)。比如,如果让你评估某一地区人的平均身高,结果大概是相近的。但是如果让你评估目前中国股市的平均市值/中位数市值,绝大部分人都是错的(之前我做过实证检验)。

4. 肥尾是一个很重要的假设前提被打破导致的,即变量的独立性。上课学的变量都是独立的,但现实却是相关的。播客中有提到,但我感觉强调的不多。有一个非常容易理解的例子:波利亚罐子。说的是,一个罐子中有五个红球,四个黑球,三个黄球,两个绿球,一个蓝球。先随便抓取一个球,然后把它和另一个相同颜色的球放回到缸内。重复着这个过程,直到填满整个缸为止。模拟程序在这里:http://success-equation.com/urn.html 。可以发现,结果是完全无法预测的,充满了随机性。

5. 以期权作为反脆弱工具本身可能也是理想化的,也有许多我觉得还需要讨论的问题,比如在中国衍生品市场不够发达怎么做(其实很想听听嘉宾聊聊他们是怎么做的),以及在什么时候开始上仓位,因为我理解塔勒布他们不是一直挂着对冲仓位的,否则损耗也是非常大的(不知道嘉宾是不是了解塔勒布及他弟子的实际操作方法)。

6. 最后,强烈要求中信出版社重译之前塔勒布的所有书籍,之前的译本翻译质量极大影响了中文世界对塔勒布的理解。
Yan如是说:强烈要求重译塔勒布+1,愿意帮忙校对。
HD106291z
HD106291z
2022.9.04
这也太详细了吧,很花功夫。不知道插几个图片/ppt视频化,是不是能传播更多人群。感想后续听完加上。
HD106291z:听完了播客,刷完了文章,稍微说说感想 本书结构其实像一篇论文,从数学角度构造肥尾,证明肥尾的性质与探讨其应用 1.阐明涉及到的数学概念、符号,先构建出前提知识 2.从概念上,区分薄尾肥尾的差别,平均斯坦的一些情况(大数定律等)在极端斯坦不够用了 3.构造肥尾分布,说出肥尾的种种特征,是否能预测,什么情况能预测,种种统计量 4.以及在金融行业的具体应用。。 书本门槛比较高,其实更适合金融期权、量化、定价等人士,普通人如果想泛化的应用,可能读之前的畅销书更能体会 所以。。其实我没咋听明白,几点感想和大家可能也差不多 1.重赔付而不是概率,预测不准是常态,重点是改变f()函数(即应对的各种梯子),使得即使黑天鹅爆发,也能对自己风险线性乃至利好 2.极端斯坦可以伪装成平均斯坦,使得在极端发生前从各类观察指标无法确认出他是极端斯坦 3.所以有些时候各类预测数据看看就行,更多还是关注下描述性的事实 还是有些疑问: 1.还是想这样理解,在惯常世界中,某些变量未超过阈值前,传统统计方法仍然是成立的,超过后才使世界极端,能衡量么,衡量的成本高么 2.就算要按赔付去思考,准备应对黑天鹅的脚手架也并非毫无成本,可能这个成本本身就是我们无法承受的吧 3.对于普通人,是不是比起学习应用肥尾分布,可能有意识地规避掉传统统计学的一些“陷阱”是不是更有用,也许能举些实例 最后感谢sarah贴心的shownotes和与戴国晨的导览,也算跟上了一段路。感觉播客这个形式对这本书可能还是吃力了,也算摸到某种界限?
徐旺旺
徐旺旺
2022.9.03
真实的市场是肥尾的,且我们有办法从中获利,前提是要正视世界的复杂,不要自欺欺人。很多人本能的抗拒肥尾效应是觉得没有抓手,但没人承诺你世界是可理解的,去适应世界,别躲在舒适区里不出来然后斥责指出问题的人太极端
吴六木
吴六木
2022.9.03
啊对,sarah对内容的结构化支持了我一路听下来,赞。原本我觉得这类知识应该用文字传递更好,但突然发现,嘿嘿,一个好声音也能带来一些不同于看文字的愉悦。不过,相比文字,即使有shownote,再去回顾的动力,额,有点弱了🤣
Shanz
Shanz
2022.9.04
想理解世界中的极端情况,塔勒布确实是当今世界上最权威的专家。无论从理论还是实践都是如此。这本肥尾效应,其实是想从数学的角度来构建他脑中对世界的理解,十分成功。但模型终归是模型,再伟大的理论仍然要在实践中被检测。塔勒布确实扩展了我自己对概率,金融和规律的理解。这是本好书,但阅读难度也很大,感谢本次分享导读。
给Sarah打call,shownotes无敌了!
Sarah_Jing
:
Jason 所在的《特许金融街》早前也请到了戴国晨作客,更宏观地聊了聊这本书以及塔勒布相关内容,欢迎各位收听:https://www.xiaoyuzhoufm.com/episode/62fc4ce2e9685e17002ecd5e
唐嘉澍Jason:谢谢Sarah!
吴六木
吴六木
2022.9.03
哎哎,终于听完啦~感谢感谢,虽然之前也看过塔勒布的书,但其实只在脑海里留下了一个有关不确定性的印象,但是听完这期导读,嘿嘿,让我复习了下好多数学知识,也让我联想到了很多现实经历,可能也正是因为知识的“精准”(有关数学)以及难度,捱过来反而有更大的收获。有几个感想:
第一个是身边人的经历,把全副身家,甚至贷款,投资了一个看似回报比较高的产品,没有给自己留余地,结果是疫情一来,整个垮掉,把自己前几十年的收获都赔掉,很痛苦。
第二个是听到平均斯坦和极端斯坦的时候联想到婚姻,女生们开始以更独立的姿态参与,以前女生容易根据看到的社会样本来幻想自己的婚姻,其实极端样本可能是看不到的(近年来多点),如果采用极端斯坦来支持决策,就别整个把自己寄托于一个可能会毁约的契约。
第三个是关于all in web3,以及昨天和朋友屏风聊参与cc0时心态,cc0,甚至现在的web3可能就是一个赔率特别高的投资,如果all in,这个风险其实很高,最好是拿自己的一部分精力/时间/资金来搞事情,因为未来咋样,太难判断了。
最后,虽然塔勒布提到了应对黑天鹅的方式,但其实也只是在一个人为设定及想象的情况下做应对,一旦超出了那个设定损失,咱也没啥办法,只能说,是否做了心理准备,对人的打击程度完全不一样。

数学方面,俺真的掩面哭泣。不过有个好奇的,现在有很多风险衡量工具,学术上哈,Mean-variance VaR CVaR ,但都是在已知分布的情况下来做,那像这种黑天鹅的,除了说在现实中改变赔付结构,还有啥理论模型能理解咩?想起有句话,塔勒布这些玩意儿真能养活好多搞学术的😅
1:15:03 提个建议:个人观点。戴国晨老师讲的很好 但是作为一个没有什么背景非这个领域的听众总感觉听起来有点“难理解” 跟着脑子里面画画distribution就比较好。所以呢 带数学公式呀 图表呀 是不是短视频之类的平台更好呢?在博客多讲讲统计直觉 讲讲例子就特别好。后面部分的例子我特别喜欢。
Sarah_Jing
:
有在认真考虑换个表现形式~ 另外就是如果没前面的知识铺垫,我可能比较不好直接把例子提出来
丫丫鱼的日日听:辛苦了辛苦了 我也感觉你挺不容易的 在描述distribution的时候。
4条回复
0x
0x
2022.10.24
非常受益,可以多听几遍,这样能了解到更多
冷彬彬
冷彬彬
2022.9.06
很有趣!完全没想到自己能听完一本数学含量如此之高的书。听完后整体感受如下:
1.有一种反直觉的规律:极端事件对总体状况影响更大。
2.这种规律里,又分为可识别的和不可识别的,前者为符合肥尾效应的事件,后者为黑天鹅事件。
3.在肥尾事件里,频次显得不那么重要了,均值也不具有太大参考价值
4.肥尾让抗风险变得更有价值,甚至要学会设计在风险中受益的策略,这是有可能的

记住了这几点,比较抽象,还得去研究下什么是正态分布,感觉二位一直都是在跟正态分布对比来讲的。

我反而觉得「听」的感觉更好,这本书的内容门槛比较高,抱着不求甚解的态度先听完一遍,其实就有了一个大概的印象,再去做一些延展的阅读就好。如果一上来就给我看一篇这么高深的文章,担心自己中途总是忍不住要去查询一些概念是什么意思,反而很难在一段时间内集中读完。就难以在一开始建立起一个整体的框架。

总之,谢谢二位主播!
何雨桐
何雨桐
2023.1.18
Sarah是信息学院哪一级的呀
Sarah_Jing
:
完蛋,要被亲师兄认出来了QAQ 我…我在微信上跟你打个招呼
dongzhen
dongzhen
2022.9.03
我觉得对于大部分的普通人和非数理背景的投资者来说,看Sarah的访谈和戴老师的专栏就够提炼主旨了,毕竟买书巨贵这本书又难啃
这集感觉很不好,用一个名词来解释另一个名词,不能更通俗灵活地运用,说明也是一知半解的样子
KINA_HLL
KINA_HLL
2023.4.01
41:26 这本书应该是《被平均的风险》!
阿珂_xk
阿珂_xk
2023.2.07
shownotes太棒了!感谢Sarah和嘉宾的分享,收获颇多
HD316059v
HD316059v
2022.11.13
肥尾的特点是:负反馈和正反馈共存。股价在大多数时间有一个公允的价格,会处在负反馈的循环里面,但在暴涨暴跌的时候,越多人卖就会引起更多人卖,这是个正反馈。平时身体会处在自愈的状态,但是在严重的病症里面,局部的疾病导致整体环境的改变,引起更多的问题。脆弱和健壮共存,可能就是有机体的特点。
Koronos
Koronos
2022.9.14
06:37 我在杰晶维基上读过戴先生的译文,非常感谢他。
张巍教练
张巍教练
2022.9.13
听完了,书买错了,智商不够用啊!
HD369923m
HD369923m
2022.9.07
Baby 我来了!来抽书!去写优质评论!