《模型思维:数学模型结构大模型黑箱》2
REDCAPE 模型功能
-
推理:reasoning
从模型中得出的推论总是采用条件判断形式:如果条件A成立,那么可以得出结果B。
当我们将模型中推导出来的主张与叙述性主张进行比较时,这种“条件性”的威力将会变得更加明显,即便后者有经验证据支持时也是如此。
通过利用模型,我们可以划出一条界线:什么时候应该采用、什么时候不能采用。 -
解释:explanation
模型为经验现象提供了清晰的逻辑解释。
模型可以解释点值(point values)和点值的变化。
最有效的模型既能解释简单的现象,也能解决令人费解的问题。
基于模型的解释必须包括正式的假设和明确的因果链条,而且这些假设和因果链条都要面对数据。 -
设计:design
模型还可以通过提供框架来帮助设计,因为只有在适当的框架内我们才可以考虑不同选择的含义。工程师使用模型设计供应链;计算机科学家使用模型设计Web协议;社会科学家使用模型设计制度。 -
交流 communication
由于创造了一种共同的表示方法,模型能够有效地改进交流。模型要求对相关特征及其关系给出正式的定义,这使我们能够精确地进行交流。可复制、可度量等。 -
行动 action
在最重要的行动中,决策者要使用多个复杂的模型,模型与数据紧密相关。
指导行动的模型通常依赖于数据,但并不是全部模型都依赖于数据。 -
预测 prediction
过去,解释和预测往往是齐头并进的。
现在,有的模型可以用来预测,但是却不一定能解释什么。深度学习算法可以预测产品的销售情况、明天的天气变化、价格演变趋势和身体健康状况,但是它们几乎没有提供什么解释。
有些模型有很强的解释力,但是在预测上却没有什么价值。 -
探索 exploration
暂且将现实世界的约束丢到一边,可以极大地激发我们的创造力。
多模型思维
[!BIAS]
孔多塞陪审团定理意味着,如果有足够多的模型,我们几乎永远不会犯错。多样性预测定理则意味着,如果能够构建一组多样的中等准确性的预测模型,我们就可以将多模型误差减少为接近于零。然而,分类模型告诉我们,构建多个独立模型是困难的。
虽然增加模型可以提高准确性(根据多样性预测定理,必定会是这样),但是在已经拥有了一定数量的模型之后再继续增加模型,每个模型的边际贡献就会下降。
孔多塞陪审团定理:
多数投票正确的概率比任何人(模型)都更高;当人数(模型数)变得足够大时,多数投票的准确率将接近100%。
例如,我们尝试用几个不同的模型来处理同一个问题,这些模型的简化方法各不相同,但都有一个共同的生物学假设。如果这些模型(尽管它们有不同的假设)都导致相似的结果,那我们就得到了一个强有力的定理,它基本上不受模型细节的影响。
我们的真理就是若干独立的谎言的交集。——Richard Levins
多样性预测定理
多模型误差=平均模型误差-模型预测的多样性,即:
$$
(\bar M-V)^2 = \sum_{i=1}^N \frac{(M_{i}-V)^2}{N} - \sum_{i=1}^N \frac{(M- \bar M)^2}{N}
$$
$$
M_{i}表示模型i的预测,\bar{M}等于模型的平均值,V等于真值
$$
这个定理的原理在于,相反类型的误差(正负)会相互抵消。如果一个模型的预测值太高,同时另一个模型的预测值太低,那么这些模型就会表现出预测多样性。两个模型的误差相互抵消,模型的平均值将比任何一个模型更加准确。即便两个模型的预测值都太高,这些预测值的平均误差仍然不会比两个高预测值的平均误差更糟。
这个定理确实意味着,任何多样性的模型(或人)的集合将比其普通成员的预测更加准确,这种现象就是通常所说的“群体的智慧”(wisdomof crowds)
PS:有点像集成学习的方法,比如我的研究计划里,使用集成学习的方法来预测主观幸福感。
“任何一种看待世界的单一方式都会遗漏掉某些细节,使我们更容易产生盲点。”
分类模型
我们在构建多模型思维的时候,并非增加越多的模型,效果越好。第二个和第三个模型不一定比第一个模型更好,它们也许会更糟。但是,即使它们的准确性稍差,但只要分类(字面意义)有所不同,就应该把它们加入进来。
适当的模型粒度
“不要迷失在细节的丛林中”
统计学家把一个模型中能够解释的variation的比例称为该模型的R^2
$$
R^2 = \frac {\begin{matrix} \sum_{x \in X} (V(x)-\bar V)^2\end{matrix}-\begin{matrix} \sum_{x \in X} (M(x)- V(x))^2\end{matrix}}{\begin{matrix} \sum_{x \in X} (V(x)-\bar V)^2\end{matrix}}
$$
$$
其中,V(x)等于X中的x的值,\bar V等于平均值,M(x)等于模型的估值
$$
创建分类模型的目的是根据属性构建类别,使同一类别中的单位具有类似的均值。当然,没有任何一种分类方法是完美的。在每个类别中,单位的均值可能会略有不同,我们称这种情况称为分类误差(categorization error)。
构建的类别越大,分类误差就越大,因为类别越大,我们就越可能将具有不同均值的单位集中到同一个类别中。但是,更大的类别依赖更多的数据,又可以使我们对每个类别均值的估计更加准确(参见平方根规则)。因估计均值错误而出现的误差称为估值误差(valuation error)。估值误差随类别数量的增加而减少。
增加类别的数量能够通过将具有不同均值的单位归入同一个类别减少分类误差。统计学家将这种情况称为模型偏差(model bias)。但是同时,构建更多类别则会增加对每个类别均值估计的误差,统计学家将这种情况称为均值方差的增加。
同时,创造过多的类别会导致对数据的过度拟合,而过度拟合会破坏对未来事件的预测。
因此,我们在决定要构建许多个类别时就面临着一个权衡。对于这种权衡,我们将它总结为模型误差分解定理(model error decomposition theorem),统计学家则将这个结果称为偏差-方差权衡(bias-variance trade-off)。
模型误差 = 分类误差+估值误差
$$
\begin{matrix} \sum_{x \in X} (M(x)- V(x))^2\end{matrix} = \sum_{i=1}^n \begin{matrix} \sum_{x \in S_{i}} (V(x)-V_{i})^2\end{matrix} + \sum_{i=1}^n(M_{i}-V_{i})^2
$$
$$
其中,M(x)和M_{i}分别表示数据点x和类别S_{i}和V(x)的模型值,V_{i}表示它们的实际值。
$$
高阶项的存在会带来大误差的风险,因为高阶项有很强的放大效应。为了避免过度拟合,可以避免使用高阶项。不过,一种更巧妙的解决方法是,可以采取自举聚合法(bootstrap aggregating)或装袋法(bagging)来构建模型。
对人类建模的挑战
- 多样性:人们的偏好、行动能力不同,形成的社交网络、利他主义倾向以及分配给不同行动的认知资源(注意力)也有所不同。
- 易受社会影响的:例如极端行为带来的溢出效应(spillovers)。
- 容易出错的:认知依恋(cognitiveattachment)缺失导致的误差就可能是随机且独立的,认知偏差导致的误差可能是系统性的、相关的。人们对最近发生的事件往往更加重视,并且更容易回忆起故事性的情节而不是统计数字。这类共同偏差不会被消除。
- 渴望(目的性):有些人渴望财富和名声,有些人渴望改变世界
- 人的主体性:人类有采取行动的能力,改变行为的能力以及学习的能力。
人类总是下意识的追求认知范围内的“最优化”。
损失厌恶是指面对收益时,人们表现为风险厌恶,面对损失时,人们却表现为风险偏好。损失厌恶初看上去似乎并不是非理性的,但是它意味着对于一个相同的情景,在呈现为潜在损失与潜在收益时,人们会选择不同的行为。
双曲贴现意味着,人们对近期的贴现更强。双曲贴现可以解释人们为什么会欠下巨额信用卡债务、吃不健康的食品、做出无保护措施的性行为,也可以解释许多人不能为退休进行储蓄的原因。
人类行为发生在零智能与完全理性这两种极端情况之间,因此构建行为个体利用适应性规则的模型是有意义的。
基于最优化的模型假设人们最大化的效用函数或收益函数,而基于规则的模型则假设特定的行为。
许多人将基于最优化的模型等同于数学(模型),而将基于规则的模型等同于计算(模型)。
在基于最优化的模型中,对偏好或收益的假设是最基本的;而在基于规则的模型中,对行为的假设才是最基本的。
正如理性选择模型可以作为人类认知能力的上限,固定规则模型则可以作为人类认知能力的下限。
模型会产生什么样的结果?均衡、周期、随机性、复杂性
周期与均衡的模型可以创造一个相对稳定的环境,在此环境中,人类可以进行学习。
如果模型产生了均衡(或简单的周期),并且均衡与优化行为不一致,那就意味着我们的模型存在逻辑缺陷。
如果可以采取任何行动的适应性规则产生了均衡,那么这种均衡必定与致力于最优化的行为主体的行为一致。如果同样这些适应性规则产生了复杂性,那么行为主体的行为就不一定是最优的。
卢卡斯批判
政策或环境的变化可能引起受影响者的行为反应。因此,使用过去的行为数据估计的模型将不准确。模型必须考虑到人们对政策和环境变化做出反应这一事实。
quick knowledge
韩国全租房引发的债务危机,以及最近在计算珠海购房出租的利益计算,突然意识到加息与房价的关系。
比如,50万购买一套小住宅,租金1500-2000元/月,预估需要20-25年回本,即赚到50万;
而50万存在银行吃复利,3%的年利率,20-25年后差不多也是这个数值。
此时,未考虑房价的波动-涨跌,以中国目前的行情来看,长远来说, 是下跌企稳的趋势。故而,