Print service provided by iDogiCat: http://www.idogicat.com/
home logo





Home > Finance > iDog's Investment Study > 概率分布

概率分布

随机变量

当某一决策(实验)的结果可被量化时,或者说对于每一个基本事件我们都可以对其赋予某个数值时,实验结果就可以称为随机变量。在投资决策中,随机变量可被定义为收益的多少(金额或百分比)。

随机变量的所有可能取值的集合,加上它们各自的概率,称为随机变量的概率分布。

随机变量分为可数的(离散的)和不可数的(连续的)。其分布分别为离散分布和连续分布。

随机变量的期望值

随机变量的期望值:如果实验(包括决策环境和决策)可无限地重复,随机变量的均值。

实际生活中,某一特定经济环境中的决策(即实验)往往不能重复,更不能“无限地重复”。但是,我们还是采用收益的期望值来测度投资决策的回报。原因是:

  • 没有更好的测度方法
  • 尽管对某一特定的投资只能作出一次决策,但是,投资者在长期内会作出很多的决策。在这段时间内,收益的均值就会接近于所有决策的期望收益的平均值。

期望值的公式:

期望值的公式

其中,r为收益,E(r)为收益的期望值,Pr(i)为收益为ri的概率,而且有

期望值的性质:

  • 随机变量加上一个常数,其期望值也增加同样的常数
  • 随机变量乘以一个常数,其期望值也改变同样的比例
  • 随机变量对其期望值的偏差(即两者之差: )也是一个随机变量,其期望值必为0。

期望值的性质

散布指标

值域

随机变量可能取的最大值和最小值之差。这是一种很粗糙的指标。

方差

”惊奇“是实际收益对预期收益的偏差,包括偏差的方向和幅度两个方面。方差测度的是预期的惊奇。

从直觉上,可以计算实际收益对预期收益的偏差,并对该偏差取期望,用来测度实际收益这一随机变量的非确定性。但是,我们已经知道,该偏差的期望值必为0,也就是概率加权的正偏差和复偏差正好互相抵消。为解决这一问题,对偏差取平方,这样,它就必然为非负数。

方差定以为收益对起预期的偏差的平方的期望。

方差

方差的性质:

  • 随机变量加上一个常数,其方差不变
  • 随机变量乘以一个常数,其方差变为该常数的平方倍

方差的性质

标准差

由于方差的单位跟随机变量不同,因此,对其开平方,就得到标准差σ。

标准差的性质:

  • 随机变量加上一个常数,其标准差不变
  • 随机变量乘以一个常数,其标准差变为该常数的绝对值倍

标准差的性质

方差系数

为了评价随机变量的散布程度,往往把散布指标与其期望值比较。标准差与期望值的比称为方差系数。

方差系数

方差系数绝非随机变量散布性质的理想指标。比如,当随机变量具有(接近)0的期望值时,不管标准差多大,方差系数总是趋于无穷大。

在金融界,对于整体风险的情况,标准差就是比较好的指标;对于某一单独的资产,使用β指标。

偏度

标准差并非平均的“惊奇”度。因为先把偏差平方,在求其(概率加权)均值的平方根,因此,会加大对大偏差的权重。

风险:随机变量对其期望的偏差。

如果出现较大的偏差,风险厌恶者比较担心出现负的偏差。但是,标准差并没把正、负偏差(好、坏情况)区分开。

对于一个给定的标准差,可能是下面两种情况中的一种:

  • 随机变量具有易于发生的小的负偏差,和不易于发生的大的正偏差
  • 随机变量具有易于发生的小的正偏差,和不易于发生的大的负偏差

风险厌恶者可能偏好于前一种情况。因为风险一般被认为是发生灾难(大的坏结果)的可能性。

三阶矩是能对好、坏结果的可能性进行分离的一种指标。它同样是建立在偏差d上:

三阶矩

立方强化了大偏差的权重,同时又保持了各个偏差的符号。由于偏差的概率加权平均为0,偏差的立方的概率加权平均就使较大的偏差占优势,同时,最终结果的符号会说明正偏差比较显著还是负偏差比较显著。

可以对三阶矩开三次方根(记为m3),并与标准差比较。

例:某股票的看涨期权和看跌期权的比较

期权M3m3σ
看涨期权10.5218.98%229.13%
看跌期权0.0202527.25%52.50%

可见,两种投资工具都想正方向偏斜(M3 > 0),这是期权的典型特征。看涨期权比看跌期权偏斜得更厉害。比较标准差和m3,可见,期权的标准差的大部分都是由其正偏斜引起的,这表明,好的结果幅度更大,而坏的结果幅度更小,尽管更易于发生。

连续分布

正态分布

正态分布也叫高斯分布或钟型分布。服从正态分布的随机变量有如下性质:

  • 期望值是众数,同时也是中位数
    • 期望值:概率加权平均数
    • 众数:出现频率最高的基本事件
    • 中位数:所有事件按大小顺序排列时位于中间的那个数
  • 正态分布是关于期望值对称的。由此可知以下两点
    • 绝对值相同的正偏差和负偏差出现的频率相同
    • 对期望值的偏差越大的事件发生的可能性越小--正态分布的关键就是事件的概率随着其对期望值的偏差的增大而呈指数下降
  • 正态分布可以由两个参数完全决定:期望值和标准差。
  • 正态分布的稳定性:
    • 对服从正态分布的随机变量加上一个常数或乘以一个常数,得到的随机变量仍服从正态分布
    • 多个服从正态分布的随机变量的加权和仍服从正态分布(这个特征对资产组合分析十分有用)

利用正态分布的稳定性,我们把服从正态分布的随机变量减去其期望值,并处以其标准差,得到的随机变量的期望值为0,标准差为1。它服从“标准正态分布”。

服从标准正态分布的随机变量z与其概率密度函数的关系:

标准正态分布的概率密度函数

连续分布的随机变量可能取的值有无穷多个,因此它取每个值的概率必为无穷小。因此,要用它的概率密度函数,通过在随机变量的一段取值范围上对其概率密度函数积分,来得到它落在该取值范围里的概率。

累积正态分布函数N(a)表示随机变量z小于等于a的概率:

累积正态分布函数

应用:

累积正态分布函数的逆函数

累积正态分布函数的逆函数

服从非标准正态分布的随机变量x,以如下方法替换成服从标准正态分布的x*的方法:

这样做的目的是简化计算。

置信区间

对于有较大标准差的随机变量(如股票的收益),我们有理由怀疑其某个绝对数值的的可靠性。一种量化的方法是解决这个问题:如果随机变量落在某区间的概率为P(比如:95%),那么该区间是什么?该区间被称为P的置信区间(95%的置信区间)。

一种符合逻辑的置信区间是以随机变量的期望值为中心的区间,因为符合正态分布的随机变量本身就是关于其期望值对称的。

求标准正态分布的置信区间:

求非标准正态分布的置信区间:

得到

对数正态分布

正态分布描述股价和收益率有两个不足:正态分布允许随机变量取任何值,但股价不能为负;正态分布不适于计算复利。对数正态分布可用于解决这些问题。

对数正态分布描述一个不断增长的随机变量,其增长率为一符合正态分布的随机变量。因此,它反映了连续计算复利的特征。

假定某资产的以年连续复利(Annual Continuously Compounded)计算的收益率服从正态分布,期初价格P0,年连续复利rc,则其期末价格为

其有效年利率为

r服从对数正态分布。尽管年连续复利rc可以为负,其期末价格却不可能为负。

服从对数正态分布的资产的特性:

期望年收益:

一般称这种资产的年复利服从期望值为μ*、标准差为σ的正态分布。

考察期间的可变性:

对于年连续复利服从对数正态分布的资产,已知年收益的期望值μ和标准差σ,求月连续复利的情况:

对于周连续复利服从对数正态分布的资产,已知周收益的期望值μweek和标准差σweek,按一年有52周计算,求年连续复利的情况:

实际应用中,为了得到标准正态分布的连续复利R,通常对原始收益率做如下变换:

在短时期内(比如一个月以内),不必做这种变换,因为R和r很接近,用r来近似R已足够精确。但是,对于较长的时期,这种转换是必要的。