金融工程基础实战之贝叶斯股票投资决策
金融工程中会使用到很多经典公式,贝叶斯在金融工程中的应用非常广泛。今天我们就从经典故事入手,使用较为通俗的语言,来和大家分享贝叶斯在金融工程中的基础应用。
先从一个经典的故事讲起。
一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率被估计为 0.9,问题是:在狗叫的时候发生入侵的概率是多少?
这个其实就是通过概率来判断可能性。所谓概率其实就是描述不确定事件发生可能性的数值。假如你有1000万,投资两个项目,一个项目赢利的概率是80%,另一个项目赢利的概率是10%。你愿意投资哪个?正常的大多数人应该都会选择赢利概率是80%的项目。
为了解答经典故事中“在狗叫的时候发生入侵的概率是多少?”这个问题,我们先从基础的概率与概率分布讲起。
我们认为,在随机事件里,某一结果发生的次数占全部各种结果发生的次数的比率即为该结果发生的概率。
如果我们以A表示随机事件中的某一个结果,那么A发生的概率为:
P(A)=A发生的次数/全部各种结果发生的次数
这个大家好理解吧,假如我们投硬币,一共投了10次,硬币正面出现了6次,就是A,那么P(A)=6/10=0.6
而概率根据不同的计算方法,又分为古典概率、主观概率以及相对频数概率。各种概率类型,涉及内容也比较多,大家有兴趣的可以着重了解,这里就不细讲了。
我们再说一下条件概率(Conditional Probability)。条件概率,就是指在另一个事件已经发生的情况下某一事件发生的概率。如果用公式表示给定B的情况下,A发生的条件概率为:
P(A|B)=P(AB)/P(B) 公式一
P(AB),是A和B同时发生的联合概率。
那么,P(B|A)=P(BA)/P(A) 公式二
这个公式大家应该容易理解吧?就是把上面公式换了一下,变成了给定A的情况下,B发生的条件概率。
根据公式一有:P(AB)=P(A|B)*P(B) 公式三
而我们知道,P(AB)、P(BA),都表示的是A和B同时发生的联合概率。
所以:P(AB)=P(BA) 公式四
把公式四代入到公式三中,得出:P(BA)= P(A|B)*P(B) 公式五。
那么,把公式五代入到公式二中有:
P(B|A)= P(A|B)*P(B)/ P(A) 公式六
公式六这个公式是什么呢?这个公式就是大名鼎鼎的贝叶斯公式。
公式中的元素代表的意思,文中已经讲过了,那么现在我们开始分析文章中“在狗叫的时候发生入侵的概率是多少?”的问题。
在这个问题中,我们可以提炼出两个事件,一个是“狗叫”,一个是“盗贼入侵”。
事件 |
故事中的信息点 |
概率 |
狗叫(A) |
狗平均每周晚上叫 3 次 |
P(A) = 3/7 |
盗贼入侵(B) |
20 年里一共发生过 2 次被盗 |
P(B) =2/(20*365) 即: 2/7300 |
那么,当狗叫,发生入侵,就可以表示为: P(盗贼入侵|狗叫) 即 P(B|A)。
而故事中,“盗贼入侵时狗叫的概率被估计为 0.9”,可以表示为: P(狗叫|盗贼入侵) 即 P(A|B)=0.9。
所以:
P(B|A)= 0.9*(2/7300)/(3/7)= 0.000575
我们得出,在狗叫的时候发生入侵的概率是0.000575。
基础讲完,我们进入实战环节,也就是我们文章的主题,金融工作基础实战之使用贝叶斯进行股票投资决策。
既然实战,就使用现实中真实的数据。
我们选取“祥源文化(股票代码:600576)“来进行分析。
作者发布这篇文章的时间是星期天凌晨(2018年1月14日),来判断周一(也就是2018年1月15日)。在周一(2018年1月15日)上证指数上涨的情况下,祥源文化这支股票上涨的概率。
表示为:P(祥源文化上涨|上证指数上涨)
我们先收集一下近半年内,祥源文化和上证指数在每周一的情况:
祥源文化
序号 |
时间 |
星期 |
是否上涨 |
1 |
2017/6/5 |
星期一 |
1 |
2 |
2017/6/12 |
星期一 |
0 |
3 |
2017/6/19 |
星期一 |
1 |
4 |
2017/6/26 |
星期一 |
1 |
5 |
2017/7/3 |
星期一 |
1 |
6 |
2017/7/10 |
星期一 |
0 |
7 |
2017/7/17 |
星期一 |
0 |
8 |
2017/7/24 |
星期一 |
0 |
9 |
2017/7/31 |
星期一 |
0 |
10 |
2017/8/7 |
星期一 |
1 |
11 |
2017/8/14 |
星期一 |
1 |
12 |
2017/8/21 |
星期一 |
1 |
13 |
2017/8/28 |
星期一 |
1 |
14 |
2017/9/4 |
星期一 |
0 |
15 |
2017/9/11 |
星期一 |
1 |
16 |
2017/9/18 |
星期一 |
1 |
17 |
2017/9/25 |
星期一 |
1 |
18 |
2017/10/9 |
星期一 |
1 |
19 |
2017/10/16 |
星期一 |
0 |
20 |
2017/10/23 |
星期一 |
0 |
21 |
2017/10/30 |
星期一 |
0 |
22 |
2017/11/6 |
星期一 |
1 |
23 |
2017/11/13 |
星期一 |
0 |
24 |
2017/11/20 |
星期一 |
0 |
25 |
2017/11/27 |
星期一 |
0 |
26 |
2017/12/4 |
星期一 |
0 |
27 |
2017/12/11 |
星期一 |
1 |
28 |
2017/12/18 |
星期一 |
0 |
29 |
2017/12/25 |
星期一 |
0 |
30 |
2018/1/8 |
星期一 |
0 |
14 |
上证指数
序号 |
时间 |
星期 |
是否上涨 |
1 |
2017/6/5 |
星期一 |
0 |
2 |
2017/6/12 |
星期一 |
0 |
3 |
2017/6/19 |
星期一 |
1 |
4 |
2017/6/26 |
星期一 |
1 |
5 |
2017/7/3 |
星期一 |
1 |
6 |
2017/7/10 |
星期一 |
0 |
7 |
2017/7/17 |
星期一 |
0 |
8 |
2017/7/24 |
星期一 |
1 |
9 |
2017/7/31 |
星期一 |
1 |
10 |
2017/8/7 |
星期一 |
1 |
11 |
2017/8/14 |
星期一 |
1 |
12 |
2017/8/21 |
星期一 |
1 |
13 |
2017/8/28 |
星期一 |
1 |
14 |
2017/9/4 |
星期一 |
1 |
15 |
2017/9/11 |
星期一 |
1 |
16 |
2017/9/18 |
星期一 |
1 |
17 |
2017/9/25 |
星期一 |
0 |
18 |
2017/10/9 |
星期一 |
1 |
19 |
2017/10/16 |
星期一 |
0 |
20 |
2017/10/23 |
星期一 |
1 |
21 |
2017/10/30 |
星期一 |
0 |
22 |
2017/11/6 |
星期一 |
1 |
23 |
2017/11/13 |
星期一 |
1 |
24 |
2017/11/20 |
星期一 |
1 |
25 |
2017/11/27 |
星期一 |
0 |
26 |
2017/12/4 |
星期一 |
0 |
27 |
2017/12/11 |
星期一 |
1 |
28 |
2017/12/18 |
星期一 |
1 |
29 |
2017/12/25 |
星期一 |
0 |
30 |
2018/1/8 |
星期一 |
1 |
20 |
由两个表的数据,我们可以得出以下数据:
事件 |
概率 |
祥源文化上涨 (A) |
P(A) =14/30 即:7/15 |
上证指数上涨 (B) |
P(B) =20/30 即: 2/3 |
而P (上证指数上涨|祥源文化上涨) ,我们根据历史数据,预估为0.9:即 P(B|A) =0.9
所以,我们得出:
P(A|B)= 0.9*(7/15)/(2/3)= 0.63
所以结论就是,在周一(2018年1月15日)上证指数上涨的情况下,祥源文化这支股票上涨的概率是0.63。也就是说,周一(2018年1月15日)只要上证指数是上涨的,祥源文化大可能也是会上涨的。
大家发现没有,概率最大的作用是将商业和日常生活中遇到的各种不确定性量化了。
其实,本文这个模型非常非常基础,分享出来,也就是给大家一个参考。文中还有很多不足之处,例如,数据样本量太少,精度上会存在瑕疵。另外,某支股票的趋势,会受多种因素影响,而文中的方法,太过单一。现实中的投资模型,要远远比文章中描述的要复杂的多的多,维度相对更为全面,权重指标描述更为准确。同时,用到的不仅仅是贝叶斯这一种分析方法,往往还有蒙特卡洛模拟、时间序列、回归、离散概率分布【如,贝努力(Bernoulli Distribution )、二项(Binomial Distribution)、超几何(Hyper-geometric Distribution)、普哇松(Poisson Distribution)】、连续概率分布【如,均匀分布(Uniform Distribution)、正态分布(Normal Distribution)】等。现实的中金融工程,往往是一个非常复杂的组合模型。
不积跬步无以至千里。而本文的价值在于给大家一个启示。如果我们平时养成习惯,把生活中的一些数据记录下来,或许会对你某些时候的决策提供一定的帮助。如果我们在日常股票投资过程中,对数据加以利用,加上每次上涨幅度这个维度,来判断某种操作习惯的赢利概率,再不断进行修正,相信大家坚持积累下来,一定是有所收获的。
今天就到这里,感谢大家,希望本文能给大家带来帮助。