最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

基于历史数据集生成情景树的两种新方法

IT圈 admin 51浏览 0评论

2024年5月9日发(作者:田金鹏)

基于历史数据集生成情景树的两种新方法∗

许道宝;张芳

【摘 要】A scenario tree is an efficient way to represent the stochastic

parameters in decision problems under uncertainty. Two new historical

data based scenario tree generation methods are proposed in this paper.

Considering the financial management background, an LP model used to

detect arbitrage opportunity is developed. It is easy to exclude the

arbitrage oppor-tunity when using two new methods to generate the

scenario tree, the generated scenario tree includes the past realistic

evolution of the historical data, and the distribution determined by the

scenario tree can properly fit the empirical distribution of asset

returns;moreover, the gen-erated scenario tree could describe the trend of

the returns of the assets, providing two efficient scenario analysis tools for

dynamic portfolio selection problems.% 情景树是描述不确定性决策问题

中随机参数的一种有效方式。本文提出了两种基于历史数据集生成情景树的新方法。

结合金融背景,给出了如何检测套利机会的线性规划模型。两种新方法在生成情景

时能够容易地规避套利机会,并且所生成的情景包含了部分历史数据真实的演化模

式,能够比较好地拟合资产收益的经验分布函数;此外,所得情景可以恰当地描述

资产收益未来的走势,为动态投资组合选择问题提供了两种有效的情景分析工具。

【期刊名称】《工程数学学报》

【年(卷),期】2013(000)003

【总页数】10页(P339-348)

【关键词】投资组合选择;情景分析;情景树;K-means;套利机会

【作 者】许道宝;张芳

【作者单位】西安交通大学数学与统计学院,西安 710049;西安交通大学数学与

统计学院,西安 710049

【正文语种】中 文

【中图分类】O221.5

1 引言

在现实生活中,人们面临着众多具有不确定性的复杂决策问题,如金融中的投资组

合选择及风险管理问题,电力生产调度问题,航线航班的制定问题等等,如何恰当

地描述该类问题中所涉及到的随机参数成为了一项重要的研究课题.在这方面,比

较有效的当属情景树方法.如果假设各阶段的随机参数只有有限个可能的取值(情

景),那么根据随机参数随时间的演化关系可得到一个树状结构,我们称之为情景

树.情景树代表了随机参数在决策期内可能的取值,情景的数量以及情景树的结构

不仅关系到决策问题的复杂性和稳健性,而且所生成的情景树的好坏直接影响着最

终决策的优劣.

目前,人们已经提出了很多生成情景树的方法.抽样法[1]是最简单也是最基本的

情景生成方法.在使用该方法时,一般需要事先确定随机收益的概率分布,或者能

够用历史数据构造出比较好的经验分布函数,然后按照相应的分布函数进行随机抽

样并将所得样本作为情景.模拟法[2]是另一种比较基本的情景生成方式,该方法

往往需要假定随机收益服从某个定量模型(如:几何布朗运动,向量自回归模型等),

然后由相应的定量模型模拟产生情景即可.为了尽可能精确地逼近随机收益的分布,

以上两种方法往往需要生成大量的情景.当情景数量过于庞大时,相应的决策问题

的规模也会变得非常巨大,这就会导致“维数灾难”,使得决策问题非常难于求解

甚至无法求解.为了控制决策问题的规模,可以借助于主成分分析[3]、聚类分析

[4]或约减技术[5]将相应的情景进一步整合与简化,得到规模相对较小的情景

树.除此之外,基于所要生成的情景树的统计性质应尽可能地接近于随机收益的统

计性质的理念,Høyland和Wallace在文献[6]中提出了一种“统计性质匹

配”(如果统计性质为各阶矩的话,则称之为“矩匹配”)的优化模型并用之来生成

情景,其实证结果表明:少量的情景数目就可使得情景树与随机收益的前四阶矩充

分的接近.但是,该框架的核心是一非线性、非凸的优化模型,求解比较困难且不

易找到全局最优解.为了克服这个缺点,文献[7]中通过预先选定情景的取值并只

将情景的概率作为优化变量,把“矩匹配”问题转化成了一个线性规划问题,但该

文献中所给模型只适用于单阶段情景树的生成.为了更容易地选择情景的取值以及

生成更一般的情景树,文献[8]提出了利用K-means选择情景代表点的方法,并将

线性“矩匹配”模型推广到了多阶段.为了充分地利用历史数据信息,文献[9]提

出了一种基于历史数据集的情景树生成方法,该方法的核心是利用K-means将历

史数据“聚合”成满足一定要求的情景树.在多阶段情景树的生成过程中,利用聚

类方法整合历史数据有个很大的缺点,那就是:随着时间的推移后面子类中的数据

会越来越少,当子类中的数据量小于所要生成的情景的数目时,聚类就变得无法进

行.

上述方法不是需要确定随机收益的分布或估计其统计性质,就是需要依赖于某个特

定的数学模型来描述随机收益.为了避开复杂的计算以及数学模型,本文借助于状

态的相似度提出两种新准则,并基于历史数据集来生成情景,所提出的两种情景生

成方法避免了K-means方法的缺陷.在金融背景下,所生成的情景不仅能够比较

好地拟合资产收益的经验分布函数,利于套利机会的排除,还可以恰当地描述资产

收益未来的走势,为动态投资组合选择问题提供了两种有效的情景分析工具.

2 情景树生成的新方法

大量实证研究表明,很多金融时间序列数据,尤其是股票收益序列经常表现出“波

动聚集”(volatility clumping)现象:随机收益在较大幅度波动后面伴随着较大幅

度的波动,在较小波动幅度后面紧接着较小幅度的波动.这说明相邻几个时刻的收

益(状态)之间存在着密切的关系,并且当前状态直接影响着下一时刻的收益值.文

献[9]提出的利用K-means方法将历史数据聚类得到下一阶段情景的方法恰恰忽略

了这一点.由于当前状态是未来收益发生的起点,我们自然会问:在历史数据集中

是否有与当前状态相同或“相类似”的点,如果有的话,这些点的下一时刻的情形

在当前状态下是否还有可能发生?这些数据能否作为下一阶段的情景呢?现实中不

乏有投资者会这么认为,如侧重于“技术分析”的投资者.下面,我们分别讨论如

何利用该思想生成单阶段和多阶段情景树.

以下假设有n个风险资产,当前可得到的历史数据有N组,将其按时间顺序排列

并存放到矩阵

中,其中第t行Rt=(Rt,1,Rt,2,···,Rt,n),t=1,2,···,N,为n个风险资产在第t个历史

时期的收益向量.不妨假设当前状态为RN,那么下一时刻的情景可取为历史数据

集中与RN相似的点的下一个时刻的数据.

2.1 单阶段情景树的生成

关于单阶段的情景生成,我们只需找出历史数据集{R1,R2,···,RN−1}中与当前状态

RN“相类似”的点,然后取这些点的下一时刻的数据作为情景即可,如图1所示.

图1:基于历史数据集生成单阶段情景树

具体地,单阶段情景树的生成方法可总结为以下步骤,不妨称之为最大相似度法.

最大相似度法:

步骤1 选取历史数据集{R1,R2,···,RN},并确定所要生成的情景的数量S;

步骤2 计算当前状态RN与历史数据的“相似度”,以2-范数为例,

上式分母上加1,是为了避免分母取值为0的情况.并将“相似度”从大到小排序

记为{di1,di2,···,diN−1};

步骤3 选取{Ri1+1,Ri2+1,···,RiS+1}作为下一阶段的情景;

步骤4 确定每个情景的概率.为简单起见,可取等概率的情况,即.

该方法完全依赖于历史数据集,避开了以往利用数学模型生成情景的框架.在历史

数据足够多的情况下,由于历史数据是以往发生的真实情景,用该方法所生成的情

景会具有更高的可信度.此外,借助于“相似度”,该方法改进了K-means和

Bootstrap方法未考虑到当前状态会对未来情景产生影响的缺点,所生成的情景树

在一定程度上体现了历史数据的某种演化关系.

上述情景生成方法的理念是已经发生的情景在相似的状态下还有可能发生.如果投

资者不这么认为的话,在该框架下我们也可考虑将更多情形下的历史数据作为情

景.例如,在上述步骤3中可以取{Ri1+1,Ri1+δ+1,···,Ri1+(S−1)δ+1}作为情景,

其中此时,我们按照与当前状态“相似度”最高到“相似度”最低的原则,从历史

数据中“近似均匀地”选取S个点,并将它们下一个时刻的数据作为情景,我们

称这种方法为近似均匀法.如果在相似的状态下,以往发生的情形还会发生,那么,

利用近似均匀法选取的情景将会比前一种方法选取的情景更为分散化.

值得注意的是,对于金融优化问题所生成的情景必须排除掉套利机会.在下一小节,

我们讨论在生成情景树时如何检测和排除套利机会.

2.2 套利机会的排除

套利是指在无需任何投入或无需承担任何风险的情况下即可获利,这是均衡市场所

不允许的.在金融优化问题中,所生成的情景必须排除掉套利机会,否则会导致优

化问题无界或导致“有偏”的最优决策[10,11].

Harrison和Kreps在文献[12]中证明了未来可能发生的状态无套利的充分必要条

件,即:存在πs≥0,s=1,2,···,S,使得方程组

成立,其中Rsi,i=1,2,···,n,s=1,2,···,S,为当前结点的子结点上的情景取值,

π=(π1,π2,···,πS)T通常被称为风险中性概率测度.上式表明,所生成的情景无套

利机会的充分必要条件为:存在风险中性概率测度,使得在该测度下所有风险资产

的期望收益相同.如果存在无风险资产,其收益为rf,则上述充要条件转化为

从上式可以看出,如果rf落在生成的情景所构成的凸包内,则不存在套利机会.

基于上述无套利机会的充分必要条件,我们可以构造如下形式的线性规划(LP)问题

来验证所生成的情景是否存在套利机会

如果z∗=0,则所生成的情景不存在套利机会;否则,则所生成的情景存在套利机

会.不难看出,LP问题(1)–(4)有可行解的必要条件是所生成的情景数量必须大于

等于决策问题中所考虑的资产的数目.

在实际应用中,我们可以先生成一棵情景树(包括前述单阶段情形),然后利用LP

问题(1)–(4)检测该情景树是否存在套利机会.如果存在套利机会,则重新调整情

景树的分枝结构,再次生成一棵新的情景树并检测是否存在套利机会,直至得到无

套利机会的情景树.另外,我们也可以在生成多阶段情景树的过程中检测套利机会:

从根结点开始,依次生成当前结点的子结点,并利用LP问题(1)–(4)检测当前结点

的子结点是否存在套利机会;如果发现套利机会,则增加当前结点的分枝数目,再

次生成其子结点;如此,直至生成整个情景树.后面的实证研究表明,只要每个结

点的分枝数目适当地大于所考虑的资产数目,我们所提出的方法能够很容易地规避

套利机会.

2.3 多阶段情景树的生成

2.1 节讨论了如何基于历史数据集生成单阶段情景树的方法.然而,在现实生活中,

大部分投资者更加关心多期决策问题.在本小节,我们将上述单阶段情景树生成方

法推广到多阶段的情形.

在实际应用中,为了更加方便地控制投资组合选择问题的结构,我们一般将情景树

设置为对称型的,即同一阶段上的结点的分枝数相同.例如,一棵T阶段的对称

型情景树的分枝结构可简记为(b1,b2,···,bT),表示该情景树在根结点处有b1个分

枝,第一阶段上的每个结点都有b2个分枝,以此类推,见图2.下面我们讨论如

何基于历史数据集生成多阶段对称型情景树.

图2: 分枝结构为(6,3,2)的3阶段对称型情景树

考虑共有T个阶段的对称型情景树生成过程.用St表示第t个阶段所要生成的情

景数量,则St=bt,t=1,2,···,T.为了便于表述,我们用S0=1表示根结点.第t阶

段的结点记为ξkt,kt=1,2,···,St.基于最大相似度法的无套利多阶段情景树生成步

骤如下:

步骤1 令t=0,kt=1;

步骤2 计算当前结点ξkt与历史数据的“相似度”,

并将“相似度”从大到小排序记为{di1,di2,···,diN−1};

步骤3 选取{Ri1+1,Ri2+1,···,Ribt+1+1}作为下一阶段的结点;

步骤4 将步骤3中的结点数据带入LP问题(1)–(4)并求解,若z∗=0,转步骤5;

否则,令bt+1=bt+1+q,St=bt,其中q为当前阶段的各个结点所增加的分枝数

目,为了控制情景树的规模,可取q=1,转步骤1;

步骤5 如果kt

否则,令kt=1,并转步骤2;

步骤6 确定每个情景的概率.特别地,可取等概率的情况,即.

该方法在根结点处生成情景时与前述单阶段情景树的生成相同.在第一阶段,由于

所有结点都是从历史数据中选出来的,故在计算其与历史数据的“相似度”时,它

们与自身的距离为0,生成下一阶段情景时,首先会选择它们下一时刻的历史数据,

后面的阶段亦是如此.这样,所生成的多阶段情景树就包含了很多真实数据随时间

的演化关系.

在上述情景树生成过程中,一旦出现套利机会,我们则统一增加相应阶段结点上的

分枝数目(步骤4),保证了所生成的情景树是对称型的.与单阶段情景树的生成类

似,在多阶段情景树的生成过程中,我们也可按照近似均匀法的思想,选取更多情

形下的历史数据作为情景.例如,在上述步骤3中可以取

{Ri1+1,Ri1+δ+1,···,Ri1+(bt+1−1)δ+1}作为情景,其中

3 实证研究

本节,我们将通过数值实验来验证所提出的两种新的情景树生成方法的优劣.我们

从深圳证券交易所任意选取了四个指数作为风险资产,它们分别为医药指数(PHA)、

金融指数(FIN)、石化指数(PET)以及金属指数(MET).交易数据取为每周的收盘数

据,时间区间为2001年7月6日至2011年3月11日,去掉中间一组全为0的

数据后,总共得到486组历史收益数据.

我们先来验证单阶段的情景生成方法.为了使得所生成的情景能与真实数据做一比

较,我们用485组历史数据生成情景,将最后一组历史数据作为样本外的数

据.首先,我们检验所生成的情景构成的累积分布与历史数据的经验分布之间的吻

合程度,图3和图4分别展示了当生成45个以及100个情景时的累积分布情

况.其中,“History”表示的是历史数据的经验分布;“Nearest”代表按照

“最大相似度法”生成的情景的累积分布;“Average”表示由“近似均匀法”所

得情景的累积分布;“K-means”表示用K-means方法将历史数据聚类所得情景

的累积分布[9].

由累积分布的图形可以看出,三种方法所生成的情景构成的分布均与历史分布的走

势相同,“近似均匀法”所生成情景的累积分布与历史分布拟合程度最高,而由

“最大相似度法”和“K-means”方法所得到的分布与历史分布的拟合程度相对

差一些.当情景数量较少时(图3),相对于K-means方法来说,“最大相似度法”

所得情景的分布与历史分布之间的误差要小一些.当情景数量增加至100时(图4),

相对于“最大相似度法”来说,K-means方法所得情景构成的分布与历史分布拟

合的更好一些.这是由于在生成情景的过程中,K-means方法用到了更多的历史

数据信息.对比图3和图4,我们还可以看出,情景数量越多,对应的累积分布与

历史分布之间的拟合程度也就越高,这是因为情景越多,历史数据信息丢失的也就

越少.

所生成的情景不仅要体现随机收益的分布情况,更重要的是,好的情景也必须能够

反映随机收益未来的走势.在当前时刻,我们不知道风险资产在下一时刻的收益取

值,为了使得当前所做的决策比较稳健,最好的方式就是用某个分布来描述未来的

收益.然而,现实中下一时刻风险资产的收益只有一种取值情况.我们可以将真实

的取值看作某个退化的分布,然后计算所生成的情景与该退化分布之间的概率分布

距离[5].表1列出了由不同情景生成方法所生成的情景与真实取值之间的概率分

布距离.

图3: 由不同方法生成的45个情景所构成的累积分布

图4: 由不同方法生成的100个情景所构成的累积分布

表1: 不同情景生成方法所生成的情景与真实收益数据之间的概率分布距离方法

S=30 S=40 S=50 S=60 S=70 S=80 S=100 Nearest 0.0571 0.0560 0.0615

0.0643 0.0662 0.0662 0.0693 Average 0.0800 0.0941 0.0932 0.0828 0.0895

0.0864 0.0829 K-means 0.0807 0.0812 0.0818 0.0819 0.0824 0.0825 0.0830

由表1中数据可以看出,在相同情景数量下,由“最大相似度法”所生成的情景

与真实数据之间的概率分布距离最小,“近似均匀法”和“K-means”方法对应

的概率分布距离相对大一些.由此可见,按照“最大相似度法”所生成的情景能更

好地近似真实的收益取值,从而,基于该方法所生成的情景所做出的决策会更接近

于真实情况.

进而,我们用“最大相似度法”和“近似均匀法”生成了多阶段情景树,图5和

图6分别展示了用这两种方法生成的分枝结构为(10,8)的两阶段情景树.图中粗线

表示的是样本外历史数据.从这两个图形不难看出,两种情景生成方法所生成的情

景树均能覆盖资产收益的真实路径,并且在每个阶段情景树均包含“较好的(涨)”

和“较差的(跌)”情景.这就保证了基于这些情景树求解相应的决策问题,所得到

的决策更具有稳健性.我们还生成了三阶段、四阶段的情景树,所生成的情景树均

具有以上性质.鉴于情景数量比较多时图形的可读性不强,在此不再展示.

图5: 由“最大相似度法”生成的分枝结构为(10,8)的两阶段对称型情景树

图6: 由“近似均匀法”生成的分枝结构为(10,8)的两阶段对称型情景树

在构建投资组合选择问题时,一般均假设有无风险资产存在.故在检测套利机会时,

我们加入了无风险资产,并令其收益率为0.14%.由于考虑了四个风险资产和无

风险资产,排除套利机会的必要条件为情景树的每个结点应至少有5个分枝.在

数值实验过程中,我们发现,当每个结点的分枝数大于等于8时,套利机会几乎

不会出现.我们提出的新方法所生成的情景都是风险资产收益曾经的实现值,这不

仅有利于套利机会的排除,同时也保留了各个资产之间的历史依赖关系.

4 结论

本文提出的“最大相似度法”和“近似均匀法”所生成的情景树,不仅能较好地拟

合随机收益的经验分布,还可恰当地预测随机收益的未来走势.这两种方法避开了

以往用复杂模型生成情景的框架,在生成情景时还考虑了当前状态的重要性,并充

分借助于相邻的历史数据,体现了资产收益之间的相关性.此外,由于所生成的情

景都是真实的历史数据,非常有利于套利机会的排除.

本文采用了2-范数来度量“相似度”,在现实应用中,投资者还可按照自己的偏

好来选择度量“相似度”的函数,如1-范数、∞-范数等等.为简便起见,本文采

用了等概率的方式生成情景,如果投资者可以确定未来收益的各阶矩的话,则可以

进一步利用“线性矩匹配”方法来确定情景发生的概率,以使所生成的情景树满足

相应的统计性质.

参考文献:

[1]Chen Z P,Consigli G,Dempster M A H,et s sequential sampling

algorithms for dynamic portfolio management[C]//New Operational Tools

for the Management of Financial Risks,Zopounidis C eds,Kluwer Academic

Publishers,Portland,1997:197-211

[2]Carino D R,Kent T,Myers D H,et Russell-Yasuda Kasai model:an

asset liability model for a Japanese insurance company using multistage

stochastic programming[J].Interfaces,1994,24(1):29-49

[3]Mulvey J M,Vladimirou stic network programming for f i

nancial planning problems[J].Management Science,1992,38(11):1642-1664

[4]G¨ulpinar N,Rusterm B,Settergren tion and optimization

approaches to scenario tree generation[J].Journal of Economic

Dynamics&Control,2004,28(7):1291-1315

[5]Heitsch H,R¨omisch io tree reduction for multistage stochastic

programs[J].Computational Management Science,2009,6(2):117-133

[6]Høyland K,Wallace S ting scenario trees for multistage

decision problems[J].Management Science,2001,47(2):295-307

[7]Ji X D,Zhu S S,Wang S Y,et al.A stochastic linear goal programming

approach to multistage portfolio management based on scenario

generation via linear programming[J].IIE Transactions,2005,37(10):957-969

[8]Xu D B,Chen Z P,Yang io tree generation approaches using K-

means and LP moment matching methods[J].Journal of Computational and

Applied Mathematics,2012,236(17):4561-4579

[9]吉小东,汪寿阳,李振涛.一种基于聚类分析的多阶段情景生成方法[J].系统工程

理论与实践,2006,26(7):11-17

Ji X D,Wang S Y,Li Z approach for multistage scenario generation

based on clustering analysis[J].Systems Engineering-

Theory&Practice,2006,26(7):11-17

[10]Klaassen t on “generating scenario trees for multistage

decision problems”[J].Management Science,2002,48(11):1512-1516

[11]Geyer A,Hanke M,Weissensteiner -arbitrage conditions,scenario

trees,and multi-asset f i nancial optimization[J].European Journal of

Operational Research,2010,206(3):609-613

[12]Harrison J M,Kreps D gales and arbitrage in multiperiod

securities markets[J].Journal of Economic Theory,1979,20(3):381-408

2024年5月9日发(作者:田金鹏)

基于历史数据集生成情景树的两种新方法∗

许道宝;张芳

【摘 要】A scenario tree is an efficient way to represent the stochastic

parameters in decision problems under uncertainty. Two new historical

data based scenario tree generation methods are proposed in this paper.

Considering the financial management background, an LP model used to

detect arbitrage opportunity is developed. It is easy to exclude the

arbitrage oppor-tunity when using two new methods to generate the

scenario tree, the generated scenario tree includes the past realistic

evolution of the historical data, and the distribution determined by the

scenario tree can properly fit the empirical distribution of asset

returns;moreover, the gen-erated scenario tree could describe the trend of

the returns of the assets, providing two efficient scenario analysis tools for

dynamic portfolio selection problems.% 情景树是描述不确定性决策问题

中随机参数的一种有效方式。本文提出了两种基于历史数据集生成情景树的新方法。

结合金融背景,给出了如何检测套利机会的线性规划模型。两种新方法在生成情景

时能够容易地规避套利机会,并且所生成的情景包含了部分历史数据真实的演化模

式,能够比较好地拟合资产收益的经验分布函数;此外,所得情景可以恰当地描述

资产收益未来的走势,为动态投资组合选择问题提供了两种有效的情景分析工具。

【期刊名称】《工程数学学报》

【年(卷),期】2013(000)003

【总页数】10页(P339-348)

【关键词】投资组合选择;情景分析;情景树;K-means;套利机会

【作 者】许道宝;张芳

【作者单位】西安交通大学数学与统计学院,西安 710049;西安交通大学数学与

统计学院,西安 710049

【正文语种】中 文

【中图分类】O221.5

1 引言

在现实生活中,人们面临着众多具有不确定性的复杂决策问题,如金融中的投资组

合选择及风险管理问题,电力生产调度问题,航线航班的制定问题等等,如何恰当

地描述该类问题中所涉及到的随机参数成为了一项重要的研究课题.在这方面,比

较有效的当属情景树方法.如果假设各阶段的随机参数只有有限个可能的取值(情

景),那么根据随机参数随时间的演化关系可得到一个树状结构,我们称之为情景

树.情景树代表了随机参数在决策期内可能的取值,情景的数量以及情景树的结构

不仅关系到决策问题的复杂性和稳健性,而且所生成的情景树的好坏直接影响着最

终决策的优劣.

目前,人们已经提出了很多生成情景树的方法.抽样法[1]是最简单也是最基本的

情景生成方法.在使用该方法时,一般需要事先确定随机收益的概率分布,或者能

够用历史数据构造出比较好的经验分布函数,然后按照相应的分布函数进行随机抽

样并将所得样本作为情景.模拟法[2]是另一种比较基本的情景生成方式,该方法

往往需要假定随机收益服从某个定量模型(如:几何布朗运动,向量自回归模型等),

然后由相应的定量模型模拟产生情景即可.为了尽可能精确地逼近随机收益的分布,

以上两种方法往往需要生成大量的情景.当情景数量过于庞大时,相应的决策问题

的规模也会变得非常巨大,这就会导致“维数灾难”,使得决策问题非常难于求解

甚至无法求解.为了控制决策问题的规模,可以借助于主成分分析[3]、聚类分析

[4]或约减技术[5]将相应的情景进一步整合与简化,得到规模相对较小的情景

树.除此之外,基于所要生成的情景树的统计性质应尽可能地接近于随机收益的统

计性质的理念,Høyland和Wallace在文献[6]中提出了一种“统计性质匹

配”(如果统计性质为各阶矩的话,则称之为“矩匹配”)的优化模型并用之来生成

情景,其实证结果表明:少量的情景数目就可使得情景树与随机收益的前四阶矩充

分的接近.但是,该框架的核心是一非线性、非凸的优化模型,求解比较困难且不

易找到全局最优解.为了克服这个缺点,文献[7]中通过预先选定情景的取值并只

将情景的概率作为优化变量,把“矩匹配”问题转化成了一个线性规划问题,但该

文献中所给模型只适用于单阶段情景树的生成.为了更容易地选择情景的取值以及

生成更一般的情景树,文献[8]提出了利用K-means选择情景代表点的方法,并将

线性“矩匹配”模型推广到了多阶段.为了充分地利用历史数据信息,文献[9]提

出了一种基于历史数据集的情景树生成方法,该方法的核心是利用K-means将历

史数据“聚合”成满足一定要求的情景树.在多阶段情景树的生成过程中,利用聚

类方法整合历史数据有个很大的缺点,那就是:随着时间的推移后面子类中的数据

会越来越少,当子类中的数据量小于所要生成的情景的数目时,聚类就变得无法进

行.

上述方法不是需要确定随机收益的分布或估计其统计性质,就是需要依赖于某个特

定的数学模型来描述随机收益.为了避开复杂的计算以及数学模型,本文借助于状

态的相似度提出两种新准则,并基于历史数据集来生成情景,所提出的两种情景生

成方法避免了K-means方法的缺陷.在金融背景下,所生成的情景不仅能够比较

好地拟合资产收益的经验分布函数,利于套利机会的排除,还可以恰当地描述资产

收益未来的走势,为动态投资组合选择问题提供了两种有效的情景分析工具.

2 情景树生成的新方法

大量实证研究表明,很多金融时间序列数据,尤其是股票收益序列经常表现出“波

动聚集”(volatility clumping)现象:随机收益在较大幅度波动后面伴随着较大幅

度的波动,在较小波动幅度后面紧接着较小幅度的波动.这说明相邻几个时刻的收

益(状态)之间存在着密切的关系,并且当前状态直接影响着下一时刻的收益值.文

献[9]提出的利用K-means方法将历史数据聚类得到下一阶段情景的方法恰恰忽略

了这一点.由于当前状态是未来收益发生的起点,我们自然会问:在历史数据集中

是否有与当前状态相同或“相类似”的点,如果有的话,这些点的下一时刻的情形

在当前状态下是否还有可能发生?这些数据能否作为下一阶段的情景呢?现实中不

乏有投资者会这么认为,如侧重于“技术分析”的投资者.下面,我们分别讨论如

何利用该思想生成单阶段和多阶段情景树.

以下假设有n个风险资产,当前可得到的历史数据有N组,将其按时间顺序排列

并存放到矩阵

中,其中第t行Rt=(Rt,1,Rt,2,···,Rt,n),t=1,2,···,N,为n个风险资产在第t个历史

时期的收益向量.不妨假设当前状态为RN,那么下一时刻的情景可取为历史数据

集中与RN相似的点的下一个时刻的数据.

2.1 单阶段情景树的生成

关于单阶段的情景生成,我们只需找出历史数据集{R1,R2,···,RN−1}中与当前状态

RN“相类似”的点,然后取这些点的下一时刻的数据作为情景即可,如图1所示.

图1:基于历史数据集生成单阶段情景树

具体地,单阶段情景树的生成方法可总结为以下步骤,不妨称之为最大相似度法.

最大相似度法:

步骤1 选取历史数据集{R1,R2,···,RN},并确定所要生成的情景的数量S;

步骤2 计算当前状态RN与历史数据的“相似度”,以2-范数为例,

上式分母上加1,是为了避免分母取值为0的情况.并将“相似度”从大到小排序

记为{di1,di2,···,diN−1};

步骤3 选取{Ri1+1,Ri2+1,···,RiS+1}作为下一阶段的情景;

步骤4 确定每个情景的概率.为简单起见,可取等概率的情况,即.

该方法完全依赖于历史数据集,避开了以往利用数学模型生成情景的框架.在历史

数据足够多的情况下,由于历史数据是以往发生的真实情景,用该方法所生成的情

景会具有更高的可信度.此外,借助于“相似度”,该方法改进了K-means和

Bootstrap方法未考虑到当前状态会对未来情景产生影响的缺点,所生成的情景树

在一定程度上体现了历史数据的某种演化关系.

上述情景生成方法的理念是已经发生的情景在相似的状态下还有可能发生.如果投

资者不这么认为的话,在该框架下我们也可考虑将更多情形下的历史数据作为情

景.例如,在上述步骤3中可以取{Ri1+1,Ri1+δ+1,···,Ri1+(S−1)δ+1}作为情景,

其中此时,我们按照与当前状态“相似度”最高到“相似度”最低的原则,从历史

数据中“近似均匀地”选取S个点,并将它们下一个时刻的数据作为情景,我们

称这种方法为近似均匀法.如果在相似的状态下,以往发生的情形还会发生,那么,

利用近似均匀法选取的情景将会比前一种方法选取的情景更为分散化.

值得注意的是,对于金融优化问题所生成的情景必须排除掉套利机会.在下一小节,

我们讨论在生成情景树时如何检测和排除套利机会.

2.2 套利机会的排除

套利是指在无需任何投入或无需承担任何风险的情况下即可获利,这是均衡市场所

不允许的.在金融优化问题中,所生成的情景必须排除掉套利机会,否则会导致优

化问题无界或导致“有偏”的最优决策[10,11].

Harrison和Kreps在文献[12]中证明了未来可能发生的状态无套利的充分必要条

件,即:存在πs≥0,s=1,2,···,S,使得方程组

成立,其中Rsi,i=1,2,···,n,s=1,2,···,S,为当前结点的子结点上的情景取值,

π=(π1,π2,···,πS)T通常被称为风险中性概率测度.上式表明,所生成的情景无套

利机会的充分必要条件为:存在风险中性概率测度,使得在该测度下所有风险资产

的期望收益相同.如果存在无风险资产,其收益为rf,则上述充要条件转化为

从上式可以看出,如果rf落在生成的情景所构成的凸包内,则不存在套利机会.

基于上述无套利机会的充分必要条件,我们可以构造如下形式的线性规划(LP)问题

来验证所生成的情景是否存在套利机会

如果z∗=0,则所生成的情景不存在套利机会;否则,则所生成的情景存在套利机

会.不难看出,LP问题(1)–(4)有可行解的必要条件是所生成的情景数量必须大于

等于决策问题中所考虑的资产的数目.

在实际应用中,我们可以先生成一棵情景树(包括前述单阶段情形),然后利用LP

问题(1)–(4)检测该情景树是否存在套利机会.如果存在套利机会,则重新调整情

景树的分枝结构,再次生成一棵新的情景树并检测是否存在套利机会,直至得到无

套利机会的情景树.另外,我们也可以在生成多阶段情景树的过程中检测套利机会:

从根结点开始,依次生成当前结点的子结点,并利用LP问题(1)–(4)检测当前结点

的子结点是否存在套利机会;如果发现套利机会,则增加当前结点的分枝数目,再

次生成其子结点;如此,直至生成整个情景树.后面的实证研究表明,只要每个结

点的分枝数目适当地大于所考虑的资产数目,我们所提出的方法能够很容易地规避

套利机会.

2.3 多阶段情景树的生成

2.1 节讨论了如何基于历史数据集生成单阶段情景树的方法.然而,在现实生活中,

大部分投资者更加关心多期决策问题.在本小节,我们将上述单阶段情景树生成方

法推广到多阶段的情形.

在实际应用中,为了更加方便地控制投资组合选择问题的结构,我们一般将情景树

设置为对称型的,即同一阶段上的结点的分枝数相同.例如,一棵T阶段的对称

型情景树的分枝结构可简记为(b1,b2,···,bT),表示该情景树在根结点处有b1个分

枝,第一阶段上的每个结点都有b2个分枝,以此类推,见图2.下面我们讨论如

何基于历史数据集生成多阶段对称型情景树.

图2: 分枝结构为(6,3,2)的3阶段对称型情景树

考虑共有T个阶段的对称型情景树生成过程.用St表示第t个阶段所要生成的情

景数量,则St=bt,t=1,2,···,T.为了便于表述,我们用S0=1表示根结点.第t阶

段的结点记为ξkt,kt=1,2,···,St.基于最大相似度法的无套利多阶段情景树生成步

骤如下:

步骤1 令t=0,kt=1;

步骤2 计算当前结点ξkt与历史数据的“相似度”,

并将“相似度”从大到小排序记为{di1,di2,···,diN−1};

步骤3 选取{Ri1+1,Ri2+1,···,Ribt+1+1}作为下一阶段的结点;

步骤4 将步骤3中的结点数据带入LP问题(1)–(4)并求解,若z∗=0,转步骤5;

否则,令bt+1=bt+1+q,St=bt,其中q为当前阶段的各个结点所增加的分枝数

目,为了控制情景树的规模,可取q=1,转步骤1;

步骤5 如果kt

否则,令kt=1,并转步骤2;

步骤6 确定每个情景的概率.特别地,可取等概率的情况,即.

该方法在根结点处生成情景时与前述单阶段情景树的生成相同.在第一阶段,由于

所有结点都是从历史数据中选出来的,故在计算其与历史数据的“相似度”时,它

们与自身的距离为0,生成下一阶段情景时,首先会选择它们下一时刻的历史数据,

后面的阶段亦是如此.这样,所生成的多阶段情景树就包含了很多真实数据随时间

的演化关系.

在上述情景树生成过程中,一旦出现套利机会,我们则统一增加相应阶段结点上的

分枝数目(步骤4),保证了所生成的情景树是对称型的.与单阶段情景树的生成类

似,在多阶段情景树的生成过程中,我们也可按照近似均匀法的思想,选取更多情

形下的历史数据作为情景.例如,在上述步骤3中可以取

{Ri1+1,Ri1+δ+1,···,Ri1+(bt+1−1)δ+1}作为情景,其中

3 实证研究

本节,我们将通过数值实验来验证所提出的两种新的情景树生成方法的优劣.我们

从深圳证券交易所任意选取了四个指数作为风险资产,它们分别为医药指数(PHA)、

金融指数(FIN)、石化指数(PET)以及金属指数(MET).交易数据取为每周的收盘数

据,时间区间为2001年7月6日至2011年3月11日,去掉中间一组全为0的

数据后,总共得到486组历史收益数据.

我们先来验证单阶段的情景生成方法.为了使得所生成的情景能与真实数据做一比

较,我们用485组历史数据生成情景,将最后一组历史数据作为样本外的数

据.首先,我们检验所生成的情景构成的累积分布与历史数据的经验分布之间的吻

合程度,图3和图4分别展示了当生成45个以及100个情景时的累积分布情

况.其中,“History”表示的是历史数据的经验分布;“Nearest”代表按照

“最大相似度法”生成的情景的累积分布;“Average”表示由“近似均匀法”所

得情景的累积分布;“K-means”表示用K-means方法将历史数据聚类所得情景

的累积分布[9].

由累积分布的图形可以看出,三种方法所生成的情景构成的分布均与历史分布的走

势相同,“近似均匀法”所生成情景的累积分布与历史分布拟合程度最高,而由

“最大相似度法”和“K-means”方法所得到的分布与历史分布的拟合程度相对

差一些.当情景数量较少时(图3),相对于K-means方法来说,“最大相似度法”

所得情景的分布与历史分布之间的误差要小一些.当情景数量增加至100时(图4),

相对于“最大相似度法”来说,K-means方法所得情景构成的分布与历史分布拟

合的更好一些.这是由于在生成情景的过程中,K-means方法用到了更多的历史

数据信息.对比图3和图4,我们还可以看出,情景数量越多,对应的累积分布与

历史分布之间的拟合程度也就越高,这是因为情景越多,历史数据信息丢失的也就

越少.

所生成的情景不仅要体现随机收益的分布情况,更重要的是,好的情景也必须能够

反映随机收益未来的走势.在当前时刻,我们不知道风险资产在下一时刻的收益取

值,为了使得当前所做的决策比较稳健,最好的方式就是用某个分布来描述未来的

收益.然而,现实中下一时刻风险资产的收益只有一种取值情况.我们可以将真实

的取值看作某个退化的分布,然后计算所生成的情景与该退化分布之间的概率分布

距离[5].表1列出了由不同情景生成方法所生成的情景与真实取值之间的概率分

布距离.

图3: 由不同方法生成的45个情景所构成的累积分布

图4: 由不同方法生成的100个情景所构成的累积分布

表1: 不同情景生成方法所生成的情景与真实收益数据之间的概率分布距离方法

S=30 S=40 S=50 S=60 S=70 S=80 S=100 Nearest 0.0571 0.0560 0.0615

0.0643 0.0662 0.0662 0.0693 Average 0.0800 0.0941 0.0932 0.0828 0.0895

0.0864 0.0829 K-means 0.0807 0.0812 0.0818 0.0819 0.0824 0.0825 0.0830

由表1中数据可以看出,在相同情景数量下,由“最大相似度法”所生成的情景

与真实数据之间的概率分布距离最小,“近似均匀法”和“K-means”方法对应

的概率分布距离相对大一些.由此可见,按照“最大相似度法”所生成的情景能更

好地近似真实的收益取值,从而,基于该方法所生成的情景所做出的决策会更接近

于真实情况.

进而,我们用“最大相似度法”和“近似均匀法”生成了多阶段情景树,图5和

图6分别展示了用这两种方法生成的分枝结构为(10,8)的两阶段情景树.图中粗线

表示的是样本外历史数据.从这两个图形不难看出,两种情景生成方法所生成的情

景树均能覆盖资产收益的真实路径,并且在每个阶段情景树均包含“较好的(涨)”

和“较差的(跌)”情景.这就保证了基于这些情景树求解相应的决策问题,所得到

的决策更具有稳健性.我们还生成了三阶段、四阶段的情景树,所生成的情景树均

具有以上性质.鉴于情景数量比较多时图形的可读性不强,在此不再展示.

图5: 由“最大相似度法”生成的分枝结构为(10,8)的两阶段对称型情景树

图6: 由“近似均匀法”生成的分枝结构为(10,8)的两阶段对称型情景树

在构建投资组合选择问题时,一般均假设有无风险资产存在.故在检测套利机会时,

我们加入了无风险资产,并令其收益率为0.14%.由于考虑了四个风险资产和无

风险资产,排除套利机会的必要条件为情景树的每个结点应至少有5个分枝.在

数值实验过程中,我们发现,当每个结点的分枝数大于等于8时,套利机会几乎

不会出现.我们提出的新方法所生成的情景都是风险资产收益曾经的实现值,这不

仅有利于套利机会的排除,同时也保留了各个资产之间的历史依赖关系.

4 结论

本文提出的“最大相似度法”和“近似均匀法”所生成的情景树,不仅能较好地拟

合随机收益的经验分布,还可恰当地预测随机收益的未来走势.这两种方法避开了

以往用复杂模型生成情景的框架,在生成情景时还考虑了当前状态的重要性,并充

分借助于相邻的历史数据,体现了资产收益之间的相关性.此外,由于所生成的情

景都是真实的历史数据,非常有利于套利机会的排除.

本文采用了2-范数来度量“相似度”,在现实应用中,投资者还可按照自己的偏

好来选择度量“相似度”的函数,如1-范数、∞-范数等等.为简便起见,本文采

用了等概率的方式生成情景,如果投资者可以确定未来收益的各阶矩的话,则可以

进一步利用“线性矩匹配”方法来确定情景发生的概率,以使所生成的情景树满足

相应的统计性质.

参考文献:

[1]Chen Z P,Consigli G,Dempster M A H,et s sequential sampling

algorithms for dynamic portfolio management[C]//New Operational Tools

for the Management of Financial Risks,Zopounidis C eds,Kluwer Academic

Publishers,Portland,1997:197-211

[2]Carino D R,Kent T,Myers D H,et Russell-Yasuda Kasai model:an

asset liability model for a Japanese insurance company using multistage

stochastic programming[J].Interfaces,1994,24(1):29-49

[3]Mulvey J M,Vladimirou stic network programming for f i

nancial planning problems[J].Management Science,1992,38(11):1642-1664

[4]G¨ulpinar N,Rusterm B,Settergren tion and optimization

approaches to scenario tree generation[J].Journal of Economic

Dynamics&Control,2004,28(7):1291-1315

[5]Heitsch H,R¨omisch io tree reduction for multistage stochastic

programs[J].Computational Management Science,2009,6(2):117-133

[6]Høyland K,Wallace S ting scenario trees for multistage

decision problems[J].Management Science,2001,47(2):295-307

[7]Ji X D,Zhu S S,Wang S Y,et al.A stochastic linear goal programming

approach to multistage portfolio management based on scenario

generation via linear programming[J].IIE Transactions,2005,37(10):957-969

[8]Xu D B,Chen Z P,Yang io tree generation approaches using K-

means and LP moment matching methods[J].Journal of Computational and

Applied Mathematics,2012,236(17):4561-4579

[9]吉小东,汪寿阳,李振涛.一种基于聚类分析的多阶段情景生成方法[J].系统工程

理论与实践,2006,26(7):11-17

Ji X D,Wang S Y,Li Z approach for multistage scenario generation

based on clustering analysis[J].Systems Engineering-

Theory&Practice,2006,26(7):11-17

[10]Klaassen t on “generating scenario trees for multistage

decision problems”[J].Management Science,2002,48(11):1512-1516

[11]Geyer A,Hanke M,Weissensteiner -arbitrage conditions,scenario

trees,and multi-asset f i nancial optimization[J].European Journal of

Operational Research,2010,206(3):609-613

[12]Harrison J M,Kreps D gales and arbitrage in multiperiod

securities markets[J].Journal of Economic Theory,1979,20(3):381-408

发布评论

评论列表 (0)

  1. 暂无评论