« 上一篇下一篇 »

# 1172基于支持向量机的证券投资风险管理研究

西安电子科技大学
硕士学位论文
基于支持向量机的证券投资风险管理研究
姓名:胡莹
申请学位级别:硕士
专业:金融学
指导教师:王安民
20100120
摘要
捅要
风险是影响一切金融活动的基本要素。我国金融市场作为一个发展中的新兴
市场。不仅仅是信用风险,市场风险等其他风险也必将随着金融市场的发展而逐
渐加大。因此,金融风险管理方法研究对当前及未来我国金融创新以及投资机构
进行投资决策均具有重要的意义。
支持向量机(Support Vector Machine,SVM)是在统计学习理论的基础上发
展起来的一种新的机器学习方法,由于其完备的理论基础、出色的学习性能及预
测性能而得到了广泛的应用。本文研究基于支持向量机的证券风险管理方法,主
要的工作和取得的成果有:
系统总结与回顾了证券市场投资风险度量方法;介绍了基于结构风险最小化
原则的支持向量机理论与方法及SVM在经济学中的应用情况并研究了基于SVM
的证券价格预测方法。以上海证券交易所综合指数为例的实证研究表明SVM模
型能够很好的对股市波动进行建模。以华夏大盘精选基金为例的实证研究表明基
于SVM的混沌时间序列预测可以较好捕捉市场运行趋势和识别市场异常波动,
是一种优秀的风险预测与管理工具。
针对统计学框架下传统VaR计算方法的不足,发展了基于加权支持向量机
(W.SVM)的VaR计算新方法。对2001--2009年上证综指的实证研究表明,基
于W-SVM的VaR模型优于传统的VaR方法,在小样本、厚尾、非线性及有异常
波动的市场条件下,各种置信度下的W-SVM方法均能取得较好的性能。适合予
各种风险偏好投资者采用。
关键词:风险管理支持向量机在险风险值时间序列概率密度估计
Abstract
Abstract
IUsk is the basic factor that affects all financial activities.With the development
of China’S financial markets,not only credit risk,but also market risk and other risks
will gradually increase.Thus,financial risk management methods are very important to
the present and future innovation and fmancial institutions investment decisions.
Support Vector Machine(Support Vector Machine,SVM)iS based on statistical
learning theory,which is a new way for machine learning.Because of its sound
theoretical foundation,excellent learning performance and projected performance,
SVM has been widely used.In this paper,risk management method based on support
vector machine is investigated.The main work and the results achieved are:
Systematically review of stock market investment risk measurement methods;
introduced support vector machine theory and methods based on the principle of
structural risk minimization;introduced SVM application in the economics.
SVM-based prediction method of securities price is studied.Empirical studies for the
Shanghai Composite Index have shown that SVM model Can model the stock market
volatility very well.Empirical studies for the Huaxia foundation have shown that
SVM.based prediction of chaotic time series call capture the market trends and identi母
market fluctuations well and it is all excellent risk prediction and management tools.
According to the defects of the traditional VaR computation methods in the
statistics framework,a new憾model based on weighted support vector machine
(W-SVM)was investigated.The Shanghai composite index from the year 200 1 to 2009
was modeled and the simulation results indicated that the new脚method based
W.SVM is better than traditional methods.Even for small sample.abnormal
fluctuations and heavy tails in nonlinear market。W二SVM model Can obtain good
performance at different confidence intervals.And it is suitable for different investor.
Key words:risk management support vector machine value at risk time series
probability density estimation
西安电子科技大学
学位论文独创性(或创新性)声明
秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在
导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标
注和致谢中所罗列的内容以外,论文中不包含其他入已经发表或撰写过的研究成
果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的
材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中傲了明确的说
明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切的法律责任。
本人签名:窃逸
西安电子科技大学
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生
在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留
送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,
可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合
学位论文研究课题再攥写的文章一律署名单位为西安电子科技大学。
本人签名:翻篷
导师签名:筘轺止∥ 一,’一
日期趔堡:三:兰
日期型翌:主:竺
第一章绪论
第一章绪论
1.1研究背景
在现实生活中,风险无处不在。风险成了影响一切金融活动的基本要素。金
融系统的主要任务就是为了完成和实现对资金和风险进行有效分配的功能。风险
管理的发展在很大程度上依赖于从20世纪50年代起对风险管理的学术研究和70
年代衍生产品定价方面的成果。从20世纪80年代起,西方一些主要国家开始逐
渐放松了对金融体系的管制,使由政府控制的风险逐渐转移到各类金融和非金融
机构,对风险管理的需求极大地促进和推动了风险管理技术和对风险管理相关问
题的研究。
20世纪70、80年代迅速发展起来的衍生金融市场和金融工程技术,极大地
完善了市场风险管理的内容。金融产品日趋复杂化,特别是新型金融衍生产品的
不断涌现,使金融机构对风险度量的难度不断加大。金融衍生产品的使用还增加
了各国市场之问的相互依赖,需要新的风险管理防御以适应金融创新的需要。金
融衍生产品交易量的快速增长,催生了几起震惊全球金融界的大案j这些大案被
认为主要是因风险管理失控引发和导致的。1997年亚洲金融风暴还记忆犹新,lO
年后一场席卷美国、欧盟和日本等世界主要金融市场的被称之为美国次贷金融危
机爆发了。这次危机首先在美国国内爆发,然后迅速在全球蔓延,导致美、欧、
日等国家或地区许多世界著名的金融机构,如汇丰控股、巴黎银行、瑞穗集团、
花旗集团、瑞士银行、贝尔斯登、摩根大通、美林公司等一大批国际著名的金融
机构遭受巨大损失或破产。一时间从美国次贷危机引起的华尔街风暴,现在已经
演变为全球性的金融海啸。美国次贷危机的根源除了过度的金融创新外,对金融
创新的风险管理不到位也是一个关键原因。
根据BIS(m Bank for International Settlements,国际清算银行)的定义,风
险管理的过程可以划分为4个环节:风险识别、风险度量、风险评级及报告、风
险控制和管理。风险识别是根据风险的来源把风险归类到市场风险、信用风险、
操作风险和包括流动性风险、模型风险、法规风险等在内的其他风险。风险度量
是各种模型通过数据进行风险度量与分析,采用包括波动率、贝塔系数、VaR等
模型给出风险水平的度量。风险评级及报告是即时地评价、报告和监控风险。风
险控制和管理是采用一系列的商务决策,对风险限额的选择和权衡,确定可承担
的风险头寸,使用衍生工具对各类风险进行管理和控制。
随着人们对风险的日益重视,金融监管部门也加强了对金融机构承担风险的
监管。巴塞尔银行监管委员会于1996年提出了3级资本(Tier3)的概念,以弥
2 基于支持向量机的证券投资风险管理研究
补1988年资本充足率监管条例只考虑信用风险,不能合理反映市场风险的缺陷。
2003年巴塞尔银行监管委员公布了新资本协议的第3稿。新协议由3大支柱组成:
一是最低资本要求,二是监管当局对资本充足率监督检查,三是信息披露新协议。
我国通过20多年经济的快速发展,金融体制改革不断深化,特别是最近几年
开始的银行和证券交易市场的改革,且当前我国正在不断地加大金融创新的力度,
例如即将推出的融资、融券、股指期货等将使我国金融体系和证券投资机构及个
人等对风险管理的要求日益迫切。我国金融市场作为一个发展中的新兴市场,不
仅仅是信用风险,市场风险等其他风险也必将随着金融市场的发展而逐渐加大。
因此,金融风险管理方法研究对当前及未来我国金融创新以及投资机构进行投资
决策均具有重要的意义。
1.2证券投资风险管理
风险管理是人类为了自身的生存和发展而从事的最基本的活动之一。自人类
经济社会出现存贷款等金融活动以来,金融风险和金融风险管理也就成为经济和
金融体系必然的组成部分。然而,全面系统和专业化的现代金融风险管理却是最
近几十年的事情。总的来说金融风险的管理理论研究大致经历了传统的风险管理
理论、古典风险管理理论、现代风险管理理论三个发展阶段。
传统的风险管理理论主要有GAP分析法、灵敏度方法、统计分析法、情景分
析法等方法。其中最常用是灵敏度方法是利用金融资产价值对市场因子的敏感性
来测量金融资产市场风险的方法。标准的市场因子包括利率、汇率、股票指数和
商品价格等。这种方法的优点在于概念的简明和直观性,使用上的简单性;缺点
是估计的近似性,对产品类型的高度依赖性,对于复杂金融产品的难理解性等。
古典风险管理理论起源于Markowitz的均值.方差理论。他将数理统计方法引
入了资产组合选择的研究之中,把收益和风险定义为均值和方差,将风险定量化,
为金融风险的研究开辟了一条全新的思路,被喻为“华尔街的第一次革命’’,并且
40多年来一直被金融学界视为核心理论。其后发展的下方风险理论与Harlow资
产配置理论认为只有当收益率低于期望收益率时才构成风险,并用半方差来计量
下方风险。这种方法在理论上是完美的,反映了投资者的真实心理感受。Willian.
Sharpe等人针对Downside.risk方法的缺陷,开始探讨在均值一方差模型的理论框
架之下,如何使得资本市场达到均衡时,资产的价格和收益率决定的方法,并分
别独立推导出了资本资产定价模型(CAPM)。Black和Scholes于1973年发表了
基于股票标的资产的看涨期权定价模型(BS—option priang model),开创了金融衍
生产品定价理论的先河,被喻为“华尔街第二次革命”。
随着金融全球化和金融衍生工具的迅速发展,在一连串举世瞩目的衍生产品
第一章绪论3
灾难以后,金融行业需要更精确的风险度量方法和风险管理工具,能够解决不同
类型头寸的风险管理问题。各种现代风险管理技术开始不断涌现。Ⅵ瓜(V砒ue at
黜sk)也正是在这样的背景下产生的一种处理各类型资产构成的投资组合的不同
市场风险,且将各种市场因素所引起的风险整合为一维数值的风险度量方法。
1997年亚洲金融危机,世界金融业开始动荡,使人们认识到金融风险往往是
以复合形式存在,具有相互联动性。风险管理不仅是对过去的单个业务的单个风
险进行管理,而应从整个系统的角度对所有风险进行综合管理。全面风险管理就
是在这种背景下应运而生。全面风险管理在美国也是近几年才开始蒙发的,这一
管理方法还只是个设想、框架,处于初始阶段,但它必将成为大型金融机构的标
准风险管理方法。
以市场理性人假定为前提的经典投资风险管理理论核心内容是“有效市场假
说”。以此为基础发展起来的各种金融理论,包括现代资产组合理论、资本资产定
价模型、套利定价模型、期权定价模型和套期保值理论等等构成了现代金融理论
及现代投资风险管理理论的基础。但是投资风险管理不可能完全简单依赖于这些
经典经济理论与模型,它们本质上是一种抽象化的表述。发展历程也说明其在投资
中的运用经常出现曲折。因此,对传统理论的研究不能完全替代对行为金融学等
边缘学科、VaR法等风险管理技术以及衍生金融工具等新兴投资工具的研究。
1.3本文研究意义
风险度量是风险管理最基础也是最关键的技术之一。目前国际上进行投资风
险度量最有效和最常用的方法还是VaR方法。国内的研究主要集中在对VaR及其
改进方法CVaR结合中国实际进行应用研究,对于VaR值的计算方法本身的研究
相对较少。而这恰恰是VaR这类方法最关键的基础问题之一。
目前使用最为广泛的三种VaR计算方法均存在许多不足之处。蒙特卡罗模拟
法的缺点主要有两个:第一,该方法的计算量太大,造成系统成本太高。比如一
个投资组合包含1000种资产,对每种资产涉及的价格路径是1000种,那么就需
要估计一百万个资产价值。如此大的计算量没有先进的计算设备是不可能进行的。
第二,它依赖于基础风险因素的随机模型和证券的定价模型。如果这两类模型有
缺陷的话,据此估计的VaR当然就不太可靠。
以正态分布为代表的分析方法计算简单易行,但有几个致命的缺陷。首先,
它对事件风险无能为力。所谓事件风险是指发生非正常或极端情况的可能性,如
股市或汇率市场的崩溃。由于事件风险不经常发生,近期的历史数据无法充分表
达有关事件风险的信息,这也是所有使用历史数据的方法都存在的一个缺点。其
次,当存在“厚尾”现象时,以正态分布假设为基础的模型会低估VaR值。最后,
4 基于支持向量机的证券投资风险管理研究
该方法不能充分测量非线性金融工具的风险,如期权和按揭。
历史模拟法相对简单有效,但同样也存在一些缺陷:第一,它假定过去能很
好地代表未来,不能很好地预测波动性的显著变化。第二,如果投资组合的规模
较大,结构比较复杂,该方法的执行会比较困难。第三,历史数据的时间跨度长
短难以确定。如果时间跨度太短,历史数据的样本容量就会太小,从而估计误差
比较显著;反之,如果时间跨度很长,样本容量大,这样构造的分布图会过于细
致;第四,该方法对远期数据和近期数据给予同等的重视,忽视了近期数据对组
合价值影响更大的事实。但尽管如此,因为其稳健性和直观性,巴塞尔协议1993
年条款采用历史模拟法作为市场风险的基本度量方法。
可见如果能对传统的历史模拟方法进行改进,则对提高VaR技术的性能具有
重要的意义。近年来,以支持向量机(SupportVectorMachine,SVM)为代表的机
器学习理论和方法取得了重大的进展,并得到了广泛的应用。VaR值本质是一种
概率密度估计问题,利用SVM来估计VaR值是VaR风险管理技术的一次新的尝
试。本文将引入支持向量机方法来对历史数据进行建模,能够期望建立VaR值的
支持向量模型。
1.4本文的研究内容及创新点
1.4.1本文的主要研究内容
(1)证券分析投资管理技术综述。通过查阅、归纳和整理国内外关于金融风
险管理方法的相关文献,对当前主要的风险管理特别是风险度量技术进行总结。
(2)SVM的基本理论与方法研究。阐述支持向量机的理论与方法,主要探
讨LS.SVM及W-SVM两种典型支持向量的理论和算法,为发展基于SVM的证
券风险度量方法奠定理论基础。
(3)基于SVM的证券投资风险识别方法。研究基于SVM的证券价格预测
模型,将该方法用于股票价格的时间序列分析;并引入SVM改进的混沌序列分
析方法,探讨利用该模型对异常交易进行风险预警和识别。
(4)基于SVM的证券投资风险度量方法。研究W-SVM对概率密度进行估
计的方法,在此基础上提出证券投资组合的VaR模型计算新方法,并以中国沪市
为例进行实证研究。
1.4.2本文的主要创新点
本文的主要创新点在于将W-SVM方法引入证券投资风险管理技术,并建立
了一套完整的基于概率密度估计的半参数VaR动态估计方法。引入Pdskmetrie集
团发展的市场因子模型作为加权模型,从而发展了一套符合中国证券市场的
第一章绪论
SVM.VaR.模型。
1.5本文的研究框架
本文共分为六章,其研究框架见图1。l。
第一章为绪论,主要介绍本文的研究背景、研究意义及本文的主要创新点。
第二章为文献综述,主要是概述与本文相关内容的国内外研究现状,为后续
的研究奠定基础。
第三章为支持向量机理论,这是本文的主体内容之一,主要是描述支持向量
机特别是本文要用到的最小二乘支持向量机和加权支持向量机的理论与算法,为
后续研究奠定工具基础。
第四章是本文的核心内容之一。利用支持向量回归机来对证券市场的时间序
列进行分析,从而发展基于SVM的中国证券市场价格的波动模型。然后利用混
沌时间序列分析结合SVM的寻优技术,建立金融时间序列的价格波动模型,从
而对市场正常运行进行监测。当发现市场实际运行波动与SVM模型预测的价格
连续有较大差异时,即认为市场出现了异常交易,从而对市场风险进行预警。
第五章是本文最核心也是创新的章节。主要探讨如何利用W-SVM来建立一
种新的VaR值的计算方法,发展一套适合中国证券市场的建模方法,并通过沪市
的实证来验证本文所发展方法的有效性和优越性。
第六章是对本文工作的总结和展望,提出了一些可以进行进一步研究的建议。
6 基于支持向量机的证券投资风险管理研究
不足及下一步工作
图1-1本文的研究框架
第二章文献综述7
第二章文献综述
2.1投资风险管理方法国内外研究现状
风险管理是人类为了自身的生存和发展而从事的最基本的活动之~。自人类
经济社会出现存贷款等金融活动以来,金融风险和金融风险管理也就成为经济和
金融体系必然的组成部分。然而,全面、系统和专业化的现代金融风险管理却是
最近几十年的事情。总的来说金融风险的管理理论研究大致经历了四个发展阶段。
2.1.1传统的风险管理理论
风险管理在刚起步时,考虑的主要问题是什么样的风险是我们可以接受的,
什么样的风险是要避免的。有些风险我们可以承受或有能力处理;而有些风险是
必须避免的。面对不同的风险类型,应该采取的对策是什么,即在接受、转移、
对冲之间作出选择。针对以上问题,逐渐发展了各种定量方法。主要有GAP分析
法、灵敏度方法、统计分析法、情景分析法等传统风险管理理论。其中最常用灵
敏度方法是利用金融资产价值对市场因子的敏感性来测量金融资产市场风险的方
法。标准的市场因子包括利率、汇率、股票指数和商品价格等。实际中常用的灵
敏度包括:针对债券(或利率金融工具)的久期和凸性,针对股票的beta值,针
对衍生工具的Delta、Gamma、Theta、Vega、Rho值等。这种方法的优点在于概
念的简明和直观性,使用上的简单性;缺点是估计的近似性,对产品类型的高度
依赖性,对于复杂金融产品的难理解性等。
2.1.2古典风险管理理论
(1)Markowitz的均值.方差理论
.美国经济学家H.Markowitzl952年3月在《金融杂志》上发表的《资产组合
的选择》一文,可看成是现代投资学或金融经济学产生的标志。他将数理统计方
法引入了资产组合选择的研究之中,把收益和风险定义为均值和方差,将风险定
量化,为金融风险的研究开辟了一条全新的思路。在此基础上研究了证券资产的
投资组合问题,并论述了有效组合边界,即给出在一定预期收益率水平下使投资
风险达到最小化或在给定风险水平下使收益达到最高和最优投资组合计算方法,
改变了过去以常识或经验等定性的衡量风险的方法。Markowitz的这项工作被喻
为“华尔街的第一次革命",并且40多年来一直被金融学界视为核心理论。
Markowitz的均值一方差理论诞生之时起就受到众多的质疑和批评。首先,方
差计量风险有一些严格假设,它要求证券市场是有效的,每个投资者都掌握充分
的信息;每种证券的收益率都服从正态分布;投资者具有二项式的效用函数等等。
8 基于支持向量机的证券投资风险管理研究
但Fama和Turuer等人的研究表明,证券投资的收益率并不服从正态分布,同时
二项式效用函数的假设与实际不符。
(2)下方风险理论与Harlow资产配置理论
为了弥补均值.方差理论的不足,金融界、投资界的理论研究者和实际操作者
做了大量的研究和尝试。这些研究的出发点基本上是为了解决损失的真实风险感
受对投资行为的影响,以及解决方差方法的收益正态分布假设等问题。对风险度
量问题,引入风险基准或参照水平来代替方差方法中的均值,以着重考察收益分
布的左边,即损失边在风险构成中的作用,这些方法归结为Downside.Risk度量
法。这种方法认为只有当收益率低于期望收益率时才构成风险,并用半方差来计
量下方风险,这种方法在理论上是完美的,反映了投资者的真实心理感受,但它
用半方差来计量风险计算非常复杂。
(3)资本资产定价模型(CAPM)
Sharpe、Limner和Mossin等人针对Downside.risk方法的缺陷,探讨在均值
.方差模型的理论框架之下,如何使得资本市场达到均衡时资产的价格和收益率决
定的方法,并分别独立推导出了资本资产定价模型(CAPM)。CAPM模型表明,
单种资产的总风险中只有其中的系统风险对资产的预期收益有贡献,投资者不会
因资产具有的非系统风险而得到任何的预期收益。CAPM模型揭示了资本市场的
运动规律,对人们在资本市场上的投资行为具有重要的指导意义。迄今为止,西
方国家的企业财务人员,金融界以及经济学界一直将CAPM作为处理风险问题的
重要工具,将其大量运用于财务决策与风险管理等方面。但该模型认为资产收益
只与市场收益相关,这一假设条件也受到实证的挑战。
(4)期权定价理论
在金融衍生产品的风险管理方面,Black和Scholes于1973年发表了基于股
票标的资产的看涨期权的定价公式.期权定价模型(BS—option pricing model),开
创了金融衍生产品定价理论的先河。这一期权定价公式蕴涵着一个极为深刻的思
想,即期权的风险实际上在标的物的价格运动中就得到反映,而且标的物的价格
还反映了市场对未来的预期。Black和Scholer的工作被喻为“华尔街第二次革命"。
2.1.3现代的风险管理理论
(1)受险价值理论。VaR模型
随着金融全球化和金融衍生工具的迅速发展,在一连串举世瞩目的衍生产品
灾难以后,金融行业需要更精确的风险度量方法和风险管理工具,能够解决不同
类型头寸的风险管理问题。VaR正是在这样的背景下产生的一种处理各类型资产
构成的投资组合的不同市场风险,且将各种市场因素所引起的风险整合为一维数
值的风险度量方法。其中,标志着金融风险管理领域的重大突破之一就是J.P
第二章文献综述9
Morgan提出的Risk Metrics风险控制模型,它给出了估计金融机构潜在损失的基
本方法。由于VaR方法能简单清晰地表示市场风险的大小,又有严谨的概率统计
理论为依托,因而得到了国际金融界的广泛支持和认可。在短短的几年中,VaR
己成为一种最常用的风险度量技术。
(2)整体风险管理理论TRM(Tom]Risk Management)
VaR风险管理技术在风险计量上发挥着重要作用,但它也有一定的局限性,
其中最重要的是VaR基于金融资产的概率,即它对金融资产或投资组合的风险计
算方法是依过去的收益特征进行统计分析的。由于完整的风险管理包括风险识别、
测定和控制三个过程,而且对风险进行控制是金融风险管理的最终目的,这必然
要涉及到风险偏好和风险估价因素,因此只关注风险的统计特征,并不是系统的
风险管理的全部。金融风险管理的新进展即TRM系统就是在现有风险管理系统
单一变量概率(Probabilities)的基础上引进另外两个要素,即价格(Prices)和偏好
(Preferences),谋求在三要素系统中达到风险管理上的客观计量与主体偏好的均
衡。
(3)风险管理的发展趋势.全面风险管理ERM
1997年亚洲金融危机,世界金融业开始动荡,使人们认识到金融风险往往是
以复合形式存在,具有相互联动性。风险管理不仅是对过去的单个业务的单个风
险进行管理,而应从整个系统的角度对所有风险进行综合管理。全面风险管理就
是在这种背景下应运而生。ERM系统要求风险管理系统不仅仅处理市场风险或信
用风险,还要求处理各种风险,并要求包含这些风险涉及的资产与资产组合,以
及承担这些风险的各种业务单位,从业务员到机构整体,从总公司到分公司,从
本国到外国。全面风险管理在美国也是近几年才开始蒙发的,这一管理方法还只
是个设想、框架,处于初始阶段,但它必将成为大型金融机构的标准风险管理方
法。
2.2市场风险度量方法国内外研究现状
自20世纪70年代布雷顿森林体系崩溃以来,由于国际金融市场利率、汇率
波动的加剧,市场风险成为金融机构而临的重要风险。同时由于管制放松和金融
自由化的发展,以及由此而带来的金融机构混业经营的发展,传统的商业银行以
信用风险为主、投资银行以市场风险为主的差异逐渐消失。随着国际化趋势和业
务范围的深化与发展,银行等金融机构正逐步从传统的扮演资金和期限中介角色
而被要求扮演风险转移的角色。这方面的活动越来越要求金融机构应当具有非常
专业的对包括市场风险和信贷风险等风险类别进行评估及控制的能力。
随着计算技术的飞速发展和金融行业技术、市场发展的高要,风险分析与度
lO 基于支持向量机的证券投资风险管理研究
量方法从两个方面产生了突破。一是在时间方向上对不同交易期收益率序列分布
相互独立、同方差的假定放宽为异方差(Heteroskedasticity)时变参数(Time—
varying parameter)模型和随机波动率(Stochastic volatility,’SV)模型等。另一方
面是近10年来人们开始广泛应用的风险值(V甜ue.at.Risk,V水)方法。VaR方
法是根据现代金融理论,应用最新的统计分析方法和计算技术发展起来的风险分
析与度量技术。
2.2.1波动率模型
过去20多年里,文献中给出了大量针对波动率进行建模的方法。波动率模型
对期权定价、组合选择和风险管理来说都是非常重要的一个核心环节。波动率估
计模型从使用方法和模型的构建思想可以划分为4大类别【l】,主要包括使用历史
波动率进行移动平均或加权方法的模型、时变参数的GARCH系列模型、随机波
动率模型、以及通过衍生产品的内含波动率模型。对波动率模型的预测进行改进
的模型还包括使用增加样本量的高频数据模型,考虑多种资产之间关系的多元波
动率模型等。
国际上对波动率模型的研究文献相当丰富,国内也有学者在模型完善和应用
方法方面而有所建树。在国内发表的文献基本上是基于中国数据的模型实证,并
对上述的模型和方法几乎都有所涉猎。随着我国金融市场的发展,将有越来越多
的金融机构使用上述方法和模型来进行风险管理,这此模型在我国市场的适应能
力等将是我国学者需要进一步探讨的问题。
2.2.2 VaR方法
VaR方法是G30的全球衍生品研究小组于1993年开始推广、使用的风险管
理方法。随后J.P.摩根提出了Risk Metrics方法并从1994年起向公众提供计算全
球400多种资产和指数的日和月VaR值所需要的数据集。国际衍生品协会、国际
清算银行和巴塞尔银行监管委员会都推荐使用VaR系统来估价市场头寸和评价
金融风险。到目前为止,VaR方法已经成为金融机构进行风险管理的主要方法之
一,并被认为是对银行和其他金融机构的市场风险进行度量的最佳方法。VaR的
优点在于概念简单直观、计算方便且易于实施。VaR不但可对未来的情景进行估
计,而且仅用单一数字即可表征一个组合或者一家金融机构在一段时期内所面临
的市场风险【2J。
从本质上说VaR是个统计估计值,我们可以在各种统计假设之下应用多种统
计方法来得到VaR的估计。VaR方法由3个基本要素组成:相关风险因素的当前
头寸、头寸随风险因素变化的敏感性和对风险因素不利方向的预测。第一个要素
是非常明确的,VaR的不同计算方法注意来源于对第二个和第三个要素的不同处
第二章文献综述
理。虽然一个组合VaR的计算方法有许多种,但它们基本上可以划分为3类:分
析方法、历史方法和蒙特卡罗模拟法【31。
分析方法也称为参数方法,是通过假定资产的收益服从某类参数分布,用历
史数据对分布的参数进行估计而得到预期的收益分布再进行VaR的计算。历史方
法又可以细分为两类:简单历史方法和历史模拟法。简单历史方法不需要对资产
收益的分布作任何假定,它从实际的历史数据中直接寻找所要的最低收益来作为
VaR的估计。历史模拟方法就是用市场价格和比率的历史变化来构造一个组合未
来的可能损益分布,然后再从这个分布出发来估计组合的VaR。而蒙特卡罗方法
不是使用历史观测到的市场因素的变化来产生假想的未来损益,而是通过给定被
认为能恰当的刻画或近似市场因素的可能变化的变量的统计分布。
在风险管理和控制过程,不仅需要知道组合的整体风险,风险管理者还要分
析各风险因素对总风险的作用和构成。为此有研究者给出了增量风险值
(Incremental—V状)和成分风险值(Delta-VaR)来对风险因素的作用进行分析。
增量风险值刻画了资产组合中或某种风险因素发生变化时对总风险的改变量。对
增量风险比较大的资产或风险因素,对其持有量的增减将会对总风险产生比较大
的影响。成分风险值是资产组合中每种资产或风险因素对总风险贡献的比率,成
分风险值越大表明该资产或因素的作用越强。秦拯等人对VaR模型的计算方法进
行了评析,对VaR模型在金融风险管理中的应用进行了详细介绍,指出VaR模型
在金融风险管理中的应用越来越广泛,特别是随着VaR模型的不断改进,不但应
用于金融机构的市场风险、信用风险的管理,而且在流动性风险管理及金融监管
等方面有着广泛的应用【4J。
2.2.3 CV矗R方法
Al'tzner,Fritte,Giorgio等学者通过理论与实证的研究都认为一个行之有效的
风险测量方法必须满足正齐性、次可加性、单调性及过渡不变性。满足这些性质
的风险测量方法称之为一致性风险度量。Beder通过实证研究总结了VaR的两点
缺陷:其一就是VaR不能起到预警作用,即用VaR不能表示出临近的不利事件的
发生;其二就是VaR本身没有什么意义,主要表现在金融工具本身很复杂,证券
组合十分庞杂,市场概率的估计困难,计算中各种近似方法的运用与估计VaR的
统计错误会很多。Rockafellar发表文章,首次提出了满足一致性风险度量公理化
标准的条件在险价值即CVaR的风险计量技术,给出了CVaR的定义。其含义是
组合损失超过VaR的条件均值,反映超额损失的平均水平。它比VaR风险测量方
法更能体现投资组合的潜在风险。此外还描述了CVaR的性质,并给出了线性投
资组合在正态分布下的CVaR风险值的基本计算方法。CVaR模型在一定程度上
克服了VaR模型的缺点,不仅考虑了超过VaR值的频率,而且考虑了超过VaR
12 基于支持向量机的证券投资风险管理研究
值损失的条件期望,有效地改善了VaR模型在处理损失分布的厚尾现象时存在
的问题。
国内学者对CVaR的研究也可以分为两个阶段,了解学习阶段和深入研究和
具体应用阶段。了解学习阶段主要是对CVaR方法的引入,着重于对CVaR的概
念、方法的介绍⋯41。王玉玲对CVaR方法在投资组合中的应用进行了研究f5】。徐
元铖归纳了风险价值基本模型存在的局限性以及学者们对此模型进行的各种改进
州;然后从信用风险和流动性风险的角度分别介绍了国外学者对风险价值模型的
近期研究,并提出了风险价值理论进一步研究的方向17】。孟志青等人基于动态
CVaR模型研究了房地产组合投资的风险度量与控制策略【引。刘俊山对基于风险测
度理论的VaR与CVaR进行了比较研究191。
2.3支持向量机(SVM,Support Vector Machine)
2.3.1支持向量机的发展
统计学习理论和支持向量机是一套建立有限样本下机器学习的理论框架和通
用方法,既有严格的理论基础,又能较好地解决小样本、非线性、高维数和局部
最小点等实际问题,成为九十年代末机器学习领域发展最快的研究方向之一。自
从90年代初经典SVM的提出,由于其完整的理论框架和在实际应用中取得的很
多好的效果,在机器学习领域受到了广泛的重视。其理论和应用在横向和纵向上
都有了发展。支持向量机方法源于二十世纪九十年代中发展出来的有限样本下的
机器学习理论,这种内容后来形成了一个较完善的理论体系。统计学习理论
(Statistical Learning Theory,简称SLT)州。
SVM方法尚处在发展阶段,很多方面尚不完善。目前支持向量机有着几方面
的研究热点:核函数的构造和参数的选择;支持向量机从两类问题向多类问题的
推广;更多的应用领域的推广:与目前其它机器学习方法的融合;与数据预处理
方法的结合,将数据中脱离领域知识的信息,即数据本身的性质融入支持向量机
的算法中从而产生新的算法;支持向量机训练算法的探讨。
SVM在人脸检测、汽轮发电机组的故障诊断、分类、回归、聚类、时间序列
预测、系统辨识、金融工程、生物医药信号处理、数据挖掘、生物信息、文本挖
掘、自适应信号处理、剪接位点识别、数据库学习算法、手写体相似字识别、支
分形插值、惯导初始对准系统、岩爆预测、缺陷识别、计算机键盘用户身份验证、
视频字幕自动定位于提取、说话人的确认等等方面获得了广泛的应用。
2.3.2 SVM在经济学中的应用
SVM在理论上具有很突出的优势,但与其理论研究相比,应用研究相对比较
第二章文献综述
滞后。随着理论的不断完善,SVM的应用逐渐成为各国研究者的研究重点。目前,
SV】Ⅵ在模式识别、回归估计、概率密度函数估计等方面已都有应用。金融中的一
些数据,例如股价序列、企业的年度财务数据、国民经济指标的年度统计数据等,
相对而言都不是大量样本。特别是后面的两种数据的数量相对于数据的可以选取
的维数(可以达几十维、上百维)来说是小样本。当被研究的对象极为复杂,维
数高、受许多参数的影响时,是无法采用建模的方法对其进行分析的。这时,统
计分析方法是一种有效并且是唯一的分析手段。传统识别方法是基于大样本的条
件的,然而实际应用中,大多数情况都只能提供小样本。因此关于估计的一致性、
无偏性、估计方差的界等的前提条件就得不到满足。这时,应用传统识别方法就
无法取得理想的结果。
因此SVM在经济学上的应用也开始受到学者们的广泛关注【16-2s]。在国内,
应维云、覃正等将SVM用于建立客户流失预测模型【161。刘继海,陈晓剑创新的将
SVM用于信用卡申请管理及信用风险评估11171。姜明辉,袁绪川针对SVM中的人为
选择参数的随机性,提出了利用粒子群算法(PSO)进行优化的方法,构建了
PSO.SVM模型,并将其应用于商业银行的个人信用评估中【I sJ。郭雪松,孙林岩,徐晟
采用支持向量机分类的1-v.1策略建立了绿色供应商评价模型【19】。胡达沙、王坤
华提出了一种将经过改进的离散粒子群(PSO)算法和支持向量机(SVM)相结
合的算法,以选择最优的指标集并用于财务危机预警【20】。李云飞、惠晓峰基于支
持向量机建立了股票投资价值分类模型【2ll。祝金荣利用支持向量机建立了石油期
货价格预测模型122J。。
2.3.3支持向量机训练算法
SVM目前已经得到了非常成功的应用。然而,训练支持向量机需要求解一个
QP的优化问题。对于大数据的优化问题,QP的求解几乎是不可能的。为了降低
计算资源、提高算法效率、扩大应用,研究者们提出了许多SVM算法,其中比
较有代表性的方法主要有:
(1)Vaplink的分割算法
Vapnik描述了求解SVM的QP问题的一个分割方法f15】,即“Chunk"算法。
由于SVM最后的决策函数只与支持向量有关系,而与非支持向量没有关系。所
以非支持向量在计算和内存上占有了大量的资源,如果在计算的过程中只保存支
持向量,将会节省大量的计算资源。所以Chunk算法的思想就是随机的选择一
个子集,在子集上执行QP算法,只保留支持向量。然后不断加入新数据进行训
练,直到对所有样本满足KKT条件。Chunk算法大大减少了矩阵的大小,然而
Chunk仍然不能处理大规模训练问题。
(2)Platt的序列最小优化算法
14 基于支持向量机的证券投资风险管理研究
Platt提出了一个训练SVM的新方法.序列最小优化算法,即SMO
(Sequential Minimal Optimization)算法f29】。其基本思想是把一个大数据量的QP
分解为一系列的最小的QP子优化问题。SMO算法采取了一种极端的情况,即
每次只对两个拉格朗日乘子进行优化。SMO算法可以分为两个组成部分:内环
和外环。外环根据KKT优化条件,采用启发式方法从数据集中挑选出每次要优
化的数据,内环则对拉格朗日乘子进行分析求解。SMO算法解决了对于大数据
量的QP问题,其优点是针对2个样本的QP问题可以有解析解的形式,从而避
免了多样本情形下的数值解不稳定及耗时问题。同时在SMO算法中,内存的需
求与训练数据的大小呈线性关系,不需要额外矩阵存储。这样,它可以对非常大
的数据进行训练。由于在SMO中没有使用矩阵算法,其对于数值精度问题不太
敏感。SMO算法要比Chunk算法快很多倍。Smola提出了SMO回归算法,
Keerthi等人对SMO算法提出了改进,即在判别最优条件时用两个阈值代替一个
阈值,从而使算法更加合理,收敛更快130l。
(3)增量式支持向量机
对于比较大的数据集,实际的解决技巧是将问题分解为可处理的小问题来解
决。这些处理方法得到解需要多次遍历数据集。在某些情况下,样本是不断加入
的,样本的数量不确定,最典型的应用是系统的在线辨识。这种情况与SMO方
法的区别是训练样本总的个数是未知的。Cauwenberghs提出了一种增量式SVM
训练算法,即考虑增加一个训练样本或减少一个样本对拉格朗日系数和SVM的
影响,实验表明算法是有效的【3¨。增量式SVM学习方法的基本思想是先在1个
样本上对SVM进行训练,当一个新的样本加入时,对支持向量进行训练,同时
保留支持向量样本,去掉非支持向量样本。增量式的学习算法为SVM的训练提
供了新思路。
(4)PSVM算法
在PSVM中,样本被分配到数据空间中最近的两个平行平面,这种方法被
称正规化最,b--乘【32】。也可看作更广泛的正规化网络的推广。其优点是导致了非
常快速和简单的算法。最后的分类器是非线性分类器的组合,’而求解这些非线性
分类器只需求解一个简单的线性方程组。相比之下,SVM求解QP的求解过程需
要耗费大量计算时间。
2.3.4 SⅧ模型选择的研究
在SVM方法中,选择优化的SVM参数是SVM设计的非常关键而且不可
省略的步骤。这些参数决定着SVM的性能,这些参数主要有:
(1)正规化参数。正规化参数控制着最小训练误差和最小化模型复杂度的折
衷。
第二章文献综述15
(2)核参数。核参数从某种程度上定义了高维特征空间,反映了数据的先验
知识。核参数的选取过程也是模型比较的过程。
参数的调整和模型选择是SVMs研究领域的一个未决问题。目前已有多种方
法,各种方法各具特色。最简单的方法是借助设计者的经验进行手工调整。这种
方法虽然简单,但是过多的依赖于设计者的经验,缺乏理论基础,且得到的结果
缺乏可靠性。更加规则化的方法可分为三类:交叉验证和确认集的方法,基于界
的方法和统计的方法。
16 基于支持向量机的证券投资风险管理研究
第三章支持向量机理论
3.1引言
支持向量机(support vector machine,SVM)是数据挖掘中的一项新技术,借
助于最优化方法解决机器学习问题的新工具。它最初于20世纪90年代Vapnik提
出,近些年来在其理论研究和算法实现方面都取得了突破性进展,并开始成为克
服“维数灾难"和“过学习”等传统困难的有利办法。由于其完整的理论框架和
在实际应用中取得的很多好的效果,在机器学习领域受到广泛关注。支持向量机
目前主要来解决分类问题(模式识别,判别分析)和回归问题。支持向量机的最
大特点是改变了传统的经验风险最小化原则,针对结构风险最小化原则提出,因
此具有很好的泛化能力。另外,支持向量机在处理非线性问题时,首先将非线性
问题转化为高维空间中的线性问题,然后用一个核函数来代替高维空间的内积运
算,从而巧妙地解决了复杂计算问题j并且有效地克服了维数灾难以局部极小问
题。
本章首先介绍统计学习理论的核心思想以及一些基本理论成果,引入机器学
习问题和统计学习理论中的一些术语和概念。然后简要介绍结构风险最小化原则
下.用最优超平面解决回归问题的支持向量机回归方法,并给出标准学习算法的
描述。最后给出支持向量机常用的核函数定义。
3.2统计学习理论
传统统计学研究的是样本数目趋于无穷大的渐近理论,而实际问题中样本往
往有限,因此一些理论上很优秀的方法在实际应用中不尽人意。与传统统计学相
比,统计学习理论是二种专门针对小样本的机器学习理论。在这一理论基础上发
展的一种新的通用学习方法——支持向量机,最早由Cortes和Vapnik于1995年
提出。其与传统学习理论最大不同在于它服从结构风险最小而非经验风险最小,
是目前针对小样本估计和预测学习的最佳理论之一。它从理论上系统地研究了经
验风险最小化原则成立的条件、有限样本下经验风险与期望风险的关系及如何利
用这些理论找到新的学习原则和方法等问题。
3.2.1机器学习
机器学习问题就是通过某种训练手段,根据给定的训练样本集将系统的输入
输出之间的依赖关系估计出来,并且希望这一估计可以对任意给定的输入进行量
精确的输出预测。该问题可以形式化描述如下:
第三章支持向量机理论17
根据给定的,个独立同分布观测样本(而,M),(而,奶),⋯,(_,乃),其中
而∈尺“,M∈R,江1,2,⋯,,选择适当的函数集S;并选定损失函数C,在S中寻找一
个函数/似使
R(厂)=j}(x,Y,厂(x))卯(x,y) (3一1)
达到最小。其中,尸A,纠是未知具体形式的概率分布函数;f甜称为决策函数,
或假设:C 0,Y,f似)为用f(x)ES对Y进行预测而造成的损失函数。R汐称为期
望风险。在求得一个决策函数/御后,对一个新的输入x,根据厂似推出x相应的
输出Y,这称为推广。
机器学习包含了很多特殊的问题,主要的问题有三类:模式识别、回归估计
和概率密度估计。不同类型的机器学习问题有不同的损失函数。
●模式识别问题
对模式识别问题,输出Y只取两种值尸{1,0)或{1,一1),S称作指示函数集,
损失函数可定义为:
如删)=一髋篇(3乞)
其中厂@)∈S。把指示函数给出的答案与训练集实际输出不同的情况叫做分
类错误。这样,学习问题就是在概率分布函数尸O,y)未知,但是数据样本已知的
情况下,使分类错误的概率最小的函数。
●回归估计问题
在回归估计问题中,Y∈R为实数值,假设集S为实函数集合,损失函数可
定义为:
c(x,Y,/(z))=(y-fCx))2 (3·3)
·概率密度估计问题
在概率密度估计问题中,学习的目的是根据训练样本确定X的概率密度P 0)。
则损失函数可以定义为:
c(x,Y,p(x))=一logp(x) (3.4)
本文主要应用回归估计和概率密度估计方法来对证券投资风险进行度量。
3.2.2 vC维
指标函数集的VC维数就是对该函数集的复杂性或者学习能力的度量。VC
维数由以下方式确定:假如存在一个有刀个样本的样本集,能够被一个函数集中
Q的函数按照所有可能的2“种形式分为两类,则函数集能够把样本数为n的样本
集打散。指示函数集的VC维就是用这个函数集中的函数所能够打散的最大样本
集的样本数目。也就是说,如果存在h个样本的样本集能够被函数集打散,而不
18 基于支持向量机的证券投资风险管理研究
存在有h+1个样本集能被函数集打散,则函数集的VC维就是h。如果对于任意
的样本数,总能找到一个样本集能够被这个函数集打散,则函数集的VC维就是
无穷大。
VC维反映了函数集的学习能力,VC维越大则学习机器越复杂。遗憾的是目
前尚无通用的关于任意函数集VC维计算的理论,只对一些特殊的函数集推导其
VC维。比如在力维实数空间中线性分类器和线性实函数的VC维是n+l。因而,
对于给定的学习函数集,如何计算其VC维是当前统计学习理论中有待研究的一
个问题。
3.2.3结构风险最小化
在小样本情况下,传统机器学习方法中采用的经验风险最小化原则不合理,
因为我们需要同时最小化经验风险和置信范围。在模式识别中,选定了一种分类
器,就确定了学习机器的VC维。实际上,这种做法是先通过选择模型来选择置
信范围,然后固定置信范围,通过经验风险最小化求最小风险。因为缺乏对置信
范围的认识‘,这种选择往往是依赖先验知识和经验进行的,造成了神经网络等方
法对使用者“技巧’’的过分依赖。对于模式识别问题,虽然很多问题并不是线性
的,但当样本数有限时,我们用线性分类器往往能得到不错的结果,其原因就是
线性分类器的VC维比较低,有利于在样本较少的情况下得Nd,的置信范围。
我们就可以用另一种策略来解决这个问题,就是,先把函数集s=tf(x,叫,w∈
R,分为一个函数子集序列(或叫子集结构)
15;cSc—c-4c-.S (3-5)
使各个子集能够按照h的大小排列,也就是按照VC维的大小排列,即
‘磊≤%≤⋯‰≤⋯ (3—6)
同一个子集中置信范围相同;在每一个子集中寻找最小经验风险,通常它随
着子集复杂度的增加而减小。选择最小经验风险与置信范围之和最小的子集,就
可以达到期望风险的最小,这个子集中使经验风险最小的函数就是要求的最优函
数。这种方法称作结构风险最小化(Structural Risk Minimization),简称SRM原
则,如图3.1所示。其中函数集S1 c S2 c S3,VC维hl≤h2≤h3。
第三章支持向量机理论19
hi \h2 \耵
j ;
风险上界
信范围
p(f(x)-y)=(f(x)-y)2 (3-7)
形”力=|鬻裂钏㈣8,
20 基于支持向量机的证券投资风险管理研究
p(/(z)一Y)=Ii(x)-Yl
占.不敏感损失函数定义为:
彬∽叫=牌寻二型二@9,
s.不敏感损失函数给学习设定一个误差容许量g,设样本x的误差为
I(x)-y-4,当眵≤sI时不计损失,否则损失计为蚓一s。当占的值增大时,支
持向量的数目会下降,这也就影响到模型的复杂度和泛化性。我们可以根据实际
情况,通过调整占来调整模型。,
3.3支持向量机
支持向量机(Support Vector Machine简称SVM)方法是实现以上理论思想的
方法。其主要内容在九十年代中期基本形成,目前仍处在不断发展阶段。可以说,
统计学习理论之所以从20世纪90年代以来受到越来越多的重视,很大程度上是
因为它发展出了支持向量机这一通用学习方法。SVM是从线性可分情况下的最优
超平面发展起来的,它通过最大化分类间隔控制学习机器的容量,实现SRM原
则。SVM通过核函数将样本从输入空间映射到高维特征空间,并在这个特征空间
中构造最优分类超平面,实现在高维空间中的推广。SVM模型的求解最终转化成
为一个凸二次优化问题,理论上存在全局最优点,避免了局部极值问题。
3.3.1支持向量机思想
SVM实现的是如下的思想:它通过某种事先选择的非线性映射将输入向量映
射到一个高维特征空间,在这个特征空间中构造最优分类超平面。由于线性情况
下最优化的对偶问题是一个凸二次规划问题,其求解仅涉及到向量的内积运算,
因此,在特征空间中构造超平面,并不需要以显式的形式来考虑特征空间,只需
要知道这个空间中的内积运算。
SVM通过引入核函数实现高维特征空间中的内积运算。假设某一映射①把样
本从样本空间殿映射到某高维特征空间,高维特征空间中样本的内积为
(①(薯)·①(薯)),若存在某一个核函数使得下式成立:
七(t,■)=(①(一)·①(■)) (3-10)。
则可以用核函数隐式地决定非线性映射①。核函数把变换空间中的内积转化
为原空间中内积的某个函数进行计算,从而避免直接在变换空间计算。
3.3.2支持向量回归机.
支持向量机最初应用于模式识别,随着Vapnik的e不敏感损失函数的引入,
第二三章支持向量机理论
支持向量机已经扩展为解决非线性回归问题,支持向量回归机首先选择一个非线
性变换口(·)把原始空间中的数据映射到一个高维特征空间中,再在高维特征空
间中进行线性估计。假定一个训练样本集{弓,乃):l,其中输入数据和输出数据
薯∈R”,只∈R,在高维特征空间中构造最优决策函数:
f(x)=国7’①(x)+6
其中,W是权重,b为偏置项,可通过最小化等式(3.11)进行估计:
C占, 、1 fI 112 minR(C)=詈Σ£(",厂(薯))+扣|12 (3-II)
定义占.不敏感损失函数(3.9),等式(3.11)中右侧第一部分的经验风险又可通
过等式(3.9)中给出的£.不敏感损失函数进行估计,右侧每二部分为正则化置
信度,控制模型的复杂度。支持向量机结构风险最小化原则就是折衷考虑经验风
险和置信范围,使期望风险达到最小,防止过学习问题。e取值大小影响支持向
量的数目,C为正则化参数,控制对超出误差的样本的惩罚程度。
通过引入非负的松驰变量毒,并,支持向量回归机的目标函数等式(3.11)转
化为等式(3.12):
rainR(w,6):要0w82+c窆(专+等)
l"-W7’①(._)一6≤占+等(3.12)
Jt.{W 7’m(五)+6一乃s占+等
I缶≥o,等≥0
最后通过引入拉格朗日乘子,优化问题转化为对偶问题:
月(哆,茚)=Σ儡(q一彳)一占Σ(q+彳)一去ΣΣ(q一彳)(巳一巧弦(五,一)
肼臃(q卅=。臼。3’
10≤aj,茚≤C,f=1,⋯,疗
决策函数也相应地转换为:
/(x)=Σ:。(q一引K(x,xj) (3-14)
在(3—14)中,K(x,薯)是核函数,q,Ⅳ为对应的拉格朗日乘子,且满足
ai宰茚=0,仅当q≠西对应的数据样本点被定义为机器的支持向量。
3.3.3常用核函数
1.多项式核函数
多项式核函数是一种最常用的非线性映射核函数,其定义为:
丝基于支持向量机的证券投资风险管理研究
嗣墨|)=((x·√)+0d.c≥0ld=1’2.
当c>0时为非齐次多项式核,特别地,
K(x,∥)=(x·x7)d d=l,2⋯
(3.15)
c=O则编程如下齐次多项式核:
(3.16)
其中非齐次多项式核函数应用更为普遍,因为其避免了Hessian矩阵为零的
情况。
2.高斯径向基函数(Gaussian Radial Basis Function)
‰)=唧f-学1 浯㈣
3.傅立叶核函数
常用的傅立叶核有两种,他们都是由一维傅立叶核生成。第一种傅立叶核所
对应的一维傅立叶核为:
K(砒’)2下面l-面q2硼,坛,,∈R (3-18)
其中q是满足0<q<1的常数。
第二种傅立叶核对应的一维傅立叶核为:
K(琊’)=蠢(3-19)
其中T为常数。根据两种不同的一维傅立叶核可以构造出,z维傅立叶核,他们都
是傅立叶核的乘积。若计X--{【x i⋯【xL}T,x’={Ⅳ】,⋯[x1}r,则,z维傅立
叶核为:
K(毛∥)=兀K(M,[一】,) (3—20)
l
4.Sigmoid核函数
Sigmoid核函数是一种特殊的半正定核函数:
q五√)=tar叫乙(z-一)一刁,“>0I厂<o (3.21)
除了以上一些常用核函数以外,有时候还用到召样条核函数和张量积核函数。
3.3.4模型参数的影响与优化
核函数的选择是支持向量机理论研究的一个核心问题,而模型选择主要还是
集中在模型参数的选择上。众所周知,SVM回归问题的推广性能取决于一组好的
参数,如正则化参数C、不敏感参数£以及RBF核参数y等。
(1)参数C的影响
正则化参数.C能够使模型的复杂度和训练误差之间取一个折中,以便使模型
第三章支持向量机理论23
有较好的推广能力,不同数据的子空间中最优的C值不同。在确定的数据子空间
中,参数C取得太小,则对样本数据中超出e不敏感带的样本惩罚就越小,使训
练误差变大,系统的泛化能力变差,出现“欠学习”现象;C取得太大,相应地l/2l圳:
的权重就小,系统的泛化能力变差,出现“过学习’’.现象。在每个数据子空间寻
找一个合适的C值,才能使得SVM推广性能最好。
(2)参数£的影响
不敏感参数F控制着8不敏感带的宽度,影响着支持向量的数目。f值选得
太小,回归估计精度高,但支持向量数增多。£值选得太大,回归估计精度降低
支持向量数减少,支持向量机的稀疏性大。因此,在标准支持向量机中,参数和
C通过不同的方式控制着模型的复杂度。
(3)参数t7的影响
核参数t7反映了训练样本数据的分布或范围特性,它确定了局部邻域的宽
度。较大的口意味较低的方差(在更多的观测值上取平均)。因此,支持向量机优
良的推广性能能否实现,同模型中参数C、F、口等有很大的关系。对于应用者
来说,主要问题是如何根据训练样本集选择合适的模型参数,以保证建立好的模
型有很好的推广性能,成为设计支持向量回归机的关键一步。在固定的核函数情
况下,模型参数的调整与确定成为支持向量回归机设计的关键一环。模型参数调
整方法包括经验方法和理论方法等方面。肛折交叉验证方法是最普遍应用的参数
调整方法之一,它在计算代价和可靠的参数估计之间提供了最好的折中方案。
3.4支持向量机的训练算法
3。4.1 SⅧ的训练问题
尽管支持向量机因其结构简单、推广能力好等优点而得到广泛的研究和应用,
但也存在着很多问题和困难。一方面,支持向量机理论和算法中还存在大量继续
研究的问题,如实际问题中对于核函数的选择和构造缺乏理论指导,以及针对实
际问题的不同而产生各种变形算法;另一方面,实际问题中的数据往往是海量的,
样本是多类别的,学习问题对训练速度要求较高,现有算法必须加以改进才能应
用。
Vapnik[151将支持向量机问题归结为一个二次型方程求解问题。Vapnik通过对
线性不可分的两类问题的最优分类形式提出的:即使两类无错误地分开,并使两
类的分类间隙(Margin)最大。问题的数学形式为:
24 基于支持向量机的证券投资风险管理研究
双国峨1‘(国。动+商霉t(.3-j2-22)2 ,
戤刃((缈·焉)+功≥1一善,考《qf=】’··;毛
通过求其对偶问题,归结为一个二次函数极值I'口-J题:
暇匆=酗{邑乃q州Ⅵ)
戤O≤q≤G (3.23)
Σ叫=o
分类判别函数为:
广,,, 、]
/(x)=signl lΣtziyjK(x,xj)|+b l (3.24)
L、、i=1 / J
对于这个二次规划问题,经典的解法有积极方集法、对偶方法、内点算法等。
但是当训练样本增多时,这些算法便面临着维数灾,或者由于内存的限制而导致
无法训练,无法应用SVM进行模式分类和函数估计。所以如何训练大训练集的
SVM便成为SVM实际应用的瓶颈问题。
随着对支持向量机研究的深入,许多研究人员提出了一些支持向量机的变形
算法,如C.SVM系列、V-SVM系列、R.SVM(reduced SVM)、W-SVM(weighted
SVM)和Ls.SVM(1east square SVM)等算法。这些变形算法主要是通过增加函
数项、变量或系数等方法使公式变形,产生出各种有某一方面优势或者一定应用
范围的算法。
例如,针对C.SVM算法中唯一可以调节的参数C没有直观解释,在实际应
用中很难选择合适的值的缺陷,V-SVM算法中用参数y取代C,该参数可以控制
支持向量的数目和误差,也易选择。针对C.SVM算法无法解决只要求对某一类
样本正确分类,但其它类样本信息不全的问题存在缺陷。针对C.SVM算法不适
合处理大规模问题的缺陷,R-SVM算法通过限制支持向量的选择范围来控制每次
解方程的规模,擅长处理海量数据或者支持向量多的数据。针对C—SVM算法不
能根据每含采样点数据的重要性区别对待的缺陷,W-SVM算法通过给每个样本
采用不同的惩罚系数来反映各自的重要性。LS.SVM算法主要是解决计算复杂性
问题,把C.SVM算法的二次规划问题转变成了线性方程组来求解。
3.4.2 LS—SⅧ训练算法
Suykens和Vandewalb提出的最小二乘支持向量机,优化指标采用了平方项,
只有等式约束,而没C,SVM的不等式约束,从而推出不同的一系列的等式约束,
第三章支持向量机理论25
而不是二次规划问题。
LS.SVM的最小目标函数为:
minJ=i1∞r国+yΣ《,' ’厶一‘
sI.yk l缈丁妒(%)+6 l=l-eI,k=l,⋯,N
定义Lagrange函数:
三=J一).-,'ctk{yk Ecor矽(.砭)+6]一1+气}
其中吼为拉格朗日乘子,根据KKT最优条件:
嚣=o-->(0--Σ%n妒(以),
簧一。一>国=善%M=。
罢:o一>%=y.ek
oek
vO‘L。=o-->yk Ecor呼o(%)+6]一l+气=o
对于k=l,··:Ⅳ上式消去"IV和厶得到如下线性系:
[y0忍ry+T厂一,,][三]=[?]
其中:
z=f伊(五)r咒;⋯;伊(.h)rYu],】,=【乃;⋯;蜘】
i=【1;.··;1】,e=【q;⋯;eⅣ】,口=【喁;⋯%;】
E述线性系统用最小二乘法即可解。
3.5小结
(3.25)
(3-26)
(3-27)
(3·28)
统计学习理论是专门研究有限样本情况下机器学习规律的理论,在此基础上
发展起来的支持向量机算法是一种通用的学习方法。本章首先给出经验风险最小
化学习原则,然后介绍统计学习理论的复杂性和推广能力主要结论,以及Vr维
理论和结构风险最小化原则。接着介绍了结构风险最小化原则的实现算法.支持向
量机,重点叙述支持向量机的基本原理,阐明不敏感损失函数的引入,使得支持
向量机应用到回归问题,产生了对回归的支持向量估计。最后对支持向量回归主
要核函数形式进行介绍。
2§ 基于支持向量机的证券投资风险管理研究
第四童基于SVM的证券价格预测与风险识别研究
4.1引言
金融时间序列特指各种不同金融产品的时间序列,比如汇率、基金、股票价
格等。金融时间序列是一种特殊的时间序列,它与金融市场和人类的各种经济活
动紧密相关,与其它的时间序列相比,金融时间序列具有以下特征:信噪比低、
信噪难以有效分离;具有显著的非平稳特性;丰富的潜在周期特性;样本数据少
且维数高。
时间序列预测是一种定量分析方法,它是在时间序列变量分析的基础上,运
用一定的数学方法建立预测模型,使时间趋势向外延伸,从而预测未来市场的发
展变化趋势,确定变量预测值。总的来看,目前国内外关于证券价格波动研究的
方法主要有两大类:一是传统的统计学方法,另一类就是混沌等非线性系统的理
论和方法。后者是前者的发展和补充,由于它能指出~些传统方法无法解释的“巨
涨巨落"现象的本质和有序与无序的关系。
金融市场数据的非线性、非平稳性、高信噪比和有限样本,使传统的模型受
到了各种挑战,SVM的应用逐渐成为各国研究者的研究重点,且在金融时间序列
的分析和预测方面做出大量有价值的研究。本章将研究SVM在金融时间序列分
析方面的应用,从而来对证券价格进行预测和风险监测。
4.2基于SVM的上证综指预测
4.2.1实验数据选取
以上海证券交易所综合指数日线为例,来进行基于SVM的时间序列预测。
训练样本取2005年1月至2008年8月间共700个样本,用于建立上证综指的SVM
预测模型。测试样本为2008年8月22日至2009年11月23之间共300天的上证
综指,用于评价所建立的时间序列模型能否较好的预测指数波动。
4.2.2数据预处理
预测过程要经过选取数据、设定模型参数、数据预处理、训练并求解支持向
量、代入测试集数据计算模拟值、数据后处理、计算评价指标并对结果进行分析
等过程。为了便于建立SVM模型,首先需要对训练样本时间序列数据进行特征
提取。对于训练样本,本文选取输出为上证综指下一日的收盘值,输入为当日收
盘值、5日指数移动平均、10日指数移动平均、20日指数移动平均及成交量。
此外对于一个m维的样本数据里,不同的分量的数据处在不同的数量级上,
第四章基于SVM的证券价格预测研究27
数量级大的分量对模型的影响就较大,而数量级小的分量对模型的影响就小,小
数“淹没"在了大数里而失去了意义,所选择的原始数据需要进行一定的处理,
将数据标准化。本文对所有数据均采用统计方法归一化,作为SVM的训练样本,
即:
写2再x,-丽x,f=1’2'..。,z (4_1)
其中i,√v缸x)分别为变量x的平均值核标准差。
74.2.3支持向量机模型选择
支持向量机选择高斯径向核函数(3.17式)作为核函数。模型参数中,e=O.01;
正则化系数C=100,采用第三章介绍的SVM寻优算法来建立SVM回归模型。
4.2.4预测结果分析
图4.1为SVM预测结果与实际值的比较。实线为股市实际运行结果,而虚
线为本文所建立的SVM支持向量机预测的下一日指数结果。从图中可以看出,
所建立的SVM预测模型能很好的预测上证综指,能够比较好的预测金融时间序
列的波动。
图4.1上证综指实际值与预测值的比较
嚣puIa嚣04Luou
fe丢uBLI∞
28 基于支持向量机的证券投资风险管理研究
4.2基于混沌时间序列的SVM预报模型
4.2.1引言
金融系统是一个非常复杂的大系统,对金融系统的研究大多采用基于假设的
线性化简化模型,这样很可能忽略掉了系统的本金融时间序列的混沌识别的本质
特征,且简化模型一旦放松假设,很快变成复杂的和非线性的。因此,对于非线
性和混沌的研究引起人们越来越多的兴趣。金融时间序列进行分析,是金融研究
的一个很活跃的分支。将混沌与非线性理论用于金融时间序列的分析具有非凡的
意义。
混沌应用于时间序列预测,一般认为,无论是气象还是天文、水文、医学、
金融、电力等系统,每个微观质点的运动在宏观上是随机的,但在长时闻序列观
察中则表现出一定的确定性。许多以前被看作随机信号的现象,都可以用混沌的
确定性去解释它。混沌预测方法就是在相空间中找到一个非线性模型去逼近系统
动态特性。
4.2.2基于SV/,!的混沌时间序列模型
混沌时间序列预测的基础是相空间重构理论,通过相空间重构,可以找出隐
藏在混沌吸引子中的演化规律,使现有的数据纳入某种可描述的框架之下,相空
间重构时,合适的延迟时间和嵌入维数的选取将至关重要,直接影响到模型的建
立和预测汹瑚】。
Packard等人最早提出相空间重构的方法,Takens建立了相应的数学基础。
它的基本思想是:系统中的任一分量的演化都是由与之相互作用着的其他分量所
决定的,因此,这些相关分量的信息就隐含在任一分量的发展过程中,为了重构
一个“等价"的状态空间,只需考虑一个分量,并将它在某些固定点的时间延迟
点上的测量作为新维处理,即延迟值被看成是新坐标。它们确定了某个多维状态
空间中的一点,重复这一过程并测量相对于不同时间的各延迟量,就可以产生出
许多这样的点。然后再运用其他方法来检验这些点是否存在于~个混沌吸引子上。
时间序列本身蕴涵了参与此动力系统的全部变量的有关信息,通过考察观测
到的变量分量,将它在采些固定的时间延迟点上的观测量看成新的坐标,以张成
一个多维状态空间,即重构的相空间。相指一个系统在某一时刻的状态,而嵌入
维是指能够完全包含以状态转移构成的吸引子的最小相空间维数,即吸引子在该
相空闻内没有任何交叠,或者说它只有最小的自由度。这样Ⅳ个混沌时间序列的
SVM预测模型的输入矢量可表示为
第四章基于SVM的证券价格预测研究
x(t-1)=【x(t—f),x(t一2r),⋯,x(t—mf)】
f=1,2,⋯,Ⅳ
其中x0)为混沌时间序列,f为时延宽度,通常f为不小于l的整数,m为
嵌入维数。经过学习,得到预测值为y=f(X(t一1))。
4.2.3 Henon混沌时间序列
Henon映射是一种常见的混沌时间序列。Henon映射吸引子的迭代方程由下
式给出:
J x(霓+1)=l一彳(x(Jj}))2+y(尼)
1 y(后+1)=Bx(七)
取A=I.4,B=0.3。赋初值xo=0.03,Yo=0.02,生成600组数据,其中前500
组用作训练样本,后100组作为预测样本。根据相空间重构理论,取嵌入维数为
d=3,时延f=1。经过参数寻优后得到预测误差MSE=6.9625e.004。图4.2显示
了预测值与实际预测值的对比效果。可见基于SVM的混沌时间序列能够取得很
好的预测效果。
图4-2预测值与实际值的对比
30 基于支持向量机的证券投资风险管理研究
4.3基于混沌时间序列的基金价格预测
4.3.1华夏大盘精选基金
证券类数据,由于其对投资者的重要性,对证券类数据的预测研究就从没有
中断过,现在对其分析的理论成果主要还是集中在时间序列预测分析领域内,一
些学者也使用神经网络方法对其进行时间序列的分析,但是效果总不尽如人意.
对试验所用证券类数据(本文选择的是基金)的选择,遵循以下原则:
(1)尽量选择混合类基金。
混合类基金精选在各行业中具有领先地位的大型上市公司,通过对其股票的
投资,分享公司持续高增长所带来的盈利,实现基金资产的长期增值。抗击各种
异常事件的能力较强,外界对其影响较小,受人为力量控制走向的几率较低,抗
噪能力要远强于投资品种相对单一的基金。其基金净值也更能反应出企业或是领
衔的某些板块的发展趋势。对其进行分析也更具有普遍意义。
(2)尽量选择没有特别异常波动的时间区间。
基金在募集资金、流通进行投资的过程中,总会遇到一些事件严重的影响到
它的价格,使其产生异常波动,如受到股市或者债市利好或利空消息的冲击、基
金所获利润分配时除权、分红这些事件都会引起价格的某种程度的震荡。此时,
价格不在同一水平上,且理论界仍没有很好的方法将其恢复至同一水平,将其置
入分析数据中,只会影响正常分析,因此在选择研究对象的时候要特别注意。本
文选择的基金是根据细致的财务分析和深入的上市公司调研,精选出业绩增长前
景良好且被市场相对低估的个股进行集中投资。同时考虑到我国股票市场的波动
性,基金还将在资产配置层面辅以风险管理策略,即根据对宏观经济、政策形势
和证券市场走势的综合分析,监控基金资产在股票、债券和现金上的配置比例,
以避免市场系统性风险,保证基金所承担的风险水平合理。
根据基金风险控制与绩效评估系统跟踪组合及个股、证券风险,主要包括市
场风险指标和流动性风险指标分析,选择出华夏大盘精选基金作为研究对象。本
基金在证券投资基金中属于中等风险的品种,其长期平均的预期收益和风险高于
债券基金和混合基金,低于成长型股票基金。并且此基金自2004年8月11日成
立以来,到2009年年底,累计净值已超过10元,成为中国基金行业最牛基金。
本文选择该基金作为研究对象。训练样本为2004年9月到2008年5月间的800
个数据,测试样本为2008.6.2009.6月间的180个日线数据。输入为当日收盘价,
输出为下一日收盘价。
第四章基于SVM的证券价格预测研究
4.3.2预测结果分析
仍然取嵌入维数为d=3,时延f=l,支持向量机模型同4.2节。图4.3为预
测值与实际值的比较。从图中可以看出,在20.40数据点间预测效果不太好。这
期间正对应2008年6—7月间13连阴的大盘动荡,类似于2007年5月30日后几
天的极端市场行情。市场恐慌情绪导致大盘选择向下直到1665.93的近两年最低
点。对于这种市场恐慌情绪造成的数据异常,己不是金融时间序列所能预测的了。
但是连续多日的SVM预测值出现实际值的偏离,却可以说明市场交易出现了异
常现象。这从另一个方面给予投资者市场风险预警,仍然不失其风险预测的功能。
尽管前期数据不足已完全预测这种异常交易条件下的价格波动,但预测效果
仍然不超过8%的误差,也还比较好的捕捉到了基金价格的变动趋势。而50.180
数据点上的预测值比较准确,这对应2008年7月后的市场行情,此段期间市场比
较正常,没有太多极端行情发生。这说明混沌时间序列还是能比较快的捕捉到市
场的波动。基于SVM的混沌预测模型一方面可以较好的预测市场波动,同时也
能对异常交易进行预警。
图4-3预测值与实际值的对比
4.4小结
本章研究了基于SVM的证券价格预测。以上海证券交易所综合指数为例,
实证研究表明SVM模型能够很好的对股市波动进行建模。然后以华夏大盘精选
基金为例,采用基于SVM的混沌时间序列预测其净值波动,尽管市场存在某些
丝基于支持向量机的证券投资风险管理研究
极端行情,但该模型仍然可以较好的捕捉市场运行趋势和预测市场波动,是一种
较好的预测与风险管理工具。
第五章基于SVM的VaR计算新方法
第五章基于W-SVM的VaR计算新方法
5.1引言
现代投资组合风险管理高度依赖于定量技术来描述金融市场的行为。风险管
理者一方面通过70年代发展起来的金融衍生品进行了许多风险管理的创新;另一
方面也创立了许多用于识别和量化风险的高级风险管理模型。其中,VaR技术已
成为当今最为流行的风险管理技术。由于VaR方法能简单清晰地表示金融资产的
市场风险大小,又有比较严格系统的统计理论作为基础,因此得到了国际金融理
论和实业界的广泛认可u引。
国内外陆续提出了多种VaR计算方法。大致上可以分为参数方法(如
Delta-Gamma法、GARCH系列模型等)、非参数方法(历史模拟法、Monte Carlo
法、Bootstep区间估计等)和半参数方法(极值理论法、分位数回归模型、核估
计法等)【37J。这些方法绝大部分都是基于统计理论,需要大量的样本数据,因而
在金融市场预测时总是存在这样和那样的不足。
支持向量机(Support Vector Machine,SVM)是在统计学习理论的基础上发展
起来的一种新的学习方法。由于其完备的理论基础、出色的学习性能及预测性能,
该技术已成为机器学习界的研究热点刚J。除了回归估计和模式识别领域,SVM
在概率密度估计领域也有良好的应用前景。而VaR计算的关键正是市场因子的概
率密度估计。研究基于SVM的VaR计算方法是一种很诱人的选择。但是实际金
融时间序列通常具有较强的时效,直接采用标准的SVM方法来进行概率密度估
计效果通常都不是十分理想139J。本文将研究基于加权支持向量机(W-SVM)的一
种新的VaR建模方法,并以上证综指为对象进行实证研究。
5.2基于SVM的概率密度估计
5.2.1概率密度估计问题
所谓概率密度估计就是求解线性算子方程(5.1)解
{9(z 0pp)t靠=F(石) (5—1)
其中p(石)=11。,,xz><0。,同时必须满足如下条件:p(x)≥。,£p(x边=1。在
该线性算子方程中,分布函数F(x)未知,但通常给出了一些独立同分布样本
一,z2,⋯,z。。利用这些样本可以构造经验分布函数:
E(x)=专Σ口(X--Xi) (5-2)
34 基十支持向量机的证券投资风险管理研究
5.2.2概率密度估计的SVM方法
‘采用SVM方法进行概率密度估计,是从概率密度的定义出发,求解算子方
程的Af(t)=F(x)解。其中,算子A实行了一个从希尔伯特空间巨到希尔伯特空
间E,的一对一映射。对应未知的概率分布函数F(x)有观测值对:
((x,,F(x。),⋯,(x。,F(x。))。于是该问题可以重新描述为:在函数集
f(t,w)=Σ形①,=(w·①小)) (5-3)
中寻找目标函数,通过算子A把该函数集映射到导函数集:
FG,w)=∥●,w)=Σ雌么由,◇)=ΣW,么饵(x)=(w·①。×w·甲,G)) (5-4>
该函数集在另一个特征空间甲O)=瓴Ol⋯,纨(,),⋯)中是线性的,且
孵G)=么舛◇)。定义像空间中的生成核为:
K仁,X1)=主体G,hk) (5-5)
假设算子么使得该式右边对任意的薯和x,都收敛,则可以定义交叉核函数
为:
r(而,≠)=Σ孵(而扮(f) (5—6)
,嚣J
可见j寻找算子方程的解向量141与在像空间利用观测值
((而,F(x。),⋯,(Xn,F(x,,))寻找线性回归问题(5-4)的向量W是等价的。该回归问
题可以利用基于二次优化支持向量计算来求解。利用(5—5)式定义的核函数来求
出支持向量t,i=1,2,⋯,N和对应的系数a‘-a,得到利用支持向量回归逼近的系
数向量w:
w=Σ访?-a,声G,) (5-7)
将(5.7)式带入算子方程(5.3)得到解:
/O,口,口。):兰∽--ai)(vCx。净o)):羔(口卜口,kb∥)(5-8)
即为利用SVM所求的概率密度的估计。
5.2.3仿真实验
在这一小节,我们通过给定的已知概率密度分布函数生成150个随机样本,
狐后再利用上面介绍的SVM方法来利用这150样本来对该概率密度分布函数进
行估计。设给定的概率密度分布函数为:
贴,=击唧{_譬} ㈣9)
第五章基于SVM的VaR计算新方法35
取p=0,仃=l。
选取高斯核函数形式为:
,砾荆=丽I££唧{_嗲b叱(5-lo)
选取交叉核函数的形式为:
地'f)=去£exp卜譬卜㈣⋯
利用上节介绍的概率密度估计方法,由上面两式我们可以得到(5.9)的概率
密度估计形式为:
渺)2;胁(彬) (5-12)
【屈=口’,一q
未知变量屈通过给定的核函数利用预先给定的150个样本通过最小二乘支
持回归向量机算法可以求得。其中核函数中参数万,s分别取I和0.075。
图5-I概率密度估计比较图
图5一!为所求出的SVM估计的概率密度函数与实际分布函数的比较图。其
中实线表示支持向量机估计图,虚线表示真实正态概率密度图。从图中可看出直
接利用标准支持向量回归机所估计的概率密度不是很精确。
36 基于支持向量机的证券投资风险管理研究
5.3基于W-SW的概率密度估计
5.3.1加权支持向量机
在支持向量回归机中,如何设计参数C和£对构造回归函数十分重要,参数
F表示对回归函数在样本数据上的误差,占越小,要求回归函数在样本数据上的
误差越小,所得的回归函数估计精度越高。在标准SVM方法中,引入惩罚系数C
是对回归估计函数的误差大子£的样本数据点的惩罚,C越大表示对这些数据点
的惩罚越大。标准SVM对应的C和f都相同,也就是说对所有的样本数据点的
精度要求和偏离精度要求的惩罚均相同。
在实际应用中,如金融时间序列预测问题,越是离现在近的数据其重要性要
大于早期数据的重要性,也就是说某些重要的样本数据点要求小的训练误差,有
些样本数据点对误差的要求不是很高。所以,在优化问题描述时,对每个样本数
据点应该采用不同的惩罚系数C或采用不同的F,以得到更准确的回归估计,这
种支持向量机我们称它为加权支持向量机。
5.3.2概率密度估计的W-SVM方法
采用SVM方法进行概率密度估计,是从概率密度的定义出发,求解算子方
程的Af(t)=F(x)解。其中,算子A实现了一个从希尔伯特空间蜀到希尔伯特空
间E的一对一映射。
假设回归估计函数为:
I(x)=(CO·x)+6 (5-13)
在约束条件8矽一,k<or下最小化泛函%(/)=Q(厂),其中仃为预先定义
的常数。考虑数据对((而,F(x。)9·m J,(%,F(x。)),寻找厂(x)=Σp,X(x,xj),其中
r(x,毛)为对称正定的Mercer核。加权支持向量机通过对参数c或£加权,其优
化问题为最小化函数:
①(彩·∞)+ClΣ墨(等+纠l (5-14)
\i-I /
该问题可以转化为下列SVM的解:
, ,,, , 、
min①(∥,专,等)=吉(∥·∥)+ClΣ等+Σ专I (5_15)
-
\JIl i11 /
约束条件为:
Z一(∥·五)≤O-i+等或(矽·互)一Z≤q+毒(5-16)
其中:
第五章基于SVM的ⅥR计算新方法37
鬈=巧(石),zj(x)=£K(x,,)出’
互=(互(五),⋯,互(而)),形=(∥I,.一,∥,)
此时考虑使用对C进行加权的支持向量机:
砒西(嗽引=j1(形州+o陲等+喜当)
其约束条件为:
影一(形·Zf)≤q+等,/=l,2,⋯,,
(矽·zj)一Z≤q+专,f=l,2,⋯,,
等≥0,毒≥0, ,=1,2,⋯,, ·
(5—17)
(5—18)
求解上式的拉格朗日函数鞍点,将其转化为相应的对偶问题,式(5.18)的拉
格朗日函数为:
三(∥,毒,£;口‘,口,u,。‘ +)=三(矽·矽)\+,c一(I喜等+圭Im!磊)/ I()5·.l1y9)l
’一喜q瞳一(矽·互)+吼+辱]一喜口‘[(∥·乙)一巧+乃+等]一喜(q毒+西等)’
将(5-19)对国,点,£求偏导数后代/Ms-18)式可得其对偶问题为:
幽三春(冒一q)(《一哆)(Z·弓)+嘻(西十q){写(《一%)
约束条件为:
Σ(西一q)=o,o≤硝,%≤C, /=1,2,⋯,7
最终可得:
国=Σ(西一qk,6=乃一Σ(彳一口f)(薯·乃)+g
将(5.21)代入(5-3)即可求得概率密度函数。
5.3.2加权模型的选取
(5—20)
(5-21)
如果在在某个区间内的样本比较多,则可以预测到在这个区间上事件发生的
几率比较大,因而这些点上的概率估计的精度要相对高一些,所以增大这些样本
的C值达到提高精度的目的。不同的估计需要根据样本统计后采用合适的加权模
型,这类给出一种直观的加权模型。
对于样本一,扛l,⋯,N,考虑其领域Ⅳ(薯,万),f=l,⋯,Ⅳ,其中万为实现给定的
38 基于支持向量机的证券投资风险管理研究
一个常数。若Ⅳ(誓,万)=%,则可以简单定义e=号。由于q小于1,为了体现
回归机寻优时C值的作用,通常乘以一个大数M来加大惩罚系数。贝jj加权模型
可以选择为:
Cj:m、L,M (5.22) ‘ Ⅳ ’
5.3,3仿真实验
采用上一节仿真实验中产生的相同的随机样本,来比较基于标准的SVM方
法的概率密度估计,本节实验中同样取高斯核函数,核函数中参数o=l。而对于
加权支持向量机,取权重时取6=O.1,M=150。W-SVM估计的概率密度分布如
图5.2。
虚线仍然是正态分布函数实际值,下面误差较大的细实线为标准SVM估计
结果,较粗的实线(红色)为W-SVM的估计结果。从图5.2可以看出,W-SVM
的结果要好很多。这是因此基于加权的支持向量机概率密度估计充分利用了样本
在正态分布中间样本密集的特点,比起标准的SVM方法能更充分的利用样本所
给的信息,从而能更好的估计概率密度。这对于金融时间序歹B的预测是十分重要
的。
图5.2不同方法的概率密度估计比较图
第五章基于SVM的VaR计算新方法39
5.4.1 VaR的定义
5.4基于W-Sgld的gaR计算
VaR指在一定的概率水平(置信度)下,某一金融资产或证券组合在未来特
定的一段时间内最大可能损失。用公式可以表示为:
Prob(g—e0>vag)=1一口(5—23)
其中只为投资组合在初始时刻的价格,只为投资组合在f时刻的价格。设组
合回报的概率密度函数为f(x),组合回报的累计概率密度函数为F(x),
而,x2,⋯,z。为组合回报的r1个样本观测值。则由(5—23)式可得:
F(VaR);=lrf(x)dx:=口口((55.- 24))
从(5-24)式可知VaR可以看作置信水平口和/(石)的函数。如果能够根据已
有数据估计出f(x)的经验分布,那么通过求解(5-24)就可以得到在给定置信水
平下的VaR值。由于通常口预先给定,故求解VaR的核心在于确定资产组合回报
率的概率密度函数。不同的f(x)求解方法就构成了不同的VaR预测模型。本文将
采用上节介绍的加权支持向量机来求解/(x)。
5.4.2投资组合的gaR值计算
黼耥粹皴醐坼;lf;妒去斗哮P SVM 1拘舾巍其
中材为正态分布均值,B为正态分布的方差。①(x;“;8)为正态回报的累计概率密
度分布函数。假设通过W-SVM求得的概率密度分布函数为:
厂(x)=Σ%N(x;xj;B)(5-25)
设每种组合的权重为W=(q,⋯,叹),Σco,=1,收益率为尺=(‘,⋯,r2),则组
合收益率可表示为:,.=R7’缈=Σr;co,,其概率分布密度可以表示为:

删=k挚Ⅳ(铞功出2擎L脚Ⅳ(硼功凼2擎Ⅳ(巧峨;矿刎破(5-26)
以收益率表示相对VaR,根据置信度水平口下VaR的定义P(r—VaR‘)=口有:
l一口:芝%矽(圪坎。;∥7’xi;W71口渺)(5-27)
则未知变量VaR+可以通过各种标准优化算法得到。以上算法构成了完整的
W-SVM框架下的VaR计算方法。
基于支持向量机的证券投资风险管理研究
5.4.3加权模型
加权系数e的选择方法对预测效果起着至关重要的作用。对时间序列预测问
题来说,通常最近出现的数据要比先前的数据对预测结果影响要大,需要取较高
的权值。通过对历史数据进行加权处理,除了可以较好的计及金融时间序列的记
忆效应,还可以较好的解决VaR建模中样本区间长度选择困难的问题。对于金融
时间序列,本文选择的加权模型为【401:.
1 口I-1 G=M母;岛=等力。,f=0,1,..·,z一1;Σ19I=r (5-28)
1一/b i=0
其中M给预先给定的一个大数,例如100。五为金融市场的最优衰退因子。
衰退因子代表了给予过去预测值与最近一期实际值的分配权数。其值越小,代表
最近的观察值越能包含更多信息,衰退因子的衰减速度也越快,市场的记忆长度
会越短。因此,从某种意义上来说,衰退因子过小是一种市场效率低下的表现。
最优衰退因子可以通过专门的实证分析给出。不同国家的市场衰退因子一般在
O.95.0.98之间。美国Riskmetric集团对于单目的风险测量取统一的衰退因子0.94,
而对于月度的风险测量则取0.97。
5.5实证分析
5.5.1数据选取与预处理
选取样本数据为上海证券交易所1996年1月2日到2009年5月1日综合指
数的每日的收盘价。用对数收益率I=InP(t+1)一InP(f)对原数据进行处理,从而
得到可供VaR分析的时间序列(图5.3)。从图5.3中可以看到最近3年(06一09
年)波动相对比较剧烈,股市风险变大,而这一阶段正对应着(2005.5.9股改启
动、2007.10.17最高点、人民币升值和股权分置改革、金融危机)股权分置改革
和金融危机。将样本数据分为2001年1月--2006年1月和2006年1月到2009
年5月两个阶段,分别计算其收益分布的统计特征。从统计特征可以出上证综指
收益分布具有“尖峰厚尾"特性(图5.4、图5—5),第一个阶段稍微左偏,而第
二个阶段稍微右偏。前一个阶段样本数量多,样本波动率也对较小:而后一个阶
段样本数量少;波动率大。通过对两个统计特性差异较人的样奉进行yak的预测,
从而对W.SVM的性能进行评价。
第五章基于SVM的VaR计算新方法4l
O.住
O。10
O。08
O.06
0。04

姒O.眈
辫0,00

靛.o·02
4.04
.o.06
.o.03
-o。’O
-o.12
0 300 600 900 1200 1∞O 1800 2100 2400 2700 3000
日计数
35
30
25
籁20

15
10
5
O
图5-3 2001-2009年上综指对数增长率

ji
‘}
.⋯。.一i l‘ik.......
旬,06 -0.04 母再2 O山口O-02 O.OI O.06 O.D8
对数增长率
图5.4 01--05年频数分布
42 基于支持向量机的证券投资风险管理研究
SO
50
40
较30

20
10
O
4。01 .o,06 -000I .o,02 0.00 O冉2 g詹‘0,06 O.鑫l
对数增长率
图5-5 06—09年频数分布
5.5.2 W-SVM模型建立
W-SVM模型采用高斯径向密度核函数,核函数参数莎取10,误差控制参数占
=O.01,加权参数模型f=My中,M取100。01.06年间样本取y--0.967:06--
09年闻样本取7=O.973。采用改进的序贯二次规划方法来对W-SVM进行训练。
建立好上证指数的对数增长率概率分布的W-SVM模型后,就可以用其通过(5—23)
来进行v2lR的预测。
5.5.3基于W-SVM的vaR模型评价
(1)模型评价方法
本文采用Kuipie检验法对VaR模型进行评价。记Ⅳ为评价样本中投资组合
的损失值大于VaR的次数。基于似然比检验的思想,Kuipic给出了某一模型是否
有效的接收或拒绝的区间(表5.1)[41】。假设评价样本的个数为丁,则N/T则称
为失败率。将失败率与相应的左尾概率f进行比较,如果他们无显著差异,则表
示该模型所估计的值是有效的。如果他们相差很大?则说明所采用的模型是不适
当的,应予拒绝。同时,当Ⅳ位于拒绝域左侧时,表明VaR模型高估了风险:位
于拒绝域右侧时,表明VaR模型低估了风险。
第五章基于SVM的VaR计算新方法43
表5-1 T=250的Kuipic检验非拒绝域
左尾概率c 5% 2.5% l% O.05% 0.Ol%
非拒绝域【7,19] 【3,111 【I,6】10,4】【o,i】
(2)测试算例1
上证综指训练样本取值范围为2001年1月2日至2004年12月22日,共1188
个数据;评价样本取值范围为2004年12月23日至2005年12月30日,共250
个数据。在此取VaR.的计算日为1188天,计算评价样本第1天的VaR值,然后
将VaR的计算窗口和待考察的交易日依次后移1日可得下一日的VaR值共242
个数据。采用正态分布模型、历史模拟模型、蒙特卡罗模型和W-SVM模型分别
进行计算,其结果如表5-2。
表5-2各种VaR模型性能比较
置信度(I-c) 95% 97.5% 99% 99.5% 99,9%
VaR均值一O.03482 一nD3872 一o.04957 —0.05635 一O.06512
正态分布例外天数5 5 2 l l
失败率2.0% 2。0% O.8% 0.4% 0.4%
VaR均值--0.03556 一O.05487 一O.07694 一O.09534 一o.1041
历史分析例外天数15 2 l 1 0
失败率6.o% O.8% 0.4% 0.4% O.O%
vaR均值一O.03698 一O.04964 一O.0546I 一0.05979 一O.07255
蒙特卡罗例外天数10 5 5 4 2
失败率3.2% 2.4% 2.0% l,6% 0.8%
VaR均值一O.0313 一O.047l --0.0556 一O.0643l —O.0771
W:SVM 例外天数12 6 2 1 1
失败率5.8% 2.4% 0.8% 0.4% 0.4%
正态分布方法在95%时例外数在非拒绝域的左边,明显高估了风险,模型失
败。基于历史模拟法计算的值在左尾概率大于或等于2.5%时仍高估了风险,但其
在高置信度时表现较好。对于上证综指来说是一种比较保守的模型,不适合风险
偏好型的投资者。蒙特卡罗法在较低置信度下效果尚可,但在较高的置信度下低
估了收益率的实际损失值。特别是当置信度为99.9%时。这种低估倾向十分明显,
相较而言比较适合风险偏好型投资者。
在较高的置信度下,SVM模型估计时可能会低估市场风险,而用W-SVM估
计时也可能会轻微的高估股市的真实风险。但检验样本中实际损失超过VaR值的
比例与相应的c值比较一致,模型拟合效果较好。从模型可接受程度及失败率来
看,W-SVM模型在各种置信度情况下都能取得比较好的结果,同传统方法相比
具有较好的改进效果。
基于支持向量机的证券投资风险管理研究
(3)测试算例2
2006年1月4日到2008年4月1日为样本训练,样本数据为543个。2008
年4月2日到2009年4月13日为评价期,评价样本数据为250个。各种VaR模
型的性能测试如表5.3所示。由于这一阶段股市风险和波动幅度明显加大,且监
管层加强政策调控及国际金融环境变坏,导致异常波动和极端事件偶有发生。同
算例1的样本相比,市场变化的不确定性加剧。加上这一阶段样本数据相对较少,
正态分布和历史分析都明显低估了市场风险,且在低置信度时模型还通不过
Kuipic检验。而模特卡罗由于可以模拟出多种波动,在低置信度时相对较好,但
在高置信度依然较大低估了市场风险,特别是在99.9%置信度时通不过Kuipic检
验。
表5.3各种VaR模型性能比较
置信度(I—c) 95% 97 5% 99*/0 99.5% 99,9%
VaR均值一O.0359 一O.03778 —0.05142 一O.06013 —0.0689l
正态分布法铡夕}天数4 4 3 3 2
失败率1.6% 1.6% 1.2% 1.2% O.8%
Ⅵ峡均值一0.0368 一O.06113 —0.07983 —0.09632 一01023
历史分折法例外天数15 8 3 2 G
失败率6.0% 3.2% 1 2% 0 8% O.0%
VaR均值一0.03786 一O.05245 一O.05727 —0.06327 一007233
鼙特卡罗法侈5矫天数10 7 5 4 3
失败率4.0% 2.8% 2.0% 1.6% I.2%
VaR均值一O.0343 —0052l 一0.0591 一O.06554 一00814
W,SVM法例外天数13 6 2 2 l
失败率5.2% 2.4% O.8% 0.8% 0.4%
同算例1相比,W-SVM模型仅略微低估了市场风险,但基本上在各种置信
度下都有比较好的表现,且均通过了Kuipic检验,具备较好的鲁棒性。W-SVM
模型在较少样本依然能够保持较好的性能,这正是W.SVM相对传统统计方法的
固有优势之一。同时由于W-SVM模型对时间序列采用了加权技术,减小了样本
内涵信息的记忆长度,更加符合股市运行的实际情况,有效弥补了历史模拟法的
滞后和需要大容量样本的不足,改善了在小样本下正态分布和模特卡罗模型假设
容易失误的随I题。
5.6小结
本章研究了一种基于加权支持向量机的VaR计算新方法。采用最优市场因子
作为加权模型,能够合理的将股市的记忆效应考虑到VaR模型中。此外,加权支
持向量机能够在较少的样本下比较好的预测股市风险。对沪综指的实证研究表明,
第五章基于SVM的VaR计算新方法45
尽管存在后尾、非线性及异常大幅度波动,W-SVM模型在各种置信度下依然能
够较好的预测VaR,适合于作为各种风险偏好投资者采用的VaR模型。
基于支持向量机的证券投资风险管理研究
第六章总结与展望
6.1本文工作总结
本文研究了基于SVM的证券风险管理方法,主要的工作和成果有:
(1)系统总结与回顾了证券市场投资风险度量方法;介绍了SVM在经济学
中的应用情况。
(2)系统介绍了基于结构风险最小化原则支持向量机理论与方法,包括支持
向量回归机、核函数及支持向量机训练算法,为后续研究奠定了理论基础。
(3)研究了基于SVM的证券价格预测方法。以上海证券交易所证综合指数
为例,实证研究表明SVM模型能够很好的对股市波动进行建模。以华夏大盘基
金为例,采用基于SVM的混沌时间序列预测其净值波动,实证研究表明该模型
可以较好捕捉市场运行趋势和识别市场异常波动,是一种较好的预测与风险管理
工具。
(4)研究了一种基于加权支持向量机的VaR计算新方法。采用最优市场因子
作为加权模型,将股市的记忆效应考虑到VaR模型中。对沪综指的实证研究表明,
尽管存在厚尾、非线性及异常大幅度波动,W-SVM模型在各种置信度下依然能
够较好的预测VaR,适合于作为各种风险偏好投资者采用的VaR模型。
6.2本文工作展望
限于论文工作时间和作者研究水平,本文只是研究了证券风险管理特别是风
险度量这一部分内容。实证研究的时候仅仅以上证综指和基金为例进行研究,还
未涉及风险投资组合的管理,对CVAR也没有展开研究。因此本文还有很多工作
可以进一步开展深入的研究。具体包括:
(1)基于SVM—VaR的投资组合优化。可以进一步考虑不同投资组合下采用
SVM.VaR模型作为评价器的证券风险管理方法和优化方法。
(2)基于SVM的CVaR计算方法。本文仅研究了SVM—VaR计算方法,可以
进一步扩展研究SVM框架下的CVaR计算新方法。
(3)基于SVM的实时风险预测与预警方法。可以采用在线SVM方法来进行
超短线交易的风险管理与预警。
致谢47
致谢
本文是在西安电子科技大学经济管理学院王安民教授指导下完成的。从论文
的选题、结构设计、理论运用到具体的分析过程都倾注了王老师大量的心血。王
老师严谨的治学态度,渊博的学识,诲人不倦的高尚师德,实事求是不断创新的
学术风格,给我留下了深刻的印象,将使我在今后的学习和工作中终身受益。王
老师的精心指导和持续的鼓励,使我拥有了同困难做斗争的勇气,给予了我敢于
向未知领域探索的无穷动力;王老师在生活上给与我的关怀和帮助,使我能够专
心致志的把全部精力投身于学业当中去。如果说我能够在学业上取得一点点进步,
很大程度上都归功于王老师的教导和帮助。在此论文负梓之际,向王老师致以最
崇高的敬意。
我还要感谢西安电子科技大学经济管理学院的诸位老师们对我辛勤的培养。
特别要感谢温小霓教授、胡新副教授等学院老师精彩的讲解,他们对金融学知识
的讲述不仅丰富了我的专业知识,也拓展了我的视野。同时特别感谢苟晓军老师,
在我的学习和生活中为我提供了很多照顾和帮助。
感谢我的同窗张娟、李芹、王琼等同学,在这三年的生活中与我共同学习、
共同生活,是我学习和生活中的良师益友。还要衷心地感谢在百忙之中评阅论文、
提供意见和建议以及参加答辩的各位专家、教授!
最后,我要将我最诚挚的谢意献给勤劳朴实、善良忠厚的父母,是他们面朝
黄土背朝天流下的辛勤汗水哺育我成长的伟大而又无私的爱,才使得我能够顺利
完成我的学业。
48 基十支持向量』:J【的证券投资风险管理研究
参考文献
[1】王志诚,周春生.金融风险管理研究进展一国际文献综述[J】.管理世乔,2006(4):
158-169,
[2】严复,海党星,颜文虎.风险管理发展历程和趋势综述[J].管理现代化,2007(2):30—
33.
f3】肖志勇.VaR模型在金融风险管理中的应用【J】。生产力研究,2008,2(4):44-46.
【4】秦拯,陈收,邹建军.VaR模型的计算方法及其评析[J】.系统工程,2005,23(7):12—16.
【5】王玉玲.CVaR方法在投资组合中的应用【J].统计与决策,2008,2:71-72.
[6】6徐元铖.国外风险价值模型研究现状[J】.夕}、国经济与管理,2005,27(6):44—51.
【7】周艳菊,邱菀华,王宗润。基7:CVaR约束的多产品订货风险决策模型[J】.中国管理
科学,2006,1 4(5):62—67.
[8】孟志青,虞晓芬,蒋敏等.基于动态CVaR模型的房地产组合投资的风险度量与控
制策略田.系统工程理论与实践,2007,9:69—76.
[9】刘俊山.基于风险测度理论的Ⅵ汛与CVaRI}句比较研究[J】.数量经济技术经济研‘
究,2007,3:125.133.
【10】蒋敏,胡奇英,孟志青.基于权值的多阶段风险值证券组合问题研究【J].管理工程
、学报,2006,20(3):38-40.
[1l】刘小茂,杜红军.金融资产的Ⅵ畎和Cva黜砜险的优良估计川.中国管理科学,200
6,14(5):1—6.
[121杨磊,王明征,李文立.两种带有能力(Capacity)约束的报童风险模型最优策略田.
系统工程理论与实践,2008,5:35-42.
[13】韩国文.股票流动性风险测度模型的构建与实证分析[J】.中国管理科学,2008,16
(2):1—6.
【14】张鹏.不允许卖空情况下均值.方差和均值.Ⅵ汰投资组合比较研究fJ】.中国管理
科学,2008,16(4):30—35.
[1 5]VapnikV.The Nature of Statistieal Learning Theory[M】.NewYork Springer,
1995.
r161应缝云贾下赵幸等.qVM方溃黟茸存客户流失预测中的府用研究∽.系统T
程理论与实践,2007,8(4):105-111.
[17】刘继海,陈晓剑.SVM模型在信用卡申请管理中的创新应用【J】.哈尔滨工业大
学学报(社会科学版),2007,9(4):133-136.
【18】姜明辉,袁绪川.个人信用评估PSO—SVM模型的构建及应用【J】.管理学报,2008,5
(4):511—515. .
[19]郭雪松,孙林岩,徐晟.基于P.SVM的绿色供应商评价模型cJ】.预测,2007,26(5):
参考文献49
。7-11.
【20】胡达沙,王坤华.基于PSO和SVM的上市公司财务危机预警模型【J1.管理学报,20
07,4(5):588—592.
【21]李云飞,惠晓峰.基于支持向量机的股票投资价值分类模型研究【J】.中国软科学,
2008,1:135—140.
[22】祝金荣.基于支持向量机的石油期货价NNN[J].工业技术经济,2007,26(2):59.6
1.
[23]Renata Mansini.Conditional value at risk and related linear programming
models for portfolio optimization[J1。Annals of Operations Research,2007,152
(1):225-257.
【24】GJ Alexander,AM Baptista.A comparison of VaR and CVaR constraints Oil
portfolio selection晰th the mean-variance model【J】.Management Science
2004,50(9):1261—1273.
[25]Yongsheng Ding,Xinping Song and Yueming Zen.Forecasting financial condi.
tion of Chinese listed companies based on support vector machine[J】.Expert
Systems with Applications,2008,34(4):308 1-3089.
[26]Jae H.Min,Young—Chan Lee.Bankruptcy prediction using support vector ma
chine wim optimal choice of kernel function parameters帆.Expert Systems
谢m Applications,2005,28(4):603—614.
【27]Akiko Taked and Takafumi Kanamofi.A robust approach based on condition
al value。at—risk measure to statistical learning Problems【J】.European Journal
of Operational Research,2009,1 98(1):287—296.
【28]Michael Mainelli,Mark Yeandle.Best execution compliance:new techniques
for managing compliance risk【J】.The Journal of Risk Finance,2006,7(3):+
301-312.
【29]JohnC P.Fast Training of Support Vector Machines using Sequential Minimal
Optimization.Advances in Kemel Methods Support Vector Learning,Cambridge
MA,MIT Press,1 999:l 85—208.
[30]要沁c最hi“o.7tutprovements tO Piatt’S SMO Algorithm for SVM Classier Design.
National Uni.of Singapore,1999.
[3 1]Mitra P,Murthy C.A,Pal.S.K.Data Condenstajon in Large Databases by Incrc.
metnal Learning with Support Vector Machines[(;】.In:Proceedings of ICPR20
00,2000(2):712.715.
【3 21 L Wang,M Chang,J Feng.Citeseer Parallel and sequential support vector mach
ines for multi—label classification[J].International Joumal of Information Te.
—型墨王奎堑塑墨垫塑堡鲞塑窒璺堕筻堡竺壅
chnology,2005.
[33】Suykens J,Vadewalle J.Least Square Support Vector Machine Classifiers.Neu.
ral Proeessing Letters.1 999,9(3):293-300.
[34]Paekard NH,Crutehfield JP,Farmer JD.Geometry from a time series【J].
Physical Review LeRer.1 989,45(9):7 1 2.7 1 6.
【35]崔万照等.基于模糊模型支持向量机的混沌时间序列预测。物理学报.2005,54
(7):3009—30 1 8.
【36]乔瑞F.风险价值VaR[MI.陈跃,译.北京中信出版社,2005.
[37】龚锐,陈仲常,杨栋锐.GARCH族模型计算中国股市在险价值风险的比较研究与
评述[J】.数量经济技术经济研究,2005(7):67.8 1.
[38]Vapnik V N.统计学习理论的本质【M】.张学工译.北京:清华大学出版社,2000.
【39】张诏,张素,章琛曦,陈亚珠.基于支持向量机的概率密度估计方法【J】.系统仿真学
报,2005(1 7):2355.2357.
【40]P Morgan.Risk Metrics—Technical Document[R].Fourth Edition.New-York,
http://www.riskmetriCS.corn,1 996.
[4 1]Kupiee ETechniques for verifying the accuracy of risk measurement models
[J】.Journal of Derivatives,1995(3):73-84.
攻读硕士研究生期间发表的论文
攻读硕士研究生期间发表的论文
[1]胡莹,王安民,夏维力.华为战略变更测度:基于战略变更综合矩阵[J].经济管
理(.CSSCI),2008,30(7):93—96.
[2]胡莹,王安民.基于加权支持向量机的VaR计算新方法[J].经济数学(中文核
心),已录用。
[3]胡莹,王安民.美日基础研究成果转移政策浅析[J].中国基础科学(中文核心),
已录用。