SVMs核技术在质量管理中深入研究

论文价格:免费 论文用途:其他 编辑:www.sblunwen.com 点击次数:141
论文字数:61600 论文编号:sb201209021316212805 日期:2012-09-04 来源:硕博论文网

SVMs核技术在质量管理中深入研究

导读:支持向量机方法的核技术的引入,对数据进行隐式映射,解决了维数灾难的问题深入研究。由本站硕士论文中心整理。

第一章前言
    支持向量机(Support Vector Machines,简称SVMs)是九十年代中期发展起来的机器学习技术,它以统计学习理论(Statistical Learning Theory或SLT)为基础,是一种新的数据挖掘方法。由十SVMs具有严密的理论基础和良好的性能,所以受到了人们的广泛关注。近年来,支持向量机在理论研究和算法实现方面都取得了很大进展,已经成为机器学习领域的研究热点。

1.1背景及意义
    目前,SVMs算法在模式识别、回归估计、概率密度函数估计等方面都有成功应用,例如:在模式识别方面,对十手写数字识别、文章分类、语音识别、语音信号数字处理及图像分类、经济预警等问题都有很好的应用,并目_其性能也比传统的数据挖掘方法好,或与之不相上下。
    作为一种通用的机器学习方法,支持向量机是统计学习理论用十解决实际问题的具体实现。其特点之一是具有严密的理论基础,这是其它机器学习所不能及的。其理论优势体现在支持向量机的本质是求解一个凸二次规划,这个求解过程有严格的理论基础,从}fn能够获得全局最优解,可以有效地克服传统优化方法无法避免的局部极值问题。它主要是针对有限样本或小样本的学习问题,采用结构风险最小化原则对经验风险和学习机的复杂度进行控制,有效地避免过学习现象的产生,能够获得比传统学习方法更优良的泛化能力。比如:人工神经网络,由十其能够以任意精度逼近非线性函数}fn被广泛的用十辨识系统中,但其固有的局部极小、过学习以及结构和类型的选择过分依赖经验等缺陷,严重降低了其应用性能和发展前景;支持向量机的结构化风险理论有效地避免了过学习,保证了全局最优解的获取。
    支持向量机方法的一个亮点是核技术的引入。核技术对数据进行隐式映射,解决了维数灾难的问题。核技术可以将实际问题进行线性或非线性映射,隐式地将其转换到高维空间,并构造线性学习机器来实现原问题的求解。其中,核函数的使用非常重要,它决定了支持向量机的性能。具有优良性质的核函数能保证学习机器具有更好的学习和泛化能力。同时,利用核函数可以巧妙地避免高维的内积运算,使得算法的复杂度与样本维数无关,有效地避免了“维数灾难”。
    虽然支持向量机的理论研究已经取得很大进展,然将其付诸十应用领域仍然需要大量的工作。在质量管理领域,因数据具有其自身的特点,所以在应用中常常带来困难,比如:数据格式不规范,如等级、标号、区间都可能是数据属性,但不是通常的实值数据,给建模带来困难;由十现实中的时间、空间以及成本的限制,通常会造成样本不足或不完整;由十质量管理中关联因素可能很多,所以数据呈现高维分布。支持向量机对小样本数据、高维数据良好的学习能力决定其在质量管理中是一种有效地方法。这也是本文选择支持向量机研究的原因之一。在质量管理应用中,期望尽量减少支持向量机的耗时,同时提高支持向量机的性能;然Ifn,由十支向量机在某些方面仍然缺乏有效地理论支持,常用的方法仍然是以时间换性能的策略。为了取得一个较好的折中,本文在核参数以及组合核函数进行了深入研究,在前人的基础上提出了一些自己的见解,并目_应用十质量管理的实践。

1.2国内夕卜研究现状
    支持向量机应用十模式识别、回归估计、概率密度函数估计等领域并取得较好效果,其主要原因是它将结构风险最小化理论和核技术有机地组合在一起,解决了机器学习问题中出现的“过学习”和“维数灾难”问题,成为非常有力的数据挖掘工具。结构化风险理论使得支持向量机具有较好的推广能力;核函数能对样本数据能进行非线性映射,使得支持向量机具有良好的学习能力。所以支持向量机成为了当前数据挖掘的研究热点,围绕它展开的研究主要包括算法、参数、核函数等的研究。

1.3小结
    支持向量机具有严密的统计学理论基础,比其它机器学习更能达到全局最优,是目前最有前景的数据挖掘方法。但是,支持向量机的研究仍然还有一些领域缺乏有效地理论指导,有待十我们继续钻研,比如核参数寻优、核的组合等。
    由十引入了核技术,支持向量机能很好的保持数据的非线性特征,同时解决了维数灾难的问题。虽然如此,在实际应用中仍然有不完备的地方,关十简单核的选择,一般是根据核的性质或个人经验进行选择,然}fn对十实际问题还无法有效地选择核函数,特别是复杂核选择,由十经验缺乏以及对核函数本身缺乏了解,更是无法选择。所以核参数的优化仍然是目前需要继续研究的问题。
    另外,关十核的构造,目前已经有许多方法,但离实际应用仍然有一定距离,并目_没有一个好的理论判定构造核的性能,只能通过大量的实验验证得知。所以本文主要对十核参数以及组合核进行了探索,努力在耗时和性能上取得一个好的折中。在质量管理的实际应用中,数据的可靠性和可用性都受到限制,本文根据数据特点探讨了支持向量机的应用方案。
    所以本论文围绕核参数寻优、核的组合进行研究,并目_安排如下:
    第一章概述了国内外支持向量机的研究现状,主要包括算法、核函数、核参数等。并对十参数研究和组合核的研究做了重点介绍。
    第二章系统阐述了支持向量机理论基础和关键技术,以及软间隔支持向量机的推导过程。利用严密的统计学理论基础,解释了支持向量机获得最优解的原因;介绍了向量机解决维数灾难问题的关键技术一一核技术。
    第二章是针对支持向量机的建模。本文分别研究了数据的降维处理与核参数优化。数据维度归约包括独立成分分析、核主成分分析等常用方法,}fn本文提出的改进核主成分分析方法,能够取得更好的维度归约效果;核参数的研究,除了介绍目前常用的几种方法,本文提出了基十核空间距离判定最优参数的方法,能够在时间和性能上取得较好效果。
    第四章是关十组合核支持向量机的研究。在实际应用中,组合核支持向量机一般表现出更为优异的性能;但是,由十组合核的组合以及参数求解都没有较为成熟的理论指导,}fn用的一些优化算法(如遗传算法)又耗时巨大,所以本文研究了组合支持向量机的建模,提出主从核逐步建模过程。
    第五章,由十质量数据有其相应特点,所以要解决质量管理应用中的二分类问题,需要对数据进行相应预处理,并针对质量管理数据特点提出整套的应用方案,根据数据缺失以及可靠程度不同对建模要求也不同。
    第六章为总结,由十个人能力和时间有限,还有许多研究没有深入,并目_存在很多研究方法的问题,仅此总结得失。

参考文献
[1]土海洋,丁i1:.支持向量机训练算法概述[fJl.科技信息,2008.9:p167,p115.
[2]门昌赛,土文剑,基于iii}包估计的核参数选择方法[[J].计算机工程与设 计,2006,(11):1961一1963.
[3]  Wu, Kuo-Ping; Wang, Sheng-De二Choosing the Kernel parameters of Support Vector Machines According to the Inter-cluster Distance[J]二Pattern Recognition,  May2009,  Vol. 42 Issue  5:710-717
[4]吴高巍,陶卿,土环.基于后验概率的支持向量机[[J].计算机研究与发展,2005,(2):196-202.
[5]张文生,土环,戴国忠.支持向量机中引入后验概率的理论和方法研究}J].计算机研究与发 展,2002,(4):392-397.
[6]张翔,肖小玲,徐光枯.基于最大嫡估计的支持向量机概率建模[J].控制与决策,2006,(7):767-770.
[7]业宁,土迪,窦立君.信息嫡与支持向量的关系[[J].广西师范大学学报(自然科学版),2006,(4):127-130.
[8]土国胜.核函数的性质及其构造方法[[J].计算机科学,2006,(6):127-130.
[9]   Wan-Jui Lee, Sergey Verzakov and Robert P. W. Duin .Kernel Combination Versus Classifier Combination[J]. Springer Berlin/Heidelberg. 2007:22-31,.
[10] Ha-Nam Nguyen, Syng-Yup Ohn, Jaehyun Park and Kyu-Sik Park . Combined Kernel Function Approach  in  SVM  for  Diagnosis  of  Cancer  [J].Springer  Berlin/Heidelberg. Volume 3610/2005.p1017-1026.
[11] Syng-Yup  Ohn,  Ha-Nam Nguyen  and  Sung-Do  Chi  .Evolutionary  Parameter  Estimation Algorithm for Combined Kernel Function in Support Vector Machine[J]. Springer Berlin Heidelberg .Volume 3309/2004:481-486.
[12] Ha-Nam Nguyen, Syng-Yup Ohn and Woo-Jin Choi .Combined Kernel Function for Support  Vector Machine and Learning Method Based on Evolutionary Algorithm[J]. Springer Berlin/ Heidelberg .Volume .3316/2004:1273一1278.
[13]荣海娜,张葛样,金炜东,系统辨识中支持向量机核函数及其参数的研究[[J].系统仿真学报,2006,(11):3204-3226.
[14] Nello Cristianini,John Shawe-Taylor,支持向量机导论[M].北京:高等教育出版社,2004:38.
[15]邓乃扬,Hi英杰.数据挖掘中的新方法:支持向量机}M].北京:科学出版社,2004.
[16]土}弓舟,伞冶.支持向量机的训练算法综述[[J] .智能系统学报,2008,(6).
[17]若虹,杨汝良.基于KFD+ICA特征提取的SAR图像目标识别.系统工程与电子技术.2008.7:1237-1240.
[ 18]邵信光,杨慧中,陈刚,基于粒子群优化算法的支持向量机参数选择及其应用[J] .控制理论与应用,2006,(5):740-744.
[ 19]杨福生,洪波,唐庆玉.独立分量分析及其在生物医学工程中的应用[J].国外医学.生物医学工程分册,2000,(3)129-135.
[20}李伟红,龚卫国,陈伟民,梁毅雄,尹克重.基于小波分析与KPCA的人脸识别方法[[J].计算机应用,2005(10):p2339-2341

摘要 4-5
Abstract 5
第一章 前言 8-13
    1.1 背景及意义 8-9
    1.2 国内外研究现状 9-11
    1.3 小结 11-13
第二章 支持向量机的理论基础 13-19
    2.1 统计学理论 13
    2.2 核方法 13-15
    2.3 支持向量机.................................. 15-18
    2.4 小结 18-19
第三章 支持向量机的应用改进 19-40
    3.1 特征提取 19-30
        3.1.1 特征提取常用方法 19-26
        3.1.2 改进KPCA 的方案 26-30
    3.2 核参数求解 30-39
        3.2.1 几种常用核 30-32
        3.2.2 几种核参数求解方法简介 32-33
        3.2.3 核参数....................................... 33-39
    3.4 小结 39-40
第四章 组合核支持向量机的改进 40-48
    4.1 组合核简介 40-42
        4.1.1 核的组合方式 40-41
        4.1.2 组合核存在的一些缺陷 41-42
    4.2 组合核支持向量机的改进 42-47
        4.2.1 改进方案 42-43
        4.2.2 建模过程及实验 43-47
    4.3 小结 47-48
第五章 支持向量机.....................................48-64
    5.1 质量管理中的数据分析 48-50
        5.1.1 数据分析的作用 48
        5.1.2 质量管理数据分析的过程 48-50
    5.2 数据预处理 50-57
        5.2.1 数据汇总简介 51-53
.................................................................

您可能有工程硕士学位论文方面的购买需求,请到工程论文硕士论文频道选取:


QQ 1429724474 电话 18964107217