文本描述
i
摘要
商业银行信用风险研究是金融领域一个重要研究课题。本文以
数据挖掘在商业银行信用风险管理中的应用为研究对象,采用理论研
究与实证研究相结合的研究思路。理论研究主要通过获取国内外最
新的金融风险管理、商业银行信用风险管理与数据挖掘的应用研究
成果和对相关文献欧亿·体育(中国)有限公司的整理和挖掘,形成关于金融风险管理、商
业银行信用风险与数据挖掘的应用研究的基本观点和模型,并紧密
结合实证重点研究信用违约模型。实证研究结合某行山西省分行的
信用卡系统数据,采用了量化研究和比较研究两种方式。以信用数
据为基础进行定量研究,以训练样本与预测样本、正常客户与违约
客户、四种预测模型为对比进行比较研究。
理论研究方面,本文形成了如下观点:1)金融风险是社会生活
中最集中、最具潜在破坏力的风险;金融风险不可消灭,但可控制
而且必需加以控制。2)信用风险是我国国有商业银行所面临的最重
要的风险;国外已有较为成熟的现代信用风险管理模型和工具,国
内则处在积极探索的起步阶段。3)数据挖掘技术有着广阔的应用前
景,在信用风险管理中能发挥重要的作用,但目前国内基于数据挖
掘的信用风险管理应用条件尚不成熟,但前景令人振奋。4)不同信
用违约模型与工具各有千秋,要成功应用,有待于研究的深入、坚
实的数据基础、良好的信用机制和专业化人才队伍的建设。
实证研究方面,本文对数据挖掘在信用风险中的客户违约进行
了深入的研究,取得如下成果:1)信用数据特征提取和转换阶段本
文用到主成分分析、均值检验、微软DTS,Excel等数据挖掘理论和
技术。通过对14个解释变量进行研究,经检定结果发现持卡户证件
类别、学历、工作单位类别、本行代发工资、持卡情况5个变量为
信用风险特征因素。2)对信用违约模型,本文提出采用多元判别分
析模型、Logistic回归模型、决策树模型、BP神经网络模型四种模
型分别对信用违约进行预测。比较四种方法,发现BP神经网络的预
测能力最强,决策树模型次之,Logistic回归模型的预测能力第三,
多元判别分析的预测效果最弱。3)对信用违约分析结果的评价,本电子科技大学硕士论文
文提出采用训练样本和预测样本(均含正常客户和违约客户)配对,
通过模型训练,再应用模型对预测样本进行预测,分析准确率。4)
本文是应用数据挖掘对信用风险进行分析的一个较为全面的缩影,
涵盖了数据挖掘的重要方面如:数据抽取、清洗、转换、模型化、
评价等,对信用风险的其他方面的研究有重要的借鉴意义。
最后本文总结研究成果,指出研究的不足,并提出进一步开展
研究的方向及领域。
关键字金融风险,信用风险,数据挖掘,决策树,神经网络