第3l卷第6期 西安工业大学学报 VoL 31 NO.6 2011年11月 Journal of Xi’an Technological University Nov.2011 文章编号: 1673—9965(2011)06—559—07 近似支持向量机对个人住房贷款 信用风险预测 侯剑平 ,薛强 ,徐平安 (1.西安工业大学经济管理学院,西安710032;2.建设银行陕西分行,西安710006) 摘要: 为了降低银行的放贷风险,在构建商业银行个人住房贷款信用风险评价指标基础 上,采用机器学习原理中的近似支持向量机(Proximal Support Vector Machines,PSVM)模型 对某商业银行西安市场的个人住房贷款借款人数据进行实证分析,研究中个人住房贷款借款 人的各项指标作为属性矩阵,借款人是否违约作为判别矩阵,利用260个样本的训练集获得最 优超平面,再对4O个样本的测试集进行预测,结果表明PSVM模型在预测商业银行个人住房 贷款信用风险时的正确率达到了87.5 . 关键词: PSVM模型;信用风险;住房贷款;预测 中图号:F830.49 文献标志码:A 信用风险又称违约风险,是指借款人不能依约 用welbul1分布模型、Gau采用了违约分析法、杨 按期偿还住房贷款本息而给银行带来经济损失.由 星运用Merton的模型、袁绪川利用Heckit信用评 于我国开展个人住房贷款业务的时间较短,风险管 分模型、王福林、汪湘陵、田凯、龙海明、徐平安采用 理方法尚不完善,违约风险逐渐暴露.美国次贷危 Logistic模型l_9 引、刘军丽利用决策树理论进行了 机对我国商业银行信贷资产安全敲响了警钟,个人 研究;葛虹利用BP神经网络对风险进行归类和仿 住房贷款风险一旦释放将引发多米诺骨牌效应,最 真,构造出风险预警的动态模型【6 . 终会危害实体经济安全. 杨星认为房价的波动率、LTV、无风险利率、 20世纪7O年代,国内外学者开始对个人住房 贷款期限是违约的影响因素[1。 ;金明涛认为违约 贷款信用风险进行研究,应用的模型和指标变量较 的影响因素有户籍、贷款期限、房屋单价_1。 ;袁绪 多.在个人贷款信用风险影响因素方面,Bart Lam~ 川认为住房贷款风险的主要影响因素为家庭月收 brech认为贷款额度与房产价值比(Loan to Val~ 入、贷款期限、还款收入比、月还款本金、教育程度、 ue,LTV)、工资、婚姻状况和利率对违约的影响最 房价收入比、贷款金额、住房总价、住房单价、配偶 显著[ ];Morton认为赡养人数、I TV、职业对违约 状况、工作性质、贷款价值比和住房面积_1胡;刘军 的影响最显著[2 ;Gau认为借款人过去的信用评级 丽认为违约的影响因素有身份证号、拖欠月数、婚 与职业是重要的评估指标l3 ;Kau,Keenan,Kim、 否、性别、年龄、岗位、职业、学历、房价收入比、还贷 Quercia认为LTV越高,违约的概率也越高.另外 收入比、保险情况_】 . Quercia认为违约率还受时效的影响,随时间的推 随着金融市场的不断开放,很多外资银行应用 移而下降 ㈣. 先进的数据挖掘技术建立科学的客户信用评价系 在方法与模型应用方面,Bart Lambrecht_1]利 统,以降低放贷风险.同时,我国商业银行具有利用 *收稿日期:201卜O7一ll 基金资助:国家自然科学基金(70673054);西安工业大学校长基金(XAGDXZJJO823); 陕西省普通高校哲学社会科学特色学科建设项目 作者简介:侯剑平(1971一),男,西安工业大学副教授,主要研究方向计量经济学与金融.E-mail:hjp0498@163.corn. 560 西安工业大学学报 第31卷 数据挖掘技术进行客户信用评价的可行性.在长期 的电子信息化过程中,大多数商业银行存储了大量 客户信息,能够为数据挖掘提供海量数据.数据挖 掘有助于发现个人住房贷款业务发展的趋势,揭示 已知的事实,预测未知的结果.数据挖掘的目标是 从数据库中发现隐含的、有意义的知识,主要功能 是自动预测行为和趋势.利用历史数据找出规律, 建立模型,并用此模型来预测未来数据的种类特征 等.利用某商业银行个人住房贷款客户的信用信息 数据库,通过学习所获得的分类规则可用于识别顾 客是否违约. 1近似支持向量机(PSVM) 随着机器学习领域不断发展,研究从观测数据 (f4本)出发寻找规律,利用这些规律对未来数据或 无法观测的数据进行预测是现代智能技术中的重 要方面 . 1.1支持向量机分类原理 SVM(支持向量机)分类预测最早应用于心脏 病诊断.将病人的年龄、胆固醇等指标输入,从而推 断该病人是否有病.借助支持向量机模型原理,将 该模型应用于商业银行个人信用贷款的风险预测 问题研究.该模型如图1所示. 图1 SVM模型原理 Fig.1 The principle of SVM 这是一个二维空间上的分类问题.对于平面 上的所有点,可以选择一条适当的直线 * +6— 0(其中(w・ )是W一([训]1,[删]2) 和 一([z]1, ] )的内积),把平面划分为两部分,直线两侧的 点分别属于不同的类,或者可以按下列方式推断点 32所对应的 . 一-厂(z)一sgn((w・ )+6) (1) 其中sgn(・)是符号函数 ㈤一 乏 在式(1)中也可用一般的非线性函数代替线 性函数(w・x)+b,这样可得到更灵活的划分方法. 支持向量机是在高维特征空间使用线性函数 假设空间的学习系统,是借助于最优化方法解决机 器学习问题的新工具。近年来其理论基础和算法取 得了突破性进展,成为克服“维数灾难”和“过学 习”等传统困难的有力手段.目前主要应用在文本 (超文本)分类、图像分类、生物序列分析、生物数 据挖掘、手写字符识别、静态图像中球的识别等. 假设分类的数据点是,z维实数空间中的点,可 以希望用一个 一1维的超平面(通常被称为线性 分类器)把这些点分开.如果训练样本被超平面正 确分开,并且距超平面最近的样本数据与超平面之 间的距离最大,则为最优超平面.从几何位置来看, 支持向量(Support Vectors)是指最靠近最优超平 面的向量.若训练集是线性可分的,则最大间隔法 求出的分划超平面存在唯一,且此分划超平面能将 训练集中的两类点完全正确地分开.SVM依据结 构风险最小的原则,是基于最优分类面概念提出 的,这是区别于其它分类器的地方. 设线性可分样本集为{z , },i一1,2,…, ,.72 ∈R , ∈{+1,一1)是分类标号,n维空间中线性 判别函数为g(z)一 ・ +y,分类面方程为 w一 7,其中w是分类面的法向量,),是标量. 对判别函数进行归一化后,使两类所有样本都 满足l g( )l≥1,离分类面最近的样本点l g( )l 一1,距超平面最近的样本数据与超平面之间的距 离称为间隔(Margin),这样分类间隔就等于 1r ,因此间隔最大等价于使专l lw lI 最小化・ SVM模型可以表示为求解当参数7./>0时的二次 规划为 ve'y+吉I 1w ll。 . fD(Aw—eT)+ ≥ … S. 1I ≥0 式中:A∈R ,D∈{一1,+1} ,e为单位列向 量;口 为e的转置矩阵; 为权重因子; 为松弛变 量;w为分界面的法向量; 为偏置向量.相应的分 类界面可以表示为 fl ,x w— + w—y一1 (4) 第6期 侯剑平等:近似支持向量机对个人住房贷款信用风险预测 561 当错误率 一0时,两类数据被严格的线性分 开时可以认为,所有的 —y+1是所有属于A+ 的点,同时, w— 一1是所有满足A_的点,即 fA w—y+1,for D 一1 … 【A —y一1, for D 一一1 这样可以很好的区分A_与A ,固定常数),为 相对平面的距离.两个平面之间的距离为 2/ll w ll,通常把这两个最大的距离认为是边界, 通过最大化边界来增强支持向量机的能力.由于 SVM是借助二次规划来求解支持向量,而求解二 次规划将涉及m阶矩阵的计算( 为样本的个数), 当m数目很大时该矩阵的存储和计算将耗费大量 的机器内存和运算时间,因此很多学者提出了改进 的SVM算法. 1.2 近似支持向量机(PSVM)分类原理 把支持向量机(SVM)模型中的不等式约束改 成等式约束,并把经验风险由误差的一范数改为二 范数,求解二次优化的问题就转化成求解一次线性 方程组问题,就得到了近似支持向量机模型 (PSVM),近似支持向量机在数据分类过程中的训 练速度更快,可以有效地提高数据分类器的性能. PSVM旨在通过三个平行的超平面近似地将 样本集分成两类,其余的两个超平面不再是分割的 边界,而分别是两个类的聚类中心,再使这两个平 行超平面尽可能地远离中间的超平面,从而使训练 集更好地分开.PSVM模型则转化为优化问题: min一 .(w,yI )C-R叶 —m 1厶 l lY II。+吉(厶 w+ ) S.t D(Aw一 )+Y—e (6) 要解决的是线性问题,故上式为PSVM模型的线 性方程.其中, 为权重因子, 为松弛变量,w为分 界面的法向量,y为偏置向量. 求得的拉格朗日函数(Lagrangian)为 Lc ,y, , 一号II +吉I I[ ]I I 一 (D(Aw—e1)+Y—e) (7) 根据KKT(Karush—Kuhn—Tucker)条件得出 』 一A D 一0, +P D甜一o (8) 1 wy—U一0,D(Aw—ey)+Y—e一0 式(8)整理得 』 一A D ,),一一P D r 0、 1 一旦,(D(AA + )D+ J)“一e 解之得出 为 一f +D(AA + )D1 1P (10) \ / 令H一[A,一e],则 一( +HH )P (11) 从而得到线性分类器为 _厂(z)一懈+y—sgn((ax+e)Du)(12) 由于式(11)的系数是正定的,故可采用直接 求逆法,正定型可以保证所求解是全局最优的,且 是唯一的.当样本的数量远大于样本的维数时( 》 ),可采用SMW矩阵求逆公式降低求逆矩阵 的维数,大大减少计算复杂度,得到 一 (,一H(吾+H H)H )e(13) 图2为PSVM分类机的分类图示.聚类中心为 ・¨,一Y一1 W—Y一一1 分类距离为 啪 m一舸 分类向x ‘7 0 图2 近似支持向量机分类原理 Fig.2 The classify principles of P—SVM 为了求得最优超平面,近似支持向量机 (PSVM)模型的建立需要将样本数据分为训练集 和测试集,整个建模过程采用优化的思想,通过训 练集求得最优超平面.PSVM模型需要构造拉格朗 日函数进行求解,最终将模型参数的求解转化为求 拉格朗日系数“ ’’的逆矩阵“El”.式(11)满足正定 性要求,所以求到的解是全局唯一的最优解,保证 了分类间隔的最大化. 2模型检验 在应用PSVM模型预测个人住房贷款信用风 险时,首先要构建影响个人住房贷款违约因素的属 562 西安工业大学学报 第31卷 性矩阵A与判别矩阵D. 2.1属性指标体系选取 商业银行个人住房贷款信用风险评估问题可 以视为一系列的分类问题.根据已有文献研究结 果,本文从借款人特征维度、贷款特征维度、房屋特 征维度和区域特征维度对个人住房贷款信用风险 进行定性赋权与评价,共选取了17个指标构建个 人住房贷款信用风险的属性指标见表1. 表1个人住房贷款信用风险指标评价体系 Tab.1 Personal housing loan credit risk evaluation index system 维度 变量代码变量名称 量化方法 表1中部分指标是商业银行现有数据,如借款 人特征维度数据;部分指标通过计算得到,如贷款 成数为贷款额度与房产价值的比例;还有一些相关 的宏观经济指标,如房价指数,根据变量的属性进 行量化,确保指标体系的完整、科学、准确性.用构 建的个人住房贷款信用风险指标评价体系(借款人 的各项指标,见表1). 作为属性矩阵A,用借款人是否违约作为判别 矩阵D(一1代表违约,1代表正常),将样本数据随 机分为训练集和测试集,先用训练集训练出最优超 平面,获得参数w、 ,通过训练样本的比较验证, 得到正确率最高的超平面作为最优超平面. 将测试集的属性矩阵代人判别函数,获得测试 集数据值的判别矩阵D ,并与测试集原判别矩阵 D的真实值进行比较,根据比较结果计算出最优超 平面对测试集数据预测的正确率.如果预测的正确 率符合要求,表明PSVM模型能较好的预测个人 住房贷款信用风险评估;如果正确率较低说明指标 评价体系还需进一步修正. 利用PSVM进行个人住房贷款信用风险预测 步骤如图3所示. 判别函数 —sgn(w・ +y) f一1,当w‘ +y<0 1+1, 当w. + >0 式中:sgn为符号函数;w为超优平面法向量; 为 偏移量; 为预测样本借款人指标的属性向量. PSVM模型用于个人住房贷款信用风险预测 的优点为 1)能快速处理实际数据问题,算法模型具有 自检验能力,能更准确描述银行与借款人之间信用 要素和信用水平的关系特征; 2)PSVM模型在个人住房贷款信用风险的应 用中,可直接预测商业银行的新贷款客户将来是否 违约,可以用此模型预测新样本的信用风险,而原 有的logit、Logistic等模型计算的是客户违约概 率,不能直接判断客户是否违约,因此本模型在实 际应用中更直接. 2.2模型检验 为了验证本模型的实际应用效果,本文抽取了 某商业银行2005 ̄2008年的个人住房贷款客户资 料,年度数据量分别为2234、3751、7986、10065条, 按照严格的筛选标准对数据预处理,最终从大量的 第6期 侯剑平等:近似支持向量机对个人住房贷款信用风险预测 563 有效样本中随机抽取正常贷款样本150个,违约贷 属性矩阵和判别矩阵的所有数据.用矩阵A代表 款样本150个,有效样本总容量为300个.将数据 住房贷款人的各项指标的属性矩阵,矩阵D是借 样本分为训练集与测试集,每一个样本数据包含了 款人是否违约的判别矩阵. 图3 PSVM模型流程图 Fig.3 Flow chart of PSVM 为体现PSVM对于样本数据的学习能力以及 面利用判别函数对预测集的4O个样本进行预测, 模型的泛化能力,将上述300个有效样本随机分为 将预测值与真实值进行比较,比较结果见表3. 训练集260个和测试集40个.首先利用训练集数 表2 超优平面结果 据采用牛顿迭代方法训练出最优超平面,即可得到 Tab.2 The result of optimal hyperplane 』\『个法向量w(N是借款人指标属性维数)和一个 标量y.将训练集获得的超优平面参数w、 代入判 别函数,获得测试集的判别矩阵D (计算违约结 果),并与判别矩阵D(实际违约结果)进行比较,根 据比较结果得出模型计算的正确率. 文中在Matlab环境下采用自编程序进行数据 处理.具体过程如图4所示. I输 ,D l I定义 =【 一P] 计算V=H'De I 解决处理(古+ H)【 ] 分类a ̄sign(x - 图4 模型数据处理 Fig.4 The process of data 利用某商业银行实际数据计算求得最优超平 利用PSVM模型用训练集获得超优平面后对 面结果见表2,其中常数 为0.774.获得最优超平 测试集进行预测,用借款人是否违约作为判别矩 西安工业大学学报 第31卷 阵,用测试集预测借款人是否违约的正确率为 87.5 ,认为PSVM模型能够准确的研究商业银 行个人住房贷款信用风险评估,具有很好的泛化能 力和很高的计算效率. 表3预测值与真实值比较 Tab.3 The compare of predicted value and truth value 序号预测值真实值判断序号预测值真实值判断 1 -1 -1 R 21 —1 —1 R 2 —1 —1 R 22 —1 1 3 —1 —1 R 23 1 1 R 4 —1 —1 R 24 —1 1 R 5 1 1 R 25 —1 —1 R 6 —1 —1 R 26 1 1 R 7 —1 —1 R 27 1 1 R 8 —1 1 W 28 —1 —1 R 9 —1 1 W 29 —1 —1 R 1O 1 1 R 3O 1 1 R 11 —1 —1 R 31 1 1 R 12 —1 —1 R 32 —1 —1 R 13 —1 —1 R 33 1 1 R 14 —1 1 34 —1 —1 R 15 —1 —1 R 35 —1 1 R 16 —1 —1 R 36 1 1 R 17 —1 —1 R 37 —1 1 W 18 —1 —1 R 38 —1 —1 R 19 —1 —1 R 39 —1 —1 R 2O 一1 —1 R 40 1 1 R 正确率87.5 注:R表示预测正确,w表示预测错误 2.3误差原因分析 在评价预测准确性时,应该对分类的错误率引 起注意.在统计学中,原假设的设立原则是将可能 犯的严重错误看作第1类错误,因为犯第工类错误 的概率可以通过a的大小来控制,犯第Ⅱ类错误的 概率B是无法控制.文中第1类错误是指将违约客 户误判为正常客户,第1类错误率是0;第Ⅱ类错 误是指将正常客户误判为违约客户,第Ⅱ类错误率 是12.5 .这两类错误所带来的风险以及银行的 决策是完全不同的.第1类错误将导致银行做出错 误决策,会向信用状况较差的客户发放个人住房贷 款,这样会使银行面临巨大的损失,这也是美国次 贷危机引发的根源,因此这类错误的危害性巨大. 第Ⅱ类错误中银行的损失是失去正常客户,减少贷 款业务,银行决策时会提高警惕,是保守、慎重的表 现.对银行来说,显然第工类错误的损失更严重,因 此银行在实际操作中应重点防控第工类错误.本模 型对实际数据检验存在着一定误差,原因在于 1)用PSVM判断个人住房贷款借款人是否 违约的正确率为87.5 ,用测试集与真实值进行 判断后发现,第1类错误率远低于第Ⅱ类错误率 (12.5 ),可能原因就在于银行在实际操作中会根 据自身的信用风险评估体系及经验对借款人进行 初步筛选,将明显违约的借款人剔除,因此所选的 300个有效样本排除了明显违约客户,第1类错误 不会发生或者发生很少.因此,近似支持向量机具 有较高的准确率和较低的第1类错误率. 2)通常训练数据是有噪声的,因此不能保证 存在一个目标函数能够正确的映射训练数据,在对 个人住房贷款信用风险的检测中,借款人的偿债能 力可能取决于其它一些系统无法获知的因素. 3)由于系统误差和人为因素影响,同时在实 际研究中会忽略税收、住房交易成本等难以获取的 数据,这些都会影响预测精度. 3结论 利用PSVM模型构建的个人住房贷款信用风 险预测模型研究,结论如下: 1)近似支持向量机(PSVM)作为一种新的机 器学习方法,具有速度、精度和稳定性优点,PSVM 在解决低维数据分类问题时,训练速度较快且不影 响分类质量,有效地提高了分类器的性能.本文研 究认为该模型可以应用于商业银行个人住房贷款 违约预测. 2)在预测个人住房贷款是否违约时,借款人 指标的选择很重要,确认指标与违约相关,可以降 低输入空间维数,缩小求解问题规模,从而减少计 算方面的难度,减少训练时间,得到更好的决策函 数,提高准确率.本研究选取的17个指标较为全面 的反映了借款人的特征信息,能更加综合反映出贷 款人是否违约的趋势. 3)通过随机抽取某银行2005~2008年个人 住房贷款的300个样本(正常样本150个,违约样 本150个)数据对模型进行检测,测试结果的正确 率达到87.5 ,准确率较高,速度更快,证明了应 用该模型的正确性与适用性. 第6期 侯剑平等:近似支持向量机对个人住房贷款信用风险预测 565 参考文献: [1]Lambrecht,Bart,Perraudin lliam,Satehell,Stephen. Time to Default in the UK Mortgage Market[J].Eco— nomic Modelling,(10):485. [2]Morton T gregory.A Discriminant Function Analysis of Residential Mortgage Delinquency and Foreclosure [J].Areuea Journal,1975(3):73. [3]George W.Gau.-A Taxonomic Model for the Risk-rat— ing of Residential Mortgages[J].The Journal of Bus— iness,1978,51(4):687. [4] Kau,Keenan.An Overview of the Option—theoretic Pricing of Mortgages[J].Journal of Housing Re— search,1995,6(2):217. [5] Quercia,Stegman.Residential Mortgage Default:A Review of the Literature[J].Journal of Housing Re— search,1992,3(2):341. [6]王福林,贾生华,邵海华.个人住房抵押贷款违约风险 影响因素实证研究——以杭州市为例[J].经济学, 2005(3):739. WANG Fu—lin,JIA Sheng-hua。SHAO Hai—hua.An Empirical Study of the Factors Influencing Residen— tial Mortgage eDfaults:The Case of Hangzhou[J]. China Economic,2005(3):739.(in Chinese) [7]汪湘陵.基于Logistic回归的个人信用评估模型 以某银行个人住房贷款为例[J].金融经济,2008 (12):109. WANG Xiang-ling.Personal Credit Assessment Mod— els Based on Logistic Regreession-an Example Of In— dividual Housing Loans Form a Bank[J].Finance and Economy,2008(12):109.(in Chinese) [8] 田凯.商业银行个人住房按揭贷款信用风险研究 基于Logistic模型的实证研究[J].科技信息,2008 (27):418. TIAN Kai.Individual Housing Mortgage Loans Cred— it Risk In Commercial banks—a Empirical Research aBsed On Logistic Regression[J].Science and Tech— nology Information,2008(27):418.(in Chinese) [9]龙海明,唐海龙,欧阳娟.住房抵押贷款风险控制实证 研究——基于中国银行某分行的数据分析[J].财经 理论与实践,2010(167):31. L0NG Hai—ming,TANG Hai—long,OU YANG Juan. An Empirical Study on the Risk Control of Mortgage Loans:Based on the Data from A Branch of Bank of China[J].Theory and practice of Finance and Eco— nomics,2010(167):31.(in Chinese) [10]徐平安,侯剑平,薛强.基于Logistic模型的个人住 房贷款信用风险实证研究——以陕西省建设银行数 据为例[J].金融理论与实践,2010(11):52. XU Ping—an,HOU Jian—ping,XUE Qiang.Empirical Research on Personal credit Assessment Models aBsed On Logistic Regression--An Example Of In— dividual Housing Loans Form China Construction aBnk[J].Financial theory and Practice,2010(11): 52.(in Chinese) [11]葛虹.BP神经网络在个人住房抵押贷款风险分析中 的应用[D].杭州:浙江工商大学,2006. GE Hong.The Appliance Of BP Net In Personal Housing Mortgage Risk Analysis[D].Hangzhou: Zhejiang Gongshang University,2006(13):265.(in Chinese) [12]杨星,麦元勋.个人住房贷款信用风险管理实证研 究——Mert0n模型在信用评估中的应用口].南方 金融,2003(3):20. YANG Xing。MAI Yuan-xun.An Empirical Research on Credit Risk Management of Individual Housing oLans—-application of Merton Model in the Credit As—— sessment[J].South China Finance,2003(3):2O. (in Chinese) [13]上海银监局课题组.上海市商业银行个人住房贷款 风险研究[J].上海金融,2005,(12):12. Shanghai Banking Regulatory Bureau Task Force. Shanghai Commercial Bank of Individual Housign Loan Risk[J].Shanghai Finance,2005,(12):12. (in Chinese) [14]袁绪川.Heckit模型在住房抵押贷款信用评分中的 应用研究[D].哈尔滨:哈尔滨工业大学,2008. YUAN Xun-chuan.The Application of Heckit Model In Housing Mortgage Credit Score[D].Harbin: Harbin Institute of Technology,2008.(in Chinese) [15]刘军丽,陈翔.基于决策树的个人住房贷款信用风险 评估模型[J].计算机工程,2006(13):263. LIU Jun—li。CHEN Xiang.Credit Risk Assessment Model for Individual Housing Loan Based on Deci— sion Tree[J].Computer Engineering,2006(13): 263.(in Chinese) [16]张学工.关于统计学习理论与支持向量机[J].自动 化学报,2000(1):32. ZHANG Xue-gong.Introduction To Statistical Learning Theory And Support Vector aMchines[J].Acta Auto— matica Sinical,2000(1):32.(in Chinese) (下转第588页) 588 西安工业大学学报 第31卷 and to seek the way to implement its selection,the paper presents a view of establishing a comprehensive target of criminal law interpretation with the social changes and moral values taken into account. According to the social needs,the interpreter reveals the crimina1 law’S separate inherent implications within the possible and objective range of the original text,thus achieving the law’S its special natures of j ustice and social utility as well as its value of stability.The target selection should be implemented with the target hermenentics and socia1 hermententics. Key words: interpretation of the criminal 1aw;the target of the interpretation;rational analysis; implementation (责任编辑、校对杜亚勤) (上接第565页) PSVM Model Based Forecasting of the Credit Risk of Individual Housing Loan HOUJian—ping ,XUE Qiang ,XUPing-an。 (1.School of Economics and Management,Xi’an Technological university,Xi’an 710032,China; 2.Shaanxi Branch of China Construction Bank。Xi’an 710006。China) Abstract: Based on the establishment of the index system 0f credit risk Of individual housing loans in commercia1 banks,on empirica1 analysis was made of the data of borrowers of housing loans in a certain commercial bank in Xi’an by using proximal support vector machine(PSVM)in machine learning.In the study,the borrowers’S indexes were set as the attribute matrix and whether the borrowers defaultor not was set as the discriminant matrix.260 samples in the training set were used to get an optimal hyperplane,and then a forecast was made to the 40 samples in the testing set.The result suggests that the PSVM model achieves higher accuracy in the forecast of the credit risk of individual housing loans. Key words:PSVM model;credit risks;housing loan;forecast (11-任编辑、校对苗静)