sas学习之SAS-EM建模流程
SAS-EM是SAS的一个自动建模的工具,对于不熟悉SAS语言的数据分析用户来说,是一个非常友好的工具,简单易操作,而且功能强大,能够实现多种模型的自动建立。下面以一个简单的二分类模型例子来介绍下SAS-EM的建模过程。

(1)数据导入。以上图为例,把经过数据清洗整理后的数据导入SAS-EM。导入数据需要设置变量角色,其中,一定要设置目标变量,及Y变量。另外,对分类模型,特别是二分类模型,需要将水平设置为二值型。
(2)样本抽样。抽样模块中选择数据分区,一般将样本分成训练样本和验证样本,比例可以是70%的训练样本和30%的验证样本,或者60%的训练样本和40%的验证样本。具体可以根据样本量自己设定。
(3)交互式分组。抽样完成后,需要计算变量的IV值,这一步可以通过信用评分-交互式分组模块来实现。IV值大的变量进入最终模型。其中IV值的标准需要根据实际情况确定。一般来说,IV值大于0.03是一个比较常用的标准。如果变量普遍IV值较大,可以根据实际需要确定进入模型的变量的IV值。
(4)建立模型。确定好进入模型的变量后,就可以建立相关模型了。对于分类模型,一般采用逻辑回归、决策树等方式。如上图,采用了回归、决策树和神经网络三种模型。
(5)模型评价。最后,可以通过评估-模型比较模块对建立的模型进行评估。对模型的评价主要包括两个方面:一个是拟合优度评价,可以使用AIC准则和SBC(SC)准则。在其他条件相同时,模型的AIC或者SBC取值越小说明模型拟合得越好。一个是预测准确性评价,采用KS和ROC曲线进行评价。KS经验值在20-60之间,ROC曲线下面积越接近1越好。
以上就是我今天想要分享的内容。
如有数据分析需求,请联系微信号:kexiblue
还没人转发这篇日记