|
SMARTS™蓝笔以及预测模型
传统上,在决策管理领域有两大阵营,大家的目标是一致的,但是方法是不同的:
· 专家驱动的方法
该方法的一个假设是决策的关键知识都是可以在流程、操作、政策中获取的,或是隐含在业务专家的操作中的。
在这种方法中,决策管理首先通过各种方法从文档和专家那里获取决策逻辑,涉及到业务规则的获取,对其有效性进行监控并不断的优化他们。
80年代和90年代的专家系统(Expert systems),以及后来的业务规则管理系统(Business Rules Management systems),业务流程管理系统(Business Process Management systems),都是这种方法的代表。
· 数据驱动的方法
这种方法由于数据爆炸式增长正在变得非常流行,它基于这样一个假设,即关于决策的关键知识可以通过该领域内收集到的数据来确定。
在这种方法中,决策管理从对数据的探索开始,通过数据挖掘、知识挖掘技术对其进行研究和开发,创建预测分析模型。数据专家和业务专家都会参与到从数据中提取知识的复杂过程。
现代智能搜索、推荐、反欺诈、风险管理等系统都是这种方法的典型应用场景。
虽然上述两种方法确实不同,但现实情况是,大多数重要的决策管理应用程序都涉及这两种方法,经常组合应用这两种方法的方法论、技术和工具。以下组合是毫无争议的:
· 使用业务规则实现明确的策略、政策、流程和过程。
· 使用预测模型提供评分和其他有区分度的信息。
SMARTS为从数据中获得洞察力提供了广泛的支持,以便得出、制定和管理决策。我们已经看到它允许您:
· 使用红笔模式,利用进件用例来开发和管理决策
· 利用报告和KPI指标来评估这些决策的业务风险和价值
SMARTS还提供了另一种附加模式—蓝笔(BluePen)模式—允许您使用数据来进行更深入的分析工作,例如:
· 探索这些数据,包括字段进行分箱离散化处理
· 探索字段之间的相关性
· 通过算法确定有信息价值的预测字段,这些字段可以很好地预测目标字段
· 自动归纳生成决策规则集
· 使用这些预测字段和规则集作为制定决策的起点
· 使用蓝笔选择的预测字段和生成的规则集来验证和补充现有的决策逻辑
· 促进业务专家和数据专家之间的讨论
作为一名业务分析师,这些特性将使您能够在探索、制定或管理决策的过程中充分的利用数据。蓝笔模式没有将专家驱动的决策开发与数据驱动的决策开发分开,而是允许您以协作的方式将这两个方法结合起来。
这是对传统的专家驱动和数据驱动决策管理相分离方式的重大突破。SMARTS为决策专家带来了许多高级数据分析工具,这些工具允许专家在决策时直接从数据中获得更深入的见解。这将能缩短决策开发的周期,更快地做出更好的决策。这一点在高速变化的决策中尤其重要,例如反欺诈、营销决策、动态定价等。
蓝笔模式下的第一个任务就是探索数据,您可以探索文档组中的每个字段,包括标记为KPI度量的计算字段(设置为重复性字段或重新性区块下的字段除外)。对于每个字段,您将能够看到:
· 对于数值字段,显示最小值、最大值以及对应于25%、50%和75%的值。您还将看到平均值和标准偏差,以及字段值的柱状图。
· 对于非数字字段,显示不同值的数量,以及每个值出现的频率,并突出显示最频繁和最不频繁的值。
· 对于所有字段,显示与目标字段的相关性度量(基尼增益),以及唯一值统计和不同值的统计。
使用数据探索功能,您可以快速了解数据的构成,特别是对您的决策很重要的字段。
除了直接探索文档中的数据,您可能还希望以不同的方式查看数据。例如,考虑一个车险承保的申请:进件文档可能会有驾驶员和车辆的过去多年的明细数据,您可能需要了解:驾驶员过去三年内的事故总数,过去三年的平均年行驶里程。在SMARTS中,这些都是非常简单的,向表单添加计算字段即可。将这些计算字段标记为KPI指标,则这些字段将立即可用于数据分析,并且可以与其他字段一样进行探索。
您也可能需要离散化字段,对一个给定的字段进行分箱。以驾驶员的年龄为例,可能您对年龄的确切值不太感兴趣,而是更关心它属于哪个年龄段。SMARTS允许您从数字字段派生离散化字段,SMARTS配置的分析算法能基于您的数据自动建议分箱方案。
您可能还需要了解文档中字段之间的相关性。这一点很重要,原因如下:
· 两个高度相关的字段表明其中一个字段可以替换另一个字段。同时为两个高度相关的字段编写逻辑是浪费和不必要的。
· 如果某个相关字段是某个决策的输出,那么相关性分析可以给您启发,将提供决策的输入字段纳入数据驱动分析
蓝笔
您可能需要更进一步,尝试在表单中找到一组字段,这些字段显示了以下良好的特性:
· 它们对目标值有高度的预测力
· 这些字段之间的相关性很低
这使您可以将研究范围缩小到一组重叠很少的领域,并有效地预测目标值。通过专注于小部分字段,您可以更快地做出更好的决策,更好地利用最相关的信息。
SMARTS 蓝笔为您提供了几种功能强大的规则集生成算法(“分类”算法的一个子集),这些算法将预测变量与目标字段之间的相关性转换为您可以利用的显式的决策逻辑。
运行规则生成作业后,您将获得一组规则,这些规则表示预测字段与目标字段之间的关联逻辑。根据所选择的算法及其配置,您可能最终得到数十条,或数千条规则。
您可以在蓝笔用户界面中探索规则,也可以选择将生成的规则集直接插入到决策流的某个步骤中,将它们与其他专家规则混合在一起,以便像处理其他规则集一样操作它,这种情况下,SMARTS在规则管理方面提供的所有功能仍然可用。