“AI”的十次方创新成果献礼：万象智慧-AI反欺诈应用方案

文章来源：企鹅号 - 中诚信征信

导读：近年来，金融呈现互联网化趋势，越来越多的交易不再通过面对面形式达成，这也给一些不法分子可乘之机，网络上各类身份伪造、养号、骗贷、撞库、黑中介等欺诈行为层出不穷，且欺诈行为更加隐蔽和复杂。现有的大数据反欺诈体系主要依赖数据交叉核验以及专家经验进行，而与之关联的信息未能有效加入到评估环节，这也造成对单体信息不足以及团伙欺诈行为识别能力的缺失！

金融机构为应对上述欺诈风险，逐步建立大数据反欺诈体系，通过数据交叉核验以及专家经验进行欺诈识别。在此过程中，金融机构的数据维度不断丰富，其中包含的交易、通讯、社交等复杂关系数据，受限于关系型数据库的查询性能，往往造成无法查询、查询效率低等难题，数据价值难以有效体现！与此同时，金融机构在面对高维及超高维的复杂关系数据时，传统建模往往受限于数据处理能力、计算能力，模型结果往往欠佳！因此如何解决复杂关系数据的关联挖掘及建模分析，进而有效识别互联化趋势下的欺诈行为，成为各金融机构在互联网化的进程中所面临的核心问题。

“别人笑我太疯癫，我笑别人看不穿。”

在“1024程序员节”这个特别的日子里，这句话送给奋战在一线的广大程序员小伙伴们，希望你们能在代码的海洋中继续快乐地遨游。正是由于小伙伴们的辛勤付出，中诚信征信才能迎来一个个智能风控领域里的创新成果。万象智慧-AI反欺诈应用方案，作为1024程序员节献礼，致敬所有为人类社会文明和进步作出点滴贡献的程序员们！

具体解决方案

万象智慧是基于大数据、知识图谱、机器学习技术的AI反欺诈平台，在传统手段及数据基础上，补充了“关系”这一全新视角来审视风险，并以智能化手段进行欺诈的学习、识别。万象智慧平台通过对关系数据的深度挖掘，可有效解决单体信息不足的情况下反欺诈评估难题，同时万象智慧还具备天然的团伙欺诈甄别能力。

图1 方案架构图

1.关联挖掘

在处理多源异构的复杂关系数据时，万象智慧提供自定义“节点、关系、属性”的功能，平台自动化完成数据间的关联，底层主要以图数据库进行数据存储，有效解决了复杂关系数据在关联查询效率低与数据库维护成本高的难题。在中诚信以往项目经验中，常用的节点、关系、属性如下，节点可包括：身份证、手机、银行卡、申请地址、工作单位、单位地址、设备号等；关系包括：使用、拥有、居住、工作、同事、联系、人、亲属、通话、转账等；属性包括节点属性和关系属性：姓名、年龄、收入、性别、黑名单、逾期、拒贷、失信被执行、通话时长、通话频次、转账金额、转账频次等。

万象智慧平台基于“输入数据-定义知识-输出关联”的应用理念，开发了知识管理、关联查询、动态关联、统计分析、族群监控、特征筛选等子功能，用户通过可视化界面自定义业务节点、关系、属性，平台自动完成关系创建及数据关联，在应用层支持单节点的遍历查询、实时数据的动态关联、数据关联统计分析、族群演化监控、指定特征节点及族群的筛选等服务，有效解决金融机构在面对复杂关系数据的处理、应用难题。

图2 关联挖掘-功能模块

图3 关联挖掘-关联查询界面（信息脱敏）

在深度关联挖掘层面，万象智慧主要通过图的表示学习（NRL）、社交网络分析（SNA）、结合反欺诈标签的社交网络分析（SNA）三个方法进行关联欺诈的分析，通过上述方法实现了对节点的降维表示、关系网络中的凝聚性特征（个体网密度、凝聚系数、程度中心度）、关联性特征（离心率、关联中心度、介性中心度）等特征挖掘，以及欺诈网络特点的识别等，在此过程中产生的特征还以关系变量补充到机器学习的反欺诈建模中，可有效提高机器学习建模的准确性。

图4 万象智慧关系网络示例图

2.欺诈自学习

传统的数据建模涉及开发工程师、数据挖掘工程师、算法工程师、运维工程师、业务专家等多角色多环节的紧密衔接与配合，整体流程耗时长，建模及维护成本过高。

图5 传统建模环节及角色

万象智慧平台的机器学习模块，包括变量分析、模型训练、模型预测、模型应用、模型监控以及Notebook六个子功能，平台对特征工程、模型训练、模型运维的流程实现程序化，对于特征工程、算法选择、参数调优实现智能化，用户可通过载入数据，设定业务目标进行智能化的模型训练与自学习迭代！

图6 欺诈自学习-应用逻辑

图7 欺诈自学习-模型报告界面

在反欺诈应用领域，万象智慧平台依据知识图谱的复杂关系数据处理能力，创新性地将复杂关系数据和图特征数据应用与反欺诈建模与评估之中，其主要特点：

利用机器学习等方法解析数以亿计用户的数千维度信息；

基于自主研发的动态特征引擎，有效将复杂关系数据和图特征数据应用于反欺诈建模；

图8 机器学习建模

3.欺诈识别

当前的反欺诈体系主要依据数据直观表现以及规则命中情况进行预判，万象智慧在此基础上，提供了“关系”的全新视角来审视风险，在关联欺诈风险识别角度，平台主要依据机器学习建模结果，结合标签传播算法、PageRank算法、社团发现算法等进行欺诈风险的关联挖掘，并进行页面的可视化展示！

标签传播算法：基于节点相似性来判断风险的相似性，即用已知的“坏”节点信息去预测未知节点的欺诈风险程度，用边来表示两个节点的相似度，节点的风险程度按照相似度传递给其他人节点，风险程度通过图的颜色进行可视化展示。

图9 风险传播示例图

PageRank算法：PageRank是一种计算复杂关系网络中节点“重要性”的算法，一般以PageRank值进行表示，结合反欺诈业务背景，依据机器学习建模经验将复杂关系网络中每个节点的最终PageRank值进行高、中、低段分类，寻找高分段的可疑欺诈人群。

图10 PageRank算法分段图

社团发现算法：主要基于GN、SLPA、Newman等社团发现算法对复杂关系网络中的可疑欺诈团伙进行聚类挖掘。分割后的每个社区中的节点相似度较高，通过寻找欺诈节点在分割后的社区中的分布，挖掘相似度较高的其他可疑欺诈人群。

综上所述，万象智慧平台在反欺诈领域的关联挖掘、欺诈自学习、欺诈识别三方面提出了创新的解决方案，是结合大数据、知识图谱、机器学习技术的智能反欺诈系统，帮助金融机构具备从“关系”的角度识别风险的能力，可有效识别单体、团伙欺诈风险。

4.核心价值

在当前反欺诈体系中，主要依据数据与专家规则，在金融互联化趋势下，欺诈风险愈发隐蔽和复杂，如何有效防范防范互联化趋势下的欺诈行为是面临的核心问题。

万象智慧平台结合大数据、知识图谱、机器学习技术，可有效解决单体信息不足以及团伙欺诈识别难的痛点，帮助金融机构具备从“关系”的角度识别风险的能力。

核心模块：

关联挖掘：帮助金融机构深度挖掘关系数据的价值

通过图数据处理技术，有效解决金融机构处理多源异构的复杂关系数据的难题。

基于图的表示学习，实现对图数据的特征提取及分析，深度挖掘关系数据的业务价值。

欺诈自学习：基于机器学习技术的自学习模式，智能优化反欺诈体系

万象智慧平台对特征工程、模型训练、结果输出的流程实现程序化，对于特征工程、算法选择、参数调优实现智能化，可大大提升金融机构的数据分析效率及能力。

基于自学习模式，不断迭代优化欺诈模型，大大提升模型的效果，同时也降低模型的维护成本。

欺诈识别：补充“关系”这一全新视角来识别欺诈风险

基于“关系”这一全新视角，有效解决可有效解决单体信息不足的情况下反欺诈评估难题，同时万象智慧还具备天然的团伙欺诈甄别能力。

万象智慧平台可以完成对多源异构的复杂关系数据的关联挖掘，并对欺诈进行自学习，同时在当前反欺诈体系基础上，补充了“关系”这一全新视角来识别欺诈风险，帮助金融机构具备从“关系”的角度识别欺诈风险的能力。

祝全世界的程序员节日快乐?

愿我们的世界里永无Bug?

End

文 | 中诚信征信市场品牌部

发表于: 2018-10-242018-10-24 18:21:05
原文链接：https://kuaibao.qq.com/s/20181024A1LFN000?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

“AI”的十次方创新成果献礼：万象智慧-AI反欺诈应用方案

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐