数字金融 | 多源序列融合的客户洗钱风险预测与应用

2025-03-18  来源: 《银行家》2025年第2期

作者:郭晓波  董路安  邓橙橙  马丽

 

研究背景

 

数据的概念及其对反洗钱监测的意义

近年来,随着经济全球化的深入和信息技术的飞速发展,金融犯罪形势呈现出日益复杂化、智能化和线上化的趋势。这一变化对现有反洗钱监测体系提出了巨大挑战:传统的“面对面”金融交互模式逐步转变为“屏对屏”的线上服务模式,使得犯罪分子利用身份盗用和数字化手段从事非法金融活动的门槛大幅降低。同时,金融交易网络的全球化趋势进一步增加了资金流动的隐蔽性和复杂性,对反洗钱资金监测提出了挑战。

 

在此背景下,序列数据作为一种能够反映客户风险特征的重要信息源,正逐渐成为提升反洗钱监测能力的关键手段。部分金融机构已经开始探索将序列分析引入反欺诈场景,例如,通过对客户交易频率、操作、登录等数据的动态分析,有效识别欺诈模式,显著降低欺诈风险和资金损失。与此同时,很多境内金融机构的反洗钱监测分析对象仍局限在“资金交易”层面,向金融情报机构提交的报告名称也是“可疑交易报告(Suspicious Transaction Report,STR)”,而公认反洗钱师协会ACAMS指出,在部分司法管辖区,金融机构上报内涵更广的“可疑活动报告(Suspicious Activity Report,SAR)”,即在客户的资金交易之外,也会将客户交易之外的可疑活动纳入反洗钱监测视线。从国内外研究和监测实践来看,客户非金融交易的活动往往也蕴含着洗钱风险,通过对序列数据的分析,能够更加精准地揭示潜在的洗钱。随着金融机构业务和渠道的创新,客户数据采集的范围和频率随之提升,客户数据极大丰富,为金融机构开展监测创造了可能。

 

当前反洗钱监测工具的局限性

虽然数据的引入为反洗钱监测带来了新的突破,但在实际应用中依然面临诸多挑战。首先,数据通常以非结构化的形式存在,包括客户在不同渠道的操作日志、访问记录等,数据整合难度极高;其次,数据量庞大且结构复杂,给传统模型的分析能力带来严峻考验;最后,现有的反洗钱监测模型工具在应对新型金融犯罪时往往会表现出一定的滞后性和局限性。

 

 

1 不同模型对比分析

 

根据FATF反洗钱数字化转型的专项研究及相关调研,当前境内外金融机构反洗钱模型的技术发展路线如表1所示。模型建设初期往往采用传统的专家规则,此类模型高度依赖专家经验和知识,通常通过人工设置特征来识别风险。然而,随着犯罪手法的不断变化,规则模型难以及时适应新的洗钱模式,误报率高且缺乏灵活性。近年来,机器学习的引入为反洗钱监测提供了新的可能性,使监测过程更加智能化,但传统机器学习模型仍存在适应性差的缺点,且无法胜任海量非结构化数据的分析任务。上述局限性导致当前的反洗钱监测工具难以胜任数据分析的任务,同时也无法全面捕捉新型洗钱模式的风险信号。为解决这些问题,深度学习深度技术凭借其强大的表征学习能力和自适应特性,正逐步成为反洗钱监测的核心技术方向。通过对客户序列的深度建模,深度学习可以动态适应犯罪手法的变化,在传统基于交易数据的监测模式中引入序列数据,为金融机构提供更高效、更智能的风险识别工具。 

 

基于深度学习的客户序列洗钱风险分析模型

 

深度学习是人工智能的核心技术之一,其中以RNN、GRU和Transformer为代表的序列模型,在海量非结构化数据分析及建模领域表现出了显著的优势相较于传统规则模型和传统机器学习模型,序列模型能够实现非结构化数据的自动建模,可更高效、更准确地识别用户中的复杂模式。基于深度学习的客户序列洗钱风险分析模型,将客户交易序列、操作序列和客户属性信息共同作为模型训练数据,运用深度学习技术充分挖掘多源信息间的内在联系,识别客户蕴含的潜在风险因素,并对客户洗钱风险概率进行预测。具体的预测流程如图1所示。

 

 

 

1 模型结构

 

数据采集与预处理

对于客户多源数据的采集与预处理是客户序列洗钱风险分析的基础。中国民生银行建立了企业级客户数据平台和埋点平台工具,采集整合全领域数据,覆盖产品优化、用户运营、风险管理等多个业务场景的分析需求,建立转化、留存、归因等全链路的数据分析能力。基于该平台,首先,根据预设的甄别回溯周期范围采集模型分析所需的客户数据,包括客户自身属性信息、客户交易序列、客户操作序列。其次,对上述所获取的三类数据进行数据清洗操作,如异常值剔除、缺失值填充等。最后,结合反洗钱监测要点,对处理后的客户交易序列和客户操作序列构建序列衍生特征,如平均交易间隔等。平均交易间隔是指客户在一定时间内进行相邻两次交易之间的平均时间长度。平均交易间隔这一特征可以反映客户的交易频率和活跃度,能够体现客户的交易习惯和模式。在反洗钱业务中,异常的交易间隔可以辅助甄别人员准确识别高洗钱风险客户。通过客户交易序列和操作序列构建的衍生特征将作为补充输入用于客户序列洗钱风险分析模型预测。

 

序列表征学习

基于深度学习的客户序列洗钱风险分析模型,运用深度学习方法自动化实现对客户交易序列和客户操作序列的表征提取工作。首先,对预处理后的客户交易序列和客户操作序列进行分桶离散化处理。其中,金额和时间类数值型特征的出现频次通常随着取值的增大而降低,因此采用幂次分桶的方式对上述特征进行离散化处理,如下式所示:

 

其次,使用NLP中的Embedding技术对离散化后的特征进行向量嵌入。将客户交易序列和客户操作序列所包含的离散化特征映射至特定维度的向量空间,使用多维向量来表示原始离散化特征,相关操作如下式所示:

 

通过上式计算得到交易特征权重和操作特征权重,使用该权重计算得到交易序列和操作序列对应的全局表征信息。上述操作有助于提升模型对于不同客户序列中高风险因素的识别能力。

 

可疑客户识别

综合前置操作所采集和构建的客户属性信息、序列衍生特征和序列全局表征,计算客户洗钱风险概率,以挖掘具有高洗钱风险的可疑客户。首先,将数据采集与预处理环节获取的客户属性信息和序列衍生特征、序列表征学习环节获取的客户交易序列全局表征和客户操作序列全局表征四部分进行特征拼接,组成新的特征向量。其次,将上述特征向量传入全连接神经网络模型,以预测客户洗钱风险概率。最后,根据预先设置的阈值,筛选洗钱风险概率高于阈值的客户触发预警,上述客户将交由反洗钱岗位员工进行进一步分析和甄别。

 

实验结果

当前模型已投产,根据实际运行结果,引入序列数据的预警准确率显著提升,也为一线监测分析提供了新的视角。引入序列数据的深度学习模型将上报率提高了近50个百分点,客户序列数据为一线分析员的监测分析打开了全新的角度。有如下两个案例可供参考。

 

其一,客户A案例:某客户频繁进行XX交易,资金在账户中快速流转,交易XX高度集中,且上下游……其近30天的App操作XX埋点触发总会话数达到XX次,显著高于平均水平……交易与网络赌博资金的特点高度吻合……

 

其二,客户B案例:某客户多次通过XX渠道完成入账后迅速转出交易,且上下游……近90天内……该客户的XX埋点触发次数超过XX次,显著高于正常用户水平……该特征与信用卡套现高度相关…… 

 

未来工作展望

 

本文提出将序列数据引入反洗钱监测分析,依托企业级埋点平台全面梳理了电子渠道客户序列数据,并利用深度学习技术针对性地构造了监测模型,填补了客户序列在洗钱风险监测领域的研究空白,为可疑交易监测提供了新的方法论,实现对洗钱活动全方位的深刻洞察,以及对复杂洗钱手法变化的自适应。通过纳入序列信息,预警出一批网络赌博、POS套现等类型的可疑活动,实现数据驱动的精准情报监测,进一步维护人民群众的财产安全和国家金融秩序。然而,尽管技术应用取得了一定成果,但深度学习在反洗钱监测分析应用中仍存在许多值得探索的方向。

 

规范监测指引,衔接技术与业务

深度学习技术在反洗钱监测中的应用虽然提升了模型的预警能力,但模型的可解释性与业务实际应用的衔接仍有待加强。一方面,须制定基于深度学习等前沿技术的监测指引,为一线反洗钱工作人员提供明确的操作标准和案例参考。另一方面,针对金融机构长期以来习惯于资金交易监测的特点,应在监测指引中突出序列数据的分析价值,并明确与资金监测的协同方法。此外,通过构建技术与业务的双向交流机制,推动技术研发团队与业务实践部门的深度合作,确保监测工具不仅具备技术前瞻性,也符合一线需求和监管要求统一数据标准,支持履职与监管客户序列数据是反洗钱监测的重要基础,但当前数据的格式和质量在不同金融机构之间缺乏统一性,这对数据整合和监管报送工作带来了较大挑战。未来,应以行业协作的形式推动数据标准化建设,为金融机构间的数据共享与对比分析奠定基础。一方面,需要制定覆盖广泛、结构统一的数据标准,规范金融机构内部的数据采集、存储和应用流程;另一方面,建议监管部门进一步完善数据报送标准,明确序列数据在可疑交易报告(STR)中的具体应用方法与要求,确保监测模型的输出结果能够高效支持监管分析与决策。

 

推进协作共赢,平衡隐私与安全

随着经济全球化和数字化转型的加速推进,客户数据呈现出分散化和跨领域的特征。金融机构、支付机构以及电商平台等各类主体积累了大量的客户数据,但这些数据分散于不同机构中,难以形成完整的客户画像。未来,需要通过跨机构合作推动数据整合与共享,以全面提升监测效率与风险识别能力。在此过程中,应注重隐私保护和数据安全,采用联邦学习、多方安全计算等技术手段,确保在数据不出机构的前提下实现联合建模。此外,建议监管牵头探索建立行业级或区域级的联合监测平台,在满足合规要求的基础上,实现对大规模跨机构洗钱网络的精准识别与打击,为国家金融安全提供有力保障。

 

中国民生银行朱笑颜、王梓桐,龙盈智达(北京)科技有限公司王彦博、杨璇对本文亦有贡献

 

作者单位:中国民生银行

 

责任编辑:张志敏