账号:垃圾注册、撞库、盗号等 交易:盗刷、恶意占用资源、篡改交易金额等 活动:薅羊毛 短信:短信轰炸 项目介绍 实时业务风控系统是分析风险事件,根据场景动态调整规则,实现自动精准预警风险的系统。 ,风险事件的分析必须毫秒级响应,有些场景下需要尽快拦截,能够给用户止损挽回损失 低误报,这需要人工风控经验,对各种场景风险阈值和评分的设置,需要长期不断的调整,所以灵活的规则引擎是很重要的 支持对历史数据的回溯 ,能够发现以前的风险,或许能够找到一些特征供参考 项目标签 轻量级,可扩展,高性能的Java实时业务风控系统 基于Spring boot构建,配置文件能少则少 使用drools规则引擎管理风控规则,原则上可以动态配置规则 使用redis、mongodb做风控计算和事件储存,历史事件支持水平扩展 原理 统计学 次数统计,比如1分钟内某账号的登录次数,可以用来分析盗号等 频数统计,比如1小时内某ip上出现的账号,可以用来分析黄牛党等 ; 扩展风控规则,针对需要解决的场景问题,添加特定规则,分值也应根据自身场景来调整。
摘要 本文旨在为需要业务风控解决方案的企业提供一个技术指南,特别关注安全性和实时性。 技术解析 核心价值与典型场景 腾讯云全栈式风控引擎(RCE)是基于人工智能技术,结合腾讯20年风控实战经验打造的风控服务。 它能够为企业提供实时的风控能力,适用于注册、登录、营销活动等关键业务场景,有效识别和防御欺诈行为。 3大关键挑战 数据安全:在处理大量用户数据时,如何确保数据不被泄露或滥用。 原理说明:根据业务需求配置风控规则,如注册频率限制、登录异常检测等。 通过本文的技术指南,企业可以更好地理解腾讯云全栈式风控引擎的价值,并在业务中实现高效的风控管理。
我们这做风控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 不过这不影响我们去使用它,我们只需要知道在风控中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在风控主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的风控策略使用体验上十分友好。 02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在风控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行
业务风控、活动防刷、黑产对抗和设备指纹是现代企业在数字化转型中必须面对的挑战。这些技术手段旨在保护企业免受欺诈、滥用和非法活动的侵害,确保业务流程的安全性和稳定性。 天御 天御是腾讯云提供的一款综合性风控产品,它集成了多种风控技术和策略,帮助企业构建全面的风控体系。 优势: 综合防护:集成多种风控技术,提供全面的防护。 总结 在数字化时代,业务风控、活动防刷、黑产对抗和设备指纹技术是企业保护自身免受欺诈和非法活动侵害的重要手段。 腾讯云提供的一系列风控产品和服务,如风险识别RCE、全栈式风控引擎RCE、腾讯图灵盾、天御、流量反欺诈TAF和设备安全,为企业提供了全面的风控解决方案。 虽然每款产品都有其独特的优势和局限性,但它们共同构成了一个强大的风控体系,帮助企业在复杂的网络环境中保持业务的安全和稳定。
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做风控模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是
实际使用中,可以考虑根据业务目标对这两者进行调整。 举个例子,假设现在有一个提额模型,用处是将分数最高的20%客户给与更高的额度。也就是期望分数最高的20%的客群正样本捕获率最大化。 本书给出的是一种启发性的思路,读者还可以根据实际情况改写更贴合业务的损失函数。 LightGBM中也同样支持自定义损失函数和评价函数。代码上有一些细微差别。
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 01 机器学习模型不可解释的原因 前些天在同行交流群里,有个话题一直在群里热烈地讨论,那就是 如何解释机器学习模型 ,因为在风控领域,一个模型如果不能得到很好的解释一般都不会被通过的,在银行里会特别的常见
风控定义 风控是风险控制的简称,在百度百科中是这么定义风险控制的。 风控在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种风控的手段。 这里我们着重了解下信贷下的风控,结合了场景的风控,则赋予了更多的意义。 信贷风控的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷风控的核心。 ,以及在信贷场景下的风控如何实现,风控的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。 文章例子参考《智能风控平台:架构、设计与实现》
具体而言,就是银行对中小企业贷款的设计、申报、审批、发放、风控等业务按照“流水线”作业方式进行批量操作。 3.评分卡的开发应用 在互联网金融评分卡开发过程中,我们仔细研究了企业风控操作流程,反复推敲了模型构建步骤,最后我们认为从业务应用角度,评分卡开发应用应遵循: 业务定义➡️风险定义 ➡️风险分解➡️ 直到我们和某P2P公司的风控经理实际交流后才明白这其中的含义。在传统银行信用卡业务中,是很喜欢这类少量逾期的客户的,因为他们能给银行创造罚息,但是又不是恶意违约那种客户。 我们就可以采取相应的商务策略,优化业务: 流程简化:通过模型对客户分层,降低审核人员的工作量,提高审批速度。 风控优化:以客观分数代替主观评断,保证审批标准及风险偏好一致性。 所以说,风控模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道风控规则的。 四、风控的核心 如果说金融产品的核心是风控,那么风控的核心是什么?
数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 2、所属分类 金融科技 · 风控、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 作为反欺诈领域专业品牌,数美经过2年的实践与积累,构建了立体的全业务流程风控体系,可有效帮助金融机构进行反欺诈与风控。 一方面,针对个人的现金贷、消费分期等业务在快速发展;另一方面,黑灰产从业人员已超150万,市场规模高达千亿级别。这让金融企业面临着来自市场与黑灰产的双重挑战,并因此催生了对新金融风控的需求。 并将多维度、多模型的组合打法贯穿业务流程始终,做到风控与反欺诈的高召回、低误杀。
分析利率急升的影响是要使用Stress Testing的,而压力测试是ERM的一个方法,所以答案是C 01.4 区别EL和UL Expected Loss在正常业务情况下有多少损失是预计会发生的,容易预测和计算 Unexpected Loss在非正常业务情况下的损失,更难预测和计算 ? trading liquidity risk Operational risk:非金融范围的不确定性 Legal and regulatory risk:违反规则的不确定性 Business risk:业务收入的不确定性 Strategic risk:新业务开展的不确定性 Reputation Risk:名誉的不确定性 考题分析: ? risk organization integration of risk transfer integration of business process 价值有: 提高组织效率 更好的风险汇报 提高业务绩效
由于反欺诈检测是在交易时实时进行的,在要求不能误拦截的同时,还有用户体验上的要求,即不能占用太多时间,一般要求风控操作必须控制在100ms以内,对于交易量大的业务,10ms甚至更低的性能要求都是必须的。 本文重在介绍建立风控模型的方法,每个公司应该根据自己的实际业务情况和开发能力来选择合适的模型。这里列出来的模型仅为了说明问题,提供参考。 二、基于规则的风控 规则是最常用的,也是相对来说比较容易上手的风控模型。从现实情况中总结出一些经验,结合名单数据,制定风控规则,简单,有效。 常见的规则有: 1. 风控拦截历史规则 用户在某个业务上的消费行为被风控网关多次拦截。 规则引擎优点: 性能高: 对订单按照规则进行匹配,输出结果。一般不会涉及到复杂的计算。 支付风控场景分析 ; 支付风控数据仓库建设 ; 支付风控模型和流程分析(本文); 支付风控系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn
“风控是不能脱离业务存在的,是业务运营的重要组成部分。” 而在风控体系落地前,三大心得送给大家: 风控离不开业务 首先,风控不能脱离业务而存在,其次,风控要保障的是业务可持续性稳定发展并达成其发展目标,两者的目标是一致的,所以,“风控是业务运营的重要组成部分” 小步慢走,风控体系建设9步 从爱奇艺的实践中,可以看到风控的目标驱动力、业务安全风控框架、内容平台风控难点所在等。而具体如何落地?风控建设处于不同阶段的企业“可以根据能力建设的分阶段来提升”。 卢明樊给出了风控建设的9个阶段: 1.识别和管控风险: 风控要拥抱业务,和安全以及业务一起在企业内部梳理出哪些业务是高风险的,并且和业务方一起识别出关键风险场景,并且确定目前防御现状,根据二八原则,风控系统要优先解决重要业务及其核心场景的头部风险 3.优化引擎服务 风控系统对接支持业务后,应当充分考虑如何优化风控系统的服务架构,确保实时风控服务的低延迟低熔断,既要做到保证业务服务不会因为风控服务增加延迟,从而导致业务服务质量下降或者过多资源占用,
《风控建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。 cutoff一般按照业务经验来设置,就是拒绝样本中被赋予通过的样本,其badrate水平,是正常放款样本中的badrate水平的2~4倍; 4、根据步骤3设置的cutoff,高于这个阈值的赋予good标签 06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉风控模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适 Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 风控建模中的样本偏差与拒绝推断
今天来介绍一下风控中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。 异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们风控领域很多地方都会用到 这块比较基础的就是最大联通图的应用,通过不同顶点(比如设备ID、IP、地址、手机号等)和关系,把本不相干的信息联通起来,可以用于团伙作案的异常行为,这类的应用比较依赖业务专家经验。 通过这类算法,也可以把一些我们意想不到的点聚类在一起,用于业务分析。 更多的高级算法,还有OddBall、LOCKINFER、GraphRAD等,具体我也不熟,后续可以学习之后再来分享一下。
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 01 业务需求挖掘(Business insight) 当我们接到业务需求的时候,第一件事情需要了解的,就是需求的整体逻辑。一个合理的产品设计通常都是与业务痛点相挂钩的。 这个时候,我们需要沉住气,,有的时候数据建模师也需要充当起“心理辅导员”,慢慢引导业务说出实际的业务痛点与需求,好让我们对症下药(当然靠谱且有经验的业务是不会犯这种行为的)。 在经过若干分钟的业务了解,其实业务真正想提高的,是最后的审批通过率,而继续了解,发现是由于最近业务的增长,电销人员的人手不足,导致审批的效率低下,而真正有意愿购买产品的客户被营销的可能性降低,导致最终的整体转换率过低 那么在了解了业务需求后,接下来就需要针对具体的需求,继续咨询业务方一些业务知识点,而不是有了一点眉目就马上开工,毕竟模型还是做出来还是业务在用,事先沟通好一些细节性的问题也是无碍,而且沟通的过程可以让你对业务有更加深入的了解
00 Index 01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么风控建模场景下常用这两个明星算法? 03 什么风控建模场景下常用这两个明星算法? 而关于风控模型怎么调优,我会在下一节一起讲。 风控模型怎么调优 关于风控模型的调优,先前有篇文章讲得比较细致《风控ML[7] | 风控模型调优的思路有哪些》,大家可以移步去回顾一下。 不过我也相信也有很多同学和我一样,调参的过程只是象征性的调调,更多的功夫会关注在问题定义以及特征工程上,把调优交给“轮子”去自动执行,空出时间来想想业务,怎么从业务中可以提取到更多有用的特征,方为正道啊
在金融行业,风险控制(风控)是核心环节,它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来,金融机构面临着前所未有的数据量和复杂性。 在这样的背景下,风控领域特征工程应运而生,成为连接原始数据与精准风险评估的桥梁。 特征工程,简而言之,是对数据的一种深度加工,它通过一系列技术手段,将原始数据转化为对风险预测有用的信息。 这一过程不仅要求对数据进行清洗和转换,更要求深入理解业务逻辑,发掘数据背后的风险信号。 在风控领域,特征工程的核心目标是构建出能够准确反映个体或实体风险水平的特征集。 此外,良好的特征工程实践还能促进模型的解释性,为风控决策提供更加透明的依据。 随着技术的发展,特征工程的方法也在不断创新。 通过综合运用这些特征衍生方法,风控领域的特征工程能够更全面地挖掘数据潜力,为风险评估提供多维度的视角。
一套完整的风控体系,在风控中,少不了决策引擎,今天就浅谈一下风控决策引擎。 一、优先级 风控决策引擎是一堆风控规则的集合,通过不同的分支、层层规则的递进关系进行运算。 风控系统的作用在于识别绝对风控与标识相对风险,如果是绝对风控,则整套风控的审核结果便将是“拒绝”。既然结果必然是“拒绝”,则没必要运行完所有的风控规则,而主要单条触发“拒绝”即可停止剩余规则的校验。 因为芝麻信用分是否可作为决策依据将主要取决于业务方向与用户群体,因为理论上芝麻信用分的高低主要与用户在芝麻信用体系内的数据绑定维度的多与少相关,并不一定绝对反映用户的信用程度。 三、记录与统计 风控最终到底是“跑出来”的,所以,整个风控系统对所有不同风控规则的触发需进行有效的记录与统计,以便后期可支持数据分析与风控模型调整的相关工作。 (聚信立) 四、建模 现金贷风控体系较简单。如果是固定额度与固定费率式的产品业务定价,则风控体系更多的是规则的集合。
早期传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。 结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用风控类数据做一个全面的梳理。 2.风控数据来源 2.1 数据应用逻辑 常见风控流程中,客户准入时提供的资信材料有限,业务机构风控数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把控某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风控支撑 未来百行能不能有效被使用上还有待观察,但风控人员可先了解其相关的资料。百行征信涉及的模块,主要包括以下方面: 报告相关数据:报告时间;查询原因;查询结果等。 4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、风控流程、风险画像等的介绍。