
万事达卡研发出一种大规模表格模型(LTM,以区别于大语言模型 LLM),它并非基于文本或图像训练,而是以交易数据为学习对象,用于解决数字支付中的安全与真实性问题。
该公司利用数十亿笔银行卡交易训练了一款基础模型,并计划未来逐步扩展至数千亿笔。数据集涵盖支付事件及相关信息,包括商户位置、授权流程、欺诈事件、拒付、会员积分活动等。万事达卡表示,训练前已剔除所有个人身份信息,模型学习的是行为模式,而非针对单个用户身份。
通过排除个人数据,该技术降低了金融服务领域其他 AI 形式可能存在的隐私风险。万事达卡在近期博客中提到,即便没有单用户信息,海量且丰富的数据仍能让模型挖掘出具备商业价值的规律。尽管匿名化会移除一些在风险评估中看似有用的特征信号,但万事达卡认为,足够大规模的行为数据足以弥补这些信息损失。
什么是 LTM(大规模表格模型)?
大规模表格模型的架构与大语言模型(LLM)截然不同:大语言模型基于非结构化输入,通过预测序列中的下一个词元(通常被粗略称为 “单词”)工作;而万事达卡的 LTM 则是分析多维数据表中字段之间的关系,从定义上更接近传统机器学习,而非通用人工智能。
LTM 能从原始输入中自主学习哪些关系具备可预测性,从而识别出预定义规则无法捕捉的异常模式。
万事达卡将 LTM 定位为一款 **“洞察引擎”**,可嵌入现有产品、增强现有流程。与面向客户交互的模型(通常是 LLM)不同,LTM 主要用于内部决策,运营风险逻辑也随之不同。
LTM 的技术底层由英伟达(Nvidia)与 Databricks 提供支持:前者提供算力平台,后者负责数据工程与模型开发。
LTM 将在哪些场景落地?
万事达卡已率先将该技术应用于网络安全领域。与许多机构一样,万事达卡目前运行多套欺诈检测系统,这些系统在初期需要人工定义可疑行为,并持续调整规则,例如交易频率突然激增、用户短时间内在全球多地消费等。
万事达卡称,早期结果显示,在特定场景下 LTM 表现优于传统技术。例如:高金额、低频度的交易,传统模型常会误判为异常,而新模型能更精准地识别合法交易。
该公司计划采用传统流程与新模型结合的混合系统,这种谨慎态度也反映了其所处的强监管环境。万事达卡承认,没有任何单一模型能在所有场景都表现优异,因此 LTM 将作为工具之一,与现有系统协同工作。
LTM 还可用于:会员积分活动监控、资产组合管理、内部分析等海量结构化数据场景。目前企业通常为不同任务部署多个专用模型,训练、验证、监控成本高昂;而单一基础模型经微调即可适配多任务,有望简化流程、降低成本。
风险与未来规划
多功能 LTM 模式也存在风险:一款广泛部署的模型一旦出现故障,可能产生全系统影响。这也解释了万事达卡现阶段采取的策略 ——与现有检测系统并行使用。
万事达卡计划进一步扩大模型所用数据规模与整体智能程度,并将通过 API 与 SDK 开放能力,支持内部团队开发新应用。
博文强调 LTM 所承担的数据责任,重点提及隐私、透明度、模型可解释性与可审计性。任何影响信贷决策或欺诈判定的系统,都会受到严格监管,LTM 的数据处理与运行机制也不例外。
与文本、图像不同,高度结构化数据是 LTM 的核心。大规模表格模型,可能成为核心银行与支付基础设施中新一代 AI 系统的起点。不过目前相关证据仍仅限于厂商报告,相关性能结论尚不能视为最终定论。
对抗环境下的鲁棒性、训练后长期成本、监管认可度,将决定表格模型是走向成功还是遭遇挫折。这些因素将影响其普及速度与范围,而目前,万事达卡已在表格模型这一领域押下重注。
本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:3164780!