第五十一章

下一个环节,是永恒智能特地为华瑞银行准备的。

林浩在台上说道:“也许有些朋友没听过‘国际金融数据服务组织(IFDSO)’。它是由全球主要金融监管机构和科技界巨头支持的国际组织,专门提供权威的金融交易测试数据,用以帮助金融科技产品尤其是人工智能大模型,进行测试和评估。

“接下来我们将进行一次特殊的对比演示。通过‘IFDSO’的专有数据源接口,我们将即时随机获取一批由十万条转账记录组成的测试样本。当然,这些测试样本都是经过严格的匿名化脱敏处理的,不存在隐私安全问题。在这十万条记录中,既有正常的转账行为,也有涉及到诈骗、洗钱等高风险的转账记录。

“我们会将这批样本数据分别输入‘萤火虫’模型,以及永恒智能为华瑞银行开发的专属大模型。让模型来辨别区分是否属于正常的转账行为,通过直接的结果对比,向大家展示各个模型在金融领域应用中的准确性。”

说到这里,林浩微笑着转头看向星光科技的朱迅,继续说道:“如果在场有其他公司的大模型产品愿意加入这场对比‘竞赛’来展示实力的,我们也非常欢迎。”

朱迅却随即将眼神转向其他地方,他此刻并无接招的兴致。

林浩给坐在大屏幕侧边的沈蔚一个眼神,示意测试开始。沈蔚的笔记本电脑正在将操作投影到屏幕上。观众紧跟着屏幕上的界面,看着他轻盈地敲击键盘输入命令。

林浩则走下台,径直来到运维组这边,和王明、刘洋轻声交谈着什么。

不一会儿,大屏幕上显示了一个绿色的成功提示。“我们通过‘IFDSO’的数据源获取了十万条转账记录。现在,请大家稍作等待,模型需要一些时间来分析这些数据。”沈蔚告诉在场的观众。与此同时,大屏幕上出现了两条进度条,分别代表两个模型的运行状态,开始逐渐填充。

不到一分钟,“萤火虫”率先跑完了进度,它的成绩随即显示在大屏幕上:

样本总数:笔。其中,正常交易:笔,高风险交易:7885笔。

“萤火虫”模型报告,正常交易:笔,高风险交易:3186笔,无法判定:笔。正确识别正常交易:笔(正确率:61.11%),高风险交易:3066笔(正确率:38.90%)。总体正确率:59.355%。

尽管“萤火虫”的表现并不算出色,但完成速度令人印象深刻。