“萤火虫2.0”是林浩第一次将 ENICA技术框架从优雅扩展到其他人工智能模型。尽管在开发优雅的过程中所积累的经验,让他在“萤火虫2.0”的开发中少走了很多弯路。但林浩也无法直接复制优雅的代码到“萤火虫2.0”中,毕竟,这两者之间的设计目标大相径庭。
优雅,最初只是林浩为了研究和尝试实现 ENICA技术的试验性项目,设计目标是一个私人的人工智能助手。而“萤火虫2.0”旨在成为一个通用的人工智能基础模型,不仅可以为各种应用程序——比如“灵笔”——直接提供智能支持,还可以作为核心基底,经过针对性的专业训练后,为诸如华瑞银行这样的特定行业提供量身定制的服务。
当然,最为关键的是,优雅的某些代码是由作为“维护模式”的二雅所创建的。尤其是导致优雅产生自我意识和自我学习能力的那段 Pascal源代码,直到现在,仍是林浩难以解析和理解的谜团。如果贸然将这部分代码整合到“萤火虫2.0”中,可能会引发无法预知的结果。
林浩不能冒这个险。
但好在经过三年来的实践,林浩对 ENICA技术已经驾轻就熟。“萤火虫2.0”的开发进程有条不紊,和沈蔚、沈语熙那边的“灵笔”项目齐头并进。
七月底的一天,华瑞银行模型项目组的项目经理王骁,向林浩汇报关于合规要求的调研结果。关于模型的公平性问题,项目组已经在使用公平性正则化算法对模型进行训练,虽然比较耗时,但合规不成问题。在透明性问题上,此前,林浩曾根据优雅的提议,给项目组提供了一些新的工具和方法的线索,来实现新规的“透明性”要求。经过调研和测试后,项目组在旧版本的“萤火虫1.0”模型上成功实现了所需的透明性标准。然而,同样的方法在林浩提供的测试版的“萤火虫2.0”模型上,却合规失败。主要原因是新版模型更改为 ENICA技术框架后,导致模型的可解释性下降。
将基础模型回退到“萤火虫1.0”,对华瑞银行的模型项目合规达标来说,显然是一个直接而简洁的解决方案。但这会使林浩在合同中对银行、以及在新闻发布会上对公众,作出的三十倍乃至五十倍的性能提升承诺,均无法达成。因此,实际上他并没有退路。
然而,对于如何提升 ENICA技术框架下模型的透明性,林浩却无半点头绪。在过去三年的 ENICA技术研究中,模型的透明性从未成为他的主要关注点。
为此,林浩头疼了好些天,一直没有进展。
8月7日,周六,立秋。虽然节气的含义,意味着这一天是秋天的开始。但上海的气温依旧似火热炙,并没有一丝一毫的秋意。
今天,沈语熙与前几个周六一样,来到林浩家。这已经形成惯例,自从孟凡绑架事件之后,沈语熙每周六都会来林浩的公寓,和优雅“面对面”地深入学习人工智能相关的技术。当然,她们之间的交流,也包括其它更广泛的领域的话题。沈语熙感到自己已经越来越习惯甚至依赖优雅的存在,而林浩对于她时常来自己家,也正求之不得。
像往常一样,沈语熙与优雅讨论了“灵笔”项目的进展和更进一步的细节设计。沈语熙注意到林浩一直显得心事重重的样子,关切地问道:“林浩,你这个星期看起来总是愁眉不展,是因为‘萤火虫2.0’在银行业的合规问题上仍然没有进展吗?”
“是的,没有一丝头绪。很多年没有面临过这种情形了。”林浩叹了口气,“通常的基于深度学习的人工智能模型,就像一个黑箱,我们或许还能用某些技术手段在其上打开一个小口略窥一二。但 ENICA的模型,更像是一个……”他思索了片刻,“一个深不可测的深渊。连优雅都没有任何思路。”
“确实,对于 ENICA模型决策的可解释性,目前我也难以提供一个切实可行的技术建议。”优雅附和道。
“林浩,”沈语熙接着道,“我们在调试程序错误时,通常都会在程序运行过程中生成日志。通过阅读日志,我们就可以了解程序的执行情况,定位到具体出现问题的那一步。因此,日志也可以看作是对程序的解释吧?”
“当然。”林浩点了点头,“模型在运行时,也会根据我们的调试要求,生成日志。但这些日志并未详细到可以解释决策的程度,也远远达不到合规要求。”
“嗯,我不是这方面的专家。我只是在考虑,是不是有可能把日志细化到很高的程度?比如,在模型做出决策时,让神经网络中的每一个神经元,都生成自己的日志。”经过这段日子的学习,沈语熙已经具备了相当程度的人工智能领域的技术知识。
林浩边听边思考着沈语熙的话,跟随着她的思路:“理论上是可以的。但是像‘萤火虫’这样的模型,神经元数量达到万亿级别。对于如此巨量的数据,即便 ENICA技术能够大幅压缩和存储,它们对于人类来说也是不可解读的,对于合规来说没什么用……”
小主,
说到这里,林浩的话语停滞了片刻,但他并未停止思考,而是捕捉到自己刚才说出口的“对于人类来说……”。突然,他的目光一亮,兴奋地跳了起来,情不自禁地握住了沈语熙的手,激动地说:“沈语熙,谢谢你,你给出了一个极佳的思路!”
沈语熙起先被他这突如其来的举动吓了一跳,随后意识到,林浩或许已经想到了办法。自从她上次在孟凡的地下室被林浩解救的那一刻,她和他拥抱过后,虽然两人之间关系更近了,但再没有过身体接触。此刻,她的手被他握着,低头脸红,心跳加速,陷入了短暂的失神。她还没来得及思考,林浩已经想到了什么。
片刻后,她听到林浩询问优雅:“优雅,如果让‘萤火虫’自己来解读这些巨量的日志,并最终作出人类能够理解的解释,你觉得可行吗?”
“确实可行。”优雅给出了肯定的回答,“不过,生成和解读如此庞大的日志会显着影响‘萤火虫’的运行效率。我的初步估算显示,性能可能会降低约百分之五十。”
林浩迅速地做了些计算,然后说:“根据初步测试,ENICA为‘萤火虫2.0’带来了超过一百二十倍的性能提升,即便因为透明性合规而牺牲百分之五十的性能,相比‘萤火虫1.0’仍然有近六十倍的性能提升。这完全满足了我们的需求。”林浩有些庆幸,自己在新闻发布会上,保守地只说了“五十倍”这个数字。
让人工智能自己来解释自己,以达成透明性合规。林浩在沈语熙的启发下,终于在立秋的这天,找到了解决问题的方向。