数字经济时代,对于数据的开发越发重视,在现下大数据被视为如土地、劳动力等一般的战略资源,蕴含着不可限量的价值。
发展数字经济我们仍不可避免地面临着不少困难,其中数据的共享开放便是首当其冲的难题。放眼全球,情况同样如此。不同系统、不同组织之间的数据共享开放程度普遍较低,由此也带来了信息孤岛问题,海量的数据相互阻隔,难以进一步融合碰撞释放潜能。
如今,人工智能技术在各行各业中都展现出了优势,却面临两个重要挑战:一是在大多数行业中,数据以孤立的孤岛形式存在。另一个是加强数据隐私和安全性。百融云创致力于为金融机构提供全面的一体化解决方案——既要能够有效解决数据孤岛问题,又要能够持续保证运行系统的稳定,同时还要兼顾未来横向扩展的需求。
联邦学习技术的出现为解决数据隐私与数据共享的矛盾提供了有效方案。这是一种加密的分布式机器学习技术,可实现各个企业自有数据不出本地,通过加密机制下的参数交换方式,在不违反数据法规隐私的情况下,建立一个虚拟的共有模型,最终通过联合建模提升模型的效果。随着各界对金融消费者个人隐私保护的日益重视,数据和信息安全已经成为智能金融时代重要的信任基石。
百融云创人工智能金融实验室相关算法负责人介绍,运用联邦机器学习,一方面可以实现数据隔离,参与各方的数据不会泄露到外部,满足用户隐私保护和数据安全的需求;另一方面,通过联邦学习能够保证模型质量无损,不会出现负迁移,保证联邦模型比割裂的独立模型效果好。此外,重要的一点是各参与者地位对等,能够实现公平合作,实现打通"数据孤岛"到"共同富裕"的目标。
在应用场景层面,联邦学习主要有横向联邦学习、纵向联邦学习、联邦迁移学习三种。以纵向联邦学习来说,其特点是样本ID重叠较多、样本特征重叠较少,通过联邦学习可以实现双方获利,即无标签一方可以使用联邦模型预测,有标签一方提升模型准确度。比如银行和互联网公司的合作,银行有用户银行卡的收支行为与贷款信息,而电商企业掌握用户的商品浏览与购买历史信息,通过联邦学习双方可以在风控管理、信用评估、精准营销等领域实现合作。