基于联邦学习的地方征信平台建设路径探讨

发布时间:2022/09/20 |来源:《征信》

分享到

  地方征信平台建设是解决信息不对称问题、推进中小企业等主体将“信用”向“信贷”转换,促进普惠金融发展的重要抓手。近年来,地方政府、人民银行对地方征信平台建设进行积极探索和有益尝试并取得积极成效,但仍面临信息共享和应用不足、信息安全保障难等问题,建设成效有待提升。从地方征信平台建设工作实践出发,探讨利用联邦学习技术对信息“分别持有,联合使用”的优势,突破地方征信平台建设面临的瓶颈,提出由地方政府统筹推进,依托联邦学习技术框架建设地方征信平台,发挥平台信用赋能作用,拓展数据信息多元化应用的路径和相关建议。
  一、国我地方征信平台建设情况及痛点
  (一)国内具有代表性的地方征信平台建设实践
  本文所讨论地方征信平台是以多部门信息共享为基础,提供信用信息服务,以金融风险防范、促进企业和农业主体融资为主要目标的平台。目前,我国地方征信平台建设多采取“政府+市场”模式,由当地政府、人民银行主导推动。其中,起步较早、成效较突出、影响较大的建设实践有浙江“台州模式”、江苏“苏州模式”、广东“粤信融”平台、四川“天府信用通”平台等。
  1.浙江“台州模式”——金融服务信用信息共享平台
  2014年起,台州在小微企业信用信息应用上先试先行,首创金融服务信用信息共享平台。该平台由政府出资建设,设立专门事业单位管理,免费向银行提供信息服务,形成“政府主导+市场应用”的平台模式。经过多年发展,该平台逐步形成集政、银、企服务为一体的数字金融服务“旗舰”,截至2021年年底,平台已归集台州辖内金融、公安、税务等30余个部门的信用信息,实现对全市近70万个市场主体信用建档的覆盖。
  2.“苏州模式”——苏州征信平台
  苏州企业征信平台于2014年开始建设,在苏州市政府和人民银行牵头组织下,当地国资背景的市场化企业征信机构(苏州企业征信服务有限公司)全面整合企业信用信息,建立苏州地方征信平台,实现政府部门、公共事业单位信用信息的有效共享,并开发征信报告、信用评分、风险预警等多种征信产品。苏州市依托该平台帮助企业在线发布融资需求,实现金融机构线上受理融资申请,有效提升中小微企业融资效率。截至2022年2月,平台已归集39万家企业在75个政府部门和事业单位的信息,帮助超过3.7万家企业解决融资需求。
  3.广东“粤信融”平台
  “粤信融”平台即广东省中小微企业信用信息和融资对接平台,该平台由中国人民银行广州分行牵头建设,汇聚全省政务信息和公共信息,实现全省跨层级、跨部门、跨地域的涉企信用信息共享,并提供融资对接服务,有效支持广东省中小微企业融资。该平台由广州银行电子结算中心承建和运营,通过结合市场化建设运营模式,一定程度上实现了征信平台的可持续发展,具有一定的示范作用。截至2022年2月,平台已为超过14万家企业解决融资需求。
  4.四川“天府信用通”平台
  “天府信用通”平台即四川金融信用信息综合服务平台,平台由中国人民银行成都分行联合四川省发展和改革委、四川省大数据中心等8家省级部门共同发起建立。平台定位为“准公共性”的金融基础设施,按照“共建共享”的原则,整合全省政务数据资源,接入全省银行机构,引入百行征信等市场化机构,构建多维度信用信息共享、全品类基础征信产品集成、全金融业务场景覆盖、融资需求高效对接的服务体系,形成“信用到信贷”完整生态圈。截至2022年2月,平台已为企业解决融资超过5400亿元。
  (二)现有地方征信平台的主要经验做法
  1.广泛归集信用信息
  地方征信平台主要归集政务和公共数据,个别平台同时采集银行的金融数据。平台归集的政务信息覆盖面广泛,种类齐全,一般都包括工商、税务、社保等基础政务部门信息,其他政务信息、水电气等公共数据也在积极拓展。例如“天府信用通”平台归集了电力、不动产交易、公积金、法院判决等企业信用信息,为企业建立信用信息“云档案”。
  2.深入挖掘数据价值
  依托大数据资源提供征信信息服务,各平台都建立了企业信用评价和评分体系,并依托平台推动信贷产品创新,充分挖掘数据信息的内在价值。如“天府信用通”建立企业信用评价和评分体系,对企业进行“画像”,开发不动产抵质押贷、专利贷、银税互动等专项特色信贷产品,有效挖掘数据价值,为企业“增信”。
  3.积极开展促融资应用
  各平台支持企业在线发布融资需求和申请,鼓励金融机构发布线上信贷产品并在线受理融资业务。各平台均致力于提升银企融资对接效率,并探索运用大数据技术实现对信贷产品和融资需求的精准匹配和自动撮合。部分平台探索拓展非信贷领域应用,如“粤信融”平台除涵盖征信服务、信贷业务外,还提供不动产登记金融服务、联合打击涉诈、涉赌犯罪等涉及中小企业和民生领域的普惠服务。
  (三)地方征信平台建设的痛点
  1.共享意愿不充分,“信息孤岛”仍存在
  一是逐步强化的信息安全法律约束引发各数据源机构顾虑。近年来,我国《民法典》《个人信息保护法》《征信业务管理办法》等法律法规及行政规章相继出台,对信息安全提出了更高要求,法律风险导致一些政府部门对信息开放的态度非常谨慎。二是部门和行业壁垒推动形成“信息孤岛”,各部门多存在“没有法律、标准支撑,不敢交易”“认为数据重要,不愿交易”“受制于数据技术研发瓶颈,不会交易”等问题,限制了信息共享水平,造成了大量有价值的信用信息资源被闲置。
  2.数据归集加工效率低,数据质量缺乏保障
  当前征信平台多采用集中式数据库建设模式,原始数据需要从数据源单位归集保存到核心数据库,再进行加工应用。该方式存在以下弊端:一是数据归集加工效率低。地方征信平台建设涉及的数据源众多,原始数据量庞大,数据传输保存和数据加工的工作负荷极大,导致平台数据归集和应用效率不足。二是数据不同步,数据质量无法保障。原始数据源对外共享需经过复杂的审批和传输流程,核心数据库与数据源原始数据存在时间差,数据的及时性、完整性、一致性无法保障。
  3.信息安全存在隐患,隐私保护较为薄弱
  地方征信平台建设涉及数据信息交换、发布、使用等多个环节,存在信息安全和侵犯隐私风险。一是数据未实现全程加密传输,个别机构甚至还采用U盘、移动硬盘等存储介质传输原始数据,传输过程存在信息泄露风险。二是未在技术层面实现信息使用范围最小化,在使用人员可掌握原始数据的情况下,无法有效限制信息复制和传播范围。三是无法保障信息流通和使用得到信息主体充分有效授权,对信息主体隐私保护不足。
  4.融资撮合精准性有待提升,配套服务不完善
  对接入平台的金融机构而言,当前信息加工的深度仍有限,信用信息深加工产品,定制化、竞争化的银行获客服务,以及后续跟踪管理和预警等服务开发尚存不足。对信息主体而言,定制化的金融产品和服务较为有限,获得融资的流程仍较繁琐,线上融资担保、信用培育、政策资金等配套支持服务较欠缺。同时,为其他利益相关主体、政府部门等提供的平台服务较少。
  5.市场化水平较低,平台长期运营活力不足
  地方征信平台多为政府发起,公共属性较强,目前主要提供基础性、公共性服务,市场化机构参与程度不够深入,平台市场化、个性化、定制化的产品和服务较欠缺。同时平台运营依赖政府投入,平台自身经营尚难以创造合理经营利润,无法有效满足相关各方权益和利益诉求,不利于调动各方参与平台建设的积极性。
  二、联邦学习技术应用于地方征信平台建设的可行性
  联邦学习(FederatedLearning),又名联合学习、协作学习。该技术在保障各参与方数据隐私不泄露、合法合规的前提下,联合建立虚拟的共有模型,通过加密的参数交换,实现原始数据不交换、不移动的同时联合开发利用数据价值,简言之,就是实现数据“分别持有,联合使用”。
  (一)联邦学习机理
  以地方征信平台建设为例:为共享和应用数据,参与平台建设的多个数据所有方(如政府部门、事业单位、银行等)F(ii=1,2,…,n)想要共享各自的征信数据D(ii=1,2,…,n)建立联合模型时,传统做法是把各方原始征信数据Di整合到一方,并利用征信数据D{ii=1,2,…,n}进行开发并得到征信模型Msum,以实现预期的征信平台效果Vsum。然而,在地方征信平台建设实际工作中,该方式由于涉及信息主体隐私、数据安全和制度约束等问题往往难以实施。采用联邦学习,各征信数据所有方Fi在不给出己方征信原始数据Di的情况下,由协调方牵头建立联合征信模型Mfed,并将模型的基本结构与参数告知各参与方;各参与方利用本地数据进行模型训练,并生成结果参数返回给协调方;协调方汇总各参与方的参数不断优化联合征信模型Mfed,提升模型性能和效果,并逐步实现联合征信模型Mfed的效果Vfed与征信模型Msum的效果Vsum之间的差距足够小,即:|Vfed-Vsum|<δ(这里,δ为一个任意小的正值)。
  (二)联邦学习主要分类及适用情况
  1.根据联邦学习架构分类
  从架构视角,可将联邦学习分为弱中心化联邦学习和去中心化联邦学习。弱中心化联邦学习需要一个中心节点,其定位与传统集中数据库的强中心化节点有所不同,弱中心化节点只是协调方,负责执行约定的规则,并辅助参与方进行参数等信息交换,不汇聚、存储原始数据。去中心化联邦学习则是完全不建立中心节点,采取完全平等,以点对点方式开展联邦学习,目前主要两两联邦学习中应用。
  2.根据数据分布情况分类
  根据联邦学习所使用数据在各个参与方的分布情况,联邦学习可分为三类:纵向联邦学习(VerticalFederatedLearning,VFL)、横向联邦学习(HorizontalFederatedLearning,HFL)和联邦迁移学习(FederatedTransferLearning,FTL)。
  纵向联邦学习的本质是特征的联合,适用于用户重叠多、特征重叠少的场景。比如同一地区的各个政府部门和银行,他们的用户都是该地区的企业或居民(样本相同),但业务不同(特征不同)。纵向联邦学习就是将这些不同特征在加密的状态下加以聚合,以增强模型能力的联邦学习。
  横向联邦学习的本质是样本的联合,适用于参与者间业态相同但客户不同,即特征重叠多,用户重叠少时的场景。比如不同地区的银行间,他们的业务相似(特征相似),但用户不同(样本不同),横向联邦学习可以被考虑用来构建联合模型。联邦迁移学习的核心是找到源领域和目标领域之间的相似性,适用于数据集的用户与用户特征重叠都较少的情况下,不对数据进行切分,而利用迁移学习来克服数据或标签不足的情况。比如有两个不同地区不同类型的机构,这两家机构的用户群体交集很小,在这种情况下,就必须引入迁移学习,利用交集进行联邦学习。
  (三)联邦学习应用于地方征信平台的优势
  1.数据不出本地,消除地方征信平台参与方顾虑
  采用联邦学习架构开展地方征信平台建设,参与机构无需对外提供本机构原始数据,仅需交换模型中间参数,便可实现数据共享应用,大大降低平台建设参与方对于失去数据所有权和控制权、合规性风险方面的顾虑,有效提升平台建设参与积极性。
  2.信息安全强化,实现征信“数据可用不可见”
  联邦学习技术出现的初衷便是解决数据安全和隐私保护,它采用差分隐私、同态加密、隐私保护集合交集三大安全技术。采用联邦学习架构开展地方征信平台建设,可以实现数据隐私全面保护下的数据共享利用,实现征信数据“可用不可见”。
  3.数据来源唯一,确保征信数据质量
  相比传统集中数据库的方式,联邦学习未将各参与方数据整合到同一数据库,也未对原始数据进行复制,而是由模型直接对原始数据进行分析,减少了数据传输而产生的时间延迟,同时解决了集中数据库方式中数据不同步的问题,确保了数据应用过程的逻辑统一,数据及时性、准确性、完整性均得到保障。
  4.接入方式便捷,便于应用拓展
  与传统集中式数据库的建设方式比较,参与机构可根据联邦学习模型参数独立训练自身模型,无需集中数据后再训练,同时减少大量数据传输通信成本和处理成本,为地方征信平台的后续机构接入和平台应用场景的拓展提供了方便快捷的通道。此外,参与机构可以将平台的联邦学习本地模型和方法应用于多一些相似性的应用场景中,一次生成多个本地模型,灵活地实现自身应用的拓展。
  三、基于联邦学习的地方征信平台建设路径
  基于联邦学习的地方征信平台建设,总体思路是:坚持“政府推动+市场主导”原则,以建立信用信息多方共建共享机制为核心,运用联邦学习等技术建立和完善地方征信平台基础设施,深入挖掘信用信息价值,以市场需求为导向拓宽平台多元化应用,提升普惠金融发展水平,如图1所示。
  图片
  (一)地方政府统筹推进,构筑共建共享机制
  1.明确目标规划
  充分吸纳国内现有地方征信平台“政府推动”的建设理念,明确将地方征信平台定位为地方重要金融基础设施,将平台建设纳入地方普惠金融和数字经济重要规划,打造以征信信息和服务为基础的,以提升普惠金融效能为目标的地方征信平台,推进各领域信用信息共享,发挥数字资源价值,助推金融数字化和普惠金融发展。
  2.落实责任分工
  由地方政府统筹指导,推动成立由地方发展和改革委、人民银行、大数据监管局等部门组成的平台建设领导小组,由人民银行牵头开展平台建设和管理。建立涵盖信息共享、平台运行管理、信息安全等方面的平台相关制度,构建地方数据资源共享体系,厘清部门职责和分工,健全工作督查和考核机制。引导政府相关部门、公共事业单位开放共享公共数据,加强对金融机构普惠金融业务发展的指导,建立地方征信平台应用推广的考核评价机制。引入专业化的市场机构,负责平台的具体建设实施。
  3.配套激励措施
  明确配套政策和专项资金支持,建立健全激励约束机制。各相关部门根据职责制定出台支持平台建设和普惠金融发展的政策措施,加强对地方征信平台数据采集、运营管理、业务发展的激励和风险补偿,确保数据及时、全面、准确。金融监管部门依托平台灵活运用货币政策工具和监管手段,强化激励约束,引导金融机构充分利用地方征信平台开展普惠金融业务。
  (二)依托联邦学习技术框架建设地方征信平台,夯实大数据基础
  1.采用弱中心化架构搭建地方征信平台框架
  结合地方征信平台“政府推动”的理念,采取弱中心化的联邦学习架构进行搭建。鉴于近年来地方政府大多设立了诸如大数据管理局等部门,并建立了政务类信息中心,可依托信息中心建立弱中心化的联邦学习协调中心,并安排专业化机构进行运营。协调中心协调参与方执行约定的数据共享规则,辅助参与方进行信息交换,同时可将其作为信用体系联合模型训练节点,充分利用现有的网络和数据资源。
  2.基于“纵向联邦学习”开展征信数据模型训练
  地方征信平台数据共享是以某地域内的信息主体(企业、居民)为样本,同地域的不同机构(政府部门、金融机构、其他社会组织)管理或服务的对象基本重叠,而各机构履职或服务中产生的数据各有不同,即数据样本所描述的主体基本重叠,但产生不同的特征变量。基于上述两个因素,地方征信平台建设应采用纵向联邦学习模式,如图2所示。
  (1)数据样本加密对齐。地方征信平台参与方充分沟通,筛选各方能提供的信息主体标识(企业标识可使用企业名称、统一社会信用代码,个人标识可使用姓名、身份证号),通过联邦学习常用的动态加密等技术,应用上述标识进行数据样本对齐,得到各方的数据交集。
  (2)模型加密训练。可由地方征信平台协调中心根据平台建设目标、结合各参与部门共享的数据项和金融业务实际,建立地方征信平台联邦学习全局模型,模型包含但不限于数据价值挖掘、客户评价、信贷业务撮合、风险管理等模块。协调中心将地方征信平台全局模型参数等信息进行下发,各参与方根据下发的参数,结合自身的具体业务建立本地分模型。协调中心向各参与方发送公钥,用于模型加密训练,参与方利用分模型计算和自己相关的中间结果和模型的损失量,并加密发送给协调中心;协调中心解密中间结果和损失后回传给参与方;各参与方根据回传参数更新自身分模型。
  (3)模型迭代优化。通过反复训练,全局模型利用共识机制进一步验证数据真实性,反馈残缺信息,更正错误信息,筛选出信息价值高的指标特征,不断优化模型构建,提升模型准确度和有效性。
  3.充分挖掘数据价值,为普惠金融提供信息支撑
  依托地方征信平台,广泛共享各领域信用信息,构建全面覆盖企业和个人主体,涵盖政务、金融、商务等各大领域信用信息的大数据枢纽,深度挖掘数据价值。基于信贷业务需求,开发信息主体身份核实、信用画像、信用评级、信用评分、客户标签、风险预警提示等数据深加工产品,实现信息主体“全景信用画像”,提升产品针对性和实用性,为解决普惠金融风险识别难、尽职免责难、首次贷款难、信用贷款难等问题提供大数据支撑。
  (三)发挥平台信用赋能作用,拓展多元化应用
  以市场应用为导向,充分发挥平台大数据融资增信的核心作用,依托平台建立线上金融超市,引导金融机构依托地方征信平台大数据开发信贷产品,开展线上业务精准对接撮合。利用平台增强对绿色低碳、先进制造、农业农村、产业供应链的金融支持,增强金融服务的精准性和有效性,提升普惠金融发展质效。积极拓展平台在其他社会领域的应用,深化政务金融合作,强化金融服务与财政政策、产业政策的对接,支持行政征收、财政奖补等政策落实,便利各项惠企便民措施实施,助推政府“放管服”改革。探索利用平台开展金融监管应用,借助平台大数据对金融业务进行全流程、穿透式、精细化监管。
  (四)培育与监管并重,确保平台业务健康发展
  加大普惠金融对象的信用培育。引导融资担保机构入驻地方征信平台,通过平台提供小微信贷担保服务,实行优惠担保费率,降低反担保要求;引导小微企业等信息主体注册使用平台,授权共享自身信息,积极积累信用资本。对重点扶持领域,可由对应的政府主管部门联合金融监管部门,依托平台建立扶持名录库和“培育池”,持续跟踪进行信用培育。塑造和宣传平台支持普惠金融典型案例,扩大平台影响力和吸引力。强化平台信息安全管理,推动安全管理制度的建设和落实,完善信息使用授权管理,配套建立信息主体权益保护机制,强化商业秘密和个人隐私保护,确保地方征信平台的建设符合相关法律法规的要求。
  四、推动联邦学习在地方征信平台领域应用的建议
  (一)开展征信领域联邦学习应用标准体系建设
  联邦学习作为一项新技术,在征信领域中的应用尚缺乏行业标准,导致该技术运用于征信业务时难以入手,也不利于不同的联邦学习平台交互对接。同时,征信业务对数据安全要求极为严格,需要对联邦学习技术的应用场景进行明确约定和限制。建议由征信业务主管部门牵头,联合工信部门,组织征信机构、商业银行开展标准制定研究,从联邦学习的学习架构、数据安全、数据应用、兼容性等方面进行统一规范,推动联邦学习在征信领域有效应用。
  (二)建立征信领域联邦学习应用的激励机制
  建议出台制度鼓励联邦学习在地方征信平台建设领域的应用,明确将联邦学习作为地方征信平台建设的重要技术路线,创造有利于联邦学习应用的政策环境,对于创新应用联邦学习技术,推动征信平台建设发展的项目,给予一定的补贴支持。建立市场化激励机制,在地方征信平台建设过程中,积极创造商业价值,对联邦学习中贡献数据的参与方和数据加工处理方给予积极合理的回馈,提升参与方积极性。引导市场化征信机构接入平台,创造高附加值的征信产品,保持地方征信平台的长期运营活力。
  (三)培养征信平台建设领域的联邦学习应用
  人才队伍整合征信业务和联邦学习技术人才,组建一支征信平台建设领域的联邦学习技术应用研发队伍。围绕联邦学习技术与征信业务结合,建立交流共享机制,持续关注国内外最新的联邦学习技术发展动态,对联邦学习技术在征信业务的应用进行技术储备,并积极探索技术创新。同时,注重理论联合实际,在各省地方征信平台建设中试点引入联邦学习应用,在实践中锻炼和培养人才。及时总结经验并充分交流共享,打造精通地方征信平台建设和联邦学习技术的全面型人才和团队。
  (本文选自《征信》2022年第9期,作者杨阳任职于中国人民银行马鞍山市中心支行。)

文章搜索

分享到微信朋友圈x