分布式数据库在杭州中支非现场金融监管的应用探索与实践
2020-02-24 13:10 文章来自:央行科技司 收藏(0) 阅读(2074) 评论(0)
近年来,随着市场竞争日益加剧,第三方支付机构在业务开展过程中,存在未有效落实人民银行账户、特约商户实名制,账户开立资料不全,虚假、违规申领POS机具等情况。
    为进一步规范银行卡收单机构经营行为,培育良好的银行卡市场竞争环境,杭州中支使用自建的分布式数据库系统(Cloudera Hadoop),以特约商户真实性审核为途径,结合浙江省政府“最多跑一次”省级部门间数据共享平台,获取浙江省工商注册数据,以规模庞大的存量商户为重点,全面开展存量商户实名制非现场核实监管,取得显著成效。
    一、部署节点集群,构建高可用分布式数据库
    大型数据库通常运行在IBM或HP小型机上,采购、维保费用高昂。杭州中支基于开源免费的Cloudera Hadoop(以下简称CDH)搭建分布式数据库,实现低成本海量数据处理。杭州中支CDH平台目前共配置4个计算节点,使用联想X3650 PC服务器,配置两块Raid卡、12块900G SAS盘,其中两块硬盘Raid 1安装操作系统,另外10块盘Raid 0作为数据盘;所有节点分别与两台万兆交换机互联做数据交换,与两台千兆交换机互联做业务管理。
    二、完善数据资产列表,制定数据安全规范
    杭州中支制定《数据资产安全管理办法》,对数据资产进行安全等级分类,防止数据管理不善而导致数据泄密、丢失或损毁。同时建立全省统一的金融数据资源目录,梳理各类数据资源,及时掌握信息的来源、类别、内容、要素、单位等,定期更新并公布,做到数据资产共享最大化。
    基于本次数据利用项目,杭州中支及时将“浙江省工商注册数据结构”、“特约商户数据结构”添加进省级金融资产目录,并将该项数据资产定为3级(敏感)数据,只能在人民银行内部限制性使用,规定业务部门在数据查询时,只能看到相关查询结果,无法查看工商注册数据的原始数据。
    三、科学制定非现场监管比对工作方案
    科技处与支付结算处、浙江银联多次开会讨论方案,立足现有数据采集现状,充分利用银联商户交易平台与注册平台数据特点,将有交易记录的商户信息,与注册平台信息进行初次匹配,获取尽可能多的商户基本信息,在此基础上,以工商登记营业执照名称和营业执照代码为比对要素,生成两要素比对均不一致、单要素比对不一致、两要素比对均一致但商户工商登记状态为已注销等三张问题商户清单。
    分布式数据库通过将数据计算分布至多个数据节点进行并发查询处理,充分利用各数据节点的CPU及IO能力,大幅提高数据库性能。不仅提高了数据入库效率,更使得数据查询效率也有所提高。同时,利用工商部门实时同步的登记信息进行比对,解决了人工抽查存在的不准确、不全面问题,能做到精准发力。本次银联商户实名制非现场监管工作共比对商户数据127万条。