信用卡审批风险规则自动比对地址和公司名称上海协森计算机科技有限公司于2012年12月引入上海协森计算机科技有限公司前身,2003年隶属于高阳科技(香港上市公司)境内银行信用卡申请服务事业部。2008年1月,团队独立成立上海协森信息科技有限公司,主要从事银行应用软件产品研发和项目集成服务。2008年12月更名为上海协森计算机科技有限公司,注册资本增至300万元。主要客户:交通银行、建设银行、中信银行。团队:18人,其中软件工程师15人。信用卡审批客户案件主体模糊匹配技术的好处信用卡审批流程的工作内容之一:将客户信息申请表中的客户地址与人行征信系统客户地址、社保系统客户地址、公安局身份证地址进行比对,将申请表中的客户工作单位与人行征信系统客户工作单位、社保缴费工作单位进行比对。状态:地址比对,工作单位比对电脑系统提供精确比对,人工比对约20个,约80个。通常,一个申请表格数量较多的银行信用卡中心,需要20人左右进行人工判断。引入智能中文模糊匹配软件工具,计算机系统提供模糊匹配,人工匹配约80次,约20次,减少到原来的1/4。由原来的20人工作量,减少到5人进行人工判断。效率提高4倍,每年节约人力成本约100万元。地址子群,单位子群,识别群骗。模糊匹配理论体系模糊匹配算法体系两物匹配度=同值属性数加权/属性总数加权属性带权值模糊匹配算法应用基于关键词的数据检索论文数据库检索地理信息数据库检索模糊匹配地址比较企业名称对比地址模糊匹配技术地址比该对的值为“是”和“否”,即1和0。从理论上讲,地址模糊匹配的正确率不可能达到100。目标匹配度实现模糊匹配算法100050匹配度100050模糊匹配工具应用架构权重规则参数行业信息数据库单位名称匹配行政区划数据库道路数据库地址匹配地标数据库单位同义词数据库模糊匹配核心算法实时接口文件接口地址标准化批量匹配查询黑名单数据库黄页信息数据库黑中介数据库地址成对匹配公司成对匹配黑名单(地址/公司名称)查询中文地址模糊匹配算法原理利用规则和权重的组合算法,最终得到两个地址的匹配度。基于层次结构的地址库分词分析行政区划道路门牌号地标名称楼号其他地址模糊匹配技术广东省广州市天河区天河路45号天伦大厦13楼基于分词的地址匹配技术采用该方法,易于维护地址切分库,并构建自学习地址库,不断丰富和完善,提高了匹配范围和匹配精度。行政区划、其他同义词、地标、道路、分词、切分、匹配算法、参数信息管理、分词、解析算法、字符预处理、地址元素、地址比对接口API、HTTP地址知识库行政区划库建立了三级行政区划库:23个省、5个自治区、4个直辖市、2个特别行政区、283个地级市、374个县级市、1636个县、852个市辖区。根据业务需要,行政区划可扩展至四级道路库中近100万条道路,并包含其对应行政区划的信息,可进行升级。路库自学功能、同义词知识库机制、地标与详细地址对应、同一地点两种写法对应、主要算法机制、特殊字符过滤、繁体转换为简化地址、行政规划科地标知识库分割分析机制、地标名称切分从字典中查找道口品牌同义词用标准名称代替,路段化解,噪声词去除,数字段(大写/中文)转换,数字格式解析、门牌号分段、权重参数分段、一票否决参数、企业名称模糊匹配算法原理、基于分词的模糊匹配算法、企业标准名称、分段模糊匹配行政区域+企业名称+行业属性+企业属性+分支机构+部门分段权重一票否决同义词及知识库机制关键词库中文模糊匹配在信用卡审批业务申请表信息比对申请表分别与人行报告信息、公安部信息、社保信息进行比对。申请表与历史申请表信息比对申请表与人行报表历史数据库信息比对申请表与欺诈历史数据库信息比对单黑名单查询批量处理应用批量黑名单查询子群/插入功能、群防欺诈批量查询批量处理技术聚类性能优化算法当地址聚类时,将地址标准化排序后,街道上相同的地址会排列在相邻位置,使聚类的效率大大提高。下面的流程图。公司名称分组时,规范后,将按行政区域分批分组。黑名单(黑中介),黄页,历史编码库性能优化算法,原始信息数据库内容,标准化,排序,分区。将待查记录直接定位到相应的块中进行查询,提高了效率。标准地址客户机地址根据标准地址,取第一条记录N条记录取下一条记录,比较相邻记录到文件末尾,设置相同组号加1匹配不匹配的运行平台和性能测试硬件环境CPU:Intel或AMD 3GHz+内存:16G+硬盘:320G+支持两种软件环境Windows Server 2008企业版R2,64位操作系统,微软。Net框架,IIS UNIX平台(Linux),DB2数据库,J2EE主体20并发,最大响应时间秒,50并发最大响应时间为秒。10万,31秒100万,9分钟500万,51分钟1000万,1小时37分钟100万,9分钟500万,55分钟1000万,1小时43分钟黑名单匹配(比较6个字段,1个公司名称,2个地址,3个电话)17分钟定制内容和服务算法偏好调整成对匹配实时界面成对匹配文件界面数据库模糊匹配查询分组功能该产品的客户案例交通银行信用卡中心建设银行风险管理部和信用卡中心中信银行信用卡中心