未来的汽车行业,是典型的线上线下结合大量线下服务场景的汽车行业,也需要有效的算法来突破线上线下的数字世界。
张春林(上海数策软件有限公司总经理)
随着互联网技术在日益开放的网络环境下的不断发展,移动互联网已经进入成熟阶段,主流消费以互联网的形式呈现,使得个人行为产生的数据呈爆炸式增长。云计算、大数据、人工智能的蓬勃发展,预示着万物互联时代已经到来。
事实上,对于汽车行业来说,汽车不仅仅是一种交通工具,更是一种超越移动本身的内容和服务的载体。在高效直连消费者的移动互联网时代,车企关心的不仅仅是车,更是车主;只有不仅创新车生活,更创新车主生活,才能完成围绕出行服务的业务转型。
然而,要实现这些创新,传统车企存在先天不足,尤其是在消费者洞察方面:一直以来,车企的传统CRM实际上只停留在客户关系管理层面,崇尚以客户为中心,往往是以车为中心;线下卖车修车的传统商业模式也是以车为中心,低频单调。
所以车企基本没有关于人的数据,对车主也知之甚少。而人的数据在互联网上,为了通过客户数据驱动创新,车企需要在商业模式和技术平台方面进行自我改革,融入互联网基因。
进入互联网,数字世界的复杂度升级了,世界不再是二维结构,而是超维的;世界不再是平面的,而是立体网络化、相互关联的。所有的数据计算不能仅仅是二维关系数据库查询,还要进行基于图结构的知识表达和推理。基于图的最简单的应用就是互联和认知算法,我们称之为超ID算法。互联网公司也有类似的名字如SuperID和UserGraph。
在互联网早期,需要这种算法来解决三个关键问题:这是谁的设备?设备之间的关系是什么?设备所代表的人的画像是什么样的?就计算复杂度和数据纯度而言,该算法实现起来并不十分困难。
进入移动互联网时代后,互联网公司通过创新控制搜索、电子商务、社交网络等流量入口,发展了大量的O2O服务。整合了海量的线下信息,增加了算法的几何难度,这样不仅可以通过机器设备呈现人的画像,还可以确切的知道谁拥有设备,人与人之间的关系如何,这个人所在的圈子的画像如何。线上和线下没有明确的界限。
未来的汽车行业,是一个典型的线上到线下,有大量线下服务场景的行业,也需要有效的算法来突破线上线下的数字世界。
汽车行业探索HyperID算法才刚刚开始,难度比较大。因为我们车企的数据质量比人们通常估计的要差很多。比如某经销商报虚假客户手机号进行CSI/SSI电话回访以获得高分;在系统中填写手机号、身份证号、车牌号时不慎输入错误;易手车数量很大,但系统无关紧要;客户更改手机号码和联系方式,导致业务系统之间的数据真实性无法区分.
这些问题最本质的原因是我们的数据主要是经销商手工填写的。利用算法,可以有效解决这些问题。例如:
图中有三类实体:红色代表身份证号,黄色代表手机号,蓝色代表车架号。客户的信息以图表的形式展示出来,会和你一开始想象的不一样。左右两堆紧密聚集的实体都以一个手机号码为中心。很容易看出这些是“脏”数据。在商业话语中解读,经销商在卖车和修车过程中填写销售顾问和服务顾问的手机号码,用于CSI/SSI res
还有,我们分离了二手车车主和新车车主的子图,数据量有几十万;在无数这样的圈子里,我们用算法修复人工填写的错误,数据量几百万;人机关系链识别,数据量几十亿。对这些数据进行管理和打通后,基于纯数据进行知识推断,发现人际关系的网络。例如:
这张图有三对关系:翁婿,朋友,夫妻。如果有两个人,年龄相仿,性别相反,同一辆车(车主和会员)关系非常密切,那么很自然地推断他们是夫妻。其他人际关系也差不多,就不一一列举了。这些信息其实沉睡在我们的数据库里,只有算法才能让数据发挥应有的价值。我们相信这些数据是相互关联、相互吸引和相互开放的。获取的数据越多,汽车公司就越了解他们的客户和车主。
再者,通过结合产品/服务数据(保养套餐、配件、租车、延保)、环境数据(天气、季节、地点、节假日)、打通后人与人之间的关系链信息,帮助厂商及时有效地实现基于情境的全自动个性化精准营销。
随着5G和物联网技术的不断发展,到2021年,车联网的应用将进入普及期,各大车企的数字化能力将分三六九等。当一切都贴上电子信息,个体行为产生的数据将会爆炸,整个社会将被重塑为一个巨大的、无限可搜索的信息生态系统。
是否有好的算法有效统治数字世界,将是未来每个车企的核心竞争力之一。没有它,就无法真正实现汽车产业转型中以人为中心的出行服务业务转型。