东西方(微信官方账号:zhidxcom)文|心缘
很多人第一次看到M technology,都会误认为是“京”。虽然“胡”字并不常见,但却有着特殊的含义。取自“美丽深邃的眼睛”之意,三只“眼睛”的组合符合安防领域被喻为“第三只眼睛”的说法。
顾名思义,神启科技很早就扎根安防行业做算法,是国内最早提出汽车人脸识别,专注于视频结构化算法的安防公司之一。
在中关村国际创新大厦,智东西与神变科技CTO王建辉进行了深度对话,看这家由北大创立的公司如何在安防行业早早抓住AI时代的浪潮,成为视频结构化领域的种子选手。
深物科技CTO王建辉
20年安全资深CV/ML学术精英,行业与学术界玩家携手创业。
神团科技创始人兼CEO陈瑞军,1987年是北京大学经济管理系的学生。毕业后在大唐电信做业务员。2001年在北京创办了FrogVision通信公司,专注于视频光通信领域。他利用光通信经验解决数据传输问题,在安防行业积累了深厚的工作经验和行业理解。2011年,陈锐军离开青蛙视界传播。
后来,陈锐军通过朋友认识了加州大学圣迭戈分校著名CV/ML学者涂教授和华中科技大学电子信息工程系白翔教授。在涂教授的建议下,他们于2012年成立了华福睿智公司,也就是现在的神变科技。
渐渐地,团队里的年轻人开始“抛弃”华府锐志这个名字,有点土。最后深度学习开始席卷全球,所以他们团队想用“深度”这个词作为名字。作为一家以计算机视觉起家的公司,他们也想用和眼睛相关的词。在"学生"和"远见"这两个词被许多其他公司使用之后,"胡"这个特殊的词进入了他们的视线。
“胡”字由三个“眼”组成,意为美丽深邃的眼睛,也可指“第三只眼”的安防领域。于是,现在,这家公司正式更名为“神变科技”。
王建辉的本科、硕士和博士都在华中科技大学就读。博士期间主要研究算法的硬件加速。王建辉不仅与神七科技首席科学家王兴刚是本科同学,还在博士毕业前认识了陈瑞军,并收到了陈瑞军的邀请。
20.毕业一年多的王建辉加入深变科技,担任CTO,负责整体技术。
据王建辉介绍,深边科技2017年获得考拉基金数千万元A轮融资,最终获得东方盛骏数百万元天使轮投资。目前,其团队约有220人,其中R & ampd人员占总人数的一半左右,年轻人占队伍的绝大多数。
率先推出汽车人脸识别,成为视频结构化的排头兵。
与大多数CV公司从成立开始就涉足人脸识别领域不同,深边科技首先在汽车人脸识别领域布局AI技术。
王建辉告诉志东,早期之所以不做人脸识别,是因为从国家建设的角度来看,当时建的所有摄像头的高度都不低于那个高度,这个高度的摄像头看不清人脸,不适合人脸识别。
现在一些摄像头的高度可以降低,摄像头越来越高清,可以清晰的摄取一些人脸数据,所以我后来开始做人脸识别。
在陈瑞军等人的带领下,早期的深度视觉技术使用传统的计算机视觉算法,准确率较低。2012年底,他们首次提出了“汽车人脸识别”的概念,并完成了产品开发。当时深度学习还主要活跃在学术界。
到20日,他们开始转用深度学习算法,成为首批将“深度学习”技术应用于“汽车人脸识别”的公司之一,并推出了一系列汽车人脸识别产品,包括车辆特征识别算法SDK和车辆集成平台等。它明白了
然而,在安全领域,除了车辆,对人的检测、识别和分析也是一个重要的事件。在汽车人脸识别的基础上,陈锐军等人从一开始就带领团队做视频结构化算法。
结构化视频是解决安防系统整体智能化的重要途径。可以自动识别不同视角、不同光照条件下的车辆、人脸、人体特征,方便后期快速检索。
目前,中国有数亿个监控摄像头,每秒产生约66TB的非结构化监控视频数据。基于深度学习的车辆和行人识别算法比传统方法更加高效和准确。
据王建辉介绍,深边的视频结构化平台可以分别识别20多种车和20多种人的属性,准确率和效率都达到了行业领先地位。
目前平台可以识别5500多种前品牌车型,3500多种后品牌车型,基本覆盖了目前国内所有上路的车辆。
除了识别车身特征和车牌,平台还可以识别车辆更多的特征属性,如年检标志、遮阳板、纸巾盒、天窗、备胎等车内外各种物体的属性。
对于司机和乘客来说,平台不仅可以提取性别、年龄、发型和胡须、衣服颜色和款式等特征,还可以分析车内人员的行为,包括是否存在开车时不系安全带、打电话等违法行为。
以车辆识别和视频结构化为核心,在实际业务需求的驱动下,深变科技陆续推出了更加完整的产品布局,包括结构化网络摄像机、嵌入式视频分析仪、智能存储和集中分析服务器,从边缘到云端全面发展。
两大优势:高效的算法和海量的行业数据。
现在安防领域人、车、物整体解决方案的玩家越来越多。面对越来越激烈的竞争,王建辉认为神启科技有两大优势:一是其视频结构化算法在准确率和效率上领先业界,二是因为进入较早,从实际应用中积累了众多客户和庞大的数据集。
从传统的计算机视觉到AI算法解决问题,陈锐军带领的deep团队一度面临计算能力的挑战。20岁到20岁之间,他们开始用深度学习来解决问题。
那时候GPU服务器还没普及,公安用的云计算服务器建设基本都是CPU服务器,很少用GPU。面对计算资源的严重不足,当时他们对算法做了很多优化,使其可以在CPU中完成计算任务。
然后计算能力的爆发给安全市场带来了新的活力。他们继续保持自己的节奏,专注于算法精度和效率的提升。
由于视频结构化的计算量巨大,为了提高视频数据实时处理的计算效率,在陈瑞军、王建辉等人的带领下,神启科技去年还联合硬件厂商推出了基于FPGA神经网络算法的硬件加速芯片,目标是将CPU的功耗比提高4-8倍。因为市场表现不如预期,芯片产品一直迭代到今年2月。
目前深边科技在边缘计算主要使用的神经网络加速器是华为HI3559A,服务器使用的芯片是Bitland、Nvidia、华为盛腾310等。
但是,芯片业务并不是神府的主线。王建辉告诉志东,深孚的核心业务在于视频结构化算法,核心竞争力在于算法的准确性和效率。在很多客户的测试中,他们的视频结构化算法性能都是行业第一。
比如今年8月初在无锡的一次视频结构化测试中,在算法准确率非常高的情况下,神变科技的算法效率可以达到竞争对手的2到3倍。
长期的行业数据积累也是提升竞争力的关键。王建辉表示,在数据收集和车辆相关标识的标注方面存在困难
其次,大量人脸识别匹配环境,可以邀请一些公司去商场等指定地点做数据采集。但是车辆数据并不好收集,获取路面视频监控数据的唯一渠道就是公安。
另外,车辆相关识别的算法需要很强的场景适应性。该算法不仅适用于北京,也适用于其他城市。从不同区域收集的数据越多,准确性就越高。另外,对算法最有用的事件是小概率事件,常规事件对算法精度的提升相对有限,所以这些都依赖于数据的不断积累。