北京理工大学刘鹏:新能源汽车大数据平台建设与应用

时间:2017-10-31 10:59来源:盖世汽车 作者:综合报道
点击:

  第19届亚太汽车工程年会&2017中国汽车工程学会年会暨展览会(APAC 19 & 2017 SAECCE)于10月24-26日举办,本次论坛以“未来汽车与交通变革”为主题,携手行业领导、学会领导、院士、汽车及相关行业权威专家在内逾3000余位国内外业界嘉宾共同探讨汽车产业车厂与零部件协同创新和技术发展路径。以下是北京理工大学刘鹏博士在会议上的演讲实录:
 
  刘鹏:大家好。我是北理工的刘鹏。今天我给大家把我们在新能源汽车大数据平台方面的工作,以及我们从国家层面,后续给各个企业想要做的一些工作,做一个简单的介绍。
 
  主要分四个部分,第一个是发展的历程和建设,第二个是从架构体系和能力,第三个是现在大家比较关心的就是我们极力从国家平台角度延伸去做的数据的标准化,第四块是大数据挖掘和应用的工作,以及后续的想法和大家做一个沟通。
 
  从平台建设来说,2003年开始做这项工作,开始做的时候是从公交线路里面开始的,后续在奥运会期间做了延伸,保障了奥运会运行区间内的车辆安全。后续我们在2011年十部委又发布了322号文,之后北京市第一个响应国家的政策要求,建立了北京市的新能源汽车监管平台,正好北京理工大学作为北京市的整个保障体系的牵头单位和指导单位,承接了这个项目。从2011年开始北京市管理系统的建设工作。这个期间,实际上也逐步逐步形成了北京市的整个标准体系。同时在2013年开始建立了相应的标准。
 
  整个架构过程当中,也经历了几轮的发展,刚开始任务比较紧,给了两个月时间,在奥运会的体系架构之上做了延伸,保障当时2011年的要求。后续又把体系架构从C/S转到B/S,原有的数据库也做了调整,跟现在大家大部分用的Hadoop的方式比较类似,以这种方式来满足我们后续的需求。
 
  我们今年的6月份,对于我们现有的硬件能力以及平台做了测试,基本上能够达到160万辆的存储和服务的能力。同时也是从去年年底开始,完成了所有的国标32960的基本的功能。
 
  这是从2003年到现在的发展过程,整个过程当中我们做了几个工作,包括标准体系的建设,从地方标准到国家标准,同时针对整个新能源汽车运行管理过程当中的体系架构,也是在这个过程当中逐步形成的。
 
  从体系架构里面,实际上大家一直在说三级体系,这是一个三角形的,而不是梯段形的。国家平台对的是各个企业平台,而地方平台这一块早期的规划是要对当地的新能源汽车做监管和服务,后续怎么建设,还会有一些小的调整。从体系架构来说,这边是五层,包括前端的采集和接入。我们现在更多的在于接入和存储、应用、管理这一块。因为在数据的挖掘和分析过程当中,涉及到应用技术要求更高,而且在数据量上来以后,包括我们现在拿到的任务是,要支持两百万辆同时上线的这么一个数据处理的需求。在这么大的需求基础之上,在数据应用层这一块的数据分析压力比较大。而且我们现在从这次的规划来说,数据层的这些应用服务器,基本就达到了150台。
 
  这是基本的逻辑架构,跟大家差不多。这里面的核心说一下,对于车和互联网的应用,包括充电设施的应用,可能后续在平台架构里面会做更多的融合和处理,满足后续开放之后的共享需求。这是Hadoop的基础平台架构,我们做到了PB级的存储能力,而且在线性拓展等方面也做了近四年的工作。
 
  对于数据存储这一块,我们从几个方面,第一个是安全性,第二是可靠性,把新能源汽车整个过程当中涉及到的多样化的服务,包括新能源汽车的不同车型不同类型的特定需求,也做了一些动态调整和优化。
 
  整个平台现在,通过测试的企业数是270家左右,车型应该是四千多个车型。到目前为止,因为工信部和财政部的文件到11月份才会下发,之前已经有一百多个企业在做前期的示范接入。车辆这一块也有,除了北京的四万辆以外还有三万多辆外地的车在做前期数据校验。从我们后续数据的分析、监管等等来说,对数据质量的要求是非常之高的。
 
  由于第一政府这一块需要进行监管有要求,第二中央机关这一块,除了分时租赁的需求也赶上了公务车需求,我们形成了一套完整的监控体系,包括车辆控制、安全管理等方面的内容。
 
  在数据分析层面,我们每周有一个周报,定期有一个月报,而且今年年底我们也会在大学联盟基础上做一个全国新能源汽车的,说是分析报告也好,到时候会给大家做共享。
 
  在整个平台来说,我们更多的后期会把它的一些重要任务放在开放的数据接口,接口这一块有实时数据、历史数据,包括整车综合评价、故障等等。这些数据的共享有一个特定的要求是说,也会提到我的车企有我自己的数据隐私问题,包括技术机密问题等等。我相信我们所有做的API这一块的接口,一定是对公共领域相对可以公开的数据,会给客户也好运营企业也好,给个人用户也好,提供公共的出行服务。
 
  另外在标准化这一块,刚才说2011年开始正式建设北京市的平台,当时按照标准是做一个试用版。逐步在2013年发布了北京市的地方标准,在地方标准基础之上,各地也开始逐步建设,每个地方有自己的技术要求,是不是会影响车厂在各地建设中存在的问题。正好赶上近几年的大数据、云计算、车联网等等,好像一下就火了。大家在整个监控、管理包括售后服务体系过程当中,逐步形成了这么一个想法,也赶上智能汽车等等的发展,我们起码从安全监管角度来说,在内容上进行了完善,形成了现在的32960这么一个标准。
 
  在这个标准里面,对我们的技术规范是做了强制性要求,早期它是以安全为主,我发现通过这么一年多的技术发展之后,或者通过这一年内大家针对车联网的应用,以及在智能汽车快速发展过程当中,感觉它的任务已经逐步逐步偏向于后面的应用和服务了,反而把安全等等这一块,对于企业来说,作为售后服务体系的一部分。而且现在来说,对于我目前标准体系里面的数据项来说相对偏弱,一个车的数据,每一帧不到500个字节。车载终端这一块的服务能力是非常强大的,一个比较低端的终端,可能芯片上还买不着。很多企业会逐步把终端做集成化,把其他的车联网的服务继承到这个终端里面去。这个终端一定会是一个标配的产品,那么我们更可能的就是对数据进行拓展,包括售后服务等等其他的服务来做支撑,来提高产品的竞争力,同时也不会增加太多的成本。
 
  数据项这一块,标准数据61项,除了这61项之外,在故障情况下还会多12项单体数据。实际上很多企业还会提供更多的,刚才举例说,所有的数据加起来不到500个字节,实际上很多企业的数据量要乘2,进入1K。而且数据传输过程当中,我们一直倡导所有的数据链不需要按照一整包去做,可以做一些实际的需求,有的数据一秒,有的数据30秒,有的数据不重要的,一分钟也可以。这样从处理的机制,包括响应效率等等方面都会做一些优化。
 
  这里提到标准这一块做完之后,我们更多的在去年年底也做了标准的测试和验证,实际上为什么把它的验证做得非常的严格,实际上刚才我前面提到一个,数据的可用性,或者说可靠性,它实际上是我们后续所有的分析、服务等等的基本的保障。我们前期出现过很多类似的问题,从2011年开始到2013年之间,基本上会出现什么状态,大家可能听起来不可能犯的错误,车速能到一小时两千公里以上,里程还能往回跑,这些也是前期在终端的考核,包括程序的编程过程当中,可靠性等等的问题做得不太好。这种方式如果仅仅只是满足了国家,我有这个东西,而没有后续的数据服务。之后的车联网之后,要求也会更高,在标准化这一块,相信各个企业也会更加重视。
 
  所以我们在这一块也做了包括自动化的检测,也是第一次做了一些远程的测试,然后尽可能去减少大家在检测过程当中的一些任务。
 
  在大数据标准化这一块,我刚才说的是从32960的角度来说只是车的一些基本数据。实际上从车联网应用来说,还会涉及到跟人相关的,以及社会环境,包括拥堵指数等等一系列的数据,在后续应用过程当中都会是数据挖掘、应用的,或者说应用模式拓展的一个大的方向。
 
  在整个这种体系之后,我们在2017年的7月18号,在工信部的指导下成立了一个新能源汽车国家大数据联盟,这个联盟更多的是做一些,后续的数据应用这一块给大家做一些工作。基本的想法是合作、共享、协同、创新,同时共建标准。希望推动大家联盟的方式,把国家平台现有的数据大家共同去研究。可能大家会说,我的数据能否拿出来?对不起,拿不出来,但是你可以知道这个数据是什么,你提模型我给你算这也涉及到各个厂家的隐私问题。通过计算之后,拿出一部分的数据,二次数据可以拿出来公开共享,这种模式和应用拓展之后,会产生很多的,比如说在标准体系架构的处理没有的,是否后续大家形成共识之后,在标准体系架构里面逐步拓展。以参考的方式给大家,只要做到标准的话,大家在后续的服务商、厂商,应用过程当中的成本才会降低,量上去才会有助于整个行业的推推动。
 
  大数据挖掘和应用这一块,我们分成三个领域,一个是对于政府的,toG的,一个是对于商业toB的,还有一个toC的。政府考虑的更多是安全、政策方面的工作,对于商业来说目前做得比较多的,包括能耗的管理,包括调度的管理,包括涉及到金融、保险等等,后续也是一个改进的发展方向。保监会也跟我们沟通说,是否拿这些数据我们做详细的测算和分析之后,对于新能源汽车,我就根据这些数据定制保险,而且这个方式,你的驾驶习惯越好我的保险费率越低。从保险行业角度来说,它的盈利点也在于我们驾驶习惯良好的用户。而对于驾驶习惯不好的,经常有赔付的,一定是它的劣质客户。
 
  整个分的三块,我简单做一下介绍。第一个是企业、地方到国家的三级安全监管机制,从安全的角度位行业做一些工作。一点点的故障,新能源汽车只要出一例,大家就会特别关注,因为大家不清楚不了解,不知道为什么会这样。而且这个过程当中,像传统车定期做一些保养等等,包括发动机自燃等等,你会很清楚它会有什么问题。如果做一些简单的预防,是已知的预防是可以做得到的。但是电动车这一块,目前还是有一些欠缺的。
 
  第二个是在整个,因为车的数据是既有充电的也有运营的数据,会进行一些分析,包括能耗的分析,为后续其他政策的支持做一些工作。同时对于充电设施这一块,颜色比较深的,一般功率比较大,对于这一块的布置规划合理性等等,包括利用率。还有时间维度来说,什么时候开始充什么时候结束,还有快充和慢充,不同的维度对后续的设施建设和推广,包括在车辆设计过程当中,可能会有一些帮助。
 
  另外针对三万公里,我们不谈论这样的要求是否过高,后续会做一些定量的核算和评估,给政府的决策做支撑。另外是一些量的分析,包括不同维度的技术状态的分析。
 
  另外对于纯粹的从大数据分析的角度来说我们做了一些工作,包括经济性、环境性、可靠性、安全性等,就通过我的数据,在数据过程当中,你里程也好,通过这些过程来做技术评价。更多的,冬天的时候,比如北京比较明显的,一说就是一到冬天,原来行驶历程300的可能只有200,这个车和车可能是也差异的,打七折和打八折一定是有差异的。这些就完全靠数据应用的过程来做相应的评估。
 
  对于整车厂来说,核心是在于做零部件的技术分析,包括对于后面做一些溯源,包括质量评估等等,来做一些优化。优化里面还有明显的一点,电池状态评估。包括下面这个图,我们做的是电池固有设计缺陷的评估,这是完全从数据角度来说可以做的工作。
 
  实时故障监控这一块,企业做售后的服务,包括配电的管理等等,怎么做,实际上和故障状态是有关系的。
 
  对于运营企业来说,包括驾驶习惯、节能等等,通过这种运营的调度和感觉,电动车还涉及到电量和充电,降低使用成本。这是驾驶行为能耗分析的简单说明。
 
  另外我们刚才提到分时租赁这一块,我们有一套完整的系统,这套系统只是它的功能,我们在整个机关用完以后,也会对租赁的线路,包括密集度等这些方面,也做了相关的分析工作。这就涉及到人和车之间的关系,还有部门和部门之间的交互的深层分析。
(责任编辑:admin)
免责声明:本文仅代表作者个人观点,与中国电池联盟无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非中国电池联盟)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:503204601
邮箱:cbcu@cbcu.com.cn
猜你喜欢
专题
相关新闻
本月热点
欢迎投稿
联系人:王女士
Email:cbcu#cbcu.com.cn
发送邮件时用@替换#
电话:010-56284224
在线投稿
微信公众号