ob 体育

当前位置: 首页 > 媒体聚焦

《中国公路》:大数据赋能高速公路进入算力新时代

 来源:本站 作者: 发表日期:2020-09-02
字体: 加大 减小    

【编者按】本文刊载于《中国公路》2020年第16期,原标题《大数据究竟能为高速公路带来什么?》,文章有增改,作者为ob 体育aoa体育官网地址集团有限公司信息管理部总监张远信。

大数据是一种新的生产资料,是“数据”由量变引发到质变的产物;大数据同时也是一种新的思维方式,是一种我们在小数据时代无法达到而小心规避的思维方式。在高速公路从运力比拼渐变到算力比拼时代的今天,大数据成了解放高速公路行业生产力的关键要素,它的落地推广,将会产生广大的经济效应,推进高速公路行业进一步发展进步。

一、大数据是什么

大数据是指无法在一定时间范围内用常规工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能产生更强的洞察发现力和决策优化能力的海量、高增长率和多样化的信息资产。对企业而言,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据。

二、大数据在高速公路应用实例

(一)优化指挥调度

河北高速通过大数据分析对分散的全省路况、ETC、MTC、断面交通量、气象、纸卡、客服等历史和实时海量数据进行汇聚整合,并通过多种数据分析模型进行多维统计分析、关联分析、影响分析和预测分析,实现了对路网运营管理数据的全面精细化管理,解决了高速面临的跨部门业务协同困难、异构数据库无法互联、综合决策效率低、公众智能化服务水平有限等问题,提高了数据分析类应用的使用效率,从深度、广度、关联性上,挖掘出了已有数据的潜在业务价值,丰富了路网运行管理的分析手段,为保障路网运行和决策调度提供多层次实时、有力的数据支撑。 

(二)提升公众出行体验

同时河北高速在公众出行服务方面更加充分的利用公众出行服务数据和分析能力,更加贴合用户出行信息方面的主要需求和重点关切,新增数据对接内容,增强数据深加工力度,加强用户行为分析、精准信息推送等能力,提升服务的综合运营能力。

(三)智慧服务区
广东通驿公司通过大数据实现互通和整合应用,向数据资源深度挖掘利用层次迈进。
其中,服务区各项数据与企业级数据中心之间实现数据贯通,不同管理层级通过大数据可视化展示运营数据的演变趋势、经营目标的完成比例、成本费用的管控现状,多角度的分析应用等,实现运营状态可视化监管。

同时,通过建筑高速公路断面车辆监测、服务区客流采集、人流密集度分析等多个监测,结合经营数据进行综合分析,最终展示包括高速公路断面车流流量及变化趋势,入区车流占比、单车贡献度、进店率、成交率、客流贡献率等关联经营因素分析应用,用以评价商铺经营能力,分析商铺分布及业态是否合理,提供给后期业态优化,布局调整,改造依据等应用,以提高商业运营绩效。

其次,对于服务区现场巡检、公共卫生保障、安全生产、园林绿化、设备设施管理等基础管控业务领域,通过考评数据对比,不断完成自我管理提升,查缺补漏,控本节流,利用大数据的引导形成良好的管理优化闭环。

(四)智慧养护

北京首发公路养护公司通过深化大数据的应用,促进养护管理智能化、规范化。通过对养护数据的积累,不断拓展数据的应用,挖掘开发统计及图属数据功能,实现对公路路况,养护计划、工作进度、效率等各项工作的分析,让大数据效能充分发挥出来。

大数据支撑的平台不仅释放了人力物力,固化了工作流程,还促进了降本增效,提高了出资效率。通过大数据分析工作成效,合理分解养护任务,科学调配人员、物资及设备,进而提高养护资金使用效率,2019年度较2018年度养护业务成本降低了1400余万元。


三、大数据辅助决策的运作原理

通过上面的用例可以看到,大数据在高速公路运营管理和业态扩展上是大有可为的,它为各项管理和决策提供了重要数据支撑和预判支撑。这些支撑主要来源于数据挖掘,是大数据加工处理的最关键步骤,它能发现各个因子之间的相关关系,从而使大数据增值。如果需要近距离的观察大数据,我们需要详细的认识数据挖掘,简单说数据挖掘是大数据的方法论。

(一)什么是数据挖掘

数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。

数据挖掘需要从大量的、不完全的、有噪声的、随机的、模糊的数据中,提取隐含其中的、规律性的、人们事先未知的、但又是潜在的有用信息和知识。数据挖掘利用各种分析工具发现模型与数据间关系的过程,它可以帮助决策者寻找数据间潜在的某种关联,发现被隐藏的、被忽略的因素,因而被认为是在这个数据爆炸时代解决信息贫乏问题的一种有效方法。

数据挖掘作为一门交叉学科,融合了数据库、人工智能、统计学、机器学习等多领域的理论与技术。数据库、人工智能与数理统计为数据挖掘的研究提供了三大技术支持。

(二)大数据与数据挖掘(名词)的关系

从以上的描述中可以看到,大数据和数据挖掘(名词)从处理数据的目的、方式、结果上看本质是相同的,都是对数据进行挖掘分析,从而发现有价值的信息。

表面上看,大数据处理的数据是全样本海量数据,而数据挖掘主要针对不完全样本数据。但是实际上数据挖掘也同样适用于全样本海量数据。因此严格来讲他们只是叫法不一样,数据挖掘更像是大数据的一母同胞的哥哥。

由于是一母同胞,妹妹有了新的算法和工具,哥哥同样也会有。只是这个哥哥敦厚老实,妹妹则被老妈装扮得粉雕玉琢,以便吸引大众的眼球,并且理念更先进,个性更开放,更容易找到“如意郎君”。

但是回归发现数据价值本身,我们认为两者功力相当。

(三)数据挖掘与数据统计分析的关系

前面说了,数理统计是数据挖掘的三大技术支持之一。由于概率论与数理统计是大学理工科高等数学科目,因此,弄清楚数理统计和数据挖掘之间的关系有助于我们进一步认识大数据的实质。

首先,数据挖掘中的技术有相当比例是用统计学中的多变量分析来支撑,同时很多理论方法都是基于统计理论发展和延伸。因此,大数据开发需要具备一定的统计知识和技能。

其次,数据挖掘中不需要对数据分布做任何假设,其算法会自动寻找变量之间的关系。

最后,数据挖掘很多时候并不会从结果中产生明确的函数关系式,有时候甚至不知道到底是哪些变量在起作用,又是如何起作用的,也就是知其然而不知其所以然。

(四)数据挖掘运作原理

数据挖掘的核心是算法,每种算法都有不同侧重的挖掘目的。用于预测的经典算法集合我们称为分类法。

分类法是在一群已知结果(如是或否)的样本中,训练一种分类器,也即分类规则,让它能够对新的样本进行分类,预测新样本的结果。

具体的运作过程如下:我们先把数据分成训练集和测试集,通过对历史训练集的训练,生成一个或多个分类器,将这些分类器应用到测试集中,就可以对分类器的性能和准确性做出评判。如果效果不佳,那么我们或者重新选择训练集,或者调整训练模式,直到分类器的性能和准确性达到要求为止。最后将选出的分类器应用到未经分类的新数据中,就可以对新数据的类别做出预测了。

形象点说,就像一个人在有大量数据支撑的情况下去练习如何评判一个餐厅是好是差。他先抽取N个餐厅的数据来训练自己的各种评判标准,得到一个自认为不错的评判规则,然后再抽取N个餐厅的数据进行评判测试,间中调整优化评判规则直到预测的正确率达到半仙级别,最后当遇到一家新的餐厅时,使用这个最优的评判规则进行评估。这个过程就是一个不断学习和优化的过程。


四、高速公路大数据应用的现状与不足

前面举了一些业界领先的企业和管理部门应用大数据的例子,实际上在大多数高速公路运营管理机构和相关单位中,这方面还存在不少劣势和不足。

(一)应用尚处于初级阶段

目前,很多企业和管理机构处于完成了一些简单的业务数据收集整理,比如收费数据、监控数据、养护数据、服务区数据等偏重业务操作的基础数据,并积累了不大不小的数据量;或者略进一步,把这些业务数据做最简单的汇总统计,然后展示出来,对数据的整理和分析水平很低,几乎没有任何数据的增值活动。

同时,大多交通管理部门虽然汇集不少业务数据,但是大多数数据的用途只是用于简单的还原当时或实时的业务动态和路网动态,并没有深入去发现这些数据之间隐藏的关联,从而应用到一些更智能、更有价值的管理活动中去。

(二)人为孤岛严重

目前,多数高速公路的大数据分析应用被运营方分别掌控,同质企业和关联企业间的数据各自孤立,形成了目前看来最为阻碍高速公路大数据应用的一座孤峰。

同时,高速公路管理单位、交警、路政、气象等关联机构大多认为自己手上的数据属于私有或敏感数据,不能对外公开或提供公用数据接口,这又形成了另一座难于跨过的山峰。

而且,很多关联机构内部的各种业务数据收集处于野蛮生长状态,没有统一数据标准,相关的数据也还没有做到联通和共享,更不要说能对外提供具有良好质量的数据了。

(三)概念多于实践,甲乙双方思路不统一

大数据目前正处在由概念阶段到普及应用的初期,很多组织的管理者并没有意愿或能力真正落地实践。

另一方面,对于大数据建筑,乙方单位大多急于求成,没有扎实发展自己的大数据采集开发应用能力,仅仅完成了大数据整理归集存储就忙着去开展业务;而甲方单位则在还没有弄清楚自己的大数据开发战略、方向和目的,就急冲冲要建筑大数据平台,陷入业绩型建筑的怪圈。

(四)产业链条不健全、不互补,没有共荣生态圈。

大数据的产量链条包括数据获取、处理与储存、数据挖掘与应用三大块。如果是在一个共荣的生态圈内,这三大块是可以由很多公司分别独立发展到非常专业的程度,但是目前国内并没有形成这样的生态圈,以至于相关组织想要形成比较可靠的应用水平,就需要从头到尾都要做到非常专业。

这样做的结果就是很难达到,也不利于产业链的健壮和互补,不能充分整合全行业的力量和分散出资风险。最后的结果可能是样样稀松,使市场失去对大数据应用的信心。
五、如何打破现状真正让大数据为高速公路赋能

前景确实毫无疑问是光明的,但是前路颇为艰险。大数据这条路我们要怎么走才能真正走好走稳呢?这需要我们对自己的思想做一系列的解放和改造。

(一)将大数据作为新的方法论

辩证唯物主义认为,要更好更快的改造世界,需要我们发现、尊重、利用客观规律,在此基础上发挥主观能动性。这个表述和指导改造世界的方法论是没错的,但正如狭义相对论相对于广义相对论一样,有一个很重要的前提是我们要先发现客观规律,并形成可认知和传播的知识理论。

但是相对于我们已经认知的规律,不能明确确定和无法明确说明的其他事物间的关系才是客观世界的绝大部分。这就相当于管中窥豹,如果我们硬要把这窥得的一斑来指导我们的全部生产活动,无疑是非常不靠谱的。

那么如何消除这些占主要部分的不确定性呢?根据香农信息论的最大熵原理:即当我们要对未知事件寻找一个概率模型时,这个模型应当满足我们所有已经看到的数据,但对未知的情况不要做任何主观假设。简单点说,就是靠大数据来玩猜猜看,只要我们的大数据确实够全面,这个猜猜看的结果就会非常准。

于是问题的难点从发现规律变成了收集数据。在信息越来越容易获取的今天,这个问题的难度几何级的下降。那么,我们还有什么理由不运用大数据的方法论来武装我们自己呢。

(二)改变运营管理思维

方法论是道的层面,具体到高速公路运营管理上,我们需要分解成几个重要的管理思维:预测预判思维、概率相关思维、个性化思维以及智脑可靠思维。

例如,根据气象大数据和道路状况大数据等等构建的恶劣天气预警模型,结合实际地点的监控数据后,我们可以很准确的预测恶劣天气发生的种类,概率,影响范围等,从而可以提早防范应对,这属于预测预判;再如,当根据高速公路异常流程预警模型发现有较大可能发生拥堵时,我们可以及时派出秩序维护车辆提前处理,而不用等到拥堵形成后才进行处理,这属于概率相关思维;又如:主动推送个性化的出行信息,推荐个性化的出行方案;在其旅游、购物、就餐、加油等活动时,推荐其个人偏好的服务选项,这属于个性化思维;再如,我们在决策那些路面和设施需要进行什么程度的养护或维护时,充分利用大数据结合实时的设施状况做出的养护维护计划,将能更合理的利用有限的人力物力,最大程度的保障道路和设施的运行安全,这属于智脑可靠思维。

(三)改变管理人员思维方式

管理思维转变,最终也要体现在管理人员的思维方式的转变上,要真正使用大数据的思维方式解放和改造我们的思维方式:数据决策思维、开放联通共赢思维、全样本思维、标准化思维。

大数据时代,依靠全面而可靠的数据和由此提取的大数据能力,我们应该转变决策模式,树立用数据发现、用数据认知、用数据决策、用数据说话的数据决策思维;同时,面对行业数据的人为割裂,我们需要解放思想,树立开放联通共赢思维,让所有数据有序流动,充分交织,最后大家都能从中受益;再者,大数据方法论的核心全样本思维,这就要求我们的管理人员在践行大数据建筑开发过程中,要排除万难,保证我们获取到所要研究对象的全部数据;最后,要想让数据有序流转,充分交织,还需要我们的管理人员具备标准化思维。大数据由无数变数箱组合而成,这要求我们必须用标准化思维来制造每一个齿轮:在数据的分类标准、颗粒度、存储标准等等方面要建立标准规范,严格执行。


六、大数据赋能如何落地

解决了我们的方法论和思维问题后,我们来看一个实际的例子:大数据辅助高速公路应急决策,看看在实际应用场景中,大数据如何实践赋能的动作。

(一)相关大数据开发建筑

根据大数据的生产和辅助决策的原理和过程,结合辅助应急决策这个应用场景,我们至少需要训练完善两个认知分析模型和两个策略知识库:交通事件监测模型库、交通事件影响范围确定与分析模型库、交通事件处理知识库、交通疏导策略库,这些模型和知识库构成我们应急决策的智脑。

首先,我们要把高速公路过往的交通监控视频数据、交通事件数据、交通流量数据、交通管控数据、应急处理数据、交通医疗数据、拥堵数据、天气数据等等按时间轴和大数据标准进行收集整理融合,形成多维度的历史数据集。

然后我们通过数据挖掘和人工智能训练两个重要的模型库。经过训练集、测试集、准确性评估和不断优化后,交通事件监测模型库需要能在很高准确度的情况下,主要通过视频和图片辨识是否发生了交通事件,发生了那些类型的交通事件等;而交通事件影响范围确定与分析模型库则通过交通事件的相关数据准确评估交通事件的严重程度、影响范围、影响时长等等。

同时,通过相关交通事件的处理情况和外延数据,不断充实完善两个知识库。交通事件处理知识库结合两个模型库的预测和评估结果,能准确给出应急处理的处置预案,而交通疏导策略库则能准确给出受事件影响道路和车辆的疏导策略。

(二)应急决策技术和过程

有了应急决策智脑,我们怎么部署应用呢?
首先是交通事件的检测。我们主要通过融合路旁智能装置、报警电话、车内智能装置,给决策智脑提供第一手的现场数据,由智脑给出事件检测判断,如果检测到交通事件,还要给有关人员和部门发出警报。

紧接着结合当前的天气、路况、车流量,以及巡逻车、驾驶员等提供的相关信息,进行影响范围的分析评估, 判断交通事件的性质和影响范围,并预估其对交通流量的影响。
然后根据前两个阶段的监测评估,应用交通事件处理知识库,及时进行信息发布上报、自主选定应急处理议案,比如抢险救援、交通管制、疏导、铲冰除雪、医疗救助、生活保障等,展开交通事件应急处理流程并进行阶段性反馈。

交通事件清楚处理完成后,需要进一步采集和整理本次处理全过程的详细数据,补充完善相关的大数据,进而修正和优化现有模型和知识库,使其不断迭代更新,让智脑在实际事件中不断学习进步。

七、未来展望

在不久的将来,以5G、云计算、大数据、物联网、人工智能、区块链等等为技术核心基础的新基建,将会为交通行业带来一次非常深刻的数字变革,也将会成为交通强国建筑的强力引擎。依托这波新基建的数字化成果,交通等领域的大数据应用将会遍地开花,结出累累硕果。在当下,我们应该借助新基建的东风,夯实高速公路大数据的基础基石。我们认为,新基建将会大大推动自动化数据采集技术的普及,使得获取大数据的成本越来越低,样本越来越全面;同时,智能化数据处理技术将会大大提升,使得大数据的加工处理将越来越快,算力越来越便宜。

可以预见的是,取消高速公路省界收费站后,全国路网将实现全网化运行。界限的消失,使得全网数字化新基建势必融为一体,这就为全网大数据融合运营管理提供了重要的前提和基础;同时,依托一体成型的数字化新基建,大数据的融合贯通,也将慢慢打破各省级组织机构各自为政的体制。打通了数字化和数据融通这任督二脉的交通大数据必将完美呈现,形成交通智脑,支撑起全国公路一张网的运营管理模式;另一方面,交通大数据的不断完善也将支撑高速公路企业向跨界出资、高速公路+的方向进行科学决策。

总裁办信息管理部  张远信
上一篇:滨州日报:优化鲁冀高速公路网 打通沿海经济大动脉 下一篇:媒体报道 | 连贺高速公路控制性AYX爱体育贺江特大桥正式动工!
返回列表>
XML 地图