1.  > 交通知识

基于大数据的新一代交通工程方法理论体系包括(大数据在交通工程中的应用)

刘志远教授

东南大学交通学院副院长

1.城市智慧交通

智慧交通是一个大主题。 2020年8月30日,交通运输部发布了新基建解读,其中对“智慧”二字解释得非常清楚。有两个非常重要的概念,一是基础设施,二是人工智能。当然,人工智能以多种形式出现,比如通信、数据和其他算法。这些都是从方法论的角度来考虑的。其背后的核心理论和方法是大数据分析算法。因为我们看到的智能工具往往是利用大数据的各种算法(机器学习、强化学习等)来指导其思维。比如大家都熟悉的AlphaGo背后的算法就是强化学习。其他类型的大数据分析任务也使用监督学习、无监督学习、深度学习等机器学习方法。因此,我们这里所说的新一代方法体系是指数据科学中基于机器学习、强化学习等人工智能和算法的方法体系。但是,如果仅仅使用传统的统计和优化方法来分析大数据,就不属于我们这里讨论的新一代方法体系的范畴。

图1:四个维度的数据

关于大数据的方法论和理论体系,交通专家经常谈论两个概念,一个概念是问题导向,另一个概念是领域知识。只有将这两个概念深入有效地融合起来,才能解决交通大数据问题,面向问题的分析就更有价值。

2.理论分析体系的科学问题

什么是结合问题导向和领域知识的机器学习算法?这里有一个很好的比喻,就是《庄子》厨师丁解牛的故事。这个故事非常具有中国传统文化的代表性。我们结合具体问题,让大数据发挥作用,就像从牛身上切牛肉一样。在传统领域,厨师是以问题为导向的,可以轻松切牛肉。现在大数据来了,它就像一把锋利的刀。如果我们不了解问题的结构,一刀切,肉还是连着骨头,问题也得不到很好的解决。所以真正做好,就是把刀与好的技术结合起来。牛到底是什么?牛上百年的交通工程、交通仿真、交通规划、交通设计等前人积累的学科知识体系,结合大数据分析技术,构成了牛。作为一个从方法论和理论角度进行模型构建的实践者,我给出了三个科学问题来回答“牛到底是什么?”

图2:城市智慧交通:理论分析体系

我们需要解决交通系统的瓶颈。存在三个关键的科学问题。首先是对全网、跨时空的流量的准确感知。美妙之处就在于“准”字。目前的本科课程中,很多传统的方法都是基于感知,并没有达到准确性。正是因为我们没有做到准确,所以模型出现了问题,结果出现了问题,结论出现了问题,最后整个决策支持系统出现了问题。

第二个关键科学问题是交通供需相互作用的精准分析。交通专家常常希望改变现状。我们发现问题之后,它们存在的意义就是帮助我们改善这些交通问题。改善交通问题的方法有很多,比如交通规划、交通设计、交通管理、红绿灯、收费等,交通问题牵一发而动全身。任何一种方法的任何改变都会对现实产生不可预测的后果。因此,我们需要一把尺子来衡量每一个影响。

第三个关键科学问题是城市(城市群)与交通系统的综合评估。交通强国引领了我们未来25年的发展方向。智能交通青年论坛还将新基建作为关键词融入主题。 《交通强国》强调基础设施互联互通,其中提到了多种模式的共通。融合。如果我们分析一下我们的教学体系和方法体系,我们会发现没有一个工具可以整合不同的模式。他们都是独立工作,不然就是想也做不到。因此,结合这些科学问题就是我们新一代的理论。

3 现有城市交通分析方法

纵观交通工程百年的方法和理论发展史,我们对于解决这三个关键科学问题都有自己的思维体系和方法,基本上可以归纳为两大方法论和理论体系。第一种方法是分析模型。目前,学校教授的主要课程仍然是20世纪50年代和60年代构建的四阶段模式。四阶段模型是由一群经济学家和物理学家构建的。这套理论方法利用原有的经济体系和数学分析模型体系来分析交通运输。它的缺点是什么?因为要想得到一个相对完美的解决方案,必须是解析式的,并且有一些强假设,比如每个人都选择最短路径,这显然是不现实的。第二种方法理论体系是传统的模拟方法理论。与解析模型相比,该方法理论体系打破了解析模型的强假设。模拟方法理论利用仿生学通过人和车辆的运动来推演结果。它有两个缺点。第一个缺点是任何模拟都严格依赖于随机数。为了准确地使用随机数,我们必须分析现实世界。随机数模拟的问题是找到一个准确的分布形式,但这并不能全面获得。因此,交通强国向我们提出的精准、详细的要求,也是我们力所能及的。第二大缺点是它的计算时间太长。对于现实世界的交通管理来说,太长的计算时间是一场灾难,因为它不可用。

图3:“四阶段模型”和“模拟方法理论”

4.交通大数据

除了数量大、准确、全息之外,大数据和机器学习还有哪些优势呢?其实,2011年大数据刚出来的时候,给大家带来的更多是哲学思维体系的创新。它还带来了交通工程方法中哲学思维体系的变化,因为前两类方法实际上有一个共同点,那就是它是哲学思维中的演绎方法。它有关于现实世界的假设和基本建模。然后不断地推演、模拟。最终,正如它所推论的那样,它变得越来越接近现实世界。距离越来越远,所以最终得出的解决方案越来越不精细,越来越不准确。然而,机器学习系统和机器学习模型往往有一个假设,就是数据分布空间的直接对抗。因此,无论大数据模型是好模型还是坏模型,它都是一种归纳方法,并不能在此基础上进行演绎和进化,因此可以保证更好的准确性。这一思维体系的突破,带来了新一代交通工程方法理论体系。大数据方法所需的三个模块如图4所示。左边的模块需要基础数据,最后一个模块是业务层的模块。我们需要了解图2中的牛是什么,业务层的架构体系是什么。但到目前为止我们还没有做得很好。未来我们的流量专家更有潜力的领域之一是在中间算法层面。例如,手机数据并不是人们真正需要的流量。移动的汽车和人是交通人们所需要的。怎样才能只用手机数据来最终获取车流和人流呢?这是我们需要解决的问题。目前的方法体系是基于刚才的分析模型和仿真模型。我们给它起了个名字“交通模型3.0”。并不一定意味着它比1.0或2.0更好,但我们想创造一条全新的道路。

图4:流量模型3.0

流量模型3.0是机器学习和领域知识的深度融合。例如,流量分配和网络设计。只要有城市、有人,这个问题就永远存在。解决这个问题的传统方法是四阶段模型。时至今日,流量分配仍然是学术界非常热门的问题。可以说是车型方面最热门的领域。然而,在大数据的新一代方法体系下,我们不再使用以前的模型,而是使用监督学习、迁移学习和相对较新的对抗算法等新方法来分析交通问题。对于出行需求管理和交通控制,我们可以利用强化学习来构建其理论分析方法。道路交通安全监管和事故原因的一个非常重要的底层理论基础是三参数交通流模型。在全息感知大数据环境下,我们构建了基于仿真优化和贝叶斯模型的新模型。交通流模型系统。

五、案例分析

1. 基于多源数据的城市路网交通全时空感知

第一个科学问题是全网、跨时空流量的准确感知。城市交通系统的数据采集并不难,难的是如何实现精准感知?什么样的数据能够实现百分之二百的准确感知,即百分百的时间和百分百的空间?答案是没有任何数据可以达到两个准确的100%。要实现精准感知,首先要实现空间精度,比如深圳每个地方有多少辆车、有多少人。然后是时间的准确性,比如最近一个月深圳每分每秒有多少辆车、有多少人。没有一种数据能够达到这两个维度的准确度,但是我们可以找到一种在空间上准确的数据,另一种在时间上准确的数据,然后用机器学习、强化学习等算法来做中间的粘合剂,最后将两者熔合在一起,进而达到两种精度。

基于这样一个思维方式系统的转变,下面就是选择哪一类数据在空间上能够100%准确?答案是手机数据。有人的地方就有手机。手机数据遍布城市各个角落。手机数据有信令数据,但其误差很大。比信令数据更准确的是三角测量数据,其误差很难降低到50米以内。这些错误导致我们不知道城市内的位置。手机用户走哪条路,就会带来交通分配的巨大误差。

因此,手机数据可以与另一种在时间上非常准确的数据结合起来。在我国的一些城市,单点最准确的数据是卡口测速和车牌识别数据。当然,在其他国家也有不同的情况,有的国家是线圈,有的国家是接地感。卡口数据也有其缺点。其空间覆盖率较差,空间覆盖率仅为1/3。因此,这两类数据非常具有代表性,而且它们的因果关系是可以互换的。因此,如果两者能够找到很好的粘合剂将它们结合起来,实现双重融合,实现流量分布的精准分析和决策支持,这将是我们提出的基于新机器学习的理论体系。

对于这样的模型(binder),机器学习为我们提供了很多选择,比如最通用、最直接的监督学习模型,它使用手机数据作为输入,卡口数据作为输出。训练后得到模型,在没有卡口数据和准确交通流量数据的地方,无需样本扩展,仅依靠手机数据即可获得100%准确的交通数据。我们可以利用新一代的模型来发挥数据本身的优势。因此,新一代系统的优势和真正作用必须超越数据本身。如果用任何数据直接解决某个问题,就不需要模型,也不需要我们的流量工程方法体系。每一个出来的模型都必须能够利用数据中不存在的优势,并且具有比数据更高水平的优势。

图5:监督学习模型

2、基于手机大数据的交通规划理论方法体系

第二个例子是基于手机大数据的交通规划方法和理论体系。我们的传统认知就像只触摸大象的尖端,而没有构建多维全息图。借助多源数据,特别是在如此高的手机数据覆盖率和采样率的基础上,我们可以对城市交通系统内的全时空出行实现更加细致、全方位的感知。如何构建完整的交通规划方法体系,需要突破一些科学问题。

第一个问题是数据处理的问题。我们的研究对象是苏州市8000平方公里范围内的手机数据。每天的交易笔数达到20亿笔。这是一个非常大规模的大数据分析。苏州市有2万多条数据可用于数据分析和控制。为了匹配监管层面的交通区域,一天的数据处理计算时间将达到数周甚至数月,因此首先需要解决的就是快速计算的问题。

我们主要利用手机数据,通过多源数据构建交通规划模块系统,重构8个不同的功能模块。从创新的角度来说,我们完全绕过了之前的方法体系;与传统模型的比较,首先与四个阶段的流量出行、流量分布等进行比较。在相对精细化的场景下,居民可以进入自己的家中。调查的抽样率较低,基本在2%、3%以下。手机数据可以再现它的优势,而手机数据的另一个优势就是它的成本几乎为零。住户调查与人口普查类似。一个城市一轮调查的抽样率只有2%、3%。然而手机数据可以轻松达到40%或50%的采样率。最终可以获得更好的采样率。精确的行为。

大数据可以在出行感知、出行控制、客流分析、特殊场景的事件分析,包括多模态分析等方面发挥更好的作用。有时大数据可以放到传统业务体系之下,从而达到可以轻松解决的业务成果。例如,在地铁客流分析中,我们过去使用经济模型来估算客流,但其误差和准确性都是很大的问题。手机数据在地下有专门的基站,所以可以非常准确。的再现。所以,这样的问题其实并不需要方法体系。如果直接取手机数据,传统方法可以集成度更高。这是它的优点。

就肖像而言,在这样的数据体系下,我们可以整合和分析一些非交通系统的传统数据。例如,在生成行程时,我们需要知道这个社区有多少人,基于肖像和全息感知,我们可以对每个潜在的旅行者进行更丰富、更多元化的分析,从而更好地改进我们传统的模型体系。

图6:用户基本信息及画像

本文由admin发布,不代表交通知识_交通违章_天津智能交通网立场,转载联系作者并注明出处:/jtzs/56370.html

留言与评论(共有 0 条评论)
   
验证码: