电子新闻网

数据挖掘在轨道交通行业应用案例

  数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

  数据挖掘不仅仅是数据的组织或者呈现,也不仅是数据分析和统计建模,而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。总体而言数据挖掘分成六个阶段:商业理解(Business Understanding),数据理解(Data Understanding),数据准备(Data Preparation),建模(Modeling),评估(Evaluation)和发布(Deployment)。

  我国已有10多个城市拥有共30多条城市轨道交通运营线路,运营里程达到近千公里,年客运总量达20多。同时,北京、上海等15个城市共有约50条,1154公里轨道交通线个城市正在筹备建设城市轨道交通。预计至2015年前后,北京、上海、广州等22个城市将建设79条轨道交通线亿元。由此可以看出国内城市轨道交通建设呈现异常“火爆”的局面。

  发展城市轨道交通对于解决大都市交通问题是很好的解决方案,在有效缓解城市交通的同时,也会对城市形态的发展也起到了积极的引导作用。在目前形势下,发展城市轨道交通还能够在短时间内拉动固定资产投资,促进经济平稳较快发展。但发展城市轨道交通投资巨大,建设一公里的地铁线亿元人民币,因此被称为“天价工程”,其盈利模式也是世界性难题,因此对在哪些城市建设轨道交通、建设的规模有多大等重大问题,始终没有公认的判定标准。一般认为城市轨道交通建设只有与城市的发展协调同步才能取得良好的社会、经济效益,但如何界定轨道交通与城市发展的协调程度需要有科学的评价方法,基于此种考虑,本文提出城市轨道交通与城市发展协调度的概念,对轨道交通与城市协调性进行定性分析,为城市轨道交通建设规模、建设时机提供决策支持。

  轨道交通和城市发展协调性评价涉及到社会、人口、经济、城市综合交通等各方面包含众多因子,依照科学性、客观性、可比性和动态性原则,同时考虑各方面因素和资料占有的可能选取指标。

  表示城市轨道交通网发展规模和发展水平的指标A1,包括两个子指标:轨道交通网线,公里)和投入的运营车辆数量(X2,节);

  表示城市轨道交通系统运营状况的的指标A2,包括两个子指标:轨道交通系统客运总量(X3,万人)和运营车辆行驶总里程(X4,公里节);

  表示城市轨道交通系统经营管理状况的指标A3,包括两个子指标:轨道交通系统利润(X5,万元)和轨道交通系统从业人数(X6,人次)

  人口子系统的总量及结构(B1),包括3个指标:城市人口总量(Y1,万人),非农业人口总量(Y2,万人)和从业人口总量(Y3,万人);

  经济子系统的总量及结构(B2),包括5个指标:国民生产总值(Y4,亿元),第一产业生产总量(Y5,亿元),第二产业生产总量(Y6,亿元),第三产业生产总量(Y7,亿元),城市财政收入(Y8,亿元);

  城市居民生活状况(B3):包括5个指标:城市消费价格指数(Y9),城镇居民人均住宅面积(Y10,平方米),城镇居民人均可支配收入(Y11,元),失业率(Y12,%),城市市政建设投入(Y13,亿元);

  城市公共交通状况(B4):包括5个指标:城市交通投入(Y14,亿元),城市人均道路长度(Y15,公里/人),城市人均道路面积(Y16,平方公里/人),居民万人公交车拥有量(17,辆/万人),公交客运总量(Y18,万人次)。

  所选评价指标的各个指标数值来源于19962007 年的《中国城市统计年鉴》、《xx市统计年鉴》,因篇幅所限,在此不一一列出原始数据。

  主成分分析法 ( Principal Component Analysis) 简称PCA法是利用线性代数有关理论,将原来众多指标转化为少数几个互相独立,并由原来各单项指标的线性组合来表示的综合指标。其突出优点在于比较客观,提高了评价结果的可靠性和准确性。为了消除量纲不同所造成的影响,需进行标准化处理。

  标准化处理后的数据进行主成分分析,得到相关矩阵的特征根、各指标的贡献率、累计贡献率等。选取累计贡献率大于85%的前K个指标作为主成分,求得各主成分得分:

  协调是两个或两个以上系统之间的一种良性的发展关系。协调度则是对其协调状况好坏程度进行度量的定量指标,可采用模糊数学中隶属度概念对其进行描述,隶属度变化规律可以通过隶属度函数来反映,建立协调度函数:

  实际值越接近于协调值状态协调度 越大,说明系统的协调发展程度越高。通过状态协调度 可以对系统间协调发展程度进行评价:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。