城市要素库时空分析系统建设思路
前面的所有文章都是开发Python网络爬虫的编程要点,那么爬下来的数据可以做什么呢?接下来的文章我打算探讨一些数据分析应用场景。
没有更新专栏文章很久了,因为所有的精力在做一件事。在过去的两年里,GooSeeker团队内部组建了一个特殊小组,专门探索与城市相关的数据整理和数据应用价值。
为什么启动这个项目呢?
这个项目是智慧时空基础设施建设项目的产物,随着智慧城市建设的广泛和深入地推进,加上物联网技术和应用的长足发展,一副完整的数字化城市图景逐步展开。开放的互联网上积累了大量的有价值的内容,却散布在web的角角落落,而且结构也是散乱的。我们期望这些内容能够用于营商环境分析、现代化宜居城市治理、城市职居分析、政策制定的决策支撑等等方面,所以利用积累起来的网络爬虫技术,围绕着城市要素对数据进行采集和整理。现在期望将部分核心成果开放给广大数据分析和城市治理和公共管理研究者,包括研究方法和整理所得的数据,作为公共知识,让大家共享。
城市的发展运行都是在三维空间和时间交织的四维环境中进行的。时间、空间是能够描绘记录城市发展轨迹的唯一、最有效的载体,离开了时空,历史的发展就无法记录,更无法展现了,而地理信息是提供时间、空间信息最有效的方法和手段。因此,城市要素库时空分析系统,以智慧城市时空可视化为核心,集合了省市区县多级地图统计展示,统计数据可作地理上的对比,也可看时间序列上的变化。数据按照主题进行划分,覆盖数字经济和城市治理各方面,选择不同描述维度,可提炼得到度量值,也可在对比台上叠加分析。
如果把智慧城市比作人体,时空基础设施在智慧城市建设中,应该承担着相当于“人体骨架”和部分“大脑”的功能,一是地理信息是各种信息的载体,比如准确定位实时感知信息的物联网节点;二是负责与空间位置有关信息的集成、处理、可视、分析与决策。
在这个系统中,城市要素信息被分门别类呈现在地图上,采用数据立方体引擎给用户一个直观的数据探索平台。基于对数据的探索观察,可以确定深入研究的方向,进行深度分析,比如,智慧城市开放数据评价指数和城市人才结构分析。
城市要素库的数据是经过整理清洗的结构化数据集,直接用excel就能做统计分析,也可以导入其他数据分析软件,可建模分析和可视化展现。接下来我将用多篇文章展示多个数据分析场景和案例,以期抛砖引玉,期望广大数据爱好者一起分享自己的智慧,一起学习、探索、分享,成长为数据科学家