
时空大数据要把握“后发优势”
“时空大数据”一词越来越得到测绘与地理信息界的认可,无论从哲学角度还是从科学和社会实践的角度,时空大数据的提出都是成立的。
当今社会的一个重要特点是,全球、国家(区域)、城市治理对时间和空间的依赖程度越来越高,时空大数据正日益成为治理体系和治理能力现代化的核心驱动力。
我国要深入研究时空大数据的科学价值与实践价值,走出一条从基础研究起步,融理论创新、技术创新、产品创新和服务模式创新于一体的中国特色时空大数据产业化之路。
数据与文化密不可分
什么是数据文化?一方面,数据活动过程离不开一定的文化背景;另一方面,数据活动过程又直接影响到整个社会文化的面貌。数据活动过程已经形成了一种特殊的文化,即数据文化。
当“一切靠数据说话,一切凭数据决策”成为一种社会现象时,就是数据文化的形成。但回顾历史,相较西方发达国家,我国仍是个数据文化相对匮乏的国家。
尽管2014年我国就首次将大数据写入《政府工作报告》,2015年国务院印发《促进大数据发展行动纲要》,2016年3月公布的国家《“十三五”规划纲要》中提出了“大数据战略及行动计划”,许多省(自治区、直辖市)也随之发布了有关大数据行动计划的文件,但是大数据理念、大数据意识、大数据思维尚未普遍建立。
近年来,大家都在谈论大数据,但仍然面临许多问题。比如,挂牌的大数据研究单位很多,但虚的多、实的少,大数据产业刚刚起步,更未形成产业链;试图掌握(拥有或占有)大数据的多,而真正应用大数据的少,有的甚至不知怎样应用大数据;数据分散、共享难、整合难,仍是突出问题。
这其中最根本的问题就是我国的数据文化尚未受到重视,大数据时代的到来给我们带来了很多跨越式发展的机遇,但如果我们没有大数据意识、大数据思维,归根结底没有(大)数据文化,那么“后发优势”也不可能转变成“现实优势”。
所以,我们要把“大数据”这个科技符号变成“数据文化”,即政府的文化、社会的文化和大众的文化。当然,这是一个长期的任务。
通往计算型的智能社会
不可否认,数据是记录历史和现实的最重要、最可靠、最好的方式;数据还是人类知识的来源,现代意义上的大数据将逐渐成为人类全部认识的来源;而且,还可以用数据训练机器(计算机),使机器获得智能,即计算机人工智能。
摩尔定律,使得人类保存数据的能力增强;社交网络,使得人类生产数据的能力增强;数据挖掘,使得人类使用数据的能力增强。它们被称之为“改变世界的三股力量”,标志着大数据时代的到来。
有数据,必须有计算,这就是计算型社会的兴起,越来越多的社会问题都可以通过计算来解决,同时物理环境领域的计算也面临着一些革命,安置在各类物体上的传感器,万物皆联网,无处不计算,这就是普适计算。无人(自主)驾驶,让数据训练机器使之获得智能,通过大数据的整合和挖掘发现知识,实现“1+1>2”的增值效果。
大数据是什么并不重要,重要的是大数据时代改变了人们的思维模式、管理模式、商业模式。大数据时代每一个新名词的出现,都将预示着一种趋势,并极可能成为改变未来的驱动力。
5月25日贵阳大数据博览会期间,大数据战略重点实验室和全国科学技术名词审定委员会发布的“大数据十大新名词”,即块数据、主权区块链、轶序互联网、激活数据学、5G社会、开放数据、数据交易、数据铁笼、数据安全、数权法,既揭示了大数据的时代特征,又反映了大数据的发展趋势。
“大数据十大新名词”的发布,代表了中国在实施大数据战略方面取得的成绩,说明中国在推动大数据发展中抢占了理论创新、实践创新和规则创新的制高点,正开启信息时代的数据文化。
时空大数据面临机遇
中国虽然在数据文化上相对滞后,但却占有“后发优势”。时空大数据时代的到来,使我们面临前所未有的机遇。
为什么要提出“时空大数据”?当今社会的一个重要特点是,世界管理和全球治理、区域管理和区域治理、国家管理和国家治理、城市管理和城市治理等,对时间和空间的依赖程度越来越高,时空大数据正日益成为全球、地区、国家、城市治理体系和治理能力现代化的核心驱动力。
空间与时间一起构成运动着的物质存在的两种基本形式。空间指物质存在的广延性;时间指物质运动过程的持续性和顺序性。空间和时间具有客观性,同运动着的物质不可分割。没有脱离物质运动的空间和时间,也没有不在空间和时间中运动的物质。空间和时间也是相互联系的。
随着智能感知技术、物联网等技术的发展,各个领域开始了“量化”的进程,这种一切皆可“量化”的趋势导致大规模海量数据的产生,而空间参照与时间参照是大数据的两个基本特征。
从可视化角度讲,正是因为一切大数据都具有空间参照与时间参照特征,才能直观地为人们提供大数据的空间位置、空间分布和时间标识。
变“后发优势”为“现实优势”
时空大数据的产业化是一个新问题,我们应该走一条从基础研究起步的理论创新、技术创新、产品创新和服务模式创新的产业之路。以推动国家治理体系和能力现代化为目标,以新型智慧城市建设为抓手,把时空大数据的应用作为重中之重,切忌面子工程、切忌政绩工程。
在理论创新上,围绕时空大数据科学理论体系、时空大数据计算系统与科学理论、时空大数据驱动的颠覆性应用模型探索等开展重大基础研究,构建时空大数据基础理论与方法体系。
在技术创新上,采用政产学研用相结合的协同创新模式和基于开源社区的开放创新模式,围绕时空大数据存储管理、时空大数据智能综合与多尺度时空数据库自动生成及增量级联更新、时空大数据清洗、数据分析与挖掘、时空大数据可视化、自然语言理解、深度学习与深度增强学习、人类自然智能与人工智能深度融合、信息安全等领域进行创新性研究,形成时空大数据技术体系。
在产品创新上,围绕时空大数据获取、处理、分析、挖掘、管理、应用等环节,研发时空大数据存储与管理软件、分析与挖掘软件、可视化软件等软件产品与软硬件集成产品和多样化数据产品,提供时空数据与各行各业大数据、领域业务流程及应用需求深度融合的时空大数据解决方案,形成比较健全实用的时空大数据产品体系。
但是要在全球化竞争中把握住这种“后发优势”并不容易。大力推进数据文化建设、提高国人数据文化素质,是加快时空大数据发展的根本。
国家之间的竞争,表面上是科技、经济竞争,但归根结底还是国民素质和文化的竞争。没有一个健康、理性、与时俱进的文化,一个国家就难以变得很强大。为此,我们一定让时空大数据走出“学院式”的象牙塔,变成一个大众的话题,使数据文化进入国人的视野,融入国人的意识和血液。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15