京公网安备 11010802034615号
经营许可证编号:京B2-20210330
建议立法护航 打破“孤岛”释放大数据价值
在互联网时代,如何让数据释放更多的价值,成为各界关注的焦点。在今年的全国两会上,如何构建大数据经济体系、大数据如何服务社会等成为委员代表们的热议话题。昨日,记者采访了多位政协委员,就相关话题展开讨论。
现状
数据来源多样缺乏共享,数据成孤岛
全国政协委员张近东告诉记者,随着“互联网+”的深入推进,数据和人力、物力、货币、能源一样,成为企业和社会经济发展的要素资源,以开发和利用数据资源为目的的政治、经济和社会活动迅速扩大着数字产业的规模。
但是目前,由于数据来源的多样,政府和企业间各自拥有的数据资源缺乏整合与连通,信息孤岛、数据壁垒现象仍然存在。导致数据的社会价值、经济价值无法得到充分的挖掘利用,企业在数据信息获取和使用上成本高昂。例如,仅小额信贷发放过程中的身份验证环节,很多企业每年就要花费百万级甚至千万级的费用。
在另一个方面,因知识产权保护意识落后,信息安全技术实力不强,法规监管盲区等问题,个人隐私泄漏事件频发。且在法规方面,对借工作之便盗用贩售他人信息的职务犯罪,严重程度界定不够清晰,处罚力度不够,未起到有效的抑制作用。
全国政协委员谢晓尧也认为,由于一些地方没有意识到只有共享的数据资源才能释放数据的价值,因此,不重视数据开放,一些数据富集部门将数据视作部门财富,不愿意开放,或者希望获取更大的商业利益或主导权。
他表示,这从客观上形成了行业垂直的信息化体系,在地方上形成了条块分割的信息孤岛,数据开放需要纵向层层审批,造成了信息在一个区域平台共享的难度。同时,数据开放是一个新兴事物,缺乏自上而下的法律法规、执行标准、开放标准,让地方推进上无所适从。
应用
利用大数据人脸识别技术可“打拐”
那么大数据如何对人们的实际生活产生影响呢?全国政协委员李彦宏向记者表示,今年自己的提案之一,就是建议利用人工智能和大数据技术,帮助解决走失儿童问题、解决城市交通拥堵问题。
李彦宏说,近年来,人工智能和大数据技术不断完善,应用日趋成熟,有望进一步促进儿童走失案件的侦破。一方面,人脸识别能够提升图像侦查效率,尽早锁定失踪儿童或涉案人员。另一方面,人脸识别能够实现海量人脸数据的跨年龄比对,帮助侦破儿童走失积案。
李彦宏表示,可能孩子是在很小的时候走失,他再进入公众视线可能已经上小学了——比如办学生证的时候需要拍照片,这种情况下通过人工智能的比对,就有可能比以前更加高效的帮助有关部门和家庭找到走失儿童。目前大数据在这方面已经比较成熟了,可以应用到公安机关等相关的部门。
同样,大数据可以改变人们的出行。李彦宏说,交通拥堵已成为我国很多大中城市普遍存在的问题,而我国交通信号灯系统在数据采集、算法优化等方面存在不足,无法充分发挥其在缓解交通压力方面的作用。利用人工智能图像识别、图像分割等技术,则可以实现提升交通流数据采集能力,加强智能交通信号灯配时方案算法研究,做到信号灯优化配置,提升交通流畅度。
建议
顶层设计建国家层面大数据平台
如何将大数据的这些效益发挥?多位政协委员均表示,需要自上而下形成数据体系。在李彦宏看来,就以利用大数据“打拐”来说,需要建立适用于搜寻走失儿童的人脸识别模型;建立覆盖全国的走失儿童数据库;将人脸识别技术与治安、交通监控系统相结合等。这就需要国务院办公厅牵头,协调公安部、民政部等重要组成单位,统筹企业和社会力量。
全国政协委员谢晓尧认为,要充分实现大数据的价值,需要针对数据开放采取立法、建立标准、展开执行监督等一系列的措施,一方面规范数据开放,另一方面形成数据开放的倒逼机制,推动各级政府及相关社会组织实施数据开放。
他建议,可以通过建立“城市数据资源管理中心”,运用PPP模式,以企业为建设和运营主体,将政府、社会的数据汇聚和管理,建立城市开放数据的统一管理平台,为数据应用创造条件。
张近东也认为,需要建立政府主导、市场化运作的数据全生命周期管理顶层设计,打破传统的信息部门管理机制,建立国家层面的大数据平台,为政府机构、企事业单位、公民提供数据服务,政府作为数据开放共享的主体,引导企业接入大数据平台。
他建议,国家可以从制度层面,规范数据的采集、加工、流通和应用等全链条,保证数据的完整性、真实性、准确性;企业层面可以通过合作协议、激励机制等方式,引导企业开放自身数据,实现信息共享的市场化。
张近东建议,当前最先需要解决的,是引导数据共享服务与公众需求,可以在公众迫切需要的领域进行尝试,如银行征信信息、交通信息、环境信息等数据,率先推进开放共享;探索建立信息资源社会化增值开放共享绩效评价制度,鼓励创业企业运用和开发数据产品,形成应用数据大众创业的局面。
积极推进立法为数据共享安全护航
在大数据时代,数据的安全是绕不开的话题。谢晓尧建议,应从顶层设计开始,建立数据开放立法推进委员会,尽快启动数据开放立法,让数据经济建设有法可依。
张近东也表示,应该由国家相关部委牵头,联合互联网技术供应商和互联网服务企业,制定信息保护技术标准,同时通过强制培训等方式,在企业中普及信息保护的技术知识;由国家标准相关部门制定完备的参考方案,并提供相应的管理流程,并通过工商等企业管理部门提出合规性要求,强制各类公司考虑控制IT风险在内的各种风险。
在具体企业监管时,可以对企业进行分级,根据不同企业等级,制定相应法规、管理条例,强制要求相应等级企业参照国家相应标准,采取符合其等级的技术和管理规范,并保证其在信息保护方面的经费投入与其信息数量、敏感度匹配;针对相应投入较大企业,可考虑以补贴、退税等方式缓解企业压力。
同时,他表示,因目前信息泄漏源头环节相对廉价,每条仅为1元不到至10元不等,仅从涉案金额来看往往不高,且最高处罚仅为三年以下有期徒刑,无法形成有效制约。因此,建议以信息泄漏及信息转卖数量作为界定标准,提升处罚刑期上限,遏制整个信息泄露链条的关键环节。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14