
大数据跑起来:来自政府、专家、企业等各方的声音
1月,据国家发改委新闻发布会介绍,目前全国信息共享“大动脉”已经初步打通,实现了71个部门、31个地方与国家共享交换平台的对接;打通40余个国务院部门垂直信息系统,共享超600个数据项;构建涵盖47万项目录的数据资源体系,其中可共享目录占90%,可开放目录占45%。
近年来,国家相继出台各类文件,为政府数据共享开放进程列出“时间表”,规划“路线图”。2015年,国务院印发《促进大数据发展行动纲要》,要求2018年底前建成国家政府数据统一开放平台;2016年9月,国务院印发《政务信息资源共享管理暂行办法》,强调要以共享为原则,不共享为例外,各政务部门形成的政务信息资源原则上应予以共享;今年1月,多部门联合印发《公共信息资源开放试点工作方案》,要求以人民群众最关心、经济社会效益潜力较大的领域为切入点,鼓励试点先行探索积累经验。
国家行政学院应急管理教研部教授钟开斌表示:“要做好国家层面在信息化方面的顶层设计,研究和提出政务数据治理的总体思路和具体方案,自上而下地推动政务数据的共享与开放。”
各部门数据标准不一致,会导致数据收集、整理困难。对此,国家信息中心公共技术服务部助理研究员舍日古楞建议,在搜集与处理数据之前,应当以现有实际情况为基础,充分兼顾协调各部门,及时发布统一标准,必要时可考虑由第三方专业部门来规划制定。
卫计委规划与信息司相关负责人介绍,卫计委按照“标准统一、一数一源”的原则,研究编制委内数据资源管理服务办法,规范数据采集,强化统计分析,加强政务信息的系统整合。
加强大数据平台的技术研发,可为共享开放提供动力。钟开斌说:“伴随互联网产业化、大数据商业化的时代变革,有必要加强数据采集、预处理、存储及管理、分析及挖掘、展现和应用等技术研发,通过技术进步推动政务数据治理变革。”今年1月印发的《四川省促进大数据发展工作方案》,明确要求加强大数据公共技术基础设施建设和大数据科研创新平台,提高资源利用率,推动大数据科学研究与技术成果转移转化。
未来,政务信息要进一步打通壁垒,破除“信息孤岛”,让数据多跑路、群众少跑腿,做到数据取之于民、用之于民,让群众能够真正享受到政务信息共享开放的红利。
找准民生痛点 推动政企合作
数据管家解决硬需求
记者 钱一彬 吴 姗
怎么走最省时间?遇到突发路况如何处理?如何找到老乡组队返乡?日前,全国多地交管部门联合高德地图,借助大数据分析技术为春运“摩托大军”提供最佳返乡路线、个性化路况提示、“组队公告群”提醒以及一键寻找就近春运服务站等“暖心地图”服务。大数据让春运更有“温度”。
各类便民应用频频试水教育、医疗、就业、交通、社保等民生领域。大数据着眼小需求,更能解决大问题,而要释放更多技术红利,找准民生痛点是关键。上海全面推广“健康云”,病历和就诊数据汇集“上云”,就诊记录一键查询,转诊信息顺畅共享;重庆江北区智慧城管系统为路灯、排水管网、环卫车等加装智能设备,采集到的运行状态数据由“智慧城管”进行精细的分析处理,市民满意率较之前提升超过10%……
“群众对于大数据应用的期待日益高涨,政府部门应当成为大数据技术应用的‘产品经理’。”北京师范大学新闻传播学院教授张洪忠表示,“政府部门应主动寻找和感知群众在民生领域的迫切需求,通过联合、委托技术企业等方式解决相应问题并持续加以跟进完善,有效拉近大数据和普通民众之间的距离。”
去年10月,“杭州城市数据大脑”正式对外发布,不仅能根据实时交通状况优化信号灯配时方案,还能及时干预处置路面事故。试点高架道路出行时间平均节省4.6分钟,5平方公里试点范围内平均通行速度提升超过15%,特种车通行速度最高提升超过50%……这一强大的“数据大脑”,由来自13家高科技企业的顶级人工智能科学家共同构建。
数据技术与应用服务商百分点集团公司则基于自主开发的大数据操作系统BD—OS,在2016年为质检总局缺陷产品管理中心搭建大数据处理和建模分析平台,为汽车召回决策提供辅助支持,上线以来已协助处理超过1000起召回案例。“加快大数据技术的应用,不仅需要产学研用等环节联合创新,更离不开政企紧密合作。”百分点首席数据科学家杜晓梦说。
加快应用落地同样离不开人才支撑。据业内专家估算,我国未来5年内大数据人才缺口将超过130万人。“理想的应用开发过程应当是产品需求在前、技术实现在后,而不能仅靠纯技术人员单一驱动产品开发。”张洪忠认为,培养一批既了解市场需求又理解技术基础的复合型人才,将是未来大数据领域人才培育的重点方向之一。
完善配套法规 打击交易黑市
数据安全拧紧监管阀
记者 许 晴 宋静思
1月31日,中国互联网络信息中心发布第四十一次《中国互联网络发展状况统计报告》。《报告》显示,2017年下半年,47.4%的网民未遇到任何网络安全问题,相比2016年增加近两成,个人信息泄露问题比例也明显下降。
去年6月1日,《网络安全法》和《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》施行;今年5月1日,《信息安全技术个人信息安全规范》也将正式实施,随着法律法规不断完善,数据泄露和个人信息泄露问题得到遏制,许多打擦边球的大数据公司表示“日子不好过了”。
“政府需要不断检验并补充修订相关法案,构建有关大数据的政策框架。单靠企业去提升自己的技术能力、履行企业责任还远远不够,与大数据发展相应配套的保护用户隐私的法律规范需要不断创立、更新与补充。”南京大学社会学系教授陈云松说。
“打击数据黑市交易产业链,要管控需求端的源头,监管参与非法数据交易的企业。数据卖家可以‘打一枪换一个地方’,企业犯错后则需要承担很大损失和代价,更畏惧监管的锤子。”九次方大数据创始人、贵阳大数据交易所执行总裁王叁寿说,这样能促使数据需求方通过合法正规的途径获取数据,让数据黑市失去生存土壤。
“任何一部法律出台,都需要一定的配合保障。保障数据安全,不仅制度上要不断完善,技术上也要不断升级更新,区块链等解决安全问题的技术也可以考虑进来。”中国政法大学传播法研究中心副主任朱巍说。
2017年4月,全国信息安全标准化技术委员会发布《大数据安全标准化白皮书》,建议开展大数据安全标准化工作。目前,国内已经有不少大数据平台行动起来,阿里云大数据平台通过安全机制和管控措施,实现不同用户间数据“可用不可见”;京东万象数据平台则运用区块链技术和公安部公民网络电子身份标识系统eID技术,以保障数据安全。
中国传媒大学大数据挖掘与社会计算实验室主任沈浩认为:“数据开放、公开、公平也是一种数据安全的保护手段。应加强社会诚信和信用体系建设,倡导行业自律,让企业具备社会责任感和数据保护意识,不断完善升级自身隐私保护技术和管理机制。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15