京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据开发要有保护措施为后盾
大数据共享包括政府部门之间的数据共享、跨行政区域政府间的信息共享、政府与企业间数据的合作和共享、企事业单位之间的数据共享等。
政府层面,需要设立大数据协同管理机构,促进政府部门间的数据共享,但是必须要健全大数据相关制度框架和制度体系。另外,需要进一步建立基础数据库,一方面要集中存储被共享的数据,同时进行清晰校验和整合,提供可以共享的目录,以便用户可以接入和收取这些数据。当然,还要规定访问的权限和进行灾备等。
中国政府数据开放平台分布较不均衡,其中沿海经济发达地区占总数的70%,西部中部比较少。虽然中国政府开放了教育、医疗、文体、环境等方面的数据,但是开放数据的总量偏低、结构化程度低、数据质量不高、民众参与反馈不准。
数据共享和开放现在面临三大挑战:第一,不愿意共享开放,政府部门各自为政、把数据开放当成自己的权利。第二,法律法规制度不够具体,不清楚哪些数据可以跨部门共享和向公众开放。第三,缺乏公共平台,共享渠道不畅。
大数据的流通与交易
数据有提供方和使用方,很多时候,数据需要通过中介方进行交易。政府开放的数据是脱敏以后的原始数据,数据挖掘公司将政府数据加工后出售给数据使用方、行业户。一般来讲,数据生产者很少直接面向最终用户,大多通过中介渠道实现自身数据的变现。
大数据交易的关键是对数据质量的要求,包括数据的准确性、真实性、完整性、一致性等。关于交易数据合法性、及时性、可用性、安全性等问题,都是现阶段我国数据交易所面临的问题。
政府的数据不存在提供给中介方交易的问题,当然,中介方可以收集政府的数据进行加工。运营商收集的用户数据原则上所有权是用户,BAT收集的数据原则上所有权是用户,但是运营商和BAT拥有对数据脱敏及挖掘分析后加工数据的所有权。有数据的公司通过数据挖掘向政府和企业提供咨询报告,这类公司虽然没有数据所有权,但是有数据挖掘能力;而那些没有数据,但是有数据挖掘能力的公司,可以受委托完成数据挖掘。是否允许前者在保护隐私和国家安全的情况下提供数据,是否允许后者受委托进行数据挖掘后利用数据为非委托方服务,这些问题现在还没有明确规定。
此外,没有数据也没有挖掘能力的公司,可以作为中介平台,但是是否可以允许其截留数据呢?中介方收集了政府开放的数据据为己有并且出售是不是合法?因此,关于在数据源的稳定性、更新频率和数据扩散等方面,也需要相关规定给出明确的界限。
精加工的数据、可视化的数据怎么定价,怎么衡量数据挖掘的工作量,一次性买断的数据和可以重复多次出售的数据怎么定价,数据的价值与时效性有什么关系,是不是需要有对数据评估的第三方机构,都是现阶段国内数据流通和交易存在的问题。
政府和企业组织没有充分认识到用外部数据可以对自身工作和业务起到巨大的提升作用,所以,一般来讲都很少利用外部数据。很多数据拥有者对数据蕴含的价值缺乏足够的洞察,不放心让自己的数据进入流通环节,担心企业机密泄露。所以,流通也不够,交易也不够,利用更不够。
大数据利用和保护
目前,欧盟制定了严格的数据保护法案,中国虽然有宏观上的数据保护要求,但是没有全面的数据保护法规。
多元数据是跟个人隐私、专业、公共生活有关的任何信息,包括姓名、照片、电子邮件地址、工作表现、经济状况、健康状况、个人偏好、兴趣、IP地址等。针对个人信息的收集、记录、组织、建构、存储、修改、咨询、使用、传播和其他应用,包括排列组合,都可以通过人工处理或自动化处理。
个人具有管理自己数据的权益,具有自己的数据被泄露能够获得及时通知的权利以及被遗忘权。对个人数据处理,要合法公正透明,必须有规有法。只有为了公共利益或历史研究,个人数据才能长时间存储,其他目的个人数据不能长时间存储。同时,还要保证收集的个人数据有技术措施保证,不能被非法授权、非法处理、遗失丢失和损毁。
并不是说个人数据不能处理,符合规定的可以处理,例如本人同意可以作为一个或多个特定目的的数据。个人数据处理是为了保护自己,保护一个自然人的切身利益;为了公共利益,为了追求合法利益的必要,允许商业利用。商业部门、企业处理个人数据,首先是为了合法利益,当然不能侵犯提供个人信息数据的消费者的利益,尤其是儿童。现在几乎所有APP都收集个人信息,如果是为了合法利益的,是被允许的。有个社会调研,关于是否愿意为了将来应用资费上的优惠牺牲隐私,全球有27%的人表示可以牺牲隐私,中国有38%的人表示可以牺牲隐私,更多中国人认为隐私不重要,反而优惠更重要。
数据的传输存储和开发要有要求。所有的软件,包括移动应用的APP,在开发阶段和运行数据处理阶段要保护个人数据的隐私。数据控制也含APP,要有充分的技术和措施,确保数据和移动应用的完整性,必须应对数据处理面临的风险。
我国有一些关于数据开发应用的文件,工信部出台的“大数据产业发展规划”,2016年出台的“网络安全法”,都提到对个人信息和重要数据的境内存储,需要保护信息安全和个人隐私。但是,跟欧盟的法规比,我们的规范都很宏观,真正违反了会怎么样,并没有规定。
数据的价值在于融合与挖掘,政府数据对公众的最大利益在于共享与开放。数据流通与交易有利于促进数据的融合挖掘。数据的使用必须面对保护的责任与义务,尤其是对个人隐私数据的保护。数据的共享开放、流通交易和保护与安全,对数据技术提出研究挑战,数据的共享、开放、流通、交流、使用和保护对法律的制定与执行提出了很高要求,同时还需要平衡数据的保护与数据的开发利用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python文件操作场景中,批量处理文件、遍历目录树是高频需求——无论是统计某文件夹下的文件数量、筛选特定类型文件,还是批量 ...
2026-01-05在神经网络模型训练过程中,开发者最担心的问题之一,莫过于“训练误差突然增大”——前几轮还平稳下降的损失值(Loss),突然在 ...
2026-01-05在数据驱动的业务场景中,“垃圾数据进,垃圾结果出”是永恒的警示。企业收集的数据往往存在缺失、异常、重复、格式混乱等问题, ...
2026-01-05在数字化时代,用户行为数据已成为企业的核心资产之一。从用户打开APP的首次点击,到浏览页面的停留时长,再到最终的购买决策、 ...
2026-01-04在数据分析领域,数据稳定性是衡量数据质量的核心维度之一,直接决定了分析结果的可靠性与决策价值。稳定的数据能反映事物的固有 ...
2026-01-04在CDA(Certified Data Analyst)数据分析师的工作链路中,数据读取是连接原始数据与后续分析的关键桥梁。如果说数据采集是“获 ...
2026-01-04尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30数据透视表是数据分析中高效汇总、多维度分析数据的核心工具,能快速将杂乱数据转化为结构化的汇总报表。在实际分析场景中,我们 ...
2025-12-30在金融投资、商业运营、用户增长等数据密集型领域,量化策略凭借“数据驱动、逻辑可验证、执行标准化”的优势,成为企业提升决策 ...
2025-12-30CDA(Certified Data Analyst),是在数字经济大背景和人工智能时代趋势下,源自中国,走向世界,面向全行业的专业技能认证,旨 ...
2025-12-29在数据分析领域,周期性是时间序列数据的重要特征之一——它指数据在一定时间间隔内重复出现的规律,广泛存在于经济、金融、气象 ...
2025-12-29数据分析师的核心价值在于将海量数据转化为可落地的商业洞察,而高效的工具则是实现这一价值的关键载体。从数据采集、清洗整理, ...
2025-12-29在金融、零售、互联网等数据密集型行业,量化策略已成为企业提升决策效率、挖掘商业价值的核心工具。CDA(Certified Data Analys ...
2025-12-29CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26