京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据 价值何在(4)_数据分析师
在充分认识到大数据带来机遇的同时,也应该认识到大数据带来的可能性风险
肯尼思·丘基尔:大数据时代令隐私保护问题更加突出。大数据的价值在于存储后的再使用。不过,关键的一个问题是,收集、保存一切信息,与隐私保护政策是有冲突的。保存一切信息是必要的,但是在这么做之前,我们有必要问自己一个问题,即现行的隐私保护政策是不是妨碍了我们正在迈入的大数据世界。社会有必要就此进行大辩论,以便为大数据时代的隐私保护划定新的边界。
维克托·迈尔·舍恩伯格:大数据时代必然会导致人们更多的个人信息被搜集和捕捉,这势必会使很多人感到不舒服甚至不安。但是,对数据感觉到恐慌或者害怕只是一种“小数据时代”应有的情绪。在大数据时代,每个人身上能够被获取的数据点不再是百十个而是高达百万甚至上亿个,谁都根本不可能把某一个人身上的所有数据点全部掌握。所以在保护个人隐私的时候我们可能需要换一种思考方式。比如,我们的关注重点不应该是要不要提供出这些数据,而是如何使用这些数据。
实际上,大数据时代带来的挑战是如何利用大数据分析预测未来,而不是审视过去。比如,一些机构可能在数据分析的基础上做出预期评估,来拒绝一个人申请的抵押贷款,或者否决病患继续进行治疗的必要。在大数据分析的基础上,人们的个人意志和被公平对待的要求很可能被否定,这才是应该担心的地方。
对大数据进行集中管理会使其变得更容易查找,而且便于混合提取不同类别的数据。但是集中管理可能会造成严重的问题:一是可能沦为恐怖分子的袭击目标,二是会赋予管理机构过于集中的信息掌控权。
在我看来,在互联网全球化的时代,我们完全可以从不同的数据库中采集信息而不是一定要把它们集中在一起。
事实上,目前的世界大数据储存已经呈分散化的趋势,数据市场将会允许不同地域和不同条件下数据的储存,人们完全可以从各地的大数据库中提取不同的数据再进行协同整合。
吴辅世:任何事情都有其两面性。在充分认识大数据带来的机遇和利益的同时,我们也应该认识到大数据带来的可能性风险。大数据的数据量巨大、非结构性强、来源庞杂,当它超出我们控制范围时,不可预测的问题就将发生,这就对海量数据的分析及应用要求日益增强,对未来的预测能力和优化性前瞻洞察需求更高。
安晖:对大数据应用必须保持清醒认识,既不能迷信其分析结果,也不能因为其不完全准确而否定其重要作用。
一方面,由于各种原因,所分析处理的数据对象中不可避免地会包括各种错误数据、无用数据,加之作为大数据技术核心的数据分析、人工智能等技术尚未完全成熟,所以对计算机完成的大数据分析处理的结果,无法要求其完全准确。例如,谷歌通过分析亿万用户搜索内容能够比专业机构更快地预测流感暴发,但由于微博上无用信息的干扰,这种预测也曾多次出现不准确的情况。
另一方面,必须清楚定位的是,大数据作用与价值的重点在于能够引导和启发大数据应用者的创新思维,辅助决策。简单而言,若是处理一个问题,通常人能够想到一种方法,而大数据能够提供十种参考方法,哪怕其中只有三种可行,也将解决问题的思路拓展了三倍。
所以,客观认识和发挥大数据的作用,不夸大、不缩小,是准确认知和应用大数据的前提。
本文来自:CDA数据分析师官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11