京公网安备 11010802034615号
经营许可证编号:京B2-20210330
解析云计算时代大数据的分析与挑战_数据分析师考试
英特尔人类学家Genevieve Bell分享了她针对大数据(big data)所做的研究,她深刻思考了大数据对未来可能激起的改变,并探讨了在许多不同情境下,这些大数据现象实际上所蕴涵的意义。
Bell在英特尔公司的正式头衔是英特尔实验室互动暨体验研究总监,她负责的工作与英特尔其他科学家和工程师截然不同,涉及的层面涵盖了所有最近在业界掀起热烈讨论的数据海啸(data tsunami)、云计算、设备扩散(device proliferation),以及更强大的服务器在内。“大数据”,正是Bell的下一个主要研究专案。
“问题是该从何处着手?对于我们想要讨论的主题,我们仍处在试着想像这个主题的轮廓及其规模的阶段,”Bell在稍早前英特尔的伦敦Xeon E5处理器发布会上表示。“而今天,所有已达爆满边缘的数据库,只不过是个开端而已。”
接下来,Bell表示,这个世界必须去思考,我们想怎样过滤这些数据?这会对传统线上数据库带来哪些改变?既有的数据世界是否会开始失序,甚至面临崩解而后再建设的局面?
而在这一切的转变过程中,Bell表示,至少我们已经开始明白,所有的一切都会朝着建立一种数据追踪法则的方向发展,包括模拟和数字数据在内,而且,我们还必须有能力管理所有数据。
“对我来说,在这份工作中,数据本身并不是让我最感兴趣的地方,因为所有的一切事物都会产生数据,真正有趣之处在于如何开发更能善加运用这些数据的算法之类,”她解释道。
今天,我们使用数据的方法,并非都能直观地展现出数据本身的意义,Bell说,特别是演算法──要让所有的数据都能善加运用,就必须深入了解数据本身的正确性,而这又和最初的数据填写者有着密切关联。
“所有我们试图用来让数据使用更加合理的想法,都会在一开始被就放在最优先的位置,”她说。事实上,她也点出了当我们开始在单一一种数据模式内找寻数据间的固定模式、因果关系和关联时,实际上都早已落入固有的偏见之中。
“对我而言,大数据分析最迷人之处不仅在于汇聚了来自各个领域的广泛数据,更重要的是你可以拿它们来做些什么,”Bell表示,我们愈来愈依赖数据分析,某种层面来说,这也代表着文化脚本(cultural script)正在跨入崭新的水平。
这类有关数据分析的想法,也推动数据朝“拟人化”(anthropomorphizing)的方向发展。Bell指出,在开始讨论到“数据的秘密生活”(the secret life of data)之际,所有这些数据都将是必要的。而这些讨论也将进一步推动大数据和云计算等应用的扩展。
Bell表示,所有的数据实际上都拥有它自己的特性,这正是使它与其他所有数据有所差异化之处,因此,在分析数据以前,最好先厘清所有数据的特性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26