京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据来了 机会将被“数据鸿沟”所延宕
当前,苹果、Google、微软都在设法强化自身的生态系统,比如,微软最近几个月,已陆续宣布了Windows 8、Windows Phone 8等一系列新终端平台。
三年前,我首次提出了“三大平台之争”,这是一场注定要旷日持久的争夺战。如今,这场争夺战已进入新的阶段。
触摸技术及人机交互,让数以百亿计的新机器与传统的IT设备和网络连接到一起,大数据与云的结合,正为科技和商业生态带来巨大影响。云服务和彼 此连接的人群与海量设备,将发展出反映真实世界中人与人、人与机器、机器与机器关系的社会化网络,并诞生出消弭真实与虚拟界限、更加人性化、交互更自然的 商务和社交平台。
三大平台里,云是前提,是基础。
三年前,云计算对许多人来说还是新鲜和深奥的概念;而今,云已是触手可及。个人用户将文档、照片、视频、游戏存档记录上传至云中永久保存,企业客户根据自身需求,可以搭建自己的私有云,或托管、或租用公有云上的IT资源与服务,这些都已不是新鲜事。
我们看到,将现实社会关系数字化、网络化、商业化的尝试早已开始,但迄今为止,现实世界数字化的程度还不够,真正超越国别、种族和文化壁垒的社会化网络的平台仍未建成,这是中国IT产业的一个重大机遇。
无论是云计算本身、或是智能终端,还是凌驾于云和端之上的,基于社会化网络的平台和应用,都会让数以百亿计的机器、企业、个人随时随地都在获取 和产生新的数据,计算设备硬件性能进化的速度早已赶不上数据增长的速度,并且这一问题会日渐严峻——这样的背景下,只有云才能解决“赋予数据以更大价值” 的问题。这也就引出了最近产业和社会都非常关注的“大数据”话题。
和云计算一样,业界对达到怎样的数量级才算大数据并无定论,在很多行业的应用场景里,数据集本身的大小并不是最重要的,是否完整才最重要。
IT业界所指的数据,诞生不过60多年。而一直到PC普及到千家万户之前,由于存储、计算和分析工具的技术和成本限制,许多自然界和人类社会值得记录的信号,并未形成数据。
进入Web 2.0时代,智能设备用户不单单可以通过网络获取信息,还成为了信息的制造者和传播者。这个阶段,不仅是数据量开始了爆炸式增长,数据种类也开始变得繁多。
如今,通过各种有线和无线电网络,人和人、人和各种机器、机器和机器之间的连接无处不在。用户想驾车去吃饭,先用地图应用查询餐厅的位置、预计 行车路线的拥堵情况、停车场信息甚至是其他用户对餐厅的评论。吃饭的过程中,他会用手机拍摄食物的照片,编辑简短的评论,发布到微博上,还可以用LBS应 用查找在同一间餐厅吃饭的人,看有没有好友在附近……
通俗地说,就是将信号转化为数据,将数据分析为信息,将信息提炼为知识,以知识促成决策和行动。归根到底,大数据的最终意义在于获得洞察力和价值。
大数据意味着激动人心的业务与服务创新机会。零售连锁企业、电商业巨头都已在大数据挖掘与营销创新方面有着很多的成功案例,它们都是商业嗅觉极其敏锐、敢于投资未来的公司,也会因此获得丰厚的回报。
最近几年,我们还看到一些明星初创公司,比如Cloudera, Splunk, Klout, TellApart等,人员规模只在数十人,但对某个行业拥有深厚知识,并通过整合云和大数据的技术,快速解决共性需求和痛点。在未来数年,这样的“小而 精”、“快而准”企业会越来越多,并做出有可能改变世界的颠覆性产品。任何一家有雄心、渴望获取洞察力的企业,都应及早制定大数据战略和方案。否则,所有 的机会将被“数据鸿沟”所延宕。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22