
发挥大数据价值的三种途径_数据分析师
关于大数据工作的开展是技术驱动还是业务需求驱动的争论一直都有,其实现在看来这种争论没有太大意义。
如果非要说点什么,可以这样看:对于已经有明确商业价值模式的领域,技术驱动的成分更浓,比如搜索、互联网广告、推荐系统等;而对于商业价值模式模糊,甚至根本没有意识到有商业价值点的场景,业务需求驱动的模式就更有用武之地。
而且,有一点是可以达成共识的,你的大数据只是静静的躺在Hadoop集群里,而没有在某个领域(或场景、流程、产品)中发挥价值,是没有任何意义的,只是让地球更加不低碳而已。
说到如何让大数据变现, Precog的联合创始人John De提到了两块:数据驱动的流程(data-driven processes)和数据驱动的产品(data-driven products)。
类似的思想以前也提到过,如果再说详细点,我认为发挥大数据价值的途径可以有三类:
1)通过数据驱动流程的精细化、智能化
大数据对企业流程的优化已经可以渗透到几乎各个环节,诸如营销流程、会员管理流程、产品管理流程、人力资源优化等等都可以看到他们的身影。
你可以预测未来的销量,已更好的分配资源;你可以为商品找到潜在的喜好用户,以开展主动营销活动;你也可以细分既有用户的各种行为模式,以为产品的优化提供参考;你还可以看看什么员工更稳定、哪些员工会离职……
这些管理、运营流程的改进主要集中为两个词:效率、效果,驱动的源头便是在这个两个词的环节上出现了越来越严重的问题。
在这个环节中,数据挖掘应用建模者的需求会高一些。
2)打造数据驱动的数据产品
当你要改造外部公司的流程时,或者自己内部频繁出现的某类流程优化过程,往往需要将大数据的价值整合起来,通过一款数据产品表现出去。比如,淘宝为卖家提供量子恒道产品,帮助卖家更好的经营自己的店铺;比如电商网站内部频繁出现的交叉销售需求,可以给予用户的行为数据打造个性化推荐系统。
根据各方参与度和界限的不同,数据产品可以有很多模式,最简单的,直接出售自己的数据;或者在自己数据的基础上“深加工”再出售;也可以购买多家的数据,自己整合后提供更优质的某种服务,提供诸如定向广告、广告效果监测等;或者不提供数据服务,只提供计算能力,比如类似百分点的推荐引擎;也可以众包模式采集数据,汇集后形成数据交易市场;
这一类别中,成熟的产品类型是搜索、推荐、计算广告,这三个方向更需要大数据技术专家,同时具备一定的商业观、产品观的人才;而此外,还有一些相对不成熟的或短期内没有形成强技术壁垒模式的产品类型,比如上面说的量子恒道、比如大量的第三方微博营销平台,不是说这些产品不需要高深的技术,而且在当前阶段,更需要的是满足客户的“温饱需求”,未来逐渐加重技术驱动的比重。
3)打造数据驱动的服务产品
之所以把这一类单独提出,主要是这类产品的用户往往是C端,他们大都不会去考虑企业经营、流程层面的问题,而更关注产品的功能及体验。而这类产品和普通的互联网产品的区别在于是否是大数据技术密集型产品,还是人力密集型的产品。
举个例子,要打造一款餐饮服务产品,用传统的“扫街”或积累用户评价的模式就显得人力密集一点;而如果基于用户在特定网站的浏览轨迹进行内容挖掘,进而得到用户的餐饮相关标签(口味、位置、消费力),基于此推出餐饮服务产品则更像我们说的数据驱动的服务产品。
再比如传统门户模式 vs 个性化阅读模式也是类似;包括第二类中的个性化推荐模式,从用户侧看也可以视为数据驱动的服务产品。或许,未来的所有服务产品都会是大数据驱动的,但目前来看还有很长的路要走。本文来自:CDA数据分析师官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15