
来点逆反思维:什么不是大数据
如果大数据是一种潮流,那这个3年前火起来的概念应该早过时了。但大数据不仅是一种潮流。事实证明,各种细分行业的人们,仍热衷于谈论它,而且在长期的将来,还得持续挖掘。
谈论大数据可以引申出一切,谈论一切最终又会归于大数据。像马云说的,我们所处的时代,已经由IT转向了DT(Data Technology)时代。大数据是网络世界的土壤和空气,转而进入我们的血液和思维。
于深圳软件产业基地创新谷举办的环球旅讯第四期开放日TDAY,主题即“旅游业玩转大数据+”,来看活动上讨论了些什么。
大国企:用大数据打破集团下的业务艰墙
夏轶介绍,锦江电商要做大数据,除了有跟上对近年来风潮的原因,更本质的原因,还在于作为大国企的锦江电商,各种业务及其用户之间存在长期的隔离,正如他PPT里展示的那样,本该打通的,却被坚实的无形之墙给阻得死死的。以及集团下各品牌互为孤岛,没有形成理论上应该存在的多品牌互助优势。于是他们需要借由开发大数据功能来进行联通和交叉,以提升效率。
夏轶介绍,事实上大数据的应用,让他们个性化精准营销的效率,相比以前的“手动”,提高了80%之多。
对于使用大数据的心得,夏轶说,有一些事实上的关联,是人看不出的,因此需要用数据来印证。而数据与外部数据的合作,能产生价值,外部数据对于使用者越是未知,这种合作产生的价值可能就越大,“大数据最大的价值是看不到价值”,夏轶说。
在发展大数据过程中,夏轶也遇到了难题,即他所在的传统企业而且是大型国企,业务数据结构比较凌乱,数据采集和清洗存在困难。
在分享的后半部分,夏轶拿出了一些有趣的图表,比如当酒店房价高于300时,双鱼座表现出的消费能力最强(原因或许是最容易受到广告的影响),巨蟹座最分裂,而摩羯座最“勤俭持家”,济南、天津、郑州的人,去北京的人数相当高……
那么,这就是传说中的大数据吗?这些洞察结论,应该怎么利用?埋个伏笔,下面的环节将会讨论到。
分析能力>分析工具
接下来上台的E-Bizcamp 创始人兼CEO 顾青。据顾青透露,准备环球旅讯TDAY演讲的PPT,花费了他50个小时!内容非常丰富,以下是为各位读者精选的要点:
1、大数据是不是骗人的?
大数据到底有没有用?顾青以一只小猪为例:按照大数据的思维,小猪把自己所有与自己的有关的数据都统计处理了,由此算出自己还有很长的寿命。结果第二天小猪却被宰了,被宰之前,小猪骂道:“尼玛,大数据都是骗人的”。问题出在哪里?
大数据失灵了吗?在顾青看来,可能恰恰是因为数据不够大,小猪漏算了它父母寿命这个维度。
2、Google为什么强?
在互联网早期,曾经有150个左右的收费搜索引擎,如今,主流的仅剩下Google、Bing、百度数家,其中Google之强大又是毋庸置疑的。那么,Google凭什么强?
顾青介绍,在登录状态下,Google会收集用户在其他网站上的访问行为数据,从而为用户呈现出个性化的搜索结果。“在2010年之前,搜索引擎之间拼的是算法和技术,而到一定阶段后,算法都差不多了,而Google拥有的用户数据,这成为它在竞争中胜出的关键”。
由此,顾青总结,对于发展大数据而言,收集用户行为数据是至关重要的。
3、移动端更应该注重分析
如果说传统网页几乎只有一个来源即PC浏览器的话,那在移动时代,手机、Pad甚至是智能手表等多设备,以及App、H5网页、微信等多渠道……数据来源种类急剧增多,这时候,商家往往不能清晰分析,从未不能做出应用优化。
4、大数据事业,90%资金应投入给人员培训
在顾青看来,对于大数据,分析能力比分析工具更为重要。因此他提出了投资大数据事业的10/90原则:10%投资于工具,90%投资于人。顾青认为,应该培育有分析思考能力的团队,鼓励小团队管理自己的分析工作,最终更加关注分析和结果,而不是报告。
云PMS+点评大数据,住中+住后,让预测更精准
作为云PMS厂商的绿云与酒店大数据公司众荟进行了主题为“大数据+云PMS”的演讲。众荟拥有用户在酒店留下的点评信息,由此可以获得用户的喜好,比如一位用户点评过游泳池、枕头,就说明该用户对相应方面是有需求或者敏感的。
再看绿云这边,他们可以从住中获得客户的喜好信息,比如喜欢高楼层房间、需要SPA等。两者相结合,就可以更加深度全面的获得用户画像,从而做出更精准的预测和推荐。
最后的环节是座谈,亚朵酒店副总裁朱林海、IDeaS大中华区咨询总经理王越、TalkingData合伙人&高级副总裁蒋奇以及南方航空电子商务部的一位高层人士,共同坐而论道大数据。
南航:航空公司与乘客有50多个接触点可开发
南航电商的高层人士首先发言:航空公司目前具有常旅客系统、积分系统、收益管理系统等几个经典的数据系统,在此基础上,还希望通过捕捉乘客在航空公司官网、呼叫中心留下的痕迹,包括投诉,来存储更多、更复杂、更实时的数据。
该嘉宾还介绍,航空公司的整个服务流程理论上与乘客有50多个接触点,如果能通过这些信息点,采集更多维度的信息,则能让服务更细化和周到。
亚朵:《头脑特工队》就是大数据的故事
亚朵酒店讲技术问题也带着人文范。亚朵副总裁朱林海信手拈来最近上映的电影《头脑特工队》,“这就是个大数据的故事,人脑里面5个小人对应5种情绪,有点像我们说的喜怒哀乐”。
亚朵酒店的一大特色是大堂都带有书吧,住客可以免费借阅,在这件事情上,他们累计了一定的数据。“我们发现有的店记录了,有的店没做记录。结束最多的,是西安的高新店,我们分析了一下,原来这家店的书吧很漂亮。陕西人爱读书,上海人、广东人这方面不行……”,不过朱林海也很清醒地说:“当然,我这可能不叫大数据。”
最后做通信出身的朱林海谈了他对目前大数据发展的三点观感:1、数据还不够大,2、维度太少,想降维都没得降,3、太功利,几乎所有大数据都是围绕着交易的。
TalkingData:光收集罗列数据不叫大数据
TalkingData合伙人&高级副总裁蒋奇从专业大数据技术服务公司的角度指出,光收集罗列数据是没有意义的,到最后归纳出来有用的是“标签”,而专门的大数据公司,则掌握着各行各业的众多标签。
蒋奇指出,数据的收集不等于数据分析,把数据都罗列出来不等于大数据。
IDeaS:大数据要指向具体问题
IDeaS大中华区咨询总经理王越与蒋奇的思路很接近,王越说:“如果大数据预测到酒店因为某个原因可以涨价,那到底应该涨多少?双床房涨多少?大床房涨多少?为什么要涨100,而不是98或者102?大数据应该解决具体的问题,而不是说泛泛的所谓大数据。”
王越还表示,企业运用大数据,应该要指向具体的问题,是想要用大数据来解决客服问题,还是提升收益管理,这个有必要搞清楚。
这时候主持人环球旅讯CEO李超提问,有一些很大的企业,比如海航,有飞机有酒店,按理来说,最应该进行数据的打通,比如搭了海航的飞机,有延误,去到海航的酒店,就可以给客人一个房间升级。但是为什么没有打通?
对此,王越的回答是,这不是技术,而是工作机制和流程的问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15