
大数据为什么一直火不起来?投资人说,商业模式不清晰不愿投资
大数据由来已久,在国际真正兴起普遍认为是,2009年美国奥巴马把政府的数据开放以后,而2011年的麦肯锡发布的一份报告引起了整个行业的革命。在国内是2012年9月,国务院出台了相关大数据产业化的内容。
随着高度互联和大数据时代的到来,经济领域和社会生活诸多方面均呈现海量数据的特征。大到“智慧城市”,小到“量化自我”,大数据所代表的数字化生活无处不在。庞大的信息群为数据深度分析带来新的挑战,而挖掘大数据应用的商机,则为现代企业发展管理决策提供重要价值。掌握应用数据分析方法、应用环境、应用技巧和局限,亦成为决胜互联网以及移动互联网时代的必胜法门。
在“科创通----投资界系列沙龙第二弹:洞察大数据应用”上投资界人士对大数据一探究竟。
投资界“洞察大数据应用”沙龙活动现场
有了大数据,电影未上映就知道票房盈亏不再是梦
东信首席战略官郭利锋指出,“现阶段,我们做的其实还是通过大数据对消费者进行分析拆分,分类以后所谓的消费者群体的投放。随着各个领域和各行业的数据,特别是线下的数据。”
“我们专门做了一个基金投电影。电影在没有拍之前做相应的预测,判断你赚钱还是赔钱,如果是赚钱的项目就投一笔钱进去,最终回报不是说我把数据卖给你们,而是我利用数据做投资。”海银资本合伙人李东平说。“赚多少,赔多少,具体的数字准度大概是80%。”
那么,海银资本是如何利用大数据推测出电影票房的?李东平给予了详细解读:
“电影票房预测核心就是通过在互联网上的言论、表现、社交关系,把你整个这个社交网络里边的人做一个分群——是喜欢看动作片还是喜欢看惊悚片……喜欢在什么时间看。所有的这些模型构建出来之后,是喜欢看谁拍的,是哪个导演拍的,哪个演员演的?所有这些模型构建出来之后,你出来一个片子,甚至没有拍,你把故事梗概放进去——是谍战的,或者是小清新的……根据这个模型算出有多少受众喜欢这类电影,还可以把演员确定一下,喜欢这个角色的演员一二三排一个名,第一名太贵请不起可以请第二名。所有的模型得出相应的结果,这就是我们看重的预测。”
国内大数据在哪个领域应用最多?答案是,互联网金融
对于数据的分析,不同领域可以有不同的服务,不同的方法,医药、交通、金融、零售领域居多。而互联网金融应用的是最多的。
“很多P2P机构都提到10分钟的信贷(10分钟申请,10分钟放贷),实际上就是运用后台的金融大数据平台。”华创资本董事总经理曹映雪说。“金融数据云平台,它做到的就是充分的利用申请者,不光是他传统的银行挖掘到的收入和线下的数据,它还利用爬虫手段和授权,通过申请者线上交易的支付宝信息、银行信用卡账单,迅速集成,通过自身建立的模型给借款者进行信用打分。这一点就要求具有快速处理信息能力,以及对个体信用评估模型,大数据模型的定价,各方面指标的这些确定。”
大数据虽然由来已久,但仍被认为是蓝海,那么哪些领域最有创业和投资的机会?
“作为创业者来说,我个人感觉在数据存储领域可能跟芯片相关或者跟算法相关,因为数据存储是海量的,技术更新平台是非常快的,这块可能有一些机会。在数据应用领域,我可能针对具体的行业做一些应用,这块机会也比较多。”海银资本合伙人李东平说。
大数据前景广阔,“钱”景堪忧
DCM合伙人曾振宇阐述了投资人看到的大数据目前的现状是这样的:
“我们真正看这个市场的投资机会,可能是在应用层的一些机会。或许在应用层也没有什么机会。为什么呢?真正有大数据的公司数据也不会跟你共享,你有什么好分析的,我与其让你建一个公司分析我的数据,不如把你招进来和我一块工作算了,都是这样的态度。”
华创资本董事总经理曹映雪指出,大数据怎样能变现是业内普遍焦虑的问题。“从运用的角度,包括现在很多大数据说的数据变现问题,基本还是从应用场景上没有找到合适的模式。但在金融领域,金融大数据其实有相对比较好的场景。”他说。
“经常做大数据,不要觉得有一个爬虫技术就不得了,有这个技术的人太多了,关键是你把这个数据扒下来干什么用。”钜铖资本合伙人高云卓说。“利用手里的数据创造高价值,当你面对投资人时说我挖掘出什么东西,我会创造什么价值,也许你现在不赚钱,但只要这条路是对的,投资人一定愿意掏钱。”
对于投资者来说,他们愿意投资哪类大数据应用?“我们偏向应用多一些,如果在存储、算法上有一些特色,能和硬件业务有很好连接的东西,我们也会对基础设施这块有一些投资。”乐基金成都负责人李志说。
与大数据相关的哪些行业值得挖掘?晨创投西南分公司首席代表窦勇认为,“金融可能太大,而且BAT在营销方面已经占了大头,不见得还有机会。”窦勇表示,针对一些垂直领域比如做一些APP,针对区域里边的数据资源做嫁接、挖掘可能会有出路。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29