
大数据和创业到底有着什么神秘关系
怎样利用大数据的思维方式和大数据的分析方法帮助平台上的创业者?怎样用大数据创新创业?这是南开大学科技成果转化中心主任高翔思考最多的问题之一。在2015年全国大学生创业实训营的交流活动中,大咖云集的大数据讨论吸引了全场营员的注意。有人在朋友圈写道:“大数据时代来了,我们能做什么呢?”数据分析师应该重视!
“因为智能手机或者其他的智能终端的产生,大量以前不可以被数据化的东西被数据化;一旦被数据化,这个节点可以被周围的节点感知。就在此刻,这个世界正在迅速智能化。”长实资本合伙人、腾讯互联网社会研究院原副秘书长何华峰说,“这两年我很有运气能够看到行业重新构造,传统企业被颠覆,一大波创业企业产生。”
何华峰和团队研究滴滴打车,发现这家3年时间达到250亿美元市值的公司所做的“无非是连接两个点”,即汽车的位置信息和人的位置信息。
“只要能在数据中发掘出一个节点,让它发出数据跟周围的节点相连,就能造就很牛的企业。”何华峰说。
2012年天津市提出要发展大数据产业,规划被交给南开大学。高翔和一批专家一起研究了解学生创业者对大数据的思维方式和分析问题的方法。在他看来,大数据可以帮助青年创业者找到自己的“赛道”,即创业的需求和关键点所在。
携程网是产业中被何华峰看好的一个例子。沈南鹏从耶鲁大学毕业回国创办携程网一年后,从后台数据敏锐地发现:国内最紧缺的酒店是价格在每晚100~200元的酒店。对应这个需求,他创立了如家连锁酒店。
“不过对于学生来说,自己做一个携程网或者阿里巴巴这样的平台依然很遥远,一个现实的方式就是借势。”他说。
高维创业岛大数据投资总监冷静很明白开源资源的价值。
10年前百度刚开始推出竞价排名,在竞价排名里每一个关键词都有价格。冷静的团队通过技术手段一口气找到了将近100多万个关键词的价格,由高到低排序,明确 知道哪些是价格最高的行业。后来,他们又将淘宝的销量做了一个大数据分析,发现奶粉是淘宝上销量最热的产品之一。原来奶粉安全问题事件之后,大家都在通过 淘宝购买海外的奶粉,所以奶粉就成了一个非常好的赛道。
除了找赛道,大数据还可以为创业者找人。
确定与一个几乎陌生的人进行资金合作之前,冷静会去查找他的芝麻信用分。芝麻信用分是阿里巴巴基于之前的淘宝交易平台向大众提供的一个开放数据接口。如果芝麻信用分 高于750分,他会觉得这是一个可以信任的人。更方便的识人大数据来自微信朋友圈,很容易看到这个人是不是靠谱,是不是有资源跟自己进行匹配,从而帮助判 断可不可以合作。
在江苏中科龙梦科技有限公司总经理张福新看来,大数据为创业者提供的,是一个无限的资源平台。
这位我国第一款高性能通用CPU龙芯的主要设计人员之一毕业于中科大少年班,可以算是学霸。很多学生“年年都考试,年年都在做题,而有些成绩很好的同学会有总结错题的习惯,但还是有很多同学做完题就扔掉了”。于是,他的团队在推广龙芯的过程中,通过学生的错题纪录,归纳出这个学生哪个方向的学术结构有问题, 以便家长和老师有针对性地做更加有效的补偿措施。这样,让“没有主动发现能力的人能够得到纠正的机会”。
这里的大数据,可以是开源的,也可以是自己积累的。江苏常州养蟹产业发达,养蟹对水质要求很高,一旦某个晚上水温度太高或者氧气不足,螃蟹就全死了。监控水质可以搭建传感器,汇总信息。精做下去,数据积累多了,就是大数据,形成一个养蟹的智慧库。
张福新认为,如果大数据的产业是建大楼,那他所从事的国产系统研究是提供砖块的活动。任何有点子的团队没有设计能力,可以借助他们的力量完成基础硬件。而一旦大的大数据平台搭成,是年轻创业者寻求资源的极棒平台。
“在创业过程中,一定是要充分借助资源,把握住自己的定位,然后利用各个环节的数据来最高效率地完成自己的目标,应当把精力集中在最有创意、对社会最有价值的新的点子上。”张福新说
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10