京公网安备 11010802034615号
经营许可证编号:京B2-20210330
导读
“硅发布 ”杨琳桦:50天使创投创始人 David Cao 在中国转了一圈后,我们在硅谷最有名的孵化器之一 NestGSV 聊天,其中聊到一个话题,即大数据如何在种子至天使轮投资中获得应用,我觉得很有意思。
“硅发布”曾写过《下一波下岗的将是 “IT 人士”》。现在,我们来看看另一个正在硅谷发生的信号。以下是我整理的 David Cao 主要观点。Enjoy the insights from Silicon Valley!
全球创业数量大幅增加
首先第一点,全球创业数量正大幅增加。我们来看下大环境。举例说,五年前你要在美国开始创新,一般都得是当年什么思科、雅虎做过至少总监或副总裁以上级别,你得手上有那么几十万美金现金,还得 Hire 一个中国或印度人做你 CTO,否则开不了公司。
但现在,谷歌或其它公司的云计算已经把印度和中国人 CTO 职位消灭,实际上你会看到,现在越来越多创新公司它已经不需要 CTO。第二个变量,因为社交媒体发展起来,导致以前公司很需要的媒体 PR 角色也被大幅削弱,或者说创业公司,它通过很 Social 或很便宜成本就可以实现效果。
那第三个变量,产品的 Distribution 即发送这块。以前如果你要做移动产品,或要搞定运营商和大公司,你这个 BD 成本是非常高的,但现在你只要把产品放到 App Store,或放到谷歌、亚马逊平台上,它自然就会滚起来。
所以也就是说,现在发行(BD)、 Marketing,以及 CTO 这样的工作,它都正被大幅削弱,而小年轻们他只要有饭吃,甚至只要有几千美金,他就可以开始一个公司,并在这三个领域拼过那些很有经验的人。这些是我们说的导致全球创业数量大幅增加的第一个大趋势。
创业者素质大幅提高
第二,创业者素质大幅度提高。比如以前从思科、雅虎做总监出来创业,他其实没经过任何 Training,只有工作经验。但现在年轻人创业,你去看硅谷,光孵化器它就有 100 多个,还有上百家社区。
比如我们刚做的“硅谷企业家社区”是其中一个,但已经是硅谷最大线下社区,那为什么?为什么这些社区这两年突然爆发性增长?这其实涉及新型大数据环境下创业到底发生了什么变量。
第一个是,有大规模线上和线下社区,这些社区大幅扩张,急速促成内容共享和社交学习;第二个是孵化器和加速器大规模兴起,它们能帮创业者去 Training 和包装;第三个就是大赛趋势越演越烈,它主要存在目的是做删选机制。
也就是说,这三大细化趋势都在帮助创业者从原来一个 Dreamer 变成寻找天使轮投资时“很有经验”。而作为这些那些各种培训的结果,你会看到说:现在的创业者走出来去谈种子或天使投资时,他已经变得一个个看着都非常像美女。
他们的 Presentation 已大幅上升,而且他们还在用很低成本,在用谷歌和亚马逊平台,弄出一个你看着很像一头大象,但其实还不是大象的东西。与此同时,问题是什么呢?
问题是,和过去相比,这些人的失败率也在大幅提高。比如五年前那些思科、雅虎出来创业的总监或副总裁,如果手上有几十万美金现金,还 Hire 一个中国或印度人做 CTO,他们失败率会比较低,因为竞争少。假设那时这类人成功率即五年后企业还能存活率是 5%,那现在这些创业公司的存活率,可能已经变得只有千分之几,因为创业数量太多,而竞争非常非常激烈。
这就产生了一个问题,即整个传统 Funding 的流程快要奔溃了,它变得无法运作。因为进来的人越来越多,而且个个看着都不错,但他们实际成功量却只增加 100%,失败率却大幅提高。
这里我讲的主要是早期投资,即种子轮到天使轮这个阶段,大数据的主要问题就在这里:即种子轮一直到 A 轮,特别是种子轮和天使轮面临的问题比较大。
比方说一个小基金和 Partner,以前他一个月看几十个 Case,基本能判断哪几个 Case 是好项目,但现在因为创业者 Presentation 能力大幅上升,失败率却大幅增加,投资人该怎么办?
再好比大家都说斯坦福那个投资谷歌十万美金最后赚了一个亿的那个教授,运气好是一方面,但那时创业竞争也不激烈,其实他也写了不少支票出去,而大部分也都失败;另外当时找他要 Check 的人也不多,那如果是现在,可能会有几千人向他要十万美金,他该怎么给?
也就是说,以前整个种子轮、天使轮流程已无法应付这种大规模创业者。投资人已经变得没法判断,看不清楚,你没有足够多量数据去支持判断,而且你还看到大量创业者在不断涌来。
天使机构化大规模兴起 那造成的结果,其中一个冲击就是:这些传统硅谷天使俱乐部 Angle Group 等,运作开始变得很慢。每个项目都很好那他也能投得很快,但如果每个都是挺好又不够好,他就会不知道怎么决定。
所以我听到的是:这两年硅谷好几个 Angle Group 的投资效率在大幅下滑,他们面临的问题是,这些机构都是业余组织,处理不了这种大规模数据。举个例子,以前来的评审 Case 是一个月 20 个,现在是 80 个甚至 100 个,看着而且还都很接近,很接近时你是非常难选的。
所以这个时候,天使投资机构化的大规模扩张,是硅谷目前正呈现的另一个明显趋势。老牌天使投资人他们开始退役,这是“被迫退役”,因为不知道该怎么做决定。
以前很少有机构做天使,投资机构都从真正的 A 轮开始。但实际上按现在硅谷情况看,不仅仅是投资机构开始进入天使轮,也有新基金融资专门就是为天使融起来。然后它就导致,个人天使开始变得要退休。
我们这么讲吧,如果你是个人天使,以前全凭自己 Networking 就可以决定投资,但现在不行了,你必须加入一个平台或一个聚合机构,才能得到比较有优势的判断。比如那个斯坦福教授,大数据情况下他该怎么办?
两种可能:一不投了,其实就是“退休”;二变得很专业化,他开始加入一个投资机构,现在硅谷很多天使投资人他就加入各式各样的网络或者新兴投资机构,要么做 LP,要么做 GP,所以说最近硅谷天使机构的 Fund 来得很多。
实际上,你把这三年来在硅谷新建立的基金,我猜应该是爆发式增长,就是这三年在硅谷成立的天使级别基金,这个 PRE-A 的基金成立是爆发性的。像 YC 等等。以前天使是业余的人玩,但现在全是机构在玩。
大数据时代怎么删选公司
那么这样三个大趋势下,我们会怎么删选人。其实也是要用到大数据,这个数据牵涉到好几个方面,我把它分成这么几类数据。
第一类是 Social Networking。这个就是要去查,大家做天使投资其实还是很关心这个人怎么样的,那这个时候就是要去 Track 他。实际上我们要查这个创始人都是要查他 LinkedIn 等各种 Networking。
你查是为省时间,因为如果每个人都见,你会被累死。举个例子,以前你就认识我一个 David,你不用查来查去,但现在情况是说你认识一百个 David,你怎么办?所以信息收集能力对现在的投资人非常重要,这也是为什么说天使必须机构化的原因。
现在你的能力已经远远不够,你必须有全职人员,有一帮人在为你做这些事。然后,现在市场上它还派生出很多第三方数据机构,专门就是为提供这些数据,比如有家创业公司叫 Indicator,它做的主要事情就是对创业公司所有痕迹进行跟踪。
另外讲到创业者,我们还会去查说是你是否真实。首先,你必须确定在 LinkedIn、Faceebook、Twitter 上情况一致。因为也有一些人他会作假,比如他有两份工作,然后呢? Co-founder 是兼职。但他不会写全职,就是大家都很 Smart 你知道吗?他没有Treated 你,他只是隐藏了信息就是 Mislead 你。类似这样的。
所以你要通过各式数据系统去摘取数据。而如果你是业余天使人,你根本找不到那些数据,因为那些都是很专业机构在专门帮你采集,像用户访问量、活跃用户等诸如此类。
甚至还有专门公司 Track 你们团队的 List 变化,它就完全用工具抓,只要你一变化它就知道,而且这些全都是全自动化抓取和自动化分析的结果。
那还有一个是行业方面大数据,这叫趋势。你怎么判断这个趋势?回到那个斯坦福教授,以前为什么他敢投谷歌?因为他觉得这个东西还不存在,但其实真实情况可能是,它是存在的,只是那些没做成,而斯坦福教授不知道。
也就是说,如果谷歌前面只有五个,那么他投到第六个也就是谷歌时很 Lucky,但如果是像现在这种情况的 100 个呢?他的成功率会远远小于 10%,而这时每个创业者都会和你说 I am different,你就会变得很难判断这个行业趋势。
种子或天使轮核心问题
其实我觉得种子轮到天使轮,它面临的最大瓶颈是:所有这些种子轮或天使轮它投资企业时,都是静悄悄发生的,但你必须用各式各样大数据方式去把他们找出来,以确保自己不错过投资。
这些工具你在做 B 轮和 C 轮时,会有一帮人专门干这个活,因为你投的是几千万美金,有足够成本雇佣人专门花一个礼拜就做这些事,但问题在于:你是天使轮,你没那么多成本去 Hire 一个人或怎么样,所以最后你必须是个工具化和平台化方式,来确保你知道别人已经投了,这是关键。
天使轮的问题就是:A 轮属阵地战,敌我双方都公开,但天使轮尤其是种子轮,你不是所有都知道。
而且这些东西通常会在什么情况下暴露?它会是在一些社区、非正规或非主流媒体里等,所以你必须有一些更大数据挖掘和处理能力。你不能说我看一个 Case 我看得很高兴,结果别人早就投得不知道哪里去了。
最关键仍是人
那什么样的人能成功这个东西有没有变化?我觉得大方向上是有的。
我们发现,早期在五年前的成功创业者,他从大公司出来的多一些,就是高管创业比较多,因为你得有权有势有资源人脉;但现在,因为互联网技术导致这些需求量不高,这时比较聪明和勤奋的人会更有优势。
就是这个人的 Personality 比他以前经历更重要,这个人本身,他是不是会领导人,是不是对在做的这个东西非常有 Passion。这么讲,就是这个人的个人特点比他背景更重要,然后他个人的 Passion 比他经验更重要。
因为五年前如果你想创业,你有最强的 Passion,你也仍然克服不了中国/印度人给你做 CTO 及 Marketing 等这个或那个问题,但现在你有 Passion,同时那些条件被大幅度削弱,“谁可能成功”这个问题开始变得不一样。
本文作者:曹国钧
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25