
用大数据和科学理论重新解读人类历史
三十多年之后,张首晟依然经常想起德国的那个夏天,自己在一块墓地立下的理想。
那时的他尚未及冠,正在德国柏林留学。暑假期间来到哥廷根大学游玩,他经过诸多物理学家长眠的一块墓地。这里的墓志铭不同寻常,每位物理学家的墓碑上只有他为物理学、为人类作出的贡献——具有代表性的公式。海森堡墓碑上是测不准原理,玻恩的墓碑上波函数。
正在求学物理研究的张首晟被这一肃穆场景深深感染,他暗自许下决心,要把自己此生献给物理学。之后的三十多年,他来到美国继续深造拿到博士学位,从1993年起任教斯坦福大学,目前是斯坦福大学物理系、电子工程系和应用物理系的终身教授。
毫不夸张的说,张首晟已经是全球最为知名的华人物理学家之一。凭借在“量子自旋霍尔效应”和“拓扑绝缘体”两大研究中的重要贡献,张首晟已经囊括了除诺贝尔奖之外的几乎所有物理学顶级奖项。每年他都会被视为诺贝尔物理学奖的热门候选人之一。他所研究的拓扑绝缘体有望帮助已经接近瓶颈的摩尔定律重新突破,再创一个硅谷时代。
不过,这并不是我,一名科技记者采访他的唯一原因。因为在全球知名物理学家的身份外,张首晟还有一个令人意外的身份:一位成功的风险投资家。他有着自己创办的风投基金丹华资本。
与全球其他知名学府不同,斯坦福大学有着标志性的创业文化。这里走出了惠普、雅虎、谷歌等诸多科技巨头,也为硅谷培养了大批的科技人才。斯坦福教授参与创业和投资的案例比比皆是。因为对两位学生的创业项目投了10万美元天使资金,计算机系教授大卫·切利顿(David Cheriton)如今所持的谷歌股票已经超过了20亿美元。
张首晟最初进入投资圈同样也是因为斯坦福的氛围影响。他告诉新浪科技,自己和斯坦福计算机系教授孟德尔·罗森博格(Mendel Rosenblum)正好是邻居。两家孩子某天在一起踢球的时候,罗森博格和张首晟闲聊起自己的创业项目VMware。张首晟很快看到了其中的机遇,当即决定投资入股。如今的VMware市值高达200亿美元,他的先见之明也得到了丰厚回报。
此后他也陆续投资了四五个项目,有的项目也以几亿美元的方式退出。但张首晟真正涉足系统性的投资还是在2013年。他和自己曾经的学生谷安佳博士创办了丹华资本,意在连接史丹福大学(斯坦福别译)和中国。虽然很多斯坦福教授都有业余投资创业,但像张首晟这样在忙于科研和教学的同时,还做起一家系统的风投基金,却是非常罕见。
在结合科研、教育与创新方面,斯坦福无疑是全球高等学府的巅峰。张首晟也在不断推进中国高等学府在这方面的提升。作为清华大学客座教授和中科院外籍院士,他每年都会花3-4个月时间在清华大学,在教育方面培养出祁晓亮等不少物理学人才,在科研方面与清华大学、中科院等国内科研机构合作取得了量子反常霍尔效应等重要成果。
连接斯坦福与中国
在收获丰硕学术成果的同时,张首晟还在斯坦福三个系担任着教学任务,那他又有多少时间用于投资领域?关于这个话题,张首晟大笑了起来, “我是100%时间在做教育,100%时间在做科研,100%时间在做投资。这并不夸张,我们(丹华资本)有实力雄厚的团队来负责具体事务。”
他具体解释称,“我们通常认为诸多工作不能平行,很多是和体力相关,但脑力工作完全是可以平行的。很多时候,我并不是在工作时间完成投资。举例来说,光场相机创业公司Lytro是斯坦福电机系一位博士创办的。我获知Lytro这个项目就是在电机系的一个学术活动。作为一个理论物理学家,我对数据的重新组合和算法有着浓厚兴趣。投资这个项目,就是在学术研究和学校教育的时间完成的。”
张首晟介绍,丹华资本资本大部分投资都来自于中国顶级的投资机构和优秀的企业战略投资,而投资目标则聚焦在硅谷,也是诸多中国资本走向美国的合作对象。丹华资本目前有7位团队成员,一期基金融资9200万美元,两年多以来投资了22个项目,主要集中在大数据、移动互联网、虚拟现实/增强现实等领域的中早期创业公司,每笔投资从几十万到500万美元之间。其中一半项目已进入下一轮融资,某些企业的增长率超过20倍。
值的一提是,在丹华资本资本投资组合中,网站优化云服务公司Optimizely和无人机平台公司3DR被诸多外媒视为最有可能进入“独角兽俱乐部”(估值达到10亿美元)的创业公司。他们的不少投资项目同时都得到了安德森·霍洛维茨(Andreessen Horowitz)、红杉资本以及Greylock等美国主流VC的投资,这也在侧面体现了丹华资本的投资眼光和竞争力。
独角兽俱乐部——超过10亿美元估值的创业公司(图内展示仅是部分公司)
与硅谷诸多风投一样,丹华资本寻找投资标的的渠道也是通过自身的人脉网络,尤其是发掘斯坦福大学的资源。在丹华资本的团队中,张首晟是斯坦福的三系教授,还有创始合伙人谷安佳和来自斯坦福本科的毕业生,有着完善的投资发掘渠道。当然,张首晟在学术界的声望和地位,是吸引诸多学生创业项目的重要基础。
他对新浪科技表示,丹华资本以斯坦福为基点(占据投资组合的八成),辐射到整个美国高校学术圈和创业圈。丹华资本目前投资组合中,触摸屏互动技术公司Qeexo就来自于美国宾州的知名学府卡内基梅隆大学,图形数据库分析平台GraphSQL来自于加州大学圣地亚哥分校。“我们在美国高校的推荐和人脉网络资源,是其他风投所不能复制的。”张首晟有着很强的自信。
与此同时,丹华资本的中国背景也让其成为硅谷主流风投和创业公司探路中国市场的首要合作考虑。“为了让旗下投资组合公司未来可以更好进入中国市场,一些硅谷主流VC,如安德森·霍洛维茨(Andreessen Horowitz)都在不断主动向我们推荐项目,其中就包括了Optimizely这样的大热项目。”张首晟说。
在连接美国创业公司和中国市场方面,丹华资本有着诸多成功案例。在他们的沟通推动下,Qeexo的触摸屏技术用在了华为的P8手机,这是他们的第一笔订单,而后不断获得智能手机国内厂商的合作订单;在张首晟的促成下,GraphSQL则成为了支付宝和中国国家电网的技术提供商。
科学思维做投资
虽然在资源连接方面有着自己的优势,但丹华资本的最大特色还是张首晟怎样用科学思维方式做投资。“物理学里面有个很大的分支是统计力学,主要研究的就是概率和统计;现在讨论大数据,很多基本的算法都来自于物理学奖。现在大热的机器学习技术,几乎所有以人名命名的算法都来自于物理学奖。”他介绍说。
“大家对科学理解还不够广,需要有个更广的理解。我们在判断一家创业公司发展趋势的时候,也是在判断网状情况下发展,这是有科学规律的。即便你的产品和理论科学没有太大关系,但是我们可以用科学的观点来分析其成长的潜力。我们对物理学和统计学的了解比其他机构都要深入,这是其他MBA出身的投资人士所不具备的。”
在投资无人机领域,张首晟有着完全不同的理解方式。“低轨道卫星是目前一个很大产业,各个行业都需要地面数据信息,很多对冲基金会根据海洋运输的卫星照片来预判大宗商品的价格走势。现在太空有卫星,地面有谷歌街景,中间的低空照片却存在缺失,无人机未来可能会在这方面带来巨大的大数据价值。这也是我们看好投资3DR的重要原因。此外,我们还投资了一家大数据分析项目。”
3DR无人机Solo
谈到科学理论和人类文明,张首晟的兴致明显提升了不少。“我看来,整个人类文明的巅峰成就,在乎欧几里德的几何理论。古希腊人喜欢进行抽象思维,而罗马人更专注怎样把几何用在工程学上,打造了百万人口、设施完善、建筑恢弘的罗马城。但罗马帝国的伟大更在于将几何原理用在了法律上,再复杂的逻辑架构也是建造在几个显而易见的公理之上,这是罗马帝国法律体系的基石。”
用大数据和科学理论来重新解读人类历史,一直是张首晟的爱好。正如他为吴军博士《文明之光》一书所做的序,深刻阐述了大数据时代物理、科技和人文的跨界之美和意义所在。“美国《独立宣言》的第一句话,也是涵盖了欧几里德的思维精华——简单而普适。爱因斯坦的著名公式E = mc2非常简单,也是涵盖了从原子到宇宙的运行原理。”
与其他在硅谷的中国风投不同,丹华资本的投后服务主要还是在硅谷完成。中国科技企业的高管都在频繁往硅谷跑,在丹华资本与张首晟见面谈谈,很多合作就是在这样的情况下促成的。GraphSQL就是这样进入了中国电网的合作视野。“从某种意义上说,我是一个信息路由器,这是我在投资领域的最高价值。GraphSQL通常的合作对象都是互联网公司,我也帮助他们连接上了支付宝,但用到国家电网却是连他们自己都没有考虑过。”张首晟打了一个比方说。
“目前绝大多数VC都是创而优则投,还没有像我这样的科学家VC成功先例。我给丹华资本定的目标,是在未来十年内做成硅谷顶级的前十家VC。”这位斯坦福物理教授如此展望未来在投资领域的发展目标。而另一方面,他依然投入大量的时间在钟爱的物理学研究。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15