
HamptonCreek是一家专门生产植物鸡蛋食品的创业公司,它最有名的产品是“Just Mayo”,这家公司在本周刚刚进驻Dollar Tree开设专卖店,在接下来的几个月中,它还会将公司位于旧金山市中心的总部扩建成占地9万平方英尺的办公场所。不过它最大的动作还是挖走了Google的高级数据分析师丹·西格蒙德(Dan Zigmond)。HamptonCreek这样做得原因是什么呢?是要颠覆整个食品制造业。
西格蒙德在过去八年的时间里一直都在处理YouTube和Google Maps 出现的数据难题。他现在的新任务是为Hampton Creek建立全世界最大的植物数据库。这个数据库有可能会改变我们每天早上放进嘴里吃的东西,只是我们不会觉察到有什么不同而已。
可能你现在还看不出来,一位任职于蛋黄酱公司的前任Google数据科学家可以怎样改变标准美国饮食(SAD),不过根据Hampton Creek的CEO乔什·蒂特里克(Josh Tetrick)的说法,西格蒙德正是最合适的人员。“丹拥有令人难以置信的大脑,他能够整理大量的数据,并从中找出数据之间的真正联系。”他所说的“真 正的联系”指的是利用现有的数据库找出能够真正改善地球的植物。
我们已经吃了太多垃圾食品了,所以我们需要吃更多的植物!USDA最新发表的一份调查表明,我们购入了太多的红肉、细粮和不健康的脂肪。
虽然有某些研究指出美国的肉类消费正在下降,但是全世界范围的整体肉类消费正在上升。从某种程度上来说这是个好消息,因为这意味着一些曾经贫穷落后 的国家现在可以买得起更贵的食物了。尽管这是世界经济环境改善的信号,但是这对于我们的环境和身体健康来说就不是一件好事了。而且那些动物工业区的名声也 不太好。不过我们暂时先放下这些虐待动物的问题,先来看看下面的一些数字,我们要消耗5到6磅的玉米,52加仑的水和超过1,000 BTU的石油才能得到一块四分之一磅的牛肉饼。
另外,过量摄入玉米和大豆产品也导致美国人的体重大幅上升。这可能是因为购买精细或者加工过的食物的价格要比健康有机蔬果便宜得多。自从大萧条以 来,美国政府一直都根据农业法案向种植某些作物(例如玉米和大豆)的农民提供津贴。这份法案对薯片和糖果的产量提供了很大的支持,但是苹果就没有享受到这 种待遇了。
肥胖症与低收入水平的相关性也是一个无可否认的事实。超市里面能买到最便宜的食品通常都有较高的卡路里含量和较低的营养价值。这些食品大部分都是来 自农业法案所扶持的玉米和大豆。以上的原因导致了每三个美国成人当中就有一人患有肥胖症。这意味着现在美国有超过1亿的人口正在面临更高的健康风险,比如 更容易患上糖尿病和心脏病。另外,截至2008年,我们每年的医疗支出已经超过了1,470亿美元!
然而,要建立全世界最大的植物数据库来解决以上的问题可不是一件简单的事情。现在世界上有超过870万种已知的植物,更不要提每种植物之下还有多种不同的分类了。
全世界最大的植物数据库可以为世界饥饿问题做些什么
根据联合国粮食及农业组织(FAO)的估计,每晚有超过10亿人都是在饥饿的状态下入睡的。我们为食用的动物提供的粮食都比提供给这些人的多。我们应该将更多的土地用于种植粮食,而不是养殖动物,这种做法可以大幅降低发展中国家购买主食的负担。
工厂化农业经营造成了大型工业化农场的垄断地位,这样会导致大规模的浪费,我们的土壤也会被磷酸甘油之类的除草剂污染,工人的收入被拉低,另外现在 很多普通的病原体都对抗生素产生了抗药性,有很大一部分的原因都是来源于农场的工业化经营。Hampton Creek的想法是建立一个数据库,让其他的公司可以从中获取世界上各种植物的信息,然后利用这些信息来鼓励农民种植一些对地球有好处的新经济作物(不仅 仅是大豆和玉米)。这样反过来也能帮助农民更好地养家糊口,提供更加健康、性价比更高的食物,同时也能带动小型农场的发展。
Hampton Creek的调研团队现在已经记录了13种植物当中的4,000棵不同的植物,希望找出比HamptonCreek现有产品拥有更好地稳定性和口感,而且 价格更低的植物特性。蒂特里克做出了这样的比喻,“我们现在不是在搅拌鸡蛋,而是将植物捣碎,找出我们需要的特性。”
Hampton Creek最出名的产品是蛋黄酱,不过它也有卖不含鸡蛋的曲奇饼。他们很快就会推出一种外观和味道都跟鸡蛋一样的豆制品。蒂特里克说如果拥有世界上最大的 植物数据库的话,他们将会推出更多不含鸡蛋的产品。他表示有一种植物现在还没有投入市场,但是它可以降低糖果的含糖量,同时还能保持糖果本来的味道。
这家公司的目标是向大众提供价格合理,同时能够改善地球的食品。“这就是我们最近进驻Dollar Tree的原因。”蒂特里克说道,“比如像我爸爸这样的人就应该买得起蛋黄酱,不用担心它的价格和是否健康。对于普通人来说,食物应该变得更加健康和便 宜,不然它们就没有任何意义了。”
西格蒙德如果建立出全世界最大的植物数据库,Hampton Creek就可以开始研究那些植物拥有他们所需的特性,可以做出更健康、更便宜,而且对动物和环境的影响更低的食品。
蒂特里克深入的解释了他们发现某些类型的加拿大黄豆拥有合适的分子质量,这就意味着这些黄豆拥有合适的稳定性,可以用于制作Hampton想要的产品。但是从目前来看,要找到更多这样的植物特性无异于大海捞针。仅仅是加拿大黄豆就有超过2,000个变种。
根据蒂特里克的说法,如果了解了这方面的知识之后,他们就可以做出更便宜、更安全、更健康的产品。而且这些信息也是一些大型食品厂商愿意花钱购买 的。虽然蒂特里克不愿意透露具体的厂商名字,但是他说Hampton Creek现在已经跟几家知名的食品品牌商讨数据库授权的事宜。
“如果现在有人要用十亿美元买下Hampton Creek,我们全公司上下都会毫不犹豫地拒绝。”蒂特里克说道。这家公司现在已经获得了由Bill Gates Foundation和Google Ventures等投资人提供的3,000万美元资金,这是一家盈利性的公司,目前处于盈利状态。他们的“Just Mayo”产品在全国的Whole Foods、Safeway、Costco和Dollar Tree等商店有售。
Dollar Tree这家商店对于蒂特里克个人来说有着最重要的意义,因为这是一家面向中等收入的美国人的商店,也是他爸爸会走进去买东西的商店。这也是他愿意将他们 的信息卖给一些大型食品厂商的原因。他想要这些产品变得随处可见,能够让人们真正吃上更好地食物,无需再站在收银台前在价格和健康之间作出选择。“我真的 很想做一些能够改变世界的事情。”这对于他和西格蒙德来说是真是一份量身定做的工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23