京公网安备 11010802034615号
经营许可证编号:京B2-20210330
靠大数据赚钱的10个例子
从 2012 年到 2015 年,大数据持续发威,IDC 市场调查机构预测 2017 年大数据市场将价值 324 亿,拥有这样“Big Data、Big Deal”远见的人,正在利用大数据激荡出最有创意的构想,用数据的力量来创造出大量的价值。从让资料搜寻分析平台,到利用大数据帮助癌症治疗,大数据新创公司这几年内如雨后春笋般出现,2015 年这些“Big Data Startups”也会持续挖掘大数据的价值、微调其企业策略,期盼在市场中展露头角。以下几家新创公司都已经各自获得好几轮金额可观的融资,在大数据市场中十分有潜力,值得我们关注并参考,从中瞭解大数据的应用方向及潜能。
SumAll
SumAll 是一家位于纽约的新创公司,成立于 2011 年,主要为中小型企业提供即时数据分析服务。SumAll 的线上分析平台收集社交媒体及电子商务上的数据,并进行分析后,把可视化的分析结果展示在互动介面上供企业客户参考。例如社交页面上的网页流量、ebay 上的销售量等数据,生成每星期、每个月的分析报导,让企业客户追踪且分析使用者/消费者。
这家公司还有一个很酷的地方:他们分了百分之十的股份给旗下的 SumAll.org —— 一家旨在用资料分析增加社会福利的非盈利组织。
Luminoso
Luminoso 成立于 2010 年,原本是麻省理工大学媒体实验室的一个研究项目,后来发展成利用人工智慧进行文本分析的新创公司。从通讯工具里的讯息、网络上的评论等数据来源,利用自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题。
举例来说,Luminoso 提供的服务可以帮助企业追踪时下发生的热门讨论,还可以根据需求迅速回应,如果消费者对于某产品的缺陷在网上进行了投诉或者抱怨,企业可以及时进行补救。
Flatiron Health
同样发源于纽约的 Flatiron Health 成立于 2012 年,是大数据应用界中是十分有名的“医疗大数据技术”新创公司,主要专注于癌症数据分析1。
Flatiron Health 透过各种管道收集病患的临床纪录、医师诊断纪录、患者治疗结果、基因数据及缴费纪录等数据,透过分析整合后提交给肿瘤学家,透过分析过往的治疗方法跟纪录,帮助医生做出更好的临床诊断跟医治手段。全美现在有约 1000 名肿瘤学家在使用 Flatiron Health 的数据。
Flatiron 的分析平台 OncologyClound 百分之百致力于分析肿瘤学数据,不过 Flatiron 公司也表示,现在全美只有 4% 的癌症病人参与临床试验,另外 96% 无法取得的癌症病人数据则成为大数据分析中的缺口。
Domo
Domo 成立于 2010 年,总部位于犹他州盐湖城,是一家为企业决策层提供商业智慧(BI)的初创公司。2014 年就累积了约有 500 多家签约客户,其中包括了 National Geographic、eBay、Ogio 及 GoodWill 等。
Domo 的商业智慧云端平台可以即时分析多方资料,将多方来源提供的结构化及非结构化数据以即时、视觉化的方式呈现出来,不但帮助企业做决策,也是一个业务管理平台。
Tamr
Tamr 成立于 2013 年,其技术来自于麻省理工的电脑与人工智慧实验室,由麻省理工学院教授兼数据专家 Michael Stonebraker 跟种子投资家 Andy Palmer 共同创办,在 2014 年正式营运。
大数据的其中一个问题就是资料量太大了,而且资料来源剧增又不断变换,Tamr 的机器学习演算法跟软件能有效而大规模地广泛整合和管理现有和未来的多种数据来源,大量降低数据来源的搜集与连结所用的时间,同时辨别资料来源及之间的关联。
Alpine Data Labs
Alpine Data Labs 成立于 2010 年,总部位于旧金山,算是十分有名的大数据分析挖掘软件新创公司,该公司总裁兼首席执行长 Joe Otto 和首席产品长 Steven Hillion 都来自于被云端储存服务提供商 EMC 收购的 Greenplum 公司。
大部份的大数据新创公司都在做“资料可视化(Data Visualization)”,Alpine 则是提供大数据及 Hadoop 的预测性分析功能,且号称是全球第一个针对大数据的团队合作分析解决方案。
DataStax
DataStax 成立于 2010 年,总部位于加州,在去年 9 月曾获得惊人的 1 亿 600 万美元 E 轮融资。
DataStax 主要业务是开发和销售开源分布式数据库 Apache Cassandra 的商业化版本。Apache Cassandra 是高扩展性、高容错的 NoSQL 数据库,比传统的关系式数据库多了许多优势,其设计不仅兼顾了扩展性和开发灵活性,而且搜寻效率也相当不错,特别适合大数据的储存,像是 Cisco、eBay 等大公司都在使用这种数据库。
Altiscale
Hadoop 在这几年内被公认成为大数据的主流技术,而 Hadoop 也是 Altiscale 这家新创公司能够迅速成长茁壮的原因。
Altiscale 成立于 2012 年,总部在加州 Palo Alto,其 CEO 兼创办人是曾在 Yahoo 任职首席技术长(Chief Technology Officer)的 Raymie Stata ,其高层还有同样来自 Yahoo 曾担任首席架构师(Chief Architect)的 David Chaiken。相信大家都知道 Yahoo 就是 Hadoop 的发源地,那这家由 Yahoo 前任高管们所创立的大数据公司主打“Hadoop-as-a-Service”也就一点都不奇怪了。
Altiscale 的服务是解决 Hadoop 的抽象性与复杂度,为工程师搭建一个完整的 Hadoop 环境,并且对其进行维护与管理,让使用者可以更专注于数据和应用。
WibiData
WibiData 位于旧金山的创业公司,成立于 2010 年,联合创始人 Christophe Bisciglia 为企业数据管理分析公司Cloudera 的联合创始人之一,WibiData 的另一名联合创始人 Aaron Kimball 则是 Cloudera 聘用的第一个工程师2。
这家公司所开发的 WibiEnterprise 平台是由一系列的开源Apache 技术建构而成,其中包含了 Hadoop、HBase 和 Cassandra,以及用于即时收集、分析、服务数据的 Kiji 开源框架,其平台的功能是为消费者即时打造客制化的推荐内容及相关搜寻结果,和电子商务龙头 Amazon 所做的类似。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22