京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在大数据时代下,“大数据”已经成为出现频度最高的词语,大数据受到的关注越来越多,“大数据”基本上是一个包罗万象的术语,指的是收集和分析大量信息的能力,而这些信息涉及到人类生活的方方面面。过去数据分析可能需要昂贵的数据库和专业化的技术,近几年,与大数据概念有关的创业公司如雨后春笋般涌现出来,如果你愿意,完全有条件用低廉的成本使用大数据分析。
无论是来自一般商业领域,还是零售、医疗、气候等专门领域的大数据都可用来盈利,这种可能性让投资界重新兴奋起来。
笔者收集了几家成长迅猛,并已经获得风险投资的创业公司:
【Splunk】
美国商业智能软件提供商Splunk,创立于2004年,2012年在纳斯达克上市,成为首家上市的大数据公司。目前在12个国家拥有700多名员工,最早通过分析日志数据排除机器故障,现在其软件可用于监控、分析实时的机器数据以及TB级的历史数据。今天所有的网站、通信和复杂IT基础设施每时每刻都在生成大量数据流,Splunk的技术特别适合于实时数据分析,帮助用户需要及时地了解业务发展趋势。
【Tableau】
美国计算机软件公司Tableau创立于2003年,总部位于西雅图,Tableau软件的研发最早源于美国国防部的一个项目,当时为了提高人们分析信息的能力,国防部召集了斯担福大学计算机科学专业的人才,以及专门探索和分析数据库和多维数据集可视化技术研究的着名教授Pat Hanrahan和他的博士学生Chris Stolte,他们很快认识到计算机图形可以帮助人们提高理解信息的能力。Tableau开发的桌面系统中最简单的商业智能工具软件,适合企业和部门进行日常数据报表和数据可视化分析工作,它将数据运算与美观的图表完美地嫁接在一起。
从2003年成立,2010年Tableau营收达到3420万美元,2011年增长到6240万美元,2012年增长到1.28亿美元。
【Cloudera】
美国大数据软件公司Cloudera,由来自Facebook、谷歌和雅虎的前工程师、甲骨文前高管在2008年创建,短短的几年时间里,Cloudera已从一家默默无闻的创业公司,发展成为企业在应对数据挑战时不得不依赖的公司。
Cloudera 利用Hadoop 这一开源技术帮助公司搭建他们的大数据系统,Hadoop 可以利用一些价格低廉的硬件就完成大量的数据分析,所以非常受大小企业欢迎。
Cloudera利用流行的开源软件Hadoop,帮助诺基亚、高通和Groupon等公司储存和处理大数据。
【HortonWorks】
Hortonworks是一家Hadoop初创公司,2011年7月由雅虎与硅谷风投Benchmark Capital合资组建。创立之初仅有不到30名员工,大多来自雅虎专门研究Hadoop的元老级工程师,这个团队几年前开发了雅虎内部一个开源项目Hadoop。Hortonworks公司正努力让更多的人使用Hadoop,并大胆预测这项技术将在未来五年内处理世界上一半的数据。
作为又一家基于Hadoop框架提供大数据服务的创业公司,Hortonworks在短短两年多的时间里就成长起来,引起业界关注。
Hortonworks对公司的融资情况一直讳莫如深。但风投公司Benchmark Capital的普通合伙人彼得·芬顿(Peter Fenton)是该公司的投资者和公司董事会成员。
【MapR】
MapR公司是美国加州的圣何塞市的一个企业管理软件公司,主要专注于可用性和数据安全优化和开发、销售Apache Hadoop的衍生软件。MapR号称下一代Hadoop,使Hadoop变为一个速度更快、可靠性更高、更易于管理、使用更加方便的分布式计算服务和存储平台,同时性能也不断提高。MapR通过为Hadoop用户提供专业咨询服务来获取收入。
MapR目前大约一半的客户是传统的Web和基于云计算的公司,而另一半则是金融、电信和制造公司。
评论:
大数据为风险投资带来了新的市场契机,对于一些敏锐的风险投资者来说,他们最早看到未来的方向,从中发现商机,过去的几年只是一个开始,可以预见大数据行业未来十年仍然会是创业公司的机遇地,这对一些创业公司来说,无疑是一大利好消息。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27