京公网安备 11010802034615号
经营许可证编号:京B2-20210330
科幻迷+大数据,“星图数据”的大数据梦想_数据分析师
在今年的戛纳电影节上,加拿大导演大卫·柯南伯格的《星图》帮助朱丽安·摩尔斩获影后殊荣。作为科幻迷的星图数据创始人谷熠看到这则消息时,最开始还以为这是一部科幻电影,确实有点小兴奋,还想着可以借电影的名声加大公司的曝光。后来他才发现是一部批判好莱坞文化的影片,与科幻无关。但又仔细想了想,电影讲的其实是在好莱坞打拼的事情,而创业不就是打拼吗?谷熠的形容是“历尽苦难痴心不改”。
星图数据今年上线首款产品,8 月份就完成了数百万美元的 A 轮融资。谷熠说,自己带着对产品和大数据的梦想,走上了创业这条“不归路”。作为一家互联网大数据服务公司,星图数据基于海外技术团队的研究成果,开发出了一套适合中国企业的数据应用服务产品,主要为传统制造业公司提供完整的线上渠道数据,通过数据可视化的方式进行直观的呈现,帮助企业通过数据发现在拓展线上渠道过程中所产生的问题,从而进行精准经营与决策。
目前,星图数据的主要服务领域包括快速消费品、3C 与家电,以及家居家装等,美的、苏泊尔、九阳等知名家电品牌都是星图数据的合作对象。根据官方网站的介绍,星图数据的数据积累超过 24 个月,拥有超过 2400 个品类、12 万个品牌和 600 万个商品的线上零售数据,产品服务主要包括以下四个方面:
D-Matrix(数据矩阵)大数据分析系统—— 基于 iNebula(分布式大数据获取与存储系统)与 WarpEngine(大数据处理与分析引擎),集成了搜索引擎、分布式计算、机器自学习算法等大数据领域的领先技术,为品牌企业提供丰富、直观的数据查询、分析与预测功能。SkyScope(天镜)线上渠道巡检系统—— 通过搜索引擎、数据挖掘等技术,为品牌企业提供实时的渠道监控与管理工具。帮助企业及时了解渠道的经营状况、实时进行渠道巡查、发现和查处渠道的违规行为,并以短信、邮件、APP 推送等方式,实现实时预警。
AtomPower(原子力)SKU 单品分析系统——拥有及时、细致的庞大基础数据资源。能够实现数据每日更新。强大的大数据引擎,可以实现快速、自由的数据展现、分析与追溯,以及海量的数据整理和挖掘。
SARK(星舰)大数据代运营服务——帮助企业把自身拥有的数据与线上渠道消费数据结合起来,从而统览全局。借助数据分析,可以追溯每个业务流程中产生的庞大数据,并进行共享整合分析,从而帮助品牌企业从原始数据中获取新的市场洞察和预测分析能力。
从产品名字上就不难看出,星图数据的团队里,不仅谷熠是科幻迷,其他很多人也都是科幻迷。《星际穿越》上映的时候,公司组织大家一起去看电影,看完后还开会进行了一番热烈的讨论。谷熠说,原来,零散的数据就像星星一样散落在各个角落,希望可以用大数据将他们串联起来,真正发挥它们的意义和价值,这也是公司取名为“星图”的原因。
在上个月的“双十一”网络购物狂欢中,星图数据进行了全网销售数据直播。作为国内唯一一家直播全网销售情况的公司,星图数据是如何做到的呢?谷熠说,当然还是依靠技术的力量。区别于传统市场调研机构的”抽样推总“方式,星图数据采用的是”全网普查“方式,对全网 18 家主流的综合性 B2C 和垂直性 B2C 进行实时监测。“我们自主研发了两套底层系统 iNebula(数据星云)和 WarpEngine(曲速引擎)这是是我们基于大数据技术自主研发的数据获取和存储系统 & 数据处理与分析引擎,保障了我们所产出数据的及时性和准确性。”
不过,谷熠也提到,现在的数据处理过程还需要 3 个小时左右的延迟,希望在明年的“双十一”可以做到实时的数据播报,也就是真正意义上的“直播”。
成立之后没多久,星图数据就推出了“超新星+” 计划招募活动,通过申请的企业可以免费享用星图数据 D-Matrix(数据矩阵)产品 6 个月服务。被问及原因,谷熠说,在和传统企业的多年接触中,他们发现真正能够理解大数据、使用大数据的企业少之又少,“我们希望能够通过这一计划,让更多的企业了解大数据,体会到大数据给大家带来的好处和便利;也希望更多的大数据公司能够和我们一起扮演大数据传道者的角色,推动行业更快地发展。”
提到“大数据”,人们往往会想到数据安全,谷熠也被无数次问到这个问题。他说,如果从个人数据隐私的角度来讲,数据的来源和范畴其实需要一个比较清晰的界定:什么样的数据属于隐私数据?什么样的数据属于公开数据?行业中对此有很多争论,到现在也还没有一个最终的标准和结论。他说,近期出现的很多数据泄露的问题,其实是大家的风险意识不高所造成的——当然了,企业的技术安全水平也需要不断提升。“除了企业在道德层面的自律之外,也希望尽快能有相关的法律和行业规范出台。”
而“大数据”这个概念在国内火起来也不过两三年的时间。谷熠认为,这个崭新的时代才刚刚开始。他说,虽然很多人都在讲这个概念,但是真正理解的、能够应用好的还并不多。可以说,大数据的技术和商业化的进程都还在摸索和演进之中,市场也才开始逐步地开放。另外,也不应该只把大数据理解为一种技术或者是一种业务模式,大数据应该是一种能力、一种资产、一个崭新的市场,或者说是代表着一种新的生活与工作的方式。
那么,“大数据”这个概念会一直火下去吗?谷熠反问,你觉得"电力"这个概念现在还火吗?但是它已经改变了人类的工作和生活,而且它的影响也会一直持续下去。
在谷熠看来,大数据所带来的改变,一定会在未来极大地影响每个企业的运作模式和每个个人的生活方式。因此,星图数据也在考虑如何让自己的数据给消费者提供价值,换言之,toB 之外,星图数据或许会在以后推出 toC 的产品。
谷熠曾有 10 年的产品开发与管理经验,算是资深产品经理了。他曾在知名互联网企业主持设计并研发了系列基于云计算的信息服务产品、智能分析系统,并分管产品销售及市场工作;还曾参与中央部委的公共服务系统开发,并作为科研院所的专家组成员,参与了多项国家标准的编写和制定。被问及创业原因,他说,每个人应该都有自己的梦想吧,正是因为有了梦想的推动,人类社会才会发展和进步,“也正因为有一个用大数据改变世界的梦想,我们一直努力最大化地体现着数据的价值,同时也努力实现着自我的价值。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05