京公网安备 11010802034615号
经营许可证编号:京B2-20210330
专访英特尔中国研究院院长吴甘沙:期待数据开放带来真正的大数据时代
吴甘沙,2000年加入英特尔,2011年晋升为首席工程师,同年他共同领导公司的大数据中长期技术规划。在英特尔工作期间,他发表10余篇学术论文,有22项美国专利,14项专利进入审核期。
在英特尔中国研究院院长吴甘沙的微博上,有一句英文的自我简介,可大致译为“勇敢而与众不同地思考大数据”。自2011年担任英特尔首席工程师以来,他一直主持研究院大数据方面的研究。站在大数据思维和技术研发“潮头”的他认为,研究大数据的乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
当前,贵州也站在了大数据产业的“潮头”。而环顾全球,大数据正以燎原之势,从一个热词迅速转化为科研院所、政府、企业、个人共同关注、研究、应用的对象,一种新的生产力正蓬勃兴起。贵州、贵阳要引领发展趋势,对话大数据专家,从他们那儿汲取智慧是一种事半功倍的途径。为此,记者近日专访了吴甘沙。
大数据是指数社会的蛋白质
“如果以世纪之交作为分隔线,上世纪的数据文化、思维和方法论还停留在前大数据时代,真正意义上的大数据思想本世纪初才破茧而出。”吴甘沙说。
“2012年,大数据成为显学。”吴甘沙介绍,这一年,达沃斯的《大数据,大影响:全球发展的新可能》和奥巴马政府的《大数据研发计划》共同确立了大数据在世界范围的战略位置,而涂子沛《大数据》和舍恩伯格《大数据时代》在国内的出版,也使2012年被称作中国的大数据元年。
对于大数据,吴甘沙常常理解为:“摩尔定律是指数社会的基因,而大数据是指数社会的蛋白质。”上世纪60、70年代,英特尔创始人之一的戈登·摩尔提出:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。这一定律常常被用来形容信息技术进步的速度。而吴甘沙认为,随着移动互联时代的到来,数据爆发式增长在量上也越来越符合摩尔定律的指数递增规律。
“基因决定生命特征,是初始点,而蛋白质是生命的物质基础,是生命活动的主要承担者,也就是说,大数据会越来越像原材料,像货币,变成社会生命活动的主要承担者,关系到每一个人的数据化生存。”吴甘沙断言。
他进而举例说,在大数据、云计算、移动互联网和物联网等现代前沿信息技术之中,大数据是根本和核心,云计算是方式和手段,移动互联网、物联网则是物化大数据和云计算价值的应用。
大数据发挥作用的关键在于数据开放
当下,“互联网+”这一名词及其对应的发展趋势正方兴未艾,而吴甘沙则提出了“大数据×”这一说法。他说,大数据与很多传统产业融合在一起能够产生乘法效应,不同产业之间融合还能产生数据外部效应,即一个产业的数据如果用于另外一个产业,能迸发出巨大价值。
在研究中,吴甘沙越来越发现,乘法效应要充分发挥,必须走数据开放之路,让不同领域的数据真正流动起来、融合起来。“最开始,大数据的主要矛盾是互联网公司或在线数据太多的问题,接着,主要矛盾变成人没有能力从数据中提取价值的问题,最后主要矛盾变成中小公司、传统行业无法获得数据,数据孤岛的问题。”吴甘沙说,正因为如此,最近四五年,他个人的研究方向也从关注数据与机器的关系到关注数据与人,再到眼下关注数据与数据的关系。
那么,哪些数据适合开放呢?吴甘沙认为:“不涉及个体的公共数据和科研数据都可以开放,涉及个体的数据要明确数据权属、隐私界定,获得拥有者授权,采用技术匿名化之后再考虑开放。”他同时建议,可以借鉴英美,开放原始数据,而非提炼数据,保证数据满足蒂姆·伯纳斯-李提出的数据开放五星标准。
目前,贵阳正通过宽带贵阳和全域公共免费WiFi城市建设,推动社会企业和个人动态数据的“块”上集聚。吴甘沙认为,WiFi采集数据的优点就是有数据发生所在地点的信息,方便把数据放到不同的语境中分析。但他也坚持,在数据集聚之后,同样需要明确获得用户对数据的授权。
数据交易定价机制仍待实践中摸索
广义的数据开放还包括数据的共享及交易。吴甘沙认为,在大数据时代,如何让数据变成政府决策、企业经营的第一要素,数据的交易显得尤为关键。
4月14日,贵阳大数据交易所完成了首批交易。在吴甘沙看来,这样一个基于市场进行价值发现和定价,连通大数据供需双方,让数据像股票交易那样高频率碰撞的交易市场,在大数据时代是大势所趋。
但他同时指出,无论是数据的交易,还是交易过程中数据的定价,现在都没有标准的答案,“一来要从实践中摸索,二来要有意识地跟经济界做思想碰撞。”他举例说,数据在公开市场交易的时候,是根据市场价值发现机制来定价,根据数据的种类来定价,还是根据数据访问API的调用次数来定价?企业的数据资产价值几何?个人数据是否也需要定价,它的价值是不是应该由个人自己来享受,而不是完全让互联网服务提供商从中获益……
尽管这些困惑尚无定论,但吴甘沙认为这也正是大数据的魅力所在。对于大数据,深耕多年的他认为,乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
对于正在争先发展大数据的贵阳,吴甘沙认为过去一年多的工作“非常棒”,他同时给出建议:要想在与北京等发达地区发展大数据的竞争中不落伍,人才聚集和可持续的供给非常关键。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22