京公网安备 11010802034615号
经营许可证编号:京B2-20210330
专访英特尔中国研究院院长吴甘沙:期待数据开放带来真正的大数据时代
吴甘沙,2000年加入英特尔,2011年晋升为首席工程师,同年他共同领导公司的大数据中长期技术规划。在英特尔工作期间,他发表10余篇学术论文,有22项美国专利,14项专利进入审核期。
在英特尔中国研究院院长吴甘沙的微博上,有一句英文的自我简介,可大致译为“勇敢而与众不同地思考大数据”。自2011年担任英特尔首席工程师以来,他一直主持研究院大数据方面的研究。站在大数据思维和技术研发“潮头”的他认为,研究大数据的乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
当前,贵州也站在了大数据产业的“潮头”。而环顾全球,大数据正以燎原之势,从一个热词迅速转化为科研院所、政府、企业、个人共同关注、研究、应用的对象,一种新的生产力正蓬勃兴起。贵州、贵阳要引领发展趋势,对话大数据专家,从他们那儿汲取智慧是一种事半功倍的途径。为此,记者近日专访了吴甘沙。
大数据是指数社会的蛋白质
“如果以世纪之交作为分隔线,上世纪的数据文化、思维和方法论还停留在前大数据时代,真正意义上的大数据思想本世纪初才破茧而出。”吴甘沙说。
“2012年,大数据成为显学。”吴甘沙介绍,这一年,达沃斯的《大数据,大影响:全球发展的新可能》和奥巴马政府的《大数据研发计划》共同确立了大数据在世界范围的战略位置,而涂子沛《大数据》和舍恩伯格《大数据时代》在国内的出版,也使2012年被称作中国的大数据元年。
对于大数据,吴甘沙常常理解为:“摩尔定律是指数社会的基因,而大数据是指数社会的蛋白质。”上世纪60、70年代,英特尔创始人之一的戈登·摩尔提出:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。这一定律常常被用来形容信息技术进步的速度。而吴甘沙认为,随着移动互联时代的到来,数据爆发式增长在量上也越来越符合摩尔定律的指数递增规律。
“基因决定生命特征,是初始点,而蛋白质是生命的物质基础,是生命活动的主要承担者,也就是说,大数据会越来越像原材料,像货币,变成社会生命活动的主要承担者,关系到每一个人的数据化生存。”吴甘沙断言。
他进而举例说,在大数据、云计算、移动互联网和物联网等现代前沿信息技术之中,大数据是根本和核心,云计算是方式和手段,移动互联网、物联网则是物化大数据和云计算价值的应用。
大数据发挥作用的关键在于数据开放
当下,“互联网+”这一名词及其对应的发展趋势正方兴未艾,而吴甘沙则提出了“大数据×”这一说法。他说,大数据与很多传统产业融合在一起能够产生乘法效应,不同产业之间融合还能产生数据外部效应,即一个产业的数据如果用于另外一个产业,能迸发出巨大价值。
在研究中,吴甘沙越来越发现,乘法效应要充分发挥,必须走数据开放之路,让不同领域的数据真正流动起来、融合起来。“最开始,大数据的主要矛盾是互联网公司或在线数据太多的问题,接着,主要矛盾变成人没有能力从数据中提取价值的问题,最后主要矛盾变成中小公司、传统行业无法获得数据,数据孤岛的问题。”吴甘沙说,正因为如此,最近四五年,他个人的研究方向也从关注数据与机器的关系到关注数据与人,再到眼下关注数据与数据的关系。
那么,哪些数据适合开放呢?吴甘沙认为:“不涉及个体的公共数据和科研数据都可以开放,涉及个体的数据要明确数据权属、隐私界定,获得拥有者授权,采用技术匿名化之后再考虑开放。”他同时建议,可以借鉴英美,开放原始数据,而非提炼数据,保证数据满足蒂姆·伯纳斯-李提出的数据开放五星标准。
目前,贵阳正通过宽带贵阳和全域公共免费WiFi城市建设,推动社会企业和个人动态数据的“块”上集聚。吴甘沙认为,WiFi采集数据的优点就是有数据发生所在地点的信息,方便把数据放到不同的语境中分析。但他也坚持,在数据集聚之后,同样需要明确获得用户对数据的授权。
数据交易定价机制仍待实践中摸索
广义的数据开放还包括数据的共享及交易。吴甘沙认为,在大数据时代,如何让数据变成政府决策、企业经营的第一要素,数据的交易显得尤为关键。
4月14日,贵阳大数据交易所完成了首批交易。在吴甘沙看来,这样一个基于市场进行价值发现和定价,连通大数据供需双方,让数据像股票交易那样高频率碰撞的交易市场,在大数据时代是大势所趋。
但他同时指出,无论是数据的交易,还是交易过程中数据的定价,现在都没有标准的答案,“一来要从实践中摸索,二来要有意识地跟经济界做思想碰撞。”他举例说,数据在公开市场交易的时候,是根据市场价值发现机制来定价,根据数据的种类来定价,还是根据数据访问API的调用次数来定价?企业的数据资产价值几何?个人数据是否也需要定价,它的价值是不是应该由个人自己来享受,而不是完全让互联网服务提供商从中获益……
尽管这些困惑尚无定论,但吴甘沙认为这也正是大数据的魅力所在。对于大数据,深耕多年的他认为,乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
对于正在争先发展大数据的贵阳,吴甘沙认为过去一年多的工作“非常棒”,他同时给出建议:要想在与北京等发达地区发展大数据的竞争中不落伍,人才聚集和可持续的供给非常关键。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06