京公网安备 11010802034615号
经营许可证编号:京B2-20210330
专家:应尽快实现大数据技术自主自控_数据分析师
借助大数据治国必须加强核心技术和产品研发,但专家提醒,要避免走国产操作系统研发的老路。事实证明,PC时代依靠政府资金研发的国产操作系统至今无法撼动微软的垄断地位,如今的移动互联时代,要挑战安卓的地位也非常困难。在国内外差距巨大的现实情况下,我国基础软件实现赶超,必须走合作开源之路。
国家信息中心研究员宁家骏认为,政府不应再定向支持某些企业,应变“相马为赛马”、变资金扶持为市场引导,鼓励有创新能力的企业都参与进来,积极利用开源模式和开放社区资源,形成我国大数据产业发展的开源生态系统,尽快实现我国大数据技术的自主自控。
宁波市智慧城市建设协调处副处长姚坚建议,应尽快开始实施“去IOE”。比起使用IBM小型机每年的维护成本,去IOE的成本不算大。如果国内技术能够实现去IOE,应该大力倡导,同时国家层面提供一些可靠的技术保障,自上而下实施去IOE。
专家介绍说,目前大数据的关键技术研发突破主要表现在以下几个方面:一是不同数据库类型大数据的集中,能够在不同数据类型之间进行交叉分析的技术,是大数据的核心技术之一;二是不同政府部门之间的大数据共享与交换机制;三是双活容灾备份技术构建的大数据应用平台,虚拟机从一个中心切换到另一个中心的时间接近于零。
不少业内人士还建议,可以通过具体师范项目推进大数据治国进程。比如在节能降耗、环境治理、交通运输、食品安全、金融服务、健康医疗等关系国计民生的重点领域,通过政府购买企业服务等方式推动大数据应用的政企合作,改进政府管理和公共治理方式。
事实上,大数据应用已经引起美、英、日等国政府的高度重视,多国将大数据产业发展定位为国家战略,密集出台多项专门政策,一方面开放数据,给予业界高质量的数据资源,一方面在前沿及基础性研究上投入大量资金和人力,领跑大数据发展。
美国政府早在2002年就开发了一个容量巨大、集聚性强的大数据基础架构;2009年,“一站式数据下载”网站data.gov正式上线,囊括了交通、经济、医疗、教育和人口服务等方面的海量数据;2012年,奥巴马政府颁布了高达2亿美元的《大数据研究和发展计划》,白宫科学技术政策办公室、美国国家自然基金会、美国国防部、美国能源部等多个联邦部门和机构,均参与其中。
欧盟2010年正式发布“欧洲数字化议程”,2012年在“欧洲数字化议程及其挑战”中制定了大数据战略。
此外,韩国、日本、新加坡等亚洲国家,也从国家战略层面积极推动大数据产业的发展。这些大数据应用领先的国家有三个显著特点:首先,政府大数据应用项目多基于共享存储的结构化数据库,并不使用实时、动态和非结构化或半结构化的数据;其次,公共部门致力于规范大型而复杂的数据集,政府期望通过大数据应用提升政府服务民众的能力,解决国家面临的重大挑战问题,如经济、医疗、就业、自然灾害和恐怖袭击等;第三,政府设立的大部分大数据项目刚刚起步或计划实施,多数仍处于发展的初级阶段。
全国政协委员、九三学社中央副主席赖明说,从世界发展潮流看,全球的大数据应用整体处于发展初期,我国大数据应用也刚刚起步。应抓住当前大数据技术以开源为主、尚未有任何国家形成绝对垄断的有利契机,改变我国长期处于信息产业链末端赚取低端利润的现状,争取战略制高点。
腾讯互联网与社会研究院首席经济学家孟昭莉说,全球大数据细分行业内聚集了大中小型企业,中国一些大数据领军企业和学界也在发力,目前虽未取得领先,但短时间内实现弯道超车也是有可能的。
“丰富的数据资源为我国大数据发展带来了肥沃的土壤。”宁家骏说,中国拥有全球第一的人口数、互联网用户数和移动互联网用户数,国土面积广、经济体量大,这些都是其他国家难以企及的海量数据资源和应用需求潜力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05