京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据匹配农业生产与流通_数据分析师考试
“农产品产量不少,消费量也不少,但是为什么价格忽高忽低?产量与消费量如何匹配?”
三年前,正是从这个问题出发,中国农业科学院农业信息研究所(以下简称农科院信息所)所长许世卫组织研究团队开始对“基于物联网技术的农业智能信息系统与服务平台”项目进行攻关。
近日,这项由科技部立项、农业部牵头组织、由许世卫担任首席科学家的“十二五”国家科技支撑计划项目顺利通过了验收。7月17日,科技部网站以“‘互联网+’和物联网助力传统农业升级”为切入点报道了这项研究成果。
该项目涵盖了现代农业的生产、农资、市场、仓储、管理等关键环节,由全国13家单位180多位研究人员历时3年共同完成。
作为国家农业信息化研究领域的“国家队”,农科院信息所承担了项目的子课题之一 ——农业生产与市场流通匹配管理及信息服务关键技术研究与示范的研究任务。
课题的研究要解决什么问题?有哪些创新与成果?近日,《中国科学报》记者就该课题进展和相关成果采访了项目首席科学家许世卫研究员。
创新农产品数据预处理技术
“农产品从生产到流通再到消费,既是物质流,也是信息流。”许世卫告诉《中国科学报》记者。
信息及时准确的监测对于农产品市场的正常运行至关重要。然而,近些年,我国农产品市场上价格暴涨或暴跌的情形并不鲜见。这一方面使农民的利益蒙受损失,另一方面,也让管理调控部门头疼不已。
如何才能提高市场信息监测预警的准确率?在许世卫看来,准确的基础数据是关键。“如果最原始的数据有误差,那么结论也很可能会出问题。”
研究农业生产与市场流通的匹配管理,恰恰就需要即时采集准确的动态数据。那么,准确的信息又从何而来呢?
“信息的获取方式一是传统人工方式,二是现代信息技术手段,还有一种是把两者结合”,许世卫告诉记者,在他们的研究中,就利用了这样的工具——“农信采”,这是农科院信息所研究团队与清华大学等高校、科研院所联合,历时多年攻关研制出的农产品市场信息采集利器。
这种只有手机大小的设备,却能解决信息采集中的大问题,尤其当前农业信息采集中的标准化与时效性问题。
“以苹果为例,虽然卖的都是苹果,但是品种、大小、品质等具体信息都不一样,如果只统计苹果的价格,就解读不出精确的信息。”许世卫说。而农信采植入农业部行业标准,对品种进行了细化;采用了GPS空间信息匹配、无线传输等技术,将市场、品种、价格等信息即时传到后台,实现农产品流通环节信息的及时输送。
尤其是针对农信采获取的数据与已有的海量农产品市场数据的融合问题,团队创新了农产品市场数据预处理技术,建立数据清理优化模型,识别数据采集中遇到的数据缺失与噪声,从而自动模拟缺失数据、清除异常数据与纠正错误数据。设备通过科学界定农产品种类、规范信息流程、预设信息误差提醒等对农产品市场信息采集进行了革命性提升。
该技术被广泛应用到市场信息采集工作中,先后在天津、河北、福建、广东、海南等11个省市,针对田头市场、批发市场、零售市场,选择粮食、蔬菜、水果、油料、肉类、蛋类、奶类和水产品8大类主要农产品的市场信息采集开展了推广应用。
研究农产品市场产销匹配管理
在夯实了数据基础之后,研究团队针对鲜活农产品产销匹配难度大、市场波动强等问题,对农产品市场产销匹配管理评价进行了研究。
经过资料统计和亲自调研,研究人员决定选取北京市、上海市和重庆市等基础数据比较完备的城市日常消费的若干主要蔬菜为研究对象,构建了生产与市场流通匹配管理评价模型。
他们选择运用灰色关联度、核密度估计等分析方法,分别从蔬菜生产、消费的数量、品种、时间、空间多个角度,构建了蔬菜生产与市场流通匹配管理评价模型,对各大城市蔬菜生产与流通消费的匹配情况进行了全面评估,重点分析了当前我国蔬菜产地转换、流通方式情况,对蔬菜产地销地之间的运输时间、交通状况、运输成本以及季节性匹配等问题进行了深入探讨。
同时,研究团队还完成了区域农产品不同种类消费量预测研究,突破区域农产品供需预测技术。 研究主要从产品的消费类型、不同农产品消费之间的互补替代关系,以及地区差异等3个方面进行了创新的分析和预测,将多种农产品的消费需求放在统一的分析框架下进行分析,从而实现了中国31个省区各种农产品的具体消费需求情况研究。
在多领域取得突破
“我们这个课题又分为5个小课题,每个课题都有5名以上高级职称人员组成的研究团队。”许世卫告诉《中国科学报》记者,项目研究的内容非常丰富。
历时3年的研究中,信息所的研究团队在匹配管理评估研究、农业生产极值监测预警技术研究、农产品市场流通感知与信息处理研究、跨平台匹配管理决策分析系统研制、农产品产销全程服务平台开发研究等方面均取得了多项成果。
以匹配管理评估研究为例,研究团队对农产品市场全息信息规范表达与编码技术进行了研究。团队提出了畜产品全息信息处理技术,依据已有相关统计信息指标体系及标准规范,构建了畜禽产品、畜牧业管理机构和草原建设利用统计指标体系。基于该标准,可以进行数字化传输与智能化处理,大大提高了原有指标体系所收集信息的完备性和兼容性。
许世卫表示,下一阶段他们的研究成果和技术能够更大范围地推广应用,在已取得的成绩的基础上,努力提高技术先进性与设备的实用性。
背景阅读
“基于物联网技术的农业智能信息系统与服务平台”项目包括超大规模精准化农业核心业务集成应用平台及关键性设备与系统研究、农资管理与流通智能信息平台研究与应用示范,粮棉仓储特征监测安全与质量管理关键技术及系统应用示范、农业生产与市场流通匹配管理及信息服务关键技术研究与示范等4个课题。由中国农业科学院农业信息研究所、中国科学院合肥物质科学研究院、中国科学院遥感应用研究所、合浦果香园食品有限公司等13家科研院校、高新企业单位承担。
项目取得了多项创新性技术成果:突破了移动应用程序(App)与电子地图集成病虫害快速响应系统的关键技术,建立了自然灾害预警与历史分析系统;制定了《农资商品电子代码标准》;研发了粮棉仓密度与体积、温度与水分、虫害等传感器及组网技术,开发完成了粮棉仓储特征检测信息的安全传输、数据库管理及其信息分析预测预警平台;提出了畜产品全息信息编码方案,突破了农业生产极值监测预警技术、农产品市场流通感知与信息处理技术。获得实用新型专利授权3项,申请专利28项,获得计算机软件著作权37项。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18