京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用大数据思维缓解“被平均焦虑”
上月底国家统计局发布2014年全国平均工资主要数据,随后各地2014年平均工资数据陆续出炉,目前已有20多个省份公布了2014年平均工资。数据显示,20省份中北京市的平均工资最高,河南省垫底;北京、浙江、广东、青海4省份城镇非私营单位平均工资超过全国水平,北京、广东、重庆、浙江4省份城镇私营单位平均工资超过了全国水平。
几乎每一次全国或某个地方平均工资数据发布,都会让不少人感觉自己的收入低于平均工资,并引发“你拖后腿了吗”之类的吐槽,这次也不例外。某门户网站发起的一项网络调查显示,去年收入2万—4万元的网友占37.2%,4万—6万元的占25.5%,6万—10万元的占19.6%,10万元以上的网友占17.7%。这一调查结果未必反映了广泛的全貌,但符合“收入越高人数越少,收入越低人数越多”的基本判断,一些中等偏下收入者和低收入者,很容易感知自己的收入在平均线之下,也很容易发出“我又拖后腿了”的感慨。
吐槽的次数多了,吐槽的声音听起来也就不那么刺耳,人们对吐槽似乎也多了一些“理解”。如国家统计局一名官员认为,工资数据呈典型的偏态分布,少数人工资水平较高,多数人工资水平较低,多数人的工资水平会低于平均工资,同时所属单位的行业、地区、性质及个人所在岗位不同,每个人对工资水平及增长速度的感受也会有所不同,面对平均工资数据,多数收入较低的人难免产生“被平均”之感。可以这样说,平均工资数据引发“拖后腿”吐槽是正常的,如果连这样的吐槽都没有了,说明人们对自己的工资水平和社会总体的收入状况都“麻木”了,那反倒是很不正常的。
然而,对于平均工资数据引发的公众吐槽,统计部门和有关职能部门在“理解”的基础上,应当运用大数据的技术和手段,对平均工资数据及其背后的社会经济状况作出全面、科学的解读。一方面,每次公布平均工资数据时,统计部门应当对数据进行概括总结、提炼提升,帮助公众把握平均工资反映的主要问题和基本态势。如上月底发布2014年全国平均工资主要数据时,国家统计局官员总结了去年城镇单位就业人员工资水平的四个特点,包括“就业人员工资水平稳定增长,增速继续回落”、“私营单位平均工资增速快于非私营单位,两者绝对差距继续扩大,相对差距略有缩小”、“行业间平均工资差距仍然突出”等。读到这样的总结,人们可以更清楚地看到自己在社会收入格局中的位置。
另一方面,统计部门和有关职能部门应当运用大数据思维,对有关平均工资、居民收入的诸多问题进行延伸性、深层次解读。面对平均工资数据,不少人在吐槽“我又拖后腿了”的时候,其实并不讳言自己的收入在逐渐增长,只是痛感自己收入的增长赶不上平均工资的增长,更赶不上一些高收入者收入的增长。我们每个人都希望了解自己的收入有没有增长,以及增长的质量和前景如何,这些都需要由权威统计数据和统计分析来解疑释惑。
2012年11月,十八大报告提出“收入倍增计划”,即2020年实现国内生产总值和城乡居民人均收入比2010年翻一番。而实现收入倍增的主要途径,一是转变经济增长方式,二是实现高质量的就业,三是抓好收入分配。在此“大数据”背景下,国家统计局和地方统计部门每次发布平均工资数据时,至少应当回答以下问题:收入倍增计划目前实现到什么水平?转变经济增长方式、就业和收入分配三项工作,分别对收入增长起到了什么样的作用?下一阶段增加居民收入,需要重点解决哪些困难和矛盾?等等。
在无伤大雅的吐槽之外,当人们对平均工资数据有更多理性把握和深入思考,整个社会对提高居民收入和加快收入分配改革,就有了更多的共识和更大的动力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24