京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何用R做计量经济学
CRAN任务视图:计量经济学
线形回归模型(Linear regression models)
ž 线形模型可用stats包中lm()函数通过OLS来拟合,该包中也有各种检验方法用来比较模型,如:summary() 和anova()。
ž lmtest包里的coeftest()和waldtest()函数是也支持渐近检验(如:z检验而不是检验,卡方检验而不是F检验)的类似函数。
ž car包里的linear.hypothesis()可检验更一般的线形假设。
ž HC和HAC协方差矩阵的这些功能可在sandwich包里实现。
ž car和lmtest包还提供了大量回归诊断和诊断检验的方法。
ž 工具变量回归(两阶段最小二乘)由AER包中的ivreg()提供,其另外一个实现sem包中的tsls()。
微观计量经济学(Microeconometrics)
ž 许多微观计量经济学模型属于广义线形模型,可由stats包的glm()函数拟合。包括用于选择类数据(choice data)的Logit和probit模型,用于计数类数据(count data)的poisson模型。这些模型回归元的值可用effects获得并可视化。
ž 负二项广义线形模型可由MASS包的glm.nb()实现。aod包提供了负二项模型的另一个实现,并包含过度分散数据的其它模型。
ž 边缘(zero-inflated)和hurdle计数模型可由pscl包提供。
ž 多项响应(Multinomial response):特定个体协变量(individual-specific covariates)多项模型只能由nnet包中multinom()函数提供。mlogit包实现包括特定个体和特定选择(choice-specific)变量。多项响应的广义可加模型可由VGAM包拟合。针对多项probit模型的贝叶斯方法由MNP包提供,各种贝叶斯多项模型(包括logit和probit)在bayesm包中可得。
ž 顺序响应(Ordered response):顺序响应的比例优势回归由MASS包中polr()函数实现。包ordinal为顺序数据(ordered data)提供包括比例优势模型(propotional odds models)以及更一般规范的累积链接模型(cumulative link models)。贝叶斯顺序probit模型由包bayesm提供。
ž 删失响应(Censored response):基本删失回归模型(比如,tobit模型)可以由survival包中的suevreg()函数拟合,一个便利的接口tobit()在AER包中。更深入的删失回归模型,包括面板数据的模型,由censReg包提供,样本选择的模型在sampleSelection包中可得。
ž 杂项:有关微观计量经济学得进一步精细工具由micEcon族包提供:Cobb-Douglas分析、translog、二次函数在micEcon里;规模弹性不变(Constant Elasticity of Scale,CES)函数在micEconCES里;对称归一二次利润(Symmetric Normalized Quadratic Profit,SNQP)函数在micEconSNQP里;几乎理想的需求函数模型系统(Almost Ideal Demand System ,AIDS)函数在micEconAids包里;随机前沿分析(Stochastic Frontier Analysis)在frontier包中;bayesm包执行微观计量济学和营销学(marketing)中的贝叶斯方法;相对分布推断在包reldist里。
其它的回归模型(Further regression models)
ž 非线性最小二乘回归建模可用stats包里的nls()实现。
ž 分位数回归(Quantile Regression):quantreg(包括线性、非线性、删失、局部多项和可加分位数回归)。
ž 面板数据的线性模型:plm。一个空间面板模型的包(splm)正在R-Forge开发。
ž 广义动量方法(Generalized method of moments,GMM)和广义实证似然(generalized empirical likelihood,GEL):gmm。
ž 线性结构方程模型:sem,包括两阶段最小二乘。
ž 联立方程估计:systemfit。
ž 非参核方法:np。
ž Beta回归:betareg和gamlss
ž 截位(高斯)回归:truncreg。
ž 非线性混合效应模型:nlme和lme4。
ž 广义可加模型:mgcv、gam、gamlss和VGAM。
ž 杂项:包VGAM、Design和Hmisc包提供了若干(广义)线性模型处理的扩展工具,Zelig是一个针对很多种回归模型的易于使用的统一接口。
基本的时间序列架构(Basic time series infrastructure)
ž stats包的“ts” 类是R的规则间隔时间序列的标准类(尤其是年度、季度和月度数据)。
ž “ts”格式的时间序列可以与zoo包中的“zooreg” 强制互换,而不丢失信息。zoo包规则和不规则间隔时间序列的架构(后者通过类“zoo”),其中时间信息可以是任意类。这包括日间序列(典型地,以“Date”时间索引)或日内序列(例如,以“POSIXct”时间索引)。
ž 建立在“POSIXt”时间-日期类上的its、tseries和timeSeries(前fSeries)包也提供不规则间隔时间序列的架构,特别用于金融分析。
时间序列建模(Time series modelling)
ž stats包里有经典的时间序列建模工具,arima()函数做ARIMA建模和Box-Jenkins-type分析。
ž stats包还提供StructTS()函数拟合结构时间序列。
ž 可以用nlme包中的gls()函数经由OLS拟合含AR误差项的线性回归模型。
ž 时间序列的滤波和分解可以用stats 包的decompose() 和HoltWinters() 函数。
ž 这些方法的扩展,尤其是预测和模型选择,在forecast 包里。
ž mFilter 里有各种各样的时序滤波方法。
ž 估计向量自回归(VAR)模型,有若干方法可用:简单模型可用stats 包里ar()拟合,vars 包提供更精巧的模型,dse 中的estVARXls()和贝叶斯方法在MSBVAR 中。dynlm包有一个经由OLS拟合动态回归模型的方便接口,dyn实现了一个用于其它回归函数的不同方法。
ž 可以用dse拟合更高级的动态方程组。
ž tsDyn 提供各种非线性自回归时序模型。
ž 高斯线性状态空间模型可用dlm 拟合(通过最大似然、卡尔曼滤波/平滑和贝叶斯方法)。
ž 包urca、tseries和CADFtest提供了单位根和协整技术。
ž 时间序列因子分析在tsfa 包里。
ž 包sde提供随机微分方程的模拟和推断。
ž 非对称价格传导建模在apt包中。
杂项
ž 矩阵操作(Matrix manipulations)。作为一个向量和矩阵语言,R有许多基本函数处理矩阵,与Matrix和SparseM包互补。
ž 放回再抽样(Bootstrap)。除了推荐的boot包,bootstrap或simpleboot包里有一些其它的常规bootstrapping技术;还有些函数专门为时间序列数据而设计,如:meboot包里的最大熵bootstrap,tseries包里的tsbootstrap()函数。
ž 不平等(Inequality)。为了测量不平等(inequality),集中(concentration)和贫穷(poverty),ineq包提供了一些基本的工具,如:劳伦茨曲线(Lorenz curves),Pen's parade,基尼系数(Gini coefficient)。
ž 结构变化(Structural change)。R有很强的处理参数模型的结构变化和变化点的能力,可参考strucchange和segmented包。
数据集(Data sets)
ž Packages AER和Ecdat包含许多来自计量经济学教科书和杂志(应用计量经济学,商业/经济统计)的数据集。
ž AER另外提供大量例子再现来自教材和文献的分析,演示各种计量经济学方法。
ž FinTS 是Tsay的《Analysis of Financial Time Series》(2nd ed., 2005, Wiley)一书的R参考,包含运行其中一些例子所需的数据集、函数和脚本。
ž DNmoney包提供加拿大货币流通额。
ž pwt包提供佩恩世界表(Penn World Table)。
ž 包expsmooth、fma和Mcomp分别是《Forecasting with Exponential Smoothing: The State Space Approach》(Hyndman, Koehler, Ord, Snyder, 2008, Springer)、《Forecasting: Methods and Applications》(Makridakis, Wheelwright, Hyndman, 3rd ed., 1998, Wiley)和《the M-competitions》的时间序列数据包
ž 包erer包含《Empirical Research in Economics: Growing up with R》(Sun, forthcoming)一书中的函数和数据集。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04