登录
首页精彩阅读stata如何删除重复值_stata删除重复值
stata如何删除重复值_stata删除重复值
2016-12-28
收藏

stata如何删除重复值_stata删除重复值

请问 (1) 在stata中 有某两个或多个样本所有变量或部分变量相同,想删除重复的样本 仅保留一个如何操作。

(2)想有条件地删除样本,比如 if year==2007 ,命令是怎样的呢?

我的问题的两个例子就是:
(1) id      year      age        height
1      2007       5             1.2
1      2007        5            1.4
2      2008        5            1.2
比如在这个数据中,前两个样本id  year  age相同,我想要删除掉其中一个,仅保留一个,然后还想附加一个条件,就是删掉height较小(1.2)的那个。

(2)还是上面的数据,然后我想要删掉 year==2007的全部样本。

请问这两个命令如何操作,谢谢了。

最佳解答:

*设数据中无缺失值
bys id year age (height): g n=_n
bys id year age (height): g N=_N
keep if n==N
drop n N

如果想要删除height较大的数据 需要怎么做呢

*先gsort排序,再duplicates去除第二个相同样本

gsort year -height

duplicates drop id-age, force


数据分析咨询请扫描二维码

客服在线
立即咨询