Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。
文章目录stata清洗数据——去除重复数据方法stata中的_N和_n(是去重操作的基础)去重操作对单一列:id对两列(及以上):date 和 证券代码
stata清洗数据——去除重复数据方法
stata中的_N和_n(是去重操作的基础)
这个博客讲的非常清楚:
stata:变量排序及_n与_N的用法
sort 证券代码 date
by 证券代码 date:gen daycount = _N //对证券代码和date相同的观测:则产生计数变量:_N
by date 证券代码: gen set=_n //对证券代码和date相同的观测:产生编号变量_n:从1到 最后
去重操作