Stata软件之数据框

0 评论

• 在内存中同时加载多个数据集

• 将每个数据集存储在一个数据框中

• 链接相关数据框

• 使用多个数据框中的变量,就像它们在于一个框中一样

• 多任务

• 在另一框中记录结果

• 交互式使用数据框

• 保存和加载数据框集

• 使用ado和Mata格式的数据框进行编程

• 从Java和Python访问Stata数据框中的数据

                 

 

 

 

 

 

 

 

 

 

 

 

创建和数据框

内存中的数据集以数据框的形式存储,每一个框都会被命名。当Stata启动时,它会自动创建一个名为default的数据框。

 

创建数据框命名为 myframe

. frame create myframe

 

删除现有数据框:oldframe

. frame drop oldframe

 

将现有数据框oldname重命名为newname

. frame rename oldname newname

 

仅将变量x1、x2和x3复制到名为subset1的数据框中

. frame put x1 x2 x3, into(subset1)

 

只将z > 50的观测值复制到名为subset2的新框中

. frame put if z > 50, into(subset2)

 

探索数据框

列出内存中的所有数据框,以及每个框中数据的标签和维度

. frames dir

 

描述内存中每一个框中的数据

. frames describe

切换数据框

将myframe设置为活动框,对myframe中的数据执行Stata命令,并再次将default设置为活动框

. frame change myframe

. stata_command

. stata_command

. frame change default

 

使用frame前缀对myframe中的数据运行Stata命令

. frame myframe: one_stata_command

 

对myframe中的数据运行多个命令

. frame myframe {

stata_commamd

stata_command

}

在内存中存储多个数据集可以支持您同时执行多个任务,处理彼此独立但相关的数据集,将结果从一个数据集导入到另一个数据集,等等。

使用独立但相关的数据集

你有两个相关文件persons.dta 和 counties.dta,这些人住在不同郡县。你可以将数据集加载到单独的框中,并将它们链接起来。

 

在default框中打开persons.dta

. use persons

 

创建一个新的counties数据框并打开counties.dta

. frame create counties

. frame counties: use counties

 

使用变量countyid将活动框(default)中的观测值链接到郡县框中相应的观测值

. frlink m:1 countyid, frame(counties)

 

将记录各县收入中位数的变量med _ income从郡县框复制到活动框

. frget med_income, from(counties)

 

为变量med homesize创建别名,该变量记录每个郡县的房屋大小中位数,这样您就可以像在活动框中一样使用该变量。

. fralias add med_homesize, from(counties)

 

使用数据框让工作变得更简单

假设你有世界各地城市和国家的数据,并且您希望在不修改当前数据的情况下高效地分析德国的数据:

. frame put if country==”Germany”, into(subset)

. frame change subset

. stata_commands

. frame change default

. frame drop subset

 

在另一个数据框中记录结果

用变量t和p创建一个名为results的新数据框

. frame create results t p

 

进行1000次模拟,绘制100个随机正态变量,将平均值与0进行t检验,并将t统计量和p值发布到结果框中

. forvalues i=1(1)1000 {

2. quitely set obs 100

3. quietly generate x = rnormal()

4. quietly ttest x=0

5. frame post results (r(t)) (r(p))

6. drop _all

7. }

计算results框中p值小于0.05的观测值

. frame results: count p <= 0.05

 

 

 

 

 

 

 

 

北京天演融智软件有限公司(科学软件网)是Stata软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。