今天学习的视频是:
stata入门--国泰安和锐思数据下载_哔哩哔哩_bilibili 【up主:差点没头】
stata入门--从国泰安导入数据_哔哩哔哩_bilibili
目录
1.从CSMAR下载数据
以下载年报中的数据为例
2.导入stata中初步处理数据
2.1导入stata
2.2数据处理
2.3导出处理后的数据
1.从CSMAR下载数据
以下载年报中的数据为例
- 时间段选择
- 代码选择:选择股票市场分类(A股/B股/科创板……);剔除ST股票;剔除金融业【如果有自己的个人账号,可以将代码选择进行自定义保存,这样就不用每次重复这几个动作】
- 字段选择:将自己所需的数据选上
- 条件筛选:因为财报数据既包括季度报告也包括年报的数据,一般只需要年报的数据;报表类型一般选择合并报表【写完了筛选条件,一定要点添加】
2.导入stata中初步处理数据
2.1导入stata
cd C:\Users\lenovo\Desktop\Stata学习\0.数据准备
clear
import excel "C:\Users\lenovo\Desktop\Stata学习\0.数据准备\FS_Combas.xlsx",sheet("sheet1") firstrow
- 一般不会写代码导入excel;而是直接点击导入按钮,并勾选“将第一行作为变量名”
2.2数据处理
drop in 1/2
//从第一行开始删,一共删两行
rename A001212000 fixedassets
//变量重命名
rename A001000000 assets
rename A002000000 liability
rename A003000000 equity
destring fixedassets assets liability equity,replace
//红色表示字符串型,无法进行计算
//destring将字符串型改为数值型
//replace将新的数值型变量(黑色)替换原来的变量
处理前
处理后
- *红色是字符串型,黑色是数值型
2.3导出处理后的数据
- 导出为excel:一般直接点导出按钮,注意要勾选“第一行为变量名”,“覆盖文件”
- 导出为dta:如下
export excel using "C:\Users\lenovo\Desktop\Stata学习\0.数据准备\2_FS.xlsx", firstrow(variables) replace
//保存为dta文件,注意去掉后面的xlsx后缀;replace覆盖原有文件,更新文件
save C:\Users\lenovo\Desktop\Stata学习\0.数据准备\2_FS, replace
//如果前面已经指定了工作路径,可以直接写文件名称保存
save 2_FS,replace
//使用保存的dta文件
use 2_FS,clear