# read sas file
import pandas as pd
= pd.read_stata('GSS_stata/gss7222_r3.dta', convert_categoricals=False)
df df.head()
year | id | wrkstat | hrs1 | hrs2 | evwork | occ | prestige | wrkslf | wrkgovt | ... | agehef12 | agehef13 | agehef14 | adultsinhh | hompoph | hhtype1_exp | wtssps_nea | wtssnrps_nea | wtssps_next | wtssnrps_next | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1972 | 1 | 1.0 | NaN | NaN | NaN | 205.0 | 50.0 | 2.0 | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
1 | 1972 | 2 | 5.0 | NaN | NaN | 1.0 | 441.0 | 45.0 | 2.0 | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
2 | 1972 | 3 | 2.0 | NaN | NaN | NaN | 270.0 | 44.0 | 2.0 | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
3 | 1972 | 4 | 1.0 | NaN | NaN | NaN | 1.0 | 57.0 | 2.0 | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
4 | 1972 | 5 | 7.0 | NaN | NaN | 1.0 | 385.0 | 40.0 | 2.0 | NaN | ... | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
5 rows × 6691 columns
df.shape
(72390, 6691)