# read sas file
import pandas as pd
df = pd.read_stata('GSS_stata/gss7222_r3.dta', convert_categoricals=False)
df.head()
year id wrkstat hrs1 hrs2 evwork occ prestige wrkslf wrkgovt ... agehef12 agehef13 agehef14 adultsinhh hompoph hhtype1_exp wtssps_nea wtssnrps_nea wtssps_next wtssnrps_next
0 1972 1 1.0 NaN NaN NaN 205.0 50.0 2.0 NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
1 1972 2 5.0 NaN NaN 1.0 441.0 45.0 2.0 NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
2 1972 3 2.0 NaN NaN NaN 270.0 44.0 2.0 NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
3 1972 4 1.0 NaN NaN NaN 1.0 57.0 2.0 NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
4 1972 5 7.0 NaN NaN 1.0 385.0 40.0 2.0 NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 rows × 6691 columns

df.shape
(72390, 6691)