본문 바로가기

egen

[STATA] 정말 유용한 egen row: mean, sum, total, max, min, tag, group, concat, cut egen command를 통해 활용할 수 있는 함수들을 몇 가지 알아보겠습니다. mean() egen mean_price = mean(price), by(store_id) 이는 각각의 store_id에 대하여 price의 평균값을 mean_price라는 새로운 변수로 저장합니다. 예컨대 각각의 store 물건 가격의 평균값이라고 할 수 있지요.이때, 관측치에 결측값이 있으면 mean을 구하지 못합니다. rowmean() . egen avg = rowmean(a_score b_score c_score) 이는 각각의 관측값에서 서로 다른 변수 a_score,b_score,c_score 간의 평균값을 계산해서 새로운 변수로 저장합니다. 예컨대 a,b,c가 수학, 과학, 영어 점수일 때, 전과목의 평균치를 구할.. 더보기
[STATA] 변수 정렬 및 관리 - sort, tab, gen, egen, ren 주어진 dataset을 원하는 변수에 따라 새로 정렬하려면 어떻게 할까요. sort command를 사용합니다. sort benef_code 그러면 benef_code의 값이 작은 것부터 오름차순으로 정렬이 되겠지요. tab command는 범주형 자료에 유용한 빈도값을 요약해줍니다. tab command와 generate() option을 함께 사용하면 각각에 해당하는 더미변수를 생성하지요. 예컨대 tab group, gen(g) 는 각각의 group에 해당하는 더미변수 g1, g2, g3,...를 만들어 냅니다. generate 혹은 gen command는 주어진 dataset에 없는 변수를 새로 만들어낼 때 사용합니다. gen 변수명 = 변수의 내용 예컨대gen gpm=1/mpg와 같이 수식을 통해.. 더보기