본문 바로가기

분류 전체보기

[STATA] 변수 정렬 및 관리 - sort, tab, gen, egen, ren 주어진 dataset을 원하는 변수에 따라 새로 정렬하려면 어떻게 할까요. sort command를 사용합니다. sort benef_code 그러면 benef_code의 값이 작은 것부터 오름차순으로 정렬이 되겠지요. tab command는 범주형 자료에 유용한 빈도값을 요약해줍니다. tab command와 generate() option을 함께 사용하면 각각에 해당하는 더미변수를 생성하지요. 예컨대 tab group, gen(g) 는 각각의 group에 해당하는 더미변수 g1, g2, g3,...를 만들어 냅니다. generate 혹은 gen command는 주어진 dataset에 없는 변수를 새로 만들어낼 때 사용합니다. gen 변수명 = 변수의 내용 예컨대gen gpm=1/mpg와 같이 수식을 통해.. 더보기
[STATA] STATA에서의 매크로(2) - foreach, forvalue, levelsof 매크로는 동일한 것을 반복해야 할 때 유용하게 쓰인다고 했지요. local 및 global command는 동일한 변수 반복과 조건을 정의할 때에 쓸 수 있었는데, for command는 동일한 command를 반복하는 것을 피하게 해줍니다.즉, for varlist kc ki kg: egen mean_X=mean(X) 는 다음의 command들을 입력한 것과 동일합니다. egen mean_kc=mean(kc)egen mean_ki=mean(ki) egen mean_kg=mean(kg) varlist에서 지정된 모든 변수들이 X로 인식되어 egen command가 실행된 것을 볼 수 있습니다. 이를 확인하는 display command과 개별 command가 표시되지 않게하는 noheader option.. 더보기
[STATA] STATA에서의 매크로(1) - local, global 매크로란 여러 명령어를 반복해서 사용하게 될 때, 이 마이크로 명령어들을 일일이 입력하지 않고 묶어서 수행할 수 있도록 하는 기능입니다.엑셀에서도 많이 사용되지요. 그러나 STATA에서의 매크로 기능은 엑셀과는 조금 차이가 있습니다. 엑셀에서의 엑셀은 STATA에서 do-file과 비슷하지요. STATA에서의 매크로는 여러 변수들을 반복적으로 사용할 수 있도록 합니다. 예컨대 여러 regression에서 동일한 독립 변수 목록을 사용하면서 이를 반복적으로 입력하는 것을 피하고 싶을 때 매크로를 쓰게 됩니다. 매크로 command의 기본은 다음과 같습니다. 매크로 매크로이름 매크로내용 매크로의 정의와 관련하여 좀더 알아보면,. local name "something"는 대괄호 안에 있는 그대로를 매크로의 .. 더보기
[STATA] STATA 관련 파일 확장자들 - dta, do, log STATA 시작하기에 앞서 먼저 다루었어야 하는데, STATA 관련 파일 확장자는 크게 세 가지가 있습니다. 간단한 내용이기에 번역하지 않고 MIT 자료를 첨부합니다. What is it? Where does it come from? Hand in with problem set? *.dta The "input" file. This is the Stata data file. You need to download the data files for each problem set from the course website. NO *.do The "program" file that acts upon the "input" file. This is a text file containing a list of Stata.. 더보기
[STATA] set memory, set more on/off, set seed - 데이터 메모리 및 출력 설정 set은 데이터를 처리하기에 앞서 이것저것 메모리, 변수의 갯수 등 관련 설정을 해두는 데에 유용한 command입니다. 그 중 몇 가지를 소개하겠습니다. set mem command를 통해 데이터를 탑재할 메모리의 용량을 설정합니다. 이는 데이터 처리 속도와도 연관되는데, 필요한 메모리 이상으로 메모리를 설정했을 경우, 자료 처리 속도를 늦추게 되니 필요한 만큼만 설정해놓는 것이 좋습니다. 기본으로 설정된 메모리는 10 MB 입니다. 아래는 예시. set mem 25m 한편, 필요한 작업을 모두 한 다음에는 STATA를 한번 닫고 다시 열거나, 메모리를 깨끗이하고 다시 메모리 상한을 10 MB로 설정해주어야 합니다. 그럼 내가 데이터를 얼마나 쓸지 어떻게 아느냐... 일일이 계산할 필요는 없고 갖고 있.. 더보기
[STATA] log, capture, delimit command - STATA 시작하기 STATA command를 입력할 때 명령어 앞에 capture 혹은 cap을 붙일 때가 있습니다.이는 쉽게 말하면 이와 관련된 게 있으면 실행하고, 그렇지 않으면 잔만말고 가만히 있으라는 뜻입니다. 그리고 코멘트의 기록이 남지 않기를 원하면 입력합니다. 대개 STATA를 통해 데이터를 분석하기 이전에 혹시나 열려있는 log 파일이 있을 경우를 대비해서 log 파일을 닫는 작업을 먼저 실행합니다. 혹시 열러있는 log 파일이 있다면 "log using"이라는 command가 작동하지 않으니까요. 그래서 "log close"를 먼저 합니다. (do file에 에러가 있으면 끝까지 명령어들을 실행하기 전에 멈추거든요. 그래서 먼저 닫았다가 다시 열어주는겁니다.) 이때 capture log close 혹은 c.. 더보기
나의 에너지를 보충해주는 애증의 취미 생활 - 요리 아래는 디씨에 와서 해먹은 몇 가지 소소한 음식들 견과류를 듬뿍 넣고 끓인 강된장 양파가 많이 들어간 고추장 불고기 바삭한 감자 옥수수 고로케 간단하고 상큼한 샐러드 파스타 후라이드 치킨이 고파서 튀긴 치킨 귀중한 김치와 함께하는 수육과 양배추쌈 맛있게 무쳐진 가지나물 하바나 카페에서 영감을 받은 쿠바식 옥수수 전날 미리 양념을 재우고 세 번씩 양념을 발라주며 구워준 바베큐립 냉장고를 부탁해에서 이원일 쉐프님의 레시피로 만들어본 낙지호로록 각종 재료들을 넣어 예쁜 색감의 무쌈 만두피를 튀겨만든 타코쉘과 타코용 고기, 살사, 그리고 토마토 아보카도 샐러드 세 종류로 다르게 구워본 참치 돼지 목살구이, 강된장, 두부감자전, 대구전으로 차려낸 한식 손님상 국수, 죽까지 세트로 먹는 샤브샤브 초고추장이 맛있는 .. 더보기
영어 글쓰기에 대한 고민 - Grammar Girl's Quick and Dirty Tips 약 2년 반 전으로 거슬러 올라가 SAIS에서의 석사 과정을 위해 2012년 7월말쯤 처음 워싱턴 DC에 발을 내딛었을 때, 놀랍게도 저는 영어로 에세이조차 써본 적이 없는 학생이었습니다. 심지어 어렸을 때 영어권 국가에 거주를 한 경험도 전무했지요. 서울대에서 Cultural and Social Transformation of Contemporary Korea라는 수업과 Joint Courses for Global Perspectives and Cooperation라는 수업을 들었을 때 조별로 에세이를 쓰긴 했었습니다. 하지만 두 과목 모두 거의 영어권 국가에서 살다온 학생들이 수강한 과목이었기에 저는 맡은 분량만 작성하고 다른 학우들이 최종 에디팅을 마친 뒤 보고서를 제출했었습니다. 참 용감하게도 T.. 더보기
코스모폴리탄으로 살아가기 - 정체성의 문제 아래 글은 2014년 12월 30일 혼자 노트에 끄적였던 생각들을 다시 정리한 것이다. 2014년 12월 말 한해를 정리하며 친구들과 저녁을 하던 도중 새삼 정체성의 문제에 대한 이야기가 나왔다. 저녁을 함께 한 친구들 중 한 명은 미국에서 출생한 러시아-폴란드-아이리쉬계 미국인, 다른 한 명은 리투아니아에서 출생하여 어렸을 때 미국으로 이민와 이후에 미국 국적을 취득한 미국인, 그리고 나머지 한 명은 중국에서 출생하여 6세에 미국으로 이민온 미국인이었다. 미국에 살면서 느끼게 되는 것은 다양한 사람들이 '미국인'으로서의 정체성과 자부심을 확실히 갖고 있으면서도 자신의 뿌리(origin)에 대한 정체성도 확실하다는 것이다. 본인이 이민 1세대이거나 1.5세대인 경우와 같이 비교적 최근에 이민이 이루어진 .. 더보기
시에라리온 내전과 국가 재건 프로젝트 (1): 배경과 경과 시에라리온 내전 시에라리온은 이번 에볼라 파동 때에 가장 희생자가 컸던 세 국가(라이베리아, 기니, 시에라리온) 중 하나이다. 2015년 2월 20일 현재까지 11,208명이 에볼라 양성 진단을 받았고, 이 중 3,421명이 사망했다(https://www.internationalsos.com/Ebola/index.cfm?content_id=397&language_id=ENG). 2013년 기준 인구 600만에 1인당 GDP가 겨우 $678.96에 불과하며, 평균수명 역시 46세밖에 되지 않는 이 나라는 수도의 이름인 프리타운(freetown)에서 유추할 수 있듯, 이전에 영국의 식민지 노예였던 아프리카인 및 아프리카계 미국인들(크레올)이 1790년대 말부터 이 지역으로 이주 정착하면서 생겨났다. 비록 이.. 더보기