본문 바로가기

분류 전체보기

[STATA] 데이터를 쉽게 표로 만들기 - esttab, estout, eststo, estadd, estpost esttab - Display formatted regression table . estpost tabstat price mpg rep78, by(foreign) statistics(mean sd) columns(statistics) listwise foreign | e(mean) e(sd) -------------+---------------------- Domestic | price | 6179.25 3188.969 mpg | 19.54167 4.753312 rep78 | 3.020833 .837666 -------------+---------------------- Foreign | price | 6070.143 2220.984 mpg | 25.28571 6.309856 rep78 | 4.28571.. 더보기
일상을 공유할 누군가 때로 시시콜콜한 이야기들을 털어놓고 싶은데 그럴만한 상대가 마땅치 않다고 느껴질 때가 있다 강해져야지하고 다짐해보지만 또다시 사람을 찾아헤매는 나 자신을 발견하고만다 더보기
[STATA] label define, label value과 label variable의 차이점 label variable해당 변수가 무엇을 의미하는 변수인지 설명해주는 것label var school_aged0 "school-aged boys'" label define 범주형 변수(categorical variable)에서 각각의 값이 숫자로 코딩되어 있을 때, 각각의 숫자가 무엇을 의미하는 것인지 각각의 값에 라벨링을 해주는 것label define lbenef_sex 1 "male beneficiary" 2 "female beneficiary"label define yesno 0 "no" 1 "yes" label value정의된 라벨은 어떤 변수에 연계시키게 해주는 것 (label define)을 먼저 해주어야 함label define sexlabel 1 "male" 2 "female"labe.. 더보기
4월 첫째주 르포 주제 예고 - 나이지리아 대선, AIIB, 이란 핵협상 이번주에는 다음의 세 가지 주제에 대해 다뤄보려 합니다. 나이지리아 대선 AIIB 이란 핵협상 너무 무겁지 않게, 그러나 역시 너무 가볍지 않게 핵심적인 요소와 talking point만 추려서 소개할테니 많이 기대해주세요! 더보기
나이지리아 대선: 야권 후보, 무함마두 부하리의 승리 나이지리아 대선의 향방은 2015년 아프리카 전문가들에게 초유의 관심사였습니다. 저에게 있어서도 작년에 보코하람과 관련하여 석사학위 졸업논문을 쓴 적이 있기에 주목하고 있는 국가들 중 하나입니다. 나이지리아는 인구 1억 7천만(인구수 기준 세계7위)의 나이지리아는 북부와 남부 정치인들 간의 갈등, 무슬림과 기독교인들 간의 긴장 관계, 북동부의 무장단체인 보코하람, 그리고 남부 나이저델타지역의 무장단체인 MEND 등 온갖 문제들로 복잡한 나라이죠. 지난 3월 28일과 29일 양일간 치뤄진 대선에서 APC 소속 무함마두 부하리 후보가 차기 대통령으로 선출되었음이 31일 공식발표되었습니다. 무함마두 부하리 차기 대통령은 1983년 군사 쿠데타로 정권을 장악한 바 있으며, 당시 20개월만에 다시 쿠데타로 축출되.. 더보기
[오늘의 영어회화] Not half bad 오랜만의 포스팅입니다. 한동안 일때문에 정신이 없었어요. 지금은 일이 더 많아졌지만 하루를 평소보다 일찍 시작하는 것으로 모자른 시간을 보충하려 합니다. 오늘부터 영어단어/구문과 불어단어/구문 하나씩을 포스팅하려구요. STATA도 계속 업데이트하겠지만 너무 많은 command를 한번에 다루다보니 좀 정신이 없어졌어요. 그럼 오늘의 영어회화 포스팅을 시작하겠습니다. not half bad생각보다 나쁘지 않은It's not as bad as one might have thought.Something that is pretty good or that is relatively acceptable, especially if you had low expectations for it in the first place.. 더보기
Data Reconciliation - 데이터 분석에 앞서 해야 할 작업 Data reconciliation is a technique that targets at correcting measurement errors that are due to measurement noise, i.e. random errors. From a statistical point of view the main assumption is that no systematic errors exist in the set of measurements, since they may bias the reconciliation results and reduce the robustness of the reconciliation. Definition and overview of Data ReconciliationData.. 더보기
데이터의 분포를 어떻게 보여줄까 - Histogram vs. Boxplot Boxplot Boxplot은 outlier를 제거하고 사분위수를 이용하여 가운데 50% 의 데이터를 통해 그래프를 생성한다. 이를 통해 중앙값을 비롯한 각 사분위수의 범위,최대값, 최소값을 알 수 있습니다. HistogramHistogram은 전체 데이터에 기초하여 측정값이 존재하는 범위를 몇 개의 구간(급)으로 나눈 경우,각 구간에 해당하는 데이터의 총 갯수를 보여준다. 상대도수를 모두 합하면 1이 된다. 각 막대 간에는 간격이 없으며, 많은 경우 값들은 정규분포를 따르는 것처럼 보인다. 이를 통해 데이터의 범위, 데이터가 집중된 곳이나 대칭성 등을 알 수 있다. 단, 데이터 자체의 측정값들은 그래프에 나타나지 않습니다. 출처: http://www.jmp.com/support/help/Options_.. 더보기
[STATA] 문자열 관련하여 유용한 기능들 - ltrim, itrim, rtri, abbrev, proper, upper, lower ltrim() & itrim() & rtrim() 각각 문자열의 왼쪽, 중간, 오른쪽에서 빈공간을 없애줍니다. abbrev(#) 지정한 숫자에 맞게 문자열을 잘라서 약어로 만들어줍니다. proper()문자열의 첫 번째 알파벳을 대문자로 만들어줍니다. upper()문자열의 모든 알파벳을 대문자로 만들어줍니다. lower() 문자열의 모든 알파벳을 소문자로 만들어줍니다. 더보기
[STATA] 원하는 문자를 추출하고 바꾸는 정규표현식(regular expression) - regexm, regexr, regexs regular expression, 즉 정규표현식이란 특정한 규칙을 가진 문자열의 집합을 표현하는데 언어입니다. 프로그래밍에서 많이 사용되기도 하는데, 문자열의 검색과 치환을 위한 용도로 많이 쓰입니다. regexmregexm()은 문자변수에서 찾고자하는 정보가 있으면 1 그렇지 않으면 0의 값을 만들때 유용합니다.gen 새로운변수명 =regexm(기존변수명, "찾고자하는문자열") 예컨대 다음의 command는 brand라는 변수에서 BMW가 몇 개나 있는지 찾아서 이에 해당하는 더미 변수를 만듭니다. gen BMW=regexm(brand, "BMW")tab BMW regexrregexr은 원하는 문자열을 찾아서 새로운 문자열로 대체합니다. gen 새로운변수명=regexr(기존변수명, "대체하고자하는문자.. 더보기