본문 바로가기

[STATA] 문자열 관련하여 유용한 기능들 - ltrim, itrim, rtri, abbrev, proper, upper, lower ltrim() & itrim() & rtrim() 각각 문자열의 왼쪽, 중간, 오른쪽에서 빈공간을 없애줍니다. abbrev(#) 지정한 숫자에 맞게 문자열을 잘라서 약어로 만들어줍니다. proper()문자열의 첫 번째 알파벳을 대문자로 만들어줍니다. upper()문자열의 모든 알파벳을 대문자로 만들어줍니다. lower() 문자열의 모든 알파벳을 소문자로 만들어줍니다. 더보기
[STATA] 원하는 문자를 추출하고 바꾸는 정규표현식(regular expression) - regexm, regexr, regexs regular expression, 즉 정규표현식이란 특정한 규칙을 가진 문자열의 집합을 표현하는데 언어입니다. 프로그래밍에서 많이 사용되기도 하는데, 문자열의 검색과 치환을 위한 용도로 많이 쓰입니다. regexmregexm()은 문자변수에서 찾고자하는 정보가 있으면 1 그렇지 않으면 0의 값을 만들때 유용합니다.gen 새로운변수명 =regexm(기존변수명, "찾고자하는문자열") 예컨대 다음의 command는 brand라는 변수에서 BMW가 몇 개나 있는지 찾아서 이에 해당하는 더미 변수를 만듭니다. gen BMW=regexm(brand, "BMW")tab BMW regexrregexr은 원하는 문자열을 찾아서 새로운 문자열로 대체합니다. gen 새로운변수명=regexr(기존변수명, "대체하고자하는문자.. 더보기
[STATA] 일정한 조건에 따라 dummy 변수 쉽게 만들기 tabulate & generate() STATA를 통해 가장 쉽게 더미 변수를 생성하는 방법은 tabulate과 generate command를 사용하는 것입니다. tabulate 기존변수명, generate(더미변수명)list 을 실행시키면 기존 변수에서의 관측치의 갯수에 따라 더미변수명1, 더미변수명2, 더미변수명3...라는 변수가 자동으로 생성됩니다. xi: i. xi command 역시 쉽게 더미 변수를 생성하도록 해줍니다. ‘i.*’는 xi 와 같이 쓰이면 ‘i.’ 뒤에 나오는 범주형 변수로 인식하고 더미 변수를 자동으로 생성해주는 역할을 하게 됩니다. xi i.group xi: reg wage_hourly age c.age#c.age i.w2edu 한편, 두번째 예와 같이 더미변수로 regr.. 더보기