방법론 공부/계량통계 방법론
[STATA] 관측치 고유성/중복 확인 - isid
새벽첫빛
2015. 3. 10. 23:48
isid command는 각각의 변수들이 고유한 관측치들을 나타내는지를 확인하는 데에 쓰입니다.
. isid mpg
그런데
variable mpg does not uniquely identify the observations
r(459);
와 같은 결과가 나타났다면 동일한 mpg가 있다는 겁니다. 동일한 관측치가 나타난 것을 안다면 이를 확인하는 법은 _N를 통해 살펴보았었죠.
.sort mpg
.by mpg: generate nobs = _N
.list make mpg if nobs >1, sepby(mpg)
하나의 예시를 더 살펴볼까요. 패널데이터에서 두 개의 관측치가 중복적으로 입력되었을 수 있겠죠. 이를 확인하기 위해 다음과 같은 command를 실행합니다.
. isid company year
아무 오류 메시지가 없다면 company와 year 변수 모두 고유한 관측치들을 가지고 있다는 것을 의미하고, 이제 이들을 패널 데이터로 인식할 수 있게 만들어주면 됩니다.
. tsset company year
나중에 다시 다루겠지만, tsset command는
tsset 패널변수 시간변수
의 형태로 사용합니다.