본문 바로가기

방법론 공부/계량통계 방법론

[STATA] 관측치 고유성/중복 확인 - isid

isid command는 각각의 변수들이 고유한 관측치들을 나타내는지를 확인하는 데에 쓰입니다.


. isid mpg 


그런데


variable mpg does not uniquely identify the observations 

r(459); 


와 같은 결과가 나타났다면 동일한 mpg가 있다는 겁니다. 동일한 관측치가 나타난 것을 안다면 이를 확인하는 법은 _N를 통해 살펴보았었죠. 


.sort mpg

.by mpg: generate nobs = _N

.list make mpg if nobs >1, sepby(mpg)


하나의 예시를 더 살펴볼까요. 패널데이터에서 두 개의 관측치가 중복적으로 입력되었을 수 있겠죠. 이를 확인하기 위해 다음과 같은 command를 실행합니다.


. isid company year 


아무 오류 메시지가 없다면 company와 year 변수 모두 고유한 관측치들을 가지고 있다는 것을 의미하고, 이제 이들을 패널 데이터로 인식할 수 있게 만들어주면 됩니다. 


. tsset company year




나중에 다시 다루겠지만, tsset command는 


tsset 패널변수 시간변수


의 형태로 사용합니다.