본문 바로가기

boxplot

데이터의 분포를 어떻게 보여줄까 - Histogram vs. Boxplot Boxplot Boxplot은 outlier를 제거하고 사분위수를 이용하여 가운데 50% 의 데이터를 통해 그래프를 생성한다. 이를 통해 중앙값을 비롯한 각 사분위수의 범위,최대값, 최소값을 알 수 있습니다. HistogramHistogram은 전체 데이터에 기초하여 측정값이 존재하는 범위를 몇 개의 구간(급)으로 나눈 경우,각 구간에 해당하는 데이터의 총 갯수를 보여준다. 상대도수를 모두 합하면 1이 된다. 각 막대 간에는 간격이 없으며, 많은 경우 값들은 정규분포를 따르는 것처럼 보인다. 이를 통해 데이터의 범위, 데이터가 집중된 곳이나 대칭성 등을 알 수 있다. 단, 데이터 자체의 측정값들은 그래프에 나타나지 않습니다. 출처: http://www.jmp.com/support/help/Options_.. 더보기
[STATA] 두 개 이상의 분포 비교하기 - Box plot Boxplot의 정확한 명칭은 box-and-whisker plot으로, dataset의 분포를 보여주기 위해 사용되는 그래프의 일종으로, 다음과 같이 생겼습니다. STATA에서의 기본 command는 다음과 같습니다. graph box 변수1 변수2 변수3 한편, 이는 변수 카테고리가 x축에 위치해서 y축에 통계값이 나타나는 그래프이고, 반대로 변수 카테고리가 y축에 위치한 boxplot을 그리기 위해서는 다음과 같은 command를 사용합니다. graph hbox 변수1 변수2 변수3 변수1, 변수2, 변수3은 하나의 boxplot 그래프 안에서 다른 색깔로 그려집니다. 카테고리와 그래프 순서 그리고 over() option을 사용하면 전체 데이터를 over() option 에 따라 지정된 변수라는 .. 더보기