boxplot구문설명예제
각 상자마다 중앙에 있는 표시가 중앙값을 나타내고, 상자의 아래쪽 가장자리와 위쪽 가장자리는 각각 25번째 백분위수와 75번째 백분위수를 나타냅니다. 수염(Whisker)은 이상값으로 간주되지 않는 최대 또는 최소 데이터 점까지 확장되며, 이상값은 예제
예제
예제모두 축소 상자 플롯 생성하기표본 데이터를 불러옵니다. 갤런당 마일 주행 거리( boxplot(MPG) xlabel('All Vehicles') ylabel('Miles per Gallon (MPG)') title('Miles per Gallon for All Vehicles') 이 상자 플롯은 표본 데이터에 포함된 모든 차량에 대한 갤런당 마일 주행거리의 중앙값이 대략 24임을 보여줍니다. 최솟값은 약 9이고, 최댓값은 약 44입니다. 그룹화된 데이터에 대한 상자 플롯 생성하기표본 데이터를 불러옵니다. 표본 데이터의 갤런당 마일 주행거리( boxplot(MPG,Origin) title('Miles per Gallon by Vehicle Origin') xlabel('Country of Origin') ylabel('Miles per Gallon (MPG)') 각 상자는 특정 국가의 자동차에 대한 MPG 데이터를 시각적으로 나타냅니다. 이탈리아에 해당하는 "상자"는 표본 데이터에 이탈리아에 대한 관측값이 하나만 있으므로 단일 선으로 표시됩니다. 노치가 있는 상자 플롯 생성하기두 개의 표본 데이터 세트를 생성합니다. 첫 번째 표본 rng default % For reproducibility x1 = normrnd(5,1,100,1); x2 = normrnd(6,1,100,1);
figure boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'}) title('Compare Random Data from Different Distributions') 이 상자 플롯은 두 그룹의 중앙값 차이가 대략 1임을 보여줍니다. 상자 플롯에 표시된 노치가 겹치지 않기 때문에 95% 신뢰수준으로 실제 중앙값이 다르다고 결론을 내릴 수 있습니다. 다음 그림에서는 최대 수염(Whisker) 길이가 사분위 범위의 1.0배로 지정된 동일한 데이터에 대한 상자 플롯을 보여줍니다. 수염 외부에 있는 데이터 점은 figure boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'},'Whisker',1) title('Compare Random Data from Different Distributions') 수염이 작을수록 간소 상자 플롯 생성하기표본 데이터로 사용하기 위해 표준 정규분포에서 생성된 난수로 구성된 100×25 행렬을 생성합니다. rng default % For reproducibility x = randn(100,25); 동일한 Figure에 figure subplot(2,1,1) boxplot(x) subplot(2,1,2) boxplot(x,'PlotStyle','compact') 각 플롯은 동일한 데이터를 나타내지만, 상자가 많은 플롯의 경우 간소 형식이 가독성이 높을 수 있습니다. 서로 다른 길이의 벡터에 대한 상자 플롯그룹화 변수를 사용하여 서로 다른 길이의 데이터 벡터에 대한 상자 플롯을 생성합니다. 각각 길이가 rng('default') % For reproducibility x1 = rand(5,1); x2 = rand(10,1); x3 = rand(15,1); x = [x1; x2; x3];
g1 = repmat({'First'},5,1); g2 = repmat({'Second'},10,1); g3 = repmat({'Third'},15,1); g = [g1; g2; g3]; 상자 플롯을 생성합니다. 입력 인수모두 축소 x — 입력 데이터 숫자형 벡터 | 숫자형 행렬입력 데이터로, 숫자형 벡터나 숫자형 행렬로 지정됩니다. 각 상자마다 중앙에 있는 표시가 중앙값을 나타내고, 상자의 아래쪽 가장자리와 위쪽 가장자리는 각각 25번째 백분위수와 75번째 백분위수를 나타냅니다. 수염(Whisker)은 이상값으로 간주되지 않는 최대 또는 최소 데이터 점까지 확장되며, 이상값은 데이터형: g — 그룹화 변수 숫자형 벡터 | 문자형 배열 | string형 배열 | 셀형 배열 | categorical형 배열그룹화 변수로, 숫자형 벡터, 문자형 배열, string형 배열, 셀형 배열 또는 categorical형 배열로 지정됩니다. 그룹화 변수 유형으로 구성된 셀형 배열이나 행렬을 사용하여
기본적으로,
데이터형: ax — 플로팅할 좌표축 axes 그래픽 객체플롯이 그려질 좌표축으로, axes 그래픽 객체로 지정됩니다. 이름-값 인수
선택적 인수 쌍을 R2021a 이전 릴리스에서는 쉼표를 사용하여 각 이름과 값을 구분하고 예: 상자 모양 모두 축소 BoxStyle — 상자 스타일 'outline' | 'filled'상자 스타일로, 다음 중 하나로 지정됩니다.
예: Colors — 상자 색 RGB 3색 | 열 이름으로 구성된 문자형 벡터 또는 string형 스칼라상자 색으로, RGB 3색, 문자형 벡터 또는 string형 스칼라로 지정됩니다. RGB 3색은 요소를 3개 가진 행 벡터로, 요소는 각각 색을 구성하는 빨간색, 녹색, 파란색의 농도를 지정합니다. 각 농도의 범위는 [0,1]이어야 합니다. 다음 표에는 사용 가능한 색 문자와 이에 대응되는 RGB 3색 값이 정리되어 있습니다.
색 이름을 나타내는 문자형 벡터 또는 string형 스칼라(예: 이름-값 쌍 예: 중앙값 스타일로, 다음 중 하나로 지정됩니다.
예: Notch — 비교 구간을 나타내는 마커 'off' (디폴트 값) | 'on' | 'marker'비교 구간을 나타내는 마커로, 다음 중 하나로 지정됩니다.
두 중앙값은 구간이 겹치지 않는 경우 5% 유의수준에서 현저히 다릅니다. 노치가 있는 상자 플롯에 레이블이 지정된 예제는 상자 플롯 항목을 참조하십시오. 예: OutlierSize — 이상값에 대한 마커 크기 양의 숫자형 값이상값에 대한 마커 크기로, 양의 숫자형 값으로 지정됩니다. 지정된 값은 마커 크기를 포인트 단위로 나타냅니다.
예: 데이터형: PlotStyle — 플롯 스타일 'traditional' (디폴트 값) | 'compact'플롯 스타일로, 다음 중 하나로 지정됩니다.
예: Symbol — 이상값에 사용할 마커와 색 문자형 벡터 | string형 스칼라이상값에 사용할 마커와 색으로, 마커와 색에 대한 기호를 포함하는 문자형 벡터 또는 string형 스칼라로 지정됩니다. 기호는 어떤 순서로든 표시될 수 있습니다. 마커 기호를 생략하면 이상값이 표시되지 않습니다. 색 기호를 생략하면 이상값이 상자와 같은 색으로 표시됩니다.
예: 이상값이 표시되지 않도록 하려면 Widths — 상자 너비 숫자형 스칼라 | 숫자형 벡터상자 너비로, 숫자형 스칼라 또는 숫자형 벡터로 지정됩니다. 상자 개수가 지정된 너비 값의 개수와 같지 않은 경우, 필요에 따라 값 목록이 복제되거나 잘립니다. 이 이름-값 쌍의 인수는 상자 간 간격을 바꾸지 않습니다. 따라서,
예: 데이터형: 그룹 모양 모두 축소 ColorGroup — 상자 색 변경을 위한 그룹화 변수 [] (디폴트 값) | 숫자형 벡터 | 문자형 배열 | string형 배열 | 셀형 배열 | categorical형 배열상자 색 변경을 위한 그룹화 변수로, 그룹화 변수로 지정됩니다. 그룹화 변수는 숫자형 벡터, 문자형 배열, string형 배열, 셀형 배열 또는 categorical형 배열입니다. 지정된 그룹화 변수가 변경되면 상자
색도 변경됩니다. 디폴트 값 데이터형: FactorDirection — 플롯의 인자 순서 'data' (디폴트 값) | 'list' | 'auto'플롯의 인자 순서로, 다음 중 하나로 지정됩니다.
예: FullFactors — 모든 그룹 인자 플로팅 'off' (디폴트 값) | 'on'모든 그룹 인자 플로팅으로, 예: FactorGap — 서로 다른 그룹화 인자 간 거리 [] | 양의 숫자형 값 | 양의 숫자형 값으로 구성된 벡터 | 'auto'서로 다른 그룹화 인자 간 거리로, 양의 숫자형 값, 양의 숫자형
값으로 구성된 벡터 또는
예:
데이터형: FactorSeparator — 그룹화 인자 간 분리 [] | 양의 정수 | 양의 정수로 구성된 벡터 | 'auto'그룹화 인자 간 분리로, 양의 정수, 양의 정수로 구성된 벡터 또는
예: 데이터형:
GroupOrder — 그룹의 플로팅 순서 [] (디폴트 값) | string형 배열 | 셀형 배열그룹의 플로팅 순서로, 그룹화 변수의 이름을 포함하는 string형 배열 또는 셀형 배열로 지정됩니다. 여러 그룹화 변수를 사용하는 경우
쉼표로 값을 구분하십시오. 그룹화 변수로 categorical형 배열을 사용하여 상자의 순서를 제어할 수도 있습니다. 디폴트 값 데이터형: 데이터 제한과 최대 거리 모두 축소 DataLim — 극 데이터 제한 [-Inf,Inf] (디폴트 값) | 요소를 2개 가진 숫자형 벡터극 데이터 제한으로, 각각 하한과 상한을 나타내는, 요소를 2개 가진 숫자형 벡터로 지정됩니다. 데이터형: ExtremeMode — 극 데이터 처리 방법 'clip' (디폴트 값) | 'compress'극 데이터 처리 방법으로, 다음 중 하나로 지정됩니다.
예: Jitter — 최대 이상값 변위 거리 숫자형 값최대 이상값 변위 거리로, 숫자형 값으로 지정됩니다.
예: 데이터형: Whisker — 최대 수염 길이 승수 1.5 (디폴트 값) | 양의 숫자형 값최대 수염 길이 승수로, 양의 숫자형 값으로 지정됩니다. 최대 수염 길이는
데이터가 정규분포된 경우 수염을 그리지 않고 q1 및 q3 외부에 있는 모든 점을 이상값으로 만들려면 수염이 있는 상자 플롯에 레이블이 지정된 예제는 상자 플롯 항목을 참조하십시오. 예: 데이터형: 플롯 모양 모두 축소
Labels — 상자 레이블 문자형 배열 | string형 배열 | 셀형 배열 | 숫자형 벡터 | 숫자형 행렬상자 레이블로, 상자 레이블 이름을 포함하는 문자형 배열, string형 배열, 셀형 배열 또는 숫자형 벡터로 지정됩니다. 플롯에서 레이블을 제거하려면 다음 명령을 사용하십시오. 데이터형:
LabelOrientation — 레이블 방향 'inline' | 'horizontal'레이블 방향으로, 다음 중 하나로 지정됩니다.
레이블이 y 축에 있는 경우 두 설정 모두 레이블을 가로로 유지합니다. 예: LabelVerbosity — 플롯에 표시할 레이블 'all' | 'minor' | 'majorminor'플롯에 표시할 레이블로, 다음 중 하나로 지정됩니다.
예: Orientation — 플롯 방향 'vertical' (디폴트 값) | 'horizontal'플롯 방향으로, 다음 중 하나로 지정됩니다.
예: Positions — 상자 위치 숫자형 벡터상자 위치로, 각 그룹에 대해 하나의 요소(또는 데이터형:
세부 정보모두 축소 상자 플롯상자 플롯은 표본 데이터의 요약 통계량에 대한 시각화를 제공하며 다음과 같은 특징을 포함하고 있습니다.
팁
대체 기능또한
객체의 모양과 동작을 제어하려면 BoxChart Properties를 변경하십시오. 참고 문헌[1] McGill, R., J. W. Tukey, and W. A. Larsen. “Variations of Boxplots.” The American Statistician. Vol. 32, No. 1, 1978, pp. 12–16. [2] Velleman, P.F., and D.C. Hoaglin. Applications, Basics, and Computing of Exploratory Data Analysis. Pacific Grove, CA: Duxbury Press, 1981. [3] Nelson, L. S. “Evaluating Overlapping Confidence Intervals.” Journal of Quality Technology. Vol. 21, 1989, pp. 140–141. [4] Langford, E. “Quartiles in Elementary Statistics”, Journal of Statistics Education. Vol. 14, No. 3, 2006. |