티스토리 뷰

엑셀

엑셀 MEDIAN 함수로 중앙값 구하기

디디아아에에시오01 2024. 11. 2. 10:30

목차



    반응형



     

    엑셀의 MEDIAN 함수는 데이터 집합에서 중앙값을 구할 때 매우 유용한 함수입니다. 데이터의 중심에 있는 값을 반환함으로써, 특히 극단값이 존재할 때 평균 대신 사용할 수 있는 신뢰할 만한 중심 경향을 나타냅니다. 예를 들어, 연봉이나 주택 가격과 같은 값이 큰 차이를 보이는 데이터에서 MEDIAN 함수는 데이터의 왜곡을 방지하며 보다 정확한 중심을 반영합니다. 이 글에서는 MEDIAN 함수의 사용법과 실무에서 활용할 수 있는 다양한 예시를 소개합니다.

     

     

    MEDIAN 함수의 기본 사용법

    MEDIAN 함수는 사용법이 매우 간단합니다. 중간값을 구할 데이터 범위나 숫자를 인수로 넣으면 중앙값을 반환합니다.

    =MEDIAN(숫자1, 숫자2, ...)
    • 숫자1, 숫자2, ...: 중간값을 구할 숫자들입니다. 개별 숫자나 셀 범위를 입력할 수 있고, 여러 개의 셀 범위도 가능합니다.

     

    MEDIAN 함수의 활용 예시

    1. 단일 범위에서 중간값 구하기

    A1:A10 범위에 숫자가 있을 때 이 범위의 중간값을 계산하려면 아래와 같이 입력합니다.

    =MEDIAN(A1:A10)

    이 수식은 A1:A10 범위 내 모든 숫자를 오름차순으로 정렬한 뒤 중간 위치에 있는 값을 반환합니다. 단일 범위에서 쉽게 중앙값을 구할 수 있어 유용합니다.

     

    2. 여러 인수로 중간값 계산

    숫자들을 직접 입력하여 중간값을 계산할 수도 있습니다. 예를 들어, 10, 20, 30, 40, 50에서 중간값을 구하려면 아래와 같이 작성합니다.

    =MEDIAN(10, 20, 30, 40, 50)

    이 경우 결과는 30입니다. 데이터 개수가 홀수일 경우, 가장 중앙에 위치한 값을 반환하며 간단한 데이터셋에서 빠르게 중간값을 계산할 때 유용합니다.

     

    3. 짝수 개의 값에서 중간값 구하기

    데이터 개수가 짝수일 경우 MEDIAN 함수는 중앙에 있는 두 값의 평균을 반환합니다. 예를 들어 10, 20, 30, 40이라는 네 개의 숫자가 있을 때, 중간 두 값(2030)의 평균인 25가 결과로 반환됩니다.

    =MEDIAN(10, 20, 30, 40)  // 결과는 25

    이처럼 짝수 개의 데이터셋에서도 중간값을 정확히 나타낼 수 있습니다.

     

    4. 조건을 적용한 중간값 계산

    MEDIAN 함수는 기본적으로 조건을 설정할 수 있는 기능이 없으므로, 특정 조건을 만족하는 데이터의 중간값을 구하려면 IF와 배열 수식을 함께 사용합니다. 예를 들어, A1:A10 범위에서 값이 50 이상인 셀의 중간값을 구하려면 다음과 같이 배열 수식을 작성합니다.

    =MEDIAN(IF(A1:A10>=50, A1:A10))

    이 수식은 A1:A10에서 50 이상인 값들만 대상으로 중간값을 계산합니다. 배열 수식이므로 Ctrl + Shift + Enter로 입력해야 합니다. 조건에 맞는 값만 중간값을 구하는 방식이므로 다양한 분석에 활용할 수 있습니다.

     

    MEDIAN 함수의 실무 활용 사례

    중앙값을 활용한 급여 분석

    직원들의 급여 데이터를 분석할 때 평균보다 중간값을 사용하는 것이 더 현실적일 수 있습니다. 급여 편차가 큰 경우, 평균을 사용하면 극단적인 급여가 포함되어 왜곡될 수 있기 때문입니다. 중간값은 이러한 극단값을 제외하고 급여의 전반적인 경향을 파악할 수 있도록 도와줍니다.

     

    주택 가격 비교

    부동산 시장에서 주택 가격을 분석할 때 중간값은 평균보다 시장 상황을 더욱 정확히 반영합니다. 고가의 주택이 평균 가격에 미치는 영향을 줄이고자 할 때 중간값을 사용하여 현실적인 시세를 계산할 수 있습니다.

     

    데이터 분포를 통한 그룹화

    학생들의 성적이나 판매 데이터를 분석할 때 중간값을 기준으로 상위 50%와 하위 50%를 나누면 데이터의 중심을 기준으로 각 그룹의 특성을 비교할 수 있습니다. 이를 통해 성적 상하위권 분포를 쉽게 파악할 수 있습니다.

    =IF(B2>=MEDIAN(B$2:B$20), "상위", "하위")

    이 수식을 각 셀에 적용하면 중간값보다 크거나 같은 경우 "상위", 작으면 "하위"로 표시되어 데이터 그룹을 빠르게 분류할 수 있습니다.

     

    평균과 중간값의 차이점

    엑셀의 AVERAGE 함수와 MEDIAN 함수는 모두 데이터의 중심 경향을 나타내지만, 계산 방식과 해석이 다릅니다.

    • 평균(Average): 모든 값을 더한 후 개수로 나누어 계산합니다. 극단적인 값이 포함된 경우 평균이 왜곡될 수 있습니다.
    • 중간값(Median): 오름차순 정렬 후 중앙에 위치한 값을 반환합니다. 극단값의 영향을 받지 않으며 비대칭적 분포에서는 평균보다 데이터의 중심을 잘 나타냅니다.

    중간값을 사용하면 데이터의 극단값에 영향을 받지 않고 보다 공정하게 중심 경향을 파악할 수 있습니다.

     

    MEDIAN 함수 사용 시 유의사항

    • 숫자 데이터만 계산: MEDIAN 함수는 숫자 값이나 숫자가 포함된 셀 범위만 계산할 수 있습니다. 범위 내 텍스트가 포함되면 해당 셀은 무시됩니다.
    • 조건이 필요한 경우 배열 수식 사용: 특정 조건을 설정해 중간값을 계산할 때는 IF와 배열 수식을 결합해야 합니다. 배열 수식에 익숙해지면 다양한 조건을 반영한 중간값 계산이 가능합니다.

     

    실전 예제

    1. 직원 연봉 데이터에서 중앙 연봉 구하기
      B2:B20 범위에 직원들의 연봉 데이터가 있을 때 중앙값을 구하는 방법은 다음과 같습니다.이 수식은 연봉 데이터를 오름차순으로 정렬한 후 중앙값을 반환하여 연봉 분포의 중심을 파악하는 데 유용합니다.
    2. =MEDIAN(B2:B20)
    3. 상위 및 하위 절반 데이터 구분
      특정 성적이나 판매 실적에서 상위 50%와 하위 50%를 나누고자 할 때 MEDIAN 함수가 유용합니다. 예를 들어, 판매 실적에서 중간값을 기준으로 그룹을 나누어 각 그룹의 특징을 분석할 수 있습니다.이 수식을 통해 데이터에서 상위 그룹과 하위 그룹을 쉽게 구분할 수 있습니다.
    4. =IF(B2>=MEDIAN(B$2:B$20), "상위", "하위")

     

     

    Q&A

    Q1: MEDIAN 함수와 AVERAGE 함수는 어떤 상황에서 다르게 사용하나요?
    A1: AVERAGE는 모든 값을 평균내므로 극단값에 영향을 받지만, MEDIAN은 중앙값만을 반환해 극단값 영향을 받지 않아 급여나 주택 가격 같은 데이터에서 유용합니다.

     

    Q2: MEDIAN 함수에 조건을 넣을 수 있나요?
    A2: 직접 넣을 수는 없으나, IF와 배열 수식을 통해 조건을 설정하여 중간값을 구할 수 있습니다.

     

    Q3: 짝수 개의 데이터에서 MEDIAN 함수는 어떤 값을 반환하나요?
    A3: 짝수 개의 데이터에서는 중앙에 있는 두 값의 평균을 반환합니다.

     

    Q4: 텍스트가 포함된 범위에서도 MEDIAN 함수를 사용할 수 있나요?
    A4: 가능합니다. 텍스트는 자동으로 무시되며 숫자 데이터만 계산에 포함됩니다.

     

    Q5: MEDIAN 함수는 어떤 데이터 분석에 유용한가요?
    A5: 급여, 주택 가격, 시험 성적처럼 극단값의 영향을 덜 받는 데이터 중심값을 구할 때 유용합니다.

     

    반응형