Preparing Ad...

평균, 중간값, 최빈값 계산: 완전한 통계 가이드

Yên Chi - Editor of calculators.im

Yên Chi

Creator

평균, 중간값, 최빈값 계산: 완전한 통계 가이드
Preparing Ad...

목차


중심 경향의 척도는 무엇입니까?

중심 경향의 측정은 데이터 세트의 중심 또는 중간을 나타내는 통계적 값입니다.그들은 전체 숫자 모음을 요약하는 단일 값을 제공하여 복잡한 데이터를보다 관리 가능하고 해석 할 수 있도록합니다.세 가지 주요 측정은 평균, 중앙값 및 모드이며, 각각의 데이터 특성에 대한 고유 한 통찰력을 제공합니다.

이러한 통계 조치는 설명 통계의 기초를 형성하며 숙제 과제를 완료하는 학생에서 시장 동향을 분석하는 전문 데이터 과학자에 이르기까지 데이터를 사용하는 사람에게 중요합니다.

평균 이해 (평균)

의미는 무엇입니까?

일반적으로 평균이라고하는 평균은 데이터 세트의 모든 값을 값 수로 나눈 값입니다.가장 자주 사용되는 중심 경향 척도이며 데이터의 일반적인 수준에 대한 훌륭한 개요를 제공합니다.

평균을 계산하는 방법

평균 계산의 공식은 다음과 같습니다.

평균 = 모든 값의 합 ÷ 값 수

단계별 평균 계산

  1. 모든 값 추가 - 데이터 세트의 모든 숫자를 합계하십시오.
  2. 총 값 수 계산 - 보유한 데이터 포인트 수 결정
  3. 합계를 카운트로 나눕니다 - 이것은 당신에게 평균을줍니다.

평균 계산 예

시험 점수의 평균을 계산합시다 : 85, 92, 78, 95, 88, 91, 83

  • 1 단계 : 모든 값 추가 : 85 + 92 + 78 + 95 + 88 + 91 + 83 = 612
  • 2 단계 : 값 수 : 7 테스트 점수
  • 3 단계 : 평균 계산 : 612 ÷ 7 = 87.43

평균 테스트 점수는 87.43으로 평균적으로 학생들이 약 87 점을 기록했음을 나타냅니다.

평균을 사용하는시기

평균은 다음과 같이 가장 잘 작동합니다.

  • 귀하의 데이터는 일반적으로 배포됩니다
  • 당신은 극단적 인 특이 치가 없습니다
  • 모든 데이터 포인트를 사용하는 측정 값이 필요합니다
  • 간격 또는 비율 데이터로 작업하고 있습니다

평균 제한

평균을 사용하여 조심해야합니다.

  • 데이터 세트에는 극단적 이상이 포함되어 있습니다
  • 데이터가 심하게 왜곡됩니다
  • 서수 데이터로 작업하고 있습니다
  • 분포는 대칭이 아닙니다

중앙값 이해

중앙값은 무엇입니까?

중앙값은 데이터가 오름차순 또는 내림차순으로 배열 될 때 중간 값입니다.데이터 세트를 두 개의 동일한 반쪽으로 나눕니다.

중앙값을 계산하는 방법

홀수 값의 경우 :

  1. 데이터를 오름차순으로 정렬합니다
  2. 중간 위치를 찾으십시오 : (n + 1) ÷ 2
  3. 이 위치의 값은 중앙값입니다

짝수의 값에 대해 :

  1. 데이터를 오름차순으로 정렬합니다
  2. 두 개의 중간 값을 찾으십시오
  3. 평균을 계산합니다

중간 계산 예

예 1 : 홀수 값

데이터 세트 : 12, 15, 18, 22, 25, 28, 30

이미 주문, 중간 위치 = (7 + 1) ÷ 2 = 4 번째 위치

중앙값 = 22

예제 2 : 값 수의 값

데이터 세트 : 10, 15, 20, 25, 30, 35

중간 위치는 3 차 및 4 번째 값 (20 및 25)입니다.

중앙값 = (20 + 25) ÷ 2 = 22.5

중앙값을 사용하는시기

중앙값은 다음과 같은 경우 이상적입니다.

  • 귀하의 데이터에는 특이 치가 포함되어 있습니다
  • 분포가 왜곡되었습니다
  • 중심 경향의 강력한 측정이 필요합니다
  • 서수 데이터로 작업합니다
  • "일반적인"중간 값을 이해하고 싶습니다

중간 장점

  • 극단적 인 값의 영향을받지 않습니다
  • 왜곡 된 분포와 함께 작동합니다
  • 이해하고 해석하기 쉽습니다
  • 서수 데이터에 적합합니다

모드 이해

모드는 무엇입니까?

모드는 데이터 세트에서 가장 자주 나타나는 값입니다.평균 및 중앙값과 달리, 모드는 범주 형 데이터를 포함한 모든 유형의 데이터와 함께 사용할 수 있습니다.

모드 유형

  • Unimodal : 데이터 세트에는 하나의 모드가 있습니다 (하나의 값은 가장 자주 나타납니다)
  • BIMODAL : DataSet에는 두 개의 모드가 있습니다 (두 개의 값은 가장 높은 주파수의 두 값에 묶음)
  • 멀티 모드 : 데이터 세트에는 여러 모드가 있습니다 (몇 가지 값은 최고 주파수에 맞는 값)
  • 모드 없음 : 모든 값은 동일한 주파수로 나타납니다

모드를 계산하는 방법

  1. 카운트 주파수 - 각 값이 얼마나 자주 나타나는지 결정하십시오
  2. 최고 주파수 식별 - 가장 일반적인 발생 수를 찾으십시오.
  3. 선택 모드 (S) - 주파수가 가장 높은 값을 선택하십시오

모드 계산 예

예 1 : 단단한

데이터 세트 : 5, 7, 8, 8, 8, 9, 12

값 8이 세 번 나타납니다 (가장 빈번한)

모드 = 8

예 2 : 바이 모달

데이터 세트 : 2, 3, 4, 4, 5, 6, 6, 7

값 4와 6은 모두 두 번 나타납니다 (가장 빈번한 경우 묶음)

모드 = 4 및 6

예 3 : 모드 없음

데이터 세트 : 1, 2, 3, 4, 5

모든 값은 한 번 나타납니다

모드가 없습니다

사용 모드

모드는 다음과 같이 가장 유용합니다.

  • 범주 형 데이터로 작업합니다
  • 가장 일반적인 가치를 식별해야합니다
  • 데이터에는 뚜렷한 피크가 있습니다
  • 인기 또는 빈도를 이해하고 싶습니다

평균, 중앙값 및 모드 비교

주요 차이점

평균:

  • 모든 데이터 포인트를 사용합니다
  • 특이 치의 영향을받습니다
  • 대칭 분포에 가장 적합합니다
  • 수학 센터를 제공합니다

중앙값:

  • 중간 값 만 사용합니다.
  • 특이 치에 저항합니다
  • 왜곡 된 분포에 가장 적합합니다
  • 위치 센터를 제공합니다

방법:

  • 가장 일반적인 값을 식별합니다
  • 모든 데이터 유형과 함께 작동합니다
  • 존재하지 않거나 독특 할 수 있습니다
  • 주파수 패턴을 보여줍니다

올바른 측정을 선택합니다

다음과 같은 평균 사용 :

  • 데이터는 일반적으로 분배됩니다
  • 모든 데이터 포인트를 사용해야합니다
  • 추가 계산 수행
  • 간격/비율 데이터로 작업합니다

다음과 같은 경우 중앙값을 사용하십시오.

  • 데이터에는 이상치가 포함되어 있습니다
  • 분포가 왜곡되었습니다
  • 강력한 측정이 필요합니다
  • 서수 데이터로 작업합니다

다음과 같은 모드 사용 :

  • 가장 일반적인 가치를 식별합니다
  • 범주 형 데이터로 작업합니다
  • 주파수 패턴 이해
  • 데이터에는 뚜렷한 피크가 있습니다

실제 응용 프로그램

학업 환경

학생 학년 : 교사는 평균을 사용하여 전반적인 수업 공연을 계산하고, 중간 성과 학생을 찾기위한 중앙값, 그리고 가장 일반적인 등급 범위를 식별하기 위해 모드를 사용합니다.

시험 분석 : 교육 연구원은 분포 패턴을 이해하고 개선을위한 영역을 식별하기 위해 세 가지 측정 값을 사용하여 시험 점수를 분석합니다.

비즈니스 응용 프로그램

판매 데이터 : 회사는 예산 책정의 평균 판매, 현실적인 목표의 중간 판매 및 인기있는 제품을 식별하기위한 모드를 추적합니다.

고객 분석 : 비즈니스는 적절한 중심 경향 측정을 사용하여 고객 연령, 구매 금액 및 선호도를 분석합니다.

실제 사례

소득 분석 : 평균 소득은 평균 수입이 평균을 왜곡하기 때문에 평균 소득보다 더 나은 통찰력을 제공합니다.

설문 조사 결과 : 모드는 범주 형 조사에서 가장 일반적인 반응을 식별하는 데 도움이되며 수치 등급에 대한 평균 및 중간 작업.

피해야 할 일반적인 실수

평균 계산 오류

  • 카운트로 나누는 것을 잊어 버리기 - 항상 합계를 가치의 수로 나눕니다.
  • 0 값 포함 잘못 - 제로가 의미있는 데이터 포인트인지 결정
  • 데이터 유형 믹싱 - 모든 값이 수치적이고 비교할 수 있는지 확인

중간 계산 오류

  • 데이터 주문 잊어 버리기 - 중앙값을 찾기 전에 항상 값을 정렬
  • 잘못된 중간 위치 - 홀수/짝수 데이터 세트에 적절한 공식 사용
  • 평균 평균 - 데이터 세트의 경우 평균 두 개의 중간 값을 평균화합니다.

모드 식별 오류

  • 모드가 항상 존재한다고 가정합니다. 일부 데이터 세트에는 모드가 없습니다.
  • 다중 모드 누락 - 주파수의 관계를 확인하십시오
  • 값과 혼동되는 주파수 - 모드는 주파수가 아니라 값입니다.

고급 고려 사항

가중 평균

데이터 포인트가 다른 중요도 수준을 갖는 경우 가중 평균을 사용하십시오.

가중 평균 = σ (값 × 가중치) ÷ σ (중량)

트림 평균

특이 치가있는 데이터 세트의 경우 Trimmed Mean은 계산 전에 극한 값을 제거하여보다 강력한 측정을 제공합니다.

기하학적 평균

비율, 비율 또는 백분율과 관련된 데이터의 경우 기하학적 평균은 종종 산술 평균보다 더 의미있는 결과를 제공합니다.

기술 및 도구

계산기 방법

대부분의 과학 계산기에는 평균 계산을위한 내장 기능이 있습니다.중앙값 및 모드의 경우 수동 계산 또는 데이터 구성이 일반적으로 필요합니다.

소프트웨어 솔루션

  • Excel : 평균 (), median () 및 mode () 함수를 사용하십시오
  • Google 시트 : 클라우드 기반 접근성과 유사한 기능
  • 통계 소프트웨어 : R, SPSS, SAS는 포괄적 인 통계 분석을 제공합니다

프로그래밍 언어

  • Python : Numpy 및 Pandas 라이브러리는 통계 기능을 제공합니다
  • R : 모든 측정에 대한 내장 통계 기능
  • JavaScript : 웹 기반 통계 용 D3.JS와 같은 라이브러리

결론

마스터 링 평균, 중앙값 및 모드 계산은 데이터를 사용하는 사람에게는 기본입니다.각 측정 값은 데이터 세트의 특성에 대한 고유 한 통찰력을 제공하며 정확한 데이터 분석을 위해 각각을 사용하는시기를 이해하는 것이 중요합니다.

평균은 수학 센터를 제공하고 중앙값은 위치 중심을 제공하며 모드는 가장 일반적인 값을 식별합니다.이러한 측정을 결합하여 데이터 분포와 중심 경향에 대한 포괄적 인 이해를 얻습니다.

이러한 계산을 정기적으로 연습하고, 한계를 이해하며, 사용할 측정을 선택할 때 항상 데이터의 특성을 고려하십시오.이 재단은 고급 통계 분석 및 데이터 중심 의사 결정에 도움이 될 것입니다.

Preparing Ad...