통계학 - 수치를 통한 연속형 자료의 요약

2022. 4. 12. 22:02·Statistics

 

수치를 통한 연속형 자료의 요약

 

  • 중심위치의 측도(자료가 어떤 값을 중심으로 분포되어 있는가?) - 평균, 중앙값, 최빈값 
  • 퍼진 정도의 측도(자료가 중심위치로부터 얼마나 흩어져 있는가?) ‐ 분산, 표준편차, 범위, 사분위수범위, 변동계수

 

 

평균

 

모든 관측값의 합을 자료의 개수로 나눈 것

주의: 극단적으로 크거나 작은 값에 영향 많이 받음

따라서 전체 관측값을 모두 포함하고 싶을 때 적절함

 

 

중앙값

 

자료를 크기 순으로 배열했을 때 가운데 위치하는 값 => 자료 개수가 짝수이면 가운데 두 값의 평균 내기

평균과 달리, 극단적인 값에 영향 받지 않음

 

 

최빈값

 

가장 자주 나오는 값

연속형 자료에서는 쓸 일이 없다

 

 

분산과 표준편차 (모집단)

 

편차의 제곱의 합 / n

 

 

표본분산과 표본표준편차 (표본집단)

 

편차의 제곱의 합 / n-1 (편차 제곱합의 자유도)

 

 

범위

 

최댓값 – 최솟값

 

 

백분위수

 

관측값을 작은 것부터 크기 순으로 배열하였을 때, 자료의 (𝟏𝟎𝟎×𝒑)%에 위치한 값

𝒏𝒑가 정수이면, 𝒏𝒑번째 값과 (𝒏𝒑 + 𝟏)번째 값의 평균,

만약 𝒏𝒑가 정수가 아니면, [𝒏𝒑 + 𝟏]번째 값

ex. 1, 2, 4, 6, 8,의 제 30분위 수: 𝒏𝒑 = 1.5, 𝒏(𝟏−𝒑) = 3.5 =>  2

 

 

사분위수

 

자료를 크기 순으로 배열할 때 전체를 사등분하는 값

사분위수범위(IQR): 제3 사분위수 – 제1 사분위수 

제1 사분위수(𝑸𝟏) = 제25 백분위수 (25%)

제2 사분위수(𝑸𝟐) = 제50 백분위수 (50%) = 중앙값 

제3 사분위수(𝑸𝟑) = 제75 백분위수 (75%)

 

 

변동계수(CV)

 

표본평균에 대한 상대적인 퍼진 정도를 백분율(%)로 나타낸 값

자료의 단위에 영향을 받지 않고 상대적인 측도가 필요할 경우 사용

𝑪𝑽 = 표준편차/평균 × 100

 

 

상자그림
  1. 사분위수(𝑸𝟏, 𝑸𝟐, 𝑸𝟑)와 사분위수범위(𝑰𝑸𝑹) 계산
  2. 𝑸𝟏과 𝑸𝟑를 상자로 연결하고, 𝑸𝟐의 위치에 수직선을 그음
  3. 상자의 양 끝에서 𝟏. 𝟓 × 𝑰𝑸𝑹 크기의 범위를 경계로 하여, 이 범위에 포함되는 최솟값과 최댓값을 𝑸𝟏과 𝑸𝟑로부터 선으로 연결 (𝑸𝟏 − 𝟏. 𝟓 × 𝑰𝑸𝑹 ~ 𝑸𝟑 + 𝟏. 𝟓 × 𝑰𝑸𝑹)
  4. 양 경계로부터 벗어난 자료의 값을 *로 표시(이상점, outlier)

 

 

도수분포표 

 

계급구간의 중간값과 도수를 이용하여 평균과 표준편차 계산

 

 

 

 

저작자표시

'Statistics' 카테고리의 다른 글

통계학  (0) 2022.04.16
통계학 - 두 변수 자료의 요약  (0) 2022.04.12
통계학 - 표와 그림을 통한 자료의 요약 기초  (0) 2022.04.12
통계학 - 결합분포  (0) 2022.04.12
통계학 - 확률분포  (0) 2022.04.12
'Statistics' 카테고리의 다른 글
  • 통계학
  • 통계학 - 두 변수 자료의 요약
  • 통계학 - 표와 그림을 통한 자료의 요약 기초
  • 통계학 - 결합분포
abyss-s
abyss-s
프론트엔드 공부합니다.
  • abyss-s
    abyss-s의 블로그입니다.
    abyss-s
  • 전체
    오늘
    어제
    • 분류 전체보기 (188)
      • Web (16)
        • JavaScript (6)
        • TypeScript (1)
        • React (5)
        • Vue (0)
        • Storybook (1)
        • Next.js (1)
      • Backend & Infra (8)
        • Database (3)
        • Node.js (2)
        • SpringBoot (1)
      • PS (71)
      • CS (30)
        • OS (13)
        • Structure & Algorithm (5)
        • Network (10)
        • 정보처리기사 (2)
      • Language (18)
        • OOP (1)
        • JAVA (13)
        • C++ (4)
      • Activities (12)
        • 멋쟁이 사자처럼 (2)
        • OSSCA (3)
        • LG U+ URECA (3)
        • Project (2)
      • AI (0)
      • Git & Github (5)
      • Notion (1)
      • IT (4)
      • Statistics (11)
      • Book (4)
      • Diary (1)
      • Game (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

    • 깃허브
    • 백준
    • 트위터
  • 공지사항

    • abyss-s의 티스토리에 오신 것을 환영합니다.
  • 인기 글

  • 태그

    React
    파이썬
    그리디
    DP
    네트워크
    통계학
    자바기반응용프로그래밍
    Java
    BAEKJOON
    자바스크립트
    JavaScript
    생활코딩
    운영체제
    BFS
    코드트리
    OS
    Python
    github
    C++
    백준
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
abyss-s
통계학 - 수치를 통한 연속형 자료의 요약

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.