통계학 - 수치를 통한 연속형 자료의 요약
·
Statistics
수치를 통한 연속형 자료의 요약 중심위치의 측도(자료가 어떤 값을 중심으로 분포되어 있는가?) - 평균, 중앙값, 최빈값 퍼진 정도의 측도(자료가 중심위치로부터 얼마나 흩어져 있는가?) ‐ 분산, 표준편차, 범위, 사분위수범위, 변동계수 평균 모든 관측값의 합을 자료의 개수로 나눈 것 주의: 극단적으로 크거나 작은 값에 영향 많이 받음 따라서 전체 관측값을 모두 포함하고 싶을 때 적절함 중앙값 자료를 크기 순으로 배열했을 때 가운데 위치하는 값 => 자료 개수가 짝수이면 가운데 두 값의 평균 내기 평균과 달리, 극단적인 값에 영향 받지 않음 최빈값 가장 자주 나오는 값 연속형 자료에서는 쓸 일이 없다 분산과 표준편차 (모집단) 편차의 제곱의 합 / n 표본분산과 표본표준편차 (표본집단) 편차의 제곱의 합..
통계학 - 확률분포
·
Statistics
확률변수 표본공간의 각 결과(근원사건)에 실수 값을 대응시키는 함수 P(X=1), P(X=2)... 이산확률변수: 확률변수가 가질 수 있는 값의 수를 셀 수 있는 경우 연속확률변수: 확률변수가 어느 구간에 속하는 모든 값을 가질 수 있는 경우 확률분포 확률변수가 가질 수 있는 값과 그에 대응하는 확률을 나타낸 것 => 확률분포표로 정리 확률 히스토그램: 확률분포를 막대그래프로 확률질량함수(pmf) 𝒇(𝒙) = 𝑷(𝑿 = 𝒙i) 확률변수 𝑿가 값 𝒙를 갖게 되는 확률 𝑷(𝑿 = 𝒙) 누적분포함수(cdf) 이산확률변수 𝑿가 가질 수 있는 값 𝒙보다 작거나 같은 누적확률값 𝑷(𝑿 ≤ 𝒙) 를 대응시키는 함수 그냥 쉽게 범위가 정해진 확률질량함수라고 생각하자. 누적분포함수를 활용해 확률을 더 쉽게 구할 수 있음..