Among Us - Black Crewmate '통계학' 태그의 글 목록
본문 바로가기

통계학6

정규분포 균등분포- 가장 단순한 형태의 연속형 확률 분포- 연속형 확률변수가 길이가 같은 구간 내에 속할 가능성이 동일한 분포로 확률변수 X가 실수 구간 a와 b사이에서 균등하게 분포한다- 균등확률변수 X의 pdf f(x)는 상수함수인 f(x) = c이다.- 확률변수 X가 구간 [a, b]에서 균등하게 분포 -> X ~ U(a,b)- f(x) = 1/b-a (a 정규분포- 통계학에서 가장 널리 사용되는 분포로서 이항분포의 근사과정에서 제시- 표본 본포 이론의 근거를 제시한다는 측면에서도 이론적으로 가장 중요한 확률 분포- 자연 현상에서 발생하는 데이터에 가장 폭넓게 적용 가능한 확률 분포 [오차의 분포]- 평균 u를 중심으로 단봉, 좌우대칭의 종모양을 가지며 퍼진 정도는 분산의 크기가 결정- E(X) = u, V.. 2025. 3. 23.
이항분포와 그와 관련된 분포들 베르누이분포- 이산형확률분포의 가장 기본이 되는 분포- 베르누이 시행의 결과에 대한 분포 베르누이 시행- 합격/불합격, 양호/불량, 성공/실패 등과 같이 시행의 가능한 결과가 단 두가지인 실행- 표본공간의 원소 : 성공(S), 실패(P)이며 성공 = 관찰자가 관심 있는 사건 발생- X ~ bernoulli(P) : 이산형확률변수 X가 성공의 확률이 P인 베르누이 분포를 따른다.- E(X) = P, Var(X) = P(1-P)를 따른다 이항분포- 성공의 확률이 P인 베르누이 시행을 독립적으로 n번 반복했을 때 얻어지는 성공의 횟수/수에 대한 분포- X ~ B(n,p)- 모수 : 성공의 확률  P- E(x) = n x p- Var(x) = n x p x q = n x p x (1-p) 포아송 분포 - 이항 .. 2025. 3. 20.
확률분포 확률변수란?- random variable, 각각의 근원사건들에 실숫값을 대응시키는 함수이며 , X, Y, ....등으로 표시한다.- 확률변수에 쓰인 확률의 의미는 실험에 하기에 앞서 어떤 값을 갖게 될지 알 수 없는 불확실성을 표현한것- 확률에 따라 변하는 수로, 표본공간으로부터 실수값으로의 반환함수- 확률변수의 관측값에 대응하는 것은 영문 소문자로 표현- 유한하거나 무한이라도 셀 수 있는 경우에 이를 이산확률변수라 한다.- 연속적인 구간에 속하는 모든 값을 다 가질 수 있는 연속확률변수도 있다. 확률분포란?- 확률변수가 갖는 값들과 그에 대응하는 확률값을 나타내는 것으로  나열된 표나 수식으로 표현- 확률변수가 특정한 값(이산형) 또는 특정 구간(연속형)에 속할 가능성에 대한 확률을 표 또는 수식 등.. 2024. 7. 30.
두 변수 자료의 요약, 확률 분할표란?- 도표로 요약된 자료- 필요(목적)에 따라 여러 가지 값을 교차하는 부분에 표시할 수 있는데, 그 중 하나가 상대도수 산점도란?- 두 변수의 경우에도 그림을 통하여 두 변수 간의 관계를 파악할 수 있는데 이 때 사용되는 그림이 산점도- 두 변수는 서로 관계가 있을까? 관계가 있다면 두 변수가 어떤 관계가 있다고 할 수 있을까?와 같이 두 변수의 연관 관계에 대하여 알고 싶다면 두 변수를 동시에 고려할 필요가 있는데 두 변수 x와 y간의 관계를 분석할 때 중요한 첫 번째 단계가 자료에 대한 그림을 그리는 것이다. 변수 x를 수평축에 놓고 변수 y를 수직축에 놓은 후에 각 관측값의 짝을 좌표 위에 표시함으로써 얻게 되는 그림이 산점도이다. 표본상관계수란?- 산점도를 통하여 두 변수 사이의 관계를 .. 2024. 7. 26.
수치를 통한 연속형 자료의 요약 중심위치의 측도- 평균 : 중심위치의 측도 중에서 가장 많이 사용되는 방법으로서, 모든 관측괎의 합을 자료의 개수로 나눈 것이고 표본자료의 평균을 표본평균이라 하며 엑스바라 칭함- 표본평균은 관측값의 산술평균으로서 통계적 추론과정에서 광범위하게 사용될뿐만 아니라 통계적 분석과정에서 기초적인 통계수치로 가장 많이 사용됨- 모든 관측값이 반영되므로 표본평균은 극단적으로 아주 큰 값이나 아주 작은 값에 영향을 많이 받는다는 것에 주의 - 중앙값 : 전체 관측값을 크기 순서로 배열하였을 때 가운데 위치하는 값- 중앙값은 표본평균과 달리 관측값들의 변화에 민감하지 않고 특히 아주 큰 관측값이나 아주 작은 관측값에 영향을 받지 않는다. - 최빈값 : 관측값 중에서 가장 자주 나오는 값을 말함.- 최빈값은 표본평균이.. 2024. 7. 21.
통계학-1 통계학이란?- 자료의 수집과정을 설계하고, 자료를 요약하고 해석하여 결론을 이끌어 내거나 일반화하는 전체적인 원리와 방법론을 제공해주는 학문- 자료를 효과적으로 수집, 합리적으로 해석하여 올바른 결론을 유도하는 과정- 통계학의 영역은 자료의 수집과 조사를 통하여 사실을 밝혀내는 것을 포함하는 모든 지식의 습득과정까지 자연스럽게 확장된다. 다른 학문과 통계학의 공통점- 새로운 정보나 지식을 얻기 위해서는 관련된 자료를 수집하여야 한다.- 조건이 거의 같은 상황에서 관측되더라도 관측값들 사이에 어느 정도의 변동은 피할 수 없다. 예를 들어 같은 종류의 쥐들을 대상으로 약의 효능을 실험한다고 할 때 그 결과는 쥐마다 다르게 나오게 된다.- 관련된 자료를 모두 수집한다는 것은 전혀 불가능하거나 현실적으로 있을 .. 2024. 7. 9.