본문 바로가기

통계학4

확률분포 확률변수란?- random variable, 각각의 근원사건들에 실숫값을 대응시키는 함수이며 , X, Y, ....등으로 표시한다.- 확률변수에 쓰인 확률의 의미는 실험에 하기에 앞서 어떤 값을 갖게 될지 알 수 없는 불확실성을 표현한것- 확률에 따라 변하는 수로, 표본공간으로부터 실수값으로의 반환함수- 확률변수의 관측값에 대응하는 것은 영문 소문자로 표현- 유한하거나 무한이라도 셀 수 있는 경우에 이를 이산확률변수라 한다.- 연속적인 구간에 속하는 모든 값을 다 가질 수 있는 연속확률변수도 있다. 확률분포란?- 확률변수가 갖는 값들과 그에 대응하는 확률값을 나타내는 것으로  나열된 표나 수식으로 표현- 확률변수가 특정한 값(이산형) 또는 특정 구간(연속형)에 속할 가능성에 대한 확률을 표 또는 수식 등.. 2024. 7. 30.
두 변수 자료의 요약, 확률 분할표란?- 도표로 요약된 자료- 필요(목적)에 따라 여러 가지 값을 교차하는 부분에 표시할 수 있는데, 그 중 하나가 상대도수 산점도란?- 두 변수의 경우에도 그림을 통하여 두 변수 간의 관계를 파악할 수 있는데 이 때 사용되는 그림이 산점도- 두 변수는 서로 관계가 있을까? 관계가 있다면 두 변수가 어떤 관계가 있다고 할 수 있을까?와 같이 두 변수의 연관 관계에 대하여 알고 싶다면 두 변수를 동시에 고려할 필요가 있는데 두 변수 x와 y간의 관계를 분석할 때 중요한 첫 번째 단계가 자료에 대한 그림을 그리는 것이다. 변수 x를 수평축에 놓고 변수 y를 수직축에 놓은 후에 각 관측값의 짝을 좌표 위에 표시함으로써 얻게 되는 그림이 산점도이다. 표본상관계수란?- 산점도를 통하여 두 변수 사이의 관계를 .. 2024. 7. 26.
수치를 통한 연속형 자료의 요약 중심위치의 측도- 평균 : 중심위치의 측도 중에서 가장 많이 사용되는 방법으로서, 모든 관측괎의 합을 자료의 개수로 나눈 것이고 표본자료의 평균을 표본평균이라 하며 엑스바라 칭함- 표본평균은 관측값의 산술평균으로서 통계적 추론과정에서 광범위하게 사용될뿐만 아니라 통계적 분석과정에서 기초적인 통계수치로 가장 많이 사용됨- 모든 관측값이 반영되므로 표본평균은 극단적으로 아주 큰 값이나 아주 작은 값에 영향을 많이 받는다는 것에 주의 - 중앙값 : 전체 관측값을 크기 순서로 배열하였을 때 가운데 위치하는 값- 중앙값은 표본평균과 달리 관측값들의 변화에 민감하지 않고 특히 아주 큰 관측값이나 아주 작은 관측값에 영향을 받지 않는다. - 최빈값 : 관측값 중에서 가장 자주 나오는 값을 말함.- 최빈값은 표본평균이.. 2024. 7. 21.
통계학-1 통계학이란?- 자료의 수집과정을 설계하고, 자료를 요약하고 해석하여 결론을 이끌어 내거나 일반화하는 전체적인 원리와 방법론을 제공해주는 학문- 자료를 효과적으로 수집, 합리적으로 해석하여 올바른 결론을 유도하는 과정- 통계학의 영역은 자료의 수집과 조사를 통하여 사실을 밝혀내는 것을 포함하는 모든 지식의 습득과정까지 자연스럽게 확장된다. 다른 학문과 통계학의 공통점- 새로운 정보나 지식을 얻기 위해서는 관련된 자료를 수집하여야 한다.- 조건이 거의 같은 상황에서 관측되더라도 관측값들 사이에 어느 정도의 변동은 피할 수 없다. 예를 들어 같은 종류의 쥐들을 대상으로 약의 효능을 실험한다고 할 때 그 결과는 쥐마다 다르게 나오게 된다.- 관련된 자료를 모두 수집한다는 것은 전혀 불가능하거나 현실적으로 있을 .. 2024. 7. 9.