728x90
반응형

이론공부/통계 7

최소제곱법을 통한 회귀계수 행렬 구하기

행렬정의 오차 제곱합을 최소화 시켜야 하므로 오차 제곱을 구하면 행과 열이 같아야 하므로 오차의 전치행렬과 오차 행렬을 곱해주는 것과 같다. 그런데 회귀식에 의해 오차는 아래와 같이 나타낼 수 있다. 제곱식에 대입해서 전개하면 아래와 같이 전개한다. 가운데 두항은 서로 전치행렬관계이면서 1*1 행렬이므 -2로 연산이 가능하다. 오차항의 제곱을 최소화하기위해 정리된 식을 베타의 추정량으로 미분하면 아래와 같이 정리된다. 따라서 추정 회귀계수를 행렬로 나타내면 위와 같이 정리된다. 참고 사이트 http://infoso.kr/?p=3224

이론공부/통계 2024.04.09

불편추정량이란

불편 추정량(Unbiased Estimator)은 통계학에서 추정량(estimator)의 성질 중 하나를 나타낸다. 추정량이 불편적이라는 것은 그 추정량의 기대값이 추정하려는 모수(parameter)의 실제 값과 같다는 것을 의미한다. 다시 말해, 불편 추정량은 임의의 샘플을 사용하여 계산된 추정치의 평균이 모집단에서의 실제 모수와 같다는 것을 의미한다. 수학적으로, 추정량이 모수에 대한 추정치라고 할 때, 추정량이 불편 추정량인지 확인하기 위해서는 다음을 만족해야한다. 불편 추정량의 중요한 특성 중 하나는 추정량의 편향(bias)이 없다는 것이다. 편향이 없는 추정량은 표본의 크기가 커질수록 모수에 대한 추정치가 모수에 수렴한다는 것을 의미한다.

이론공부/통계 2024.04.09

척도의 종류

척도는 데이터의 성격과 측정 방법에 따라 분류할 수 있으며, 크게 질적 척도(명목적 데이터)와 양적 척도(수치적 데이터)로 나눌 수 있다. 이들 각각은 더 세분화되어 명목 척도, 서열 척도(질적 척도 내)와 등간 척도, 비율 척도(양적 척도 내)로 구분된다. 질적 척도 (Qualitative Scales) 질적 척도는 비수치적 특성을 측정하기 위해 사용되며, 주로 설문조사, 인터뷰 등에서 인간의 태도, 선호도 등을 측정할 때 사용된다. 1. 명목 척도 (Nominal Scale) 설명: 명목 척도는 데이터를 단순히 분류하기 위해 사용되는 척도로, 숫자는 구분을 위한 목적으로만 사용되며, 숫자 간에는 아무런 수학적 관계가 없다. 예시: 성별(남, 여), 혈액형(A, B, AB, O), 지역(서울, 부산, ..

이론공부/통계 2024.03.18

[사회조사분석사] 통계분석과 활용1-(2)

베르누이 시행베르누이 시행은 단 두가지 결과만을 가지는 실험이나 시행을 말한다. 이 두가지 결과는 일반적으로 "성공", "실패" 즉 1과0으로 구분되며, 각각의 확률은 p와 1-p이다. 여기서 p는 성공 확률을 나타낸다. 베르누이 시행의 대표적인 예로는 동전 던지기(앞면 또는 뒷면), 시험 합격여부(합격 또는 불합격)등이 있다. 이항분포이항분포는 고정된 수의 n번의 독립적인 베르누이 시행에서 특정한 결과(성공)가 k번 나타날 확률 분포이다. 이 때, 각 시행의 성공 확률은 p로 동일하다. 이항분포의 확률 질량 함수는 아래와 같다. 이항분포의 예로는 10번의 동전 던지기에서 앞면이 나오는 횟수, 20명의 학생들 중 시험에 합격하는 학생의 수 등이 있다. 그래프로 보는 이항분포이항분포의 모양은 n과 p에 따..

이론공부/통계 2024.03.06

[사회조사분석사] 통계분석과 활용 1-(1)

1. 배반사건 (Mutually Exclusive Events)설명: 배반사건이란 두 사건이 동시에 발생할 수 없는 경우예를 들어, 한 번의 주사위 던지기에서 3이 나오는 사건과 5가 나오는 사건은 동시에 일어날 수 없다.수식: 사건 A와 B가 배반사건일 경우, P(A∩B)=02. 독립확률 (Independent Events)설명: 두 사건이 서로 독립적일 때, 한 사건의 발생이 다른 사건의 발생 확률에 영향을 주지 않음A가 발생할 확률과 B가 발생할 확률은 서로 영향을 주지 않음두 사건이 서로 배반사건이라면 예를들어, 동전을 던졌을때 동전이 앞면 나왔을때 동전의 뒷면은 동시에 나올 수 없으므로 서로 독립이 아님예를 들어, 동전을 두 번 던져 첫 번째 던지기에서 앞면이 나오는 사건과 두 번째 던지기에서 ..

이론공부/통계 2024.03.04

선형회귀분석의 가정

선형회귀분석의 기본 가정 1. 등분산성 (타겟 y의 값과 yhat의 분산이 동일해야함) 등분산성이란 분산이 같다는 의미 특정한 패턴없이 분포한다는 의미이다. 확인법 - yhat과 잔차의 산점도를 확인한다 yhat의 크고 작음이 잔차와 어떤 연관성도 없어야한다. 어떤 패턴도 보이지 않아야한다. 2. 선형성 선형성이란 종속변수 y와 독립변수 x간에 선형성을 만족해야하는 특성 선형성을 만족하지 않는 변수가 있다면, 새로운 변수를 추가해볼것 지수나 루트 로그 등으로 변수 변환을 해볼것 선형성을 만족하지 않는 변수를 제거해볼것 변수선택법을 통해 변수를 선택해볼것 3. 정규성 (잔차가 정규성을 만족하는지 여부) 시각적인 정규성 검정 방법은 히스토그램, Q-Q plot 활용 수치적인 정규성 검정은 샤피로 윌크 검정,..

이론공부/통계 2023.02.24
728x90
반응형