728x90
반응형

분류 전체보기 90

최소제곱법을 통한 회귀계수 행렬 구하기

행렬정의 오차 제곱합을 최소화 시켜야 하므로 오차 제곱을 구하면 행과 열이 같아야 하므로 오차의 전치행렬과 오차 행렬을 곱해주는 것과 같다. 그런데 회귀식에 의해 오차는 아래와 같이 나타낼 수 있다. 제곱식에 대입해서 전개하면 아래와 같이 전개한다. 가운데 두항은 서로 전치행렬관계이면서 1*1 행렬이므 -2로 연산이 가능하다. 오차항의 제곱을 최소화하기위해 정리된 식을 베타의 추정량으로 미분하면 아래와 같이 정리된다. 따라서 추정 회귀계수를 행렬로 나타내면 위와 같이 정리된다. 참고 사이트 http://infoso.kr/?p=3224

이론공부/통계 2024.04.09

불편추정량이란

불편 추정량(Unbiased Estimator)은 통계학에서 추정량(estimator)의 성질 중 하나를 나타낸다. 추정량이 불편적이라는 것은 그 추정량의 기대값이 추정하려는 모수(parameter)의 실제 값과 같다는 것을 의미한다. 다시 말해, 불편 추정량은 임의의 샘플을 사용하여 계산된 추정치의 평균이 모집단에서의 실제 모수와 같다는 것을 의미한다. 수학적으로, 추정량이 모수에 대한 추정치라고 할 때, 추정량이 불편 추정량인지 확인하기 위해서는 다음을 만족해야한다. 불편 추정량의 중요한 특성 중 하나는 추정량의 편향(bias)이 없다는 것이다. 편향이 없는 추정량은 표본의 크기가 커질수록 모수에 대한 추정치가 모수에 수렴한다는 것을 의미한다.

이론공부/통계 2024.04.09

ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 2.0.1 for xls Excel support Use pip or conda to install xlrd.

이 오류 메시지는 xlrd 라이브러리가 설치되어 있지 않거나 지원되는 버전이 설치되어 있지 않음을 나타낸다. xlrd는 Python에서 .xls 형식의 Excel 파일을 읽기 위해 사용되는 라이브러리인데 이 라이브러리가 없으면 .xls 파일을 읽을 수 없다. 오류 메시지에 따라, xlrd 버전 2.0.1 이상이 필요하므로 Python 환경에 xlrd를 설치하려면 다음 명령어 중 하나를 사용하여 설치한다. pip을 사용하는 경우 : pip install xlrd>=2.0.1 conda를 사용하는 경우 : conda install -c anaconda xlrd

에러해결/PYTHON 2024.04.03

척도의 종류

척도는 데이터의 성격과 측정 방법에 따라 분류할 수 있으며, 크게 질적 척도(명목적 데이터)와 양적 척도(수치적 데이터)로 나눌 수 있다. 이들 각각은 더 세분화되어 명목 척도, 서열 척도(질적 척도 내)와 등간 척도, 비율 척도(양적 척도 내)로 구분된다. 질적 척도 (Qualitative Scales) 질적 척도는 비수치적 특성을 측정하기 위해 사용되며, 주로 설문조사, 인터뷰 등에서 인간의 태도, 선호도 등을 측정할 때 사용된다. 1. 명목 척도 (Nominal Scale) 설명: 명목 척도는 데이터를 단순히 분류하기 위해 사용되는 척도로, 숫자는 구분을 위한 목적으로만 사용되며, 숫자 간에는 아무런 수학적 관계가 없다. 예시: 성별(남, 여), 혈액형(A, B, AB, O), 지역(서울, 부산, ..

이론공부/통계 2024.03.18

크롬 페이지 공유

크롬 브라우저의 페이지 공유 기능: 간편하게 공유하기 크롬 브라우저의 유용한 기능 중 하나인 페이지 공유에 대해 알아보려고 한다. 이 간단한 기능을 활용하여 인터넷에서 찾은 유용한 정보나 흥미로운 컨텐츠를 같은 구글아이디로 로그인한 기기간의 공유할 수 있다. 페이지 공유란? 페이지 공유 기능은 크롬 브라우저에서 현재 보고 있는 웹 페이지를 기기간의 공유할 수 있는 기능이다. 이 기능을 사용하면 페이지 주소를 복사해서 공유할 필요가 없다. 공유하기 기능 사용하기 크롬 브라우저에서 페이지 공유 기능을 사용하려면 간단하다. 1.먼저 크롬 웹 페이지에서 우측 상단의 세로 점 3개를 클릭하여 메뉴를 연다. 2. 저장 및 내보내기를 선택한다. 3. 내 기기로 보내기를 선택한다. 활용 팁 페이지 공유 기능을 사용할 ..

잡동사니 2024.03.18

df.head와 print(df.head)의 차이

df.head와 print(df.head)의 차이 df.head()와 print(df.head)는 서로 다른 동작을 수행한다. 1.df.head(): 이 함수는 Pandas 데이터프레임(df라 가정)의 처음 몇 개의 행을 반환한다. 기본적으로 처음 5개의 행을 반환하지만, 괄호 안에 숫자를 넣어서 반환할 행의 수를 조절할 수 있다. 이 함수는 데이터프레임의 일부를 보여주는 것이 목적이므로 값을 반환한다. 예를 들면, df.head(10)은 처음 10개의 행을 반환한다. 2. print(df.head): 이것은 df.head 메서드 자체를 출력하는 것이다. 이렇게 하면 메서드의 위치와 속성을 출력하게 된다. 그러나 실제로 데이터프레임의 일부를 출력하지 않는다 일반적으로 데이터프레임의 내용을 확인하려면 df..

tool 공부/PYTHON 2024.03.14

ERROR: pip's dependency resolver does not currently take into account all the packages that are installed.

이러한 오류 메시지는 pip의 종속성 해결기가 현재 설치된 모든 패키지를 고려하지 않는다는 것을 나타낸다. 이 문제는 pip 버전이 낮거나, 가상환경이 깨진 경우, 또는 다른 이유로 인해 발생할 수 있다. 지난번에도 한번 포스팅을 했었었는데 새로운 해결방법을 몇가지 더 추가하게 되었다. 아래는 해결방법 몇가지 1. pip 업그레이드 pip install --upgrade pip pip를 최신 버전으로 업그레이드하고 다시 시도해 본다. 2. 가상환경 재생성 현재 사용 중인 가상환경이 손상되었을 수 있습니다. 가상환경을 삭제하고 새로 만든다 기존 가상환경 삭제: conda env remove -n [가상환경이름] 새 가상환경 생성: conda create --name [가상환경이름] python==[버전] ..

에러해결/PYTHON 2024.03.14

파이썬 merge 여러개 한번에 하기

여러개 데이터프레임 한번에 merge 하기 from functools import reduce pop = reduce(lambda x,y: pd.merge(x,y, on='columns1', how='outer'), [df_1, df_2, df_3, df_4]) 아래는 설명 위 코드는 functools 모듈에서 reduce 함수를 가져와 사용하고 있다. reduce 함수는 리스트와 같은 반복 가능한(iterable) 객체에 함수를 순차적으로 적용하여 하나의 값으로 축소하는 데 사용된다. 여기서는 reduce 함수를 활용하여 pd.merge() 함수를 반복적으로 적용하여 여러 데이터프레임을 하나의 데이터프레임으로 병합하고 있다. reduce() 함수는 다음과 같은 구조를 가진다. reduce(functio..

tool 공부/PYTHON 2024.03.13
728x90
반응형