728x90
반응형

결측치 2

파이썬 결측치와 공백 다루기

결측치와 공백의 차이 결측치와 공백은 데이터상에서 다른 개념이다. 얼핏봐서 비어있는 공백은 결측치 처럼 보일 수 있겠으나, 공백은 결측치가 아니고 하나의 공백(스페이스)라는 값이 들어있는 것으로 판단한다. 컴퓨터는 결측치(누락된 값)와 공백(빈 문자열)을 서로 다르게 인식한다. 아래는 두개념의 차이점이다. 결측치 (Missing Values): 결측치는 데이터의 누락이나 부재를 나타낸다. 컴퓨터에서는 주로 `NaN` (Not a Number) 또는 `None` (파이썬에서 사용)으로 표현된다. 데이터가 수치형일 때 `NaN`으로 표현되며, 파이썬과 같은 프로그래밍 언어에서는 `None`으로 표현됩니다. 결측치는 실제 값이 없거나 수집되지 않았거나 처리되지 않았을 때 발생한다. 예를 들어, 어떤 조사에서 ..

tool 공부/PYTHON 2023.08.03

python 결측치 채우기(특정값, 앞/뒤방향, 횟수제한) fillna()

# fillna 함수는 inplace를 적용할수 없음 # 결측치 0으로 채우기 df = df.fillna(0) # df에서 아래방향으로 결측치 채우기(직전값 대체) method = 'ffill' 또는 method = 'pad' df = df.fillna(method='ffill') # 또는 df = df.fillna(method='pad') # df에서 윗방향으로 결측치 채우기(다음값으로 대체) method = 'bfill' 또는 method = 'backfill' df = df.fillna(method='bfill') # 또는 df = df.fillna(method='backfill') # 결측값 채우는 횟수를 제한하기 limit = 채우는 횟수 df = df.fillna(method='bfill',l..

tool 공부/PYTHON 2022.11.24
728x90
반응형