728x90
반응형
Pandas는 파이썬에서 데이터 처리를 위해 자주 사용되는 라이브러리로, DataFrame과 Series라는 두 가지 주요 데이터 구조를 제공한다.
1. Pandas DataFrame
- 2차원 데이터 구조: DataFrame은 엑셀 스프레드시트와 유사한 2차원 테이블 형태의 데이터 구조로, 행(row)과 열(column)로 이루어져 있다.
- 여러 열 지원: DataFrame은 여러 개의 Series 객체로 구성되며, 각 열이 하나의 Series이다. 각 열은 서로 다른 데이터 타입을 가질 수 있다.
import pandas as pd
# DataFrame 생성 예시
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Score': [85.5, 90.0, 95.5]}
df = pd.DataFrame(data)
2. Pandas Series
- 1차원 데이터 구조: Series는 1차원 배열과 유사한 데이터 구조로, 인덱스(index)를 가지는 단일 열(column) 형태의 데이터이다.
- 단일 데이터 타입: Series 객체는 하나의 데이터 타입만을 가질 수 있다. (예: 숫자, 문자열 등)
import pandas as pd # Series 생성 예시
data = [85.5, 90.0, 95.5]
ser = pd.Series(data, index=['Alice', 'Bob', 'Charlie'])
비교 요약
- DataFrame은 다차원 데이터(여러 열과 행)를 다루는 반면, Series는 단일 열을 다루는 1차원 데이터 구조이다.
- DataFrame은 여러 Series가 모여 만들어진 구조라고 볼 수 있다.
728x90
반응형