에러해결/PYTHON

Pandas DataFrame vs Series

Zziii 2024. 9. 2. 12:28
728x90
반응형

Pandas는 파이썬에서 데이터 처리를 위해 자주 사용되는 라이브러리로, DataFrame과 Series라는 두 가지 주요 데이터 구조를 제공한다.

 

1. Pandas DataFrame

  • 2차원 데이터 구조: DataFrame은 엑셀 스프레드시트와 유사한 2차원 테이블 형태의 데이터 구조로, 행(row)과 열(column)로 이루어져 있다.
  • 여러 열 지원: DataFrame은 여러 개의 Series 객체로 구성되며, 각 열이 하나의 Series이다. 각 열은 서로 다른 데이터 타입을 가질 수 있다.
import pandas as pd 
# DataFrame 생성 예시 
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Score': [85.5, 90.0, 95.5]} 
df = pd.DataFrame(data)

 

2. Pandas Series

  • 1차원 데이터 구조: Series는 1차원 배열과 유사한 데이터 구조로, 인덱스(index)를 가지는 단일 열(column) 형태의 데이터이다.
  • 단일 데이터 타입: Series 객체는 하나의 데이터 타입만을 가질 수 있다. (예: 숫자, 문자열 등)
import pandas as pd # Series 생성 예시 
data = [85.5, 90.0, 95.5] 
ser = pd.Series(data, index=['Alice', 'Bob', 'Charlie'])

 

비교 요약

  • DataFrame은 다차원 데이터(여러 열과 행)를 다루는 반면, Series는 단일 열을 다루는 1차원 데이터 구조이다.
  • DataFrame은 여러 Series가 모여 만들어진 구조라고 볼 수 있다.
728x90
반응형
let textNodes = document.querySelectorAll("div.tt_article_useless_p_margin.contents_style > *:not(figure):not(pre)"); textNodes.forEach(function(a) { a.innerHTML = a.innerHTML.replace(/`(.*?)`/g, '$1'); });