Zziii 2025. 1. 2. 20:18
728x90
반응형

CRISP-DM (Cross-Industry Standard Process for Data Mining)

- 데이터마이닝 프로젝트를 체계적으로 수행하기 위한 산업간 표준 절차 

- 표준화된 절차는 총 6단계로 구성되어있음

 

1. 비즈니스 이해(Business Understanding)

: 프로젝트의 목표와 비즈니스 문제를 명확히 정의

  - 목표 설정

  - 주요 성공 기준(KPI) 정의

  - 데이터 마이닝 목표와 범위 설정

 

2. 데이터 이해(Data Understanding)

: 데이터의 구조, 품질, 특성을 파악

  - 데이터를 수집하고 초기 분석 수행

  - 데이터의 품질문제 식별

  - 주요 속성(특성) 탐색

 

3. 데이터 준비(Data Preparation)

: 분석을 위해 데이터를 준비 및 변환

  - 데이터 정제(결측값 처리, 중복 제거)

  - 데이터 변환(스케일링, 인코딩 등)

  - 특성 선택 및 생성

 

4. 모델링(Modeling)

: 데이터를 바탕으로 적합한 모델을 선택하고 개발

  - 모델 알고리즘 선택 (ex. 의사결정나무, 랜덤포레스트, XGBoost)

  - 모델 파라미터 조정 및 학습

  - 모델 성능 평가

 

5. 평가(Evaluation)

: 모델이 비즈니스를 충족하는지 평가

  - 모델 성능 검증(정확도, RMSE 등)

  - 비즈니스 목표와의 적합성 평가

  - 프로젝트 결과와 가설 검증

 

6. 배포(Deployment)

: 분석 결과와 모델을 실제 환경에 적용

  - 모델 배포(프로덕션 환경, API 등)

  - 사용자 교육 및 문서화

  - 결과 모니터링 및 유지보수 계획 수립

728x90
반응형