이론공부/데이터분석
CRISP-DM
Zziii
2025. 1. 2. 20:18
728x90
반응형
CRISP-DM (Cross-Industry Standard Process for Data Mining)
- 데이터마이닝 프로젝트를 체계적으로 수행하기 위한 산업간 표준 절차
- 표준화된 절차는 총 6단계로 구성되어있음
1. 비즈니스 이해(Business Understanding)
: 프로젝트의 목표와 비즈니스 문제를 명확히 정의
- 목표 설정
- 주요 성공 기준(KPI) 정의
- 데이터 마이닝 목표와 범위 설정
2. 데이터 이해(Data Understanding)
: 데이터의 구조, 품질, 특성을 파악
- 데이터를 수집하고 초기 분석 수행
- 데이터의 품질문제 식별
- 주요 속성(특성) 탐색
3. 데이터 준비(Data Preparation)
: 분석을 위해 데이터를 준비 및 변환
- 데이터 정제(결측값 처리, 중복 제거)
- 데이터 변환(스케일링, 인코딩 등)
- 특성 선택 및 생성
4. 모델링(Modeling)
: 데이터를 바탕으로 적합한 모델을 선택하고 개발
- 모델 알고리즘 선택 (ex. 의사결정나무, 랜덤포레스트, XGBoost)
- 모델 파라미터 조정 및 학습
- 모델 성능 평가
5. 평가(Evaluation)
: 모델이 비즈니스를 충족하는지 평가
- 모델 성능 검증(정확도, RMSE 등)
- 비즈니스 목표와의 적합성 평가
- 프로젝트 결과와 가설 검증
6. 배포(Deployment)
: 분석 결과와 모델을 실제 환경에 적용
- 모델 배포(프로덕션 환경, API 등)
- 사용자 교육 및 문서화
- 결과 모니터링 및 유지보수 계획 수립
728x90
반응형