1 minute read

  • 분석 프로젝트는 다른 유형처럼 범위, 일정, 품질, 리스크, 의사소통 등 영역별 관리가 수행되어야 한다.
  • 다양한 데이터에 기반한 분석 기법을 적용하는 특성 때문에 5가지 주요 특성을 고려하여 추가적 관리가 필요하다.
  • 분석과제 주요 특성에는 Data size, Data Complexity, Speed, Analytic Complexity, Accuracy & Precison 등이 있다.

분석과제 정의서

  • 다양한 분석과제 도출 방법을 통해 도출된 분석과제를 분석과제 정의서로 정리함
  • 필요한 소스데이터, 분석방법, 데이터 입수 난이도, 데이터 입수 사유, 분석 수행주기, 분석 결과에 대한 검증, 분석과정 상세 등을 작성함
  • 프로젝트 수행 계획의 입력물로 사용됨
  • 이해관계자가 프로젝트의 방향을 설정하고, 성공여부를 판별할 수 있는 중요한 자료로 명확하게 작성해야함

분석과제의 주요 5가지 특성 관리 영역

Data size (데이터의크기)

분석하고자 하는 데이터의 양을 고혀하는 관리 방안 수립 필요

Data Complexity (데이터의 복잡성)

비정형데이터 및 다양한 시스템에 산재되어있는 데이터들을 통합해서 분석 프로젝트를 진행할 때는 해당 데이터에 잘 적용될 수 있는 분석 모델 선정에 대한 고려 필요

Speed (속도)

  1. 분석결과 도출 후, 활용하는 시나리오 측면에서 일, 주 단위 실적은 배치 형태 작업, 사기탐지, 서비스 추천은 실시간 수행되어야 함

  2. 분석 모델의 성능 및 속도를 고려한 개발 및 테스트가 수행되어야 함


Analytic Complexity (분석적 복잡도)

  1. 정확도와 복잡도는 트레이드 오프 관계가 존재

  2. 분석 모델이 복잡할 수록 정확도는 올라가지만 해석이 어려워짐

  3. 기준점을 사전에 정의해 두어야함

Accuracy & Precision (정확도 및 정밀도)

  1. Accuracy : 분석의 활용적인 측면 (모델과 실제 값의 차이)

  2. Precision : 분석의 안정성 측면 (모델을 반복했을 때의 편차)

  3. Accuracy & Precision 은 트레이드 오프인 경우가 많다.

  4. 모델의 해석 및 적용시 사전에 고려해야 함

Leave a comment