자격증 공부/ADsP(데이터분석준전문가)

[ADsP 요약] ADsP 요약 공유(ADsP 2과목 요약 공유)

졸꾸러기 2023. 10. 30. 19:30

[ADsP 정리2] ADSP 요약 공유(ADSP 1과목 요약 공유) (tistory.com)

 

[ADsP 정리2] ADSP 요약 공유(ADSP 1과목 요약 공유)

[ADsP 정리1] ADSP 요약 공유(ADSP 1과목 요약 공유) (tistory.com) [ADsP 정리1] ADSP 요약 공유(ADSP 1과목 요약 공유) 제1과목 데이터의 이해 1. 빅데이터 활용 ①구글의 자동번역 시스템: 양(Vloume) (문제) 구글

rud-study.tistory.com

 

 

2과목 데이터 분석 기획

 

1. KDD 분석(KDD; Knowledge Discovery in Database)

데이터베이스에서 의미있는 지식을 탐색하는 데이터 마이닝, 기계학습, 인공지능 등에서 응용될 수 있는 구조를 갖추고 있음

KDD 분석 절차

프로젝트 목표 설정

데이터 세트 선택

데이터 전처리: 잡음. 이상값, 결측치를 식별하고 제거

데이터 변환: 분석 목적에 맞는 변수를 선택하거나 데이터의 차원을 축소하여 데이터 마이닝을 효율적으로 적용하도록 변경

데이터 마이닝: 데이터 패턴을 찾거나 데이터를 분류 또는 예측

 

2. 분석기획(Planning)

*빅데이터 분석 방법 절차: 분석기획 데이터 준비 데이터 분석 시스템 구현 평가 및 전개

프로젝트 위험계획 수립:

빅데이터 분석 프로젝트를 시행하면서 발생 가능한 모든 위험을 발굴하여 사전에 대응

회피, 전이, 완화, 수용

비즈니스 이해 범위 설정

프로젝트 정의 및 계획 수립

(문제) 분석 기획 단계에서 수행하는 주요 태스크로 틀린 것은?

() 필요 데이터 정의

*데이터 준비 단계: 필요 데이터 정의 데이터 스토어 설계(정형/비정형) 데이터 수집 및 정합성 점검

 

3. 분석 프로젝트 관리방안

*분석 프로젝트는 5가지 주요 속성을 고려하여 관리 필요

Data Size

Data Complexity

Speed

Analytic Complexity

Accuracy & Precision

Accuracy 모델과 실제 값의 차이가 적다는 정확도 의미

활용측면에서는 Accuracy, 안전성측면에서는 Precision이 중요

이 둘의 관계는 트레이드 오프 관계로, 모델의 해석 및 적용시 사전에 고려해야 함

(문제) 정확도는 true로 예측된 것 중 실제 true인 비율, 정밀도는 실제 true인 경우에 실제 true로 예측된 비율이다? (X)

(문제) 분석의 안정성은 Accuracy, 활요은 Precision이 중요? (X)

 

4. 빅데이터 7V

3V: Volume, Variety, Velocity

4V: 3V + Value

7V: 4V + Veracity(진실성), Validity(정확성), Volatility(휘발성)

 

5. 분석 주제 유형, 분석기획시 고려사항

분석의 대상(What) 및 분석 방법(How)에 따라 4가지 유형으로 구분

4가지 유형: Optimization, Solution, Insight, Discovery

(문제) 분석 대상은 명확하지만, 분석 방식이 명확하지 않은 경우 수행하는 분석 주제 유형은?

() 솔루션

고려사항: 가용 가능한 데이터, 적절한 유스케이스(use-case)탐색,

장애요소들에 대한 사전 계획 수립 필요

 

6. 데이터 거버넌스

의미: 전사 차원의 모든 데이터에 표준화된 관리

구성요소: 조직, 원칙, 프로세스

체계요소:

데이터 표준화: 표준 용어 설명, 데이터 사전 구축

데이터 관리체계: 메타데이터 관리, 데이터 사전 관리, 데이터 생명 주기 관리

데이터 저장소 관리

표준화 활동

(문제) 다음 중 아래의 데이터 거버넌스 체계가 설명하는 것은?

(메타데이터 관리, 데이터 사전 관리)

() 데이터 관리체계

(문제) 데이터 거버넌스 체계로 맞는 것은?

() 데이터 표준화

(문제) 표준화된 관리체계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축하는 것은?

() 데이터 거버넌스

 

7. 하향식 접근방법(Top-Down)

문제 탐색 문제 정의 해결 모색 타당성 검토

문제 탐색 단계

세부적인 솔루션에 초점을 맞추는게 아니라, 문제를 해결함으로써 발생하는 가치에 중점을 두는게 중요

기업 ·외부 환경을 포괄하는 외부 참조 모델 존재

잠재적 경쟁자의 동향 파악

폭넑은 탐색

분석해야 할 대상이 명확하면 하향식 접근 방법 사용

(문제) 분석해야 할 대상이 확실하면 상향식이다? (X)

 

8. 상향식 접근방식

인사이트 도출 후 반복적인 시행착오를 통해서 수정하며 문제를 도출하는 과정

빠르게 변화하는 환경에서 인사이트를 도출하고 시행착오를 통해서 개선해가는 방식은 상향식

비지도 학습법에 의해 수행됨

특정 값이 아니라 데이터 자체의 결합, 연관성, 유사성 등을 중심으로 데이터 표현

() 장바구니 분석, 군집 분석, 기술 통계

 

9. 분석 마스터 플랜

*분석 대상이 되는 과제 도출, 우선순위를 평가하여 세부이행계획과 중·장기 로드맵 작성

우선순위 고려 요소: 전략적 중요도, 비즈니스 성과/ROI, 실행용이성

적용범위/방식 고려요소: 업무 내제화 적용 수준, 분석 데이터 적용 수준, 기술 적용 수준

ROI요소를 고려한 우선순위 평가 기준

ROI: Return On Investment, 투자수익률

과제 우선순위 평가 기준

-시급성(중요도): Value 비즈니스 효과(Return)

-난이도(비용,수준): Volume, Variety, Velocity 투자비용요소(Investment)

(문제) 분석 마스터 플랜 수립시 분석 과제 우선순위를 결정하는 고려 요소로, 가장 부적절한 것은?

() 데이터 필요 우선순위

(문제) 분석 마스터 플랜 수립시 시급성과 난이도가 높은 과제의 우선순위가 가장 높다? (X)

(문제) ROI 관점에서 Return에 해당하는 것은? Value

 

10. 분석준비도 6개 영역

분석기법: 적합한 분석기법 사용, 분석기법 라이브러리, 분석기법 효과성 평가, 분석업무 도입 방법론

분석 업무 파악 인력 및 조직 데이터 분석 문화 IT 인프라

(문제) 분석 수준 진단 대상으로 적절하지 않은 것은?

() 분석 성과

 

11. 중장기관점 분석 기획 발굴

거시적 관점: 사회 영역, 기술 영역, 경제 영역, 환경 영역, 정치 영역

시장의 니즈 관점: 고객 영역, 채널영역(영업사원 대리점 -.. 채널 별로), 영향자들 영역(주주, 투자자)

경쟁자 확대 관점: 대체제, 경쟁자, 신규진입자

(문제) 거시적 관점에 해당되지 않는 것? 채널

 

 


제2과목 데이터 분석 기획.pdf
0.06MB