본문 바로가기
자격증 공부/ADsP(데이터분석준전문가)

[ADsP 요약] ADSP 요약 공유(ADSP 1과목 요약 공유)

by 졸꾸러기 2023. 10. 29.

[ADsP 정리1] ADSP 요약 공유(ADSP 1과목 요약 공유) (tistory.com)

 

[ADsP 정리1] ADSP 요약 공유(ADSP 1과목 요약 공유)

제1과목 데이터의 이해 1. 빅데이터 활용 ①구글의 자동번역 시스템: 양(Vloume) (문제) 구글의 자동번역 시스템은 빅데이터의 어떤 속성에 해당되는가? (답) Volume ②연관규칙학습: 변수 간에 주목

rud-study.tistory.com

 
제1과목 데이터의 이해
 

1. 빅데이터 활용
①구글의 자동번역 시스템: 양(Vloume)
(문제) 구글의 자동번역 시스템은 빅데이터의 어떤 속성에 해당되는가?
() Volume
②연관규칙학습: 변수 간에 주목할만한 상관관계가 있는지
(문제) 우유 구매자가 기저귀를 같이 구매하는지를 분석하는 방법
() 연관규칙학습
③시네매치(Cinematch): 넷플릭스
④자라: 일일 판매량 분석
 
2. CRM, SCM, ERP
①CRM(Customer Relationships Management, 고객관계관리):
⦁선별된 고객으로부터 수익을 창출하고 장기적인 고객관계를 가능케 함으로써 보다 높은 이익을 창출할 수 있는 솔루션
⦁고객 자료 분석, 고객중심지원
(문제) 고객별 구매이력 데이터 베이스를 분석하여 고객에 대한 이해를 돕고 이를 바탕으로 각종 마켓팅 전략에 활용되는 데이터베이스 솔루션은?
() CRM
(문제) CRM에 대한 설명으로 적절한 것은?
() 단순한 정보수집에서 탈피, 분석 중심의 시스템 구축 지향
②SCM(Supply Chain Management):
⦁유통업체 등 유통 공급망에 참여하는 모든 업체가 최적화하기 위한 솔루션
⦁공급망 최적화
③ERP(Enterprise Resource Planning):
⦁기업 전체를 경영자원의 효과적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율화를 위한 시스템
 
3. 빅데이터가 만들어 내는 본질적 변화
①정보의 사전처리 → 사후처리
②질 → 양
③표본조사 → 전수조사
④인과관계 → 상관관계
(문제) 빅데이터가 만들어낸 본질적 변화가 아닌 것은?
() 대면조사에서 표본조사로 변화하였다
 
4. 개인정보 비식별화
①가명처리: 홍길동 → 임꺽정
②층계처리 또는 평균값 대체: 임꺽정 180cm, 홍길동 170cm → 키 합 350cm, 평균키 175cm
③데이터 값 삭제: 홍길동 35세, 서울거주, 한국대 졸업 → 35세, 서울거주
④범주화: 홍길동, 35세 → 홍씨 30~40세
⑤데이터 마스킹: 홍길동, 35세 → 홍**, 35세
 
5. 데이터 유형 분류
①정형데이터: 형식이 정해져 있음
() RDB, 스프레드시트, 연산 가능
②반정형데이터: 형태(스키마, 메타데이터)가 있고 주로 파일로 저장됨
() 웹문서, 센서데이터
③비정형데이터: 형태가 없고 연산 불가능
(문제) 데이터 유형이 다른 것은?
①데시벨 단위의 센서데이터 ②이메일 ③음성데이터 ④영상데이터
() ①(센서데이터는 비정형데이터이다)
(문제) 비정형데이터는 데이터 내부에 메타데이터를 갖고 있고 파일 형태로 저장된다 (X)
 
6. 빅데이터 열풍과 회의론
①데이터는 크기의 이슈가 아니라, 거기에서 어떤 시각과 통찰을 얻을 수 있느냐의 문제이다
②빅데이터와 관련된 걸림돌은 ‘비용’이 아니라 분석적 방법과 성과에 대한 이해 부족이다
③항상 많은 정보가 더 많은 가치를 창출할 수 있는 것은 아니다
④데이터 성격과 데이터에서 가치에 적합한 분석이 필요하다
(문제) 데이터의 크기가 크고 분석을 많이 사용하는 것이 중요하다? (X)
(문제) 복잡하고 다양한 데이터를 최적화하는 능력이 최고의 가치를 창출하는 중요한 기준이다? (X)
(문제) 데이터 크기가 커질수록 더 많은 분석을 수행하는 것이 경쟁 우위 확보의 원천이다? (X)
 
7. 빅데이터 위기요인과 통제방안
①사생활 침해
(통제방안): 동의에서 책임으로, 개인정보 사용자에게 책임을 지게 하여 정보 사용 주체가 더욱 적극적인 보호 장치를 마련하게 하는 효과
②책임 원칙의 훼손
(위기요인) 분석 대상이 되는 사람들은 예측 알고리즘의 희생양이 될 가능성이 증가한다.
(예) 범죄예측 프로그램
(통제방안) 기존의 책임원칙을 더 보강하고 강화한다
③데이터 오용
(통제방안): 객관적 인증방안 도입
(문제) 빅데이터 시대의 위기요인으로 틀린 것은? (익명화)
(문제) 상업목적으로 데이터를 크롤링하여 개인정보를 수입하는 것은?
() 사생황 침해에 대한 위기요인이다
 
8. 행태 정보(Attitude Information)
①웹 사이트 방문 이력, 검색 이력 등 이용자의 관심, 흥미, 기호 및 성향 등을 파악하고 분석할 수 있는 온라인상의 이용자 활동 정보
②앱 사용이력, 특정 웹 사이트 구매 이력, 상트를 통한 구매 및 검색이력
③해당되지 않는 것: 연중 정당별 선호도의 변화
 

9. 관계형 데이터베이스 관리시스템(RDBMS) vs 객체지향 데이터베이스 관리시스템(ODBMS)

①RDBMS: 대규모 정보처리 가능
(예) 표로 데이터를 정리한다
②ODBMS: 복잡한 정보 모델링 가능
: 비정형 복합 정보 타입 지원 가능
(예) 이미지나 영상으로 데이터를 정리한다
(문제) 복잡한 데이터 구조를 표현 및 관리 및 비정형 복합 정보의 모델링이 가능한 DBMS는?
() 객체지형 DBMS
*DBMS: Data Base Management System
 
10. DIKW 피라미드(Data → Information → Knowldege → Wisdon)
①Data: 연필가격 A마트 100원, B마트 200원 → 수치
②Information: A마트의 연필가격이 더 싸다 → 의미부여
③Knowledge: A마트에서 연필을 사야겠다 → 결과물
④Wisdom: A마트의 다른 상품들도 B마트보다 쌀 것이라고 판단 → 아이디어
(문제) 데이터를 가공 및 처리하여 얻을 수 있는 거으로 부적절한 것은?
①정보 ②지혜 ③지식 ④ 기호
 
11. 데이터 웨어하우스 vs 데이터마트
①데이터마트는 웨어하우스의 부분이며, 특정 조직, 팀에서 사용하는 것을 목적으로 한다
②데이터마트는 웨어하우스에서 데이터를 꺼내 사용자에게 제공하는 역할을 함
(문제) 사용자의 의사결정에 도움을 주기 위하여 기간시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변환해서 관리하는 데이터베이스는? 데이터 웨어하우스
(문제) 기업의 원천성 데이터베이스는 데이터마트이다(X)
(문제) 데이터 웨어하우스는 특정 조직의 특정 분야에 초점 (X)
(문제) 데이터마트는 조직이나 부서 뿐만 아니라 모든 사람이 볼 수 있고 사용할 수 있다 (X)
*데이터 웨어하우스: 다양한 업무분야에 초점을 두고 활용된다
: 사용자의 의사결정에 도움을 주기 위해 정보를 기반으로 제공하는 하나의 통합적이고 시간성을 가지는 비휘발성 데이터의 집합이다
 
12. 데이터 크기
①바이트 → ②킬로바이트 → ③메가바이트 → ④기가바이트 → ⑤테라바이트(TB)
⑥페타바이트(PB) → ⑦엑사바이트(EB) → ⑧제타바이트(ZB )→ ⑨요타바이트(YB)
*암기팁: 페지(PEZY) - 페타 엑사 제타 요타
(문제) 데이터 크기를 작은 것부터 순서대로 나열한 것은?
() PB → EB → ZB →YB


ADsP 요약 공유 입니다
(1과목 데이터의 이해 요약 1편)

제1과목 데이터의 이해 (1-1).pdf
0.07MB