<빅데이터의 이해>
1. 다음 중 빅데이터의 일반적인 특징 3V와 그 설명이 부적절한 것은 무엇인가?
① VOLUME – 데이터 양의 증가
② VARIETY – 데이터 유형의 증가
③ VELOCITY – 데이터 생성 속도 및 처리 속도의 증가
④ VALUE – 데이터로부터 도출되는 가치의 증가
※ 정답 : 4번
2. 다음 중 빅데이터분석에 경제성을 제공해 준 결정적인 기술로 가장 적절한 것은?
① 텍스트마이닝
② 클라우드컴퓨팅
③ 저장장치 비용의 지속적인 하락
④ 스마트폰의 급속한 확산
※ 정답 : 2번
3. 다음 중 빅데이터에 의한 변화로 잘못 연결된 것은 무엇인가?
① 사전처리에서 사후처리로의 변화
② 표본조사에서 전수조사로의 변화
③ 데이터의 양보다 질을 중시하는 변화
④ 인과관계에서 상관관계로의 변화
※ 정답 : 3번
4. 다음 중 데이터의 가치 산정이 어려운 이유로 부적절한 것은 무엇인가?
① 데이터의 활용 방식 : 데이터를 언제 누가 사용했는지 알 수 없기 때문이다.
② 가치 창출 : 무심코 지나칠 수 있는 데이터 속에서 가치가 발견될 수 있기 때문이다.
③ 분석 기술 발전 : 과거에 찾지 못했던 가치를 찾을 수 있기 때문이다.
④ 인공지능 : 이미지 분석, 음성 분석과 같은 인공지능의 발전에 기여하기 때문이다.
※ 정답 : 4번
5. 다음 중 데이터의 가치 산정이 어려운 이유를 나타내는 사례로 가장 부적절한 것은?
① 구글 검색에서 나타나는 것과 같은 데이터의 반복적 재사용
② 전기차 배터리 정보를 충전소 최적지 선정과 같은 2차적 목적에 활용
③ 독자의 전자책 독서 순서 정보가 저자의 글쓰기 방식에 영향을 주는 것
④ 은행 대출심사 알고리즘 작동 원리 이해의 어려움
※ 정답 : 4번 – 알고리즘 전문가인 알고리즈미스트에게 도움받아야 하는 이유
6. 다음 중 빅데이터 분석의 특성에 대한 설명 중 가장 부적절한 것은?
① 더 많은 정보가 더 많은 가치를 창출할 수 있는 것은 아니다.
② 비즈니스의 핵심에 대해 보다 객관적이고 종합적인 통찰력을 줄 수 있는 데이터를 찾는 것이 중요하다.
③ 빅데이터 과제와 관련된 주된 걸림돌은 비용이 아니다.
④ 데이터의 크기가 커질수록 분석을 많이 사용하는 것이 중요해진다.
※ 정답 : 4번 – 데이터의 성격과 데이터에서 얻고자 하는 가치에 적합한 분석을 사용하는 것이 중요
7. 다음 중 빅데이터가 만들어 내는 변화와 가장 거리가 먼 것은?
① 가치가 있을 것이라고 예상되는 특정한 정보만 모아서 처리하는 것이 아니라 최대한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아내는 방식이 중요해진다.
② 데이터의 규모가 증가함에 따라 사소한 몇 개의 오류 데이터는 분석결과에 영향을 미치지 않기 때문에 데이터세트에 포함하여 분석해도 상관없는 경우가 많아진다.
③ 인과관계의 규명없이 상관관계 분석 결과만으로도 인사이트를 얻고 이를 바탕으로 수익을 창출할 수 있는 기회가 점차 늘어나고 있다.
④ 데이터의 양이 증가하고 유형이 복잡해짐에 따라 수많은 데이터 중에서 분석에 필요한 데이터를 선정하기 위한 정교한 표본조사 기법의 중요성이 대두되고 있다.
※ 정답 : 4번
– 사전처리에서 사후처리로 / 데이터의 질에서 양으로 /인과관계에서 상관관계로 / 표본조사에서 전수조사로
8. 아래 ㄱ 에 들어갈 내용을 작성하시오.
IoT시대가 되면 수많은 물건에 센서가 부착되어 데이터가 끊임없이 생산된다. 이 때 빅데이터 사업자들은 IoT를
통해 생산된 데이터를 저장해두고 이 데이터를 3rd party에 API를 통해 공개하여 활용하도록 할 수 있다. 이러한 기능을 빅데이터의 ㄱ 기능이라고 한다.
※ 정답 : 플랫폼 - 공동 활용의 목적으로 구축된 유/무형의 구조물을 의미
9. 아래는 빅데이터로 달성할 수 있는 경영혁신 단계를 나열한것이다. 빅데이터 경영혁신의 시작 단계에서 궁극적인 단계까지 바르게 나열한 것은?
(가) 생산성 향상 / (나) 발견에 의한 문제해결 / (다) 의사결정 향상 / (라) 새로운 고객가치와 비즈니스 창출
※ 정답 : (가) > (나) > (다) > (라)
10. 다음 중 빅데이터로 인한 변화방향을 기술한 것으로 가장 부적절한 것은?
① 필요한 정보만을 수집하던 시대에서 가능한 많은 정보를 수집한 후 용도를 찾아내는 시대로의 변화
② 단순한 상관관계보다 이론적 인과관계를 중시하는 방향으로 변화
③ 표본조사보다 전수조사가 보편화되는 시대로의 변화
④ 데이터의 질보다 양을 중시하는 시대로의 변화
※ 정답 : 2번
11. 다음 중 빅데이터의 출현 배경과 가장 거리가 먼 것은?
① 하둡과 같은 분산처리 기술의 발전
② M2M, IoT와 같은 통신 기술의 발전
③ 의료정보 등 공공데이터의 개방 가속화
④ 트위터, 페이스북 등 SNS의 급격한 확산
※ 정답 : 3번
- 공공데이터의 개방은 빅데이터의 출현배경이라기 보다는 빅데이터 현상 이후 국가에서 이를 보다 활성화하기 위한 측면이 강함
12. 구글 번역 서비스에서 활용된 빅데이터의 특성으로 가장 적절한 것은?
① Volume
② Variety
③ Velocity
④ Varacity
※ 정답 : 1번
- 구글은 전 세계에서 수집한 수십억개의 공문서 및 도서를 기반으로 번역 서비스를 개발하였고, 수집한 문서가 많으면 많을수록 번역의 질이 높아진다는 가정하에서 출발
13. 다음 중 빅데이터에 관한 설명으로 가장 적절한 것은?
① 빅데이터 분석을 통한 가치창출 여부는 데이터의 규모에 의해 크게 좌우된다.
② 비즈니스 핵심에 대해 보다 객관적이고 종합적인 통찰을 줄 수 있는 데이터를 확보해야 한다.
③ 빅데이터 프로젝트를 추진하는데 있어 가장 큰 걸림돌은 막대한 소요비용이다
④ 성과가 높은 기업의 대부분은 폭넓은 가치 분석적 통찰력을 갖추고 있는 것으로 밝혀졌다.
※ 정답 : 2번
- 1번 : 데이터 유형의 다양성에 따라 잠재적 보상을 받을 수 있다고 조사됨
- 3번 : 빅데이터와 관련된 걸림돌은 비용이 아니라 분석적 방법과 성과에 대한 이해부족임
- 4번 : 성과가 높은 기업 중에서도 폭넓은 가치 분석적 통찰력을 갖추고 있는 기업 비율은 낮음
14. 빅데이터 시대에 가치 패러다임이 변화하는 단계를 올바르게 나열한 것은?
① 연결 > 디지털화 > 에이전시
② 디지털화 > 연결 > 에이전시
③ 에이전시 > 연결 > 디지털화
④ 연결 > 에이전시 > 디지털화
※ 정답 : 2번
15. 아래 (ㄱ)에 들어갈 말로 적절한 것은?
빅데이터가 기업에 주는 영향으로 혁신 촉진, 경쟁력 제고, 그리고 (ㄱ) 향상을 들 수 있다.
※ 정답 : 생산성
16. 다음 중 일반적으로 통용되고 있는 빅데이터의 정의와 가장 거리가 먼 것은 무엇인가?
① 빅데이터는 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터이다.
② 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처다.
③ 빅데이터는 데이터의 양(Volume), 데이터의 유형과 소스 측면의 다양성(Variety), 데이터 수집과 처리 측면에서 속도(Velocity)가 급격히 증가하면서 나타난 현상이다.
④ 빅데이터는 기존의 작은 데이터 처리 분석으로는 얻을 수 없었던 통찰과 가치를 하둡을 기반으로 하는 대용량 분산처리 기술을 통해 창출하는 새로운 방식이다.
※ 정답 : 4번
- 하둡은 대량의 자료를 처리할 수 있도록 대형 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램 지우너 프레임워크로 빅데이터 자체로 볼 수는 없음
17. 다음 중 구글의 Ngram Viewer는 빅데이터의 어떤 기능을 보여주는 사례라고 할 수 있는가?
① 현미경
② 21세기의 오일
③ 차세대 산업혁명의 에너지원
④ 플랫폼
※ 정답 : 1번
- Ngram Viewer는 모든 책을 디지털로 전환하여 검색 서비스에 포함시키려는 구글의 프로젝트 결과물로서 제공되는 서비스임. 여기에서는 특정한 말뭉치를 검색하면 그 말뭉치가 시간의 흐름에 따라 어떤 빈도로 사용되어 왔는지를 보여주며, 렌즈처럼 특정 시점에 비교하려는 말뭉치와의 빈도수를 보여줌으로써 현미경의 확대 유사한 서비스를 제공함
<비즈니스 모델>
1. 다음 중 비즈니스 모델에서 빅데이터 분석 방법과 그에 대한 활용 예시가 부적절한 것은?
① 회귀분석 : 연인들의 거리에 따른 애정도의 변화는 얼마인가?
② 감정분석 : 고객의 만족도가 높을수록 재방문할 확률은 얼마인가?
③ 유형분석 : 같은 패턴의 행동을 보이는 동물은 무엇인가?
④ 연관규칙학습 : 고객의 장바구니를 분석한 결과 어떤 구입 품목들이 연관성을 가지는가?
※ 정답 : 2번 – 고객 만족에 따른 확률 변화이므로 회귀분석
2. 다음 중 연관분석에 대한 설명으로 올바른 것은?
① 여러 변인들 사이에 주목할 만한 규칙이 있는지 찾는 분석 기법
② 대치, 변이 등의 연산을 활용하여 최적화가 필요한 문제에 적용할 수 있는 기법
③ SNS 상의 사용자들 사이의 팔로워, 팔로잉 관계 속에서 특정 분야에 대한 영향력이 큰 사람을 찾는 기법
④ 많은 양의 데이터로부터 특성을 찾고 컴퓨터 그 특성을 이해하고 미래를 예측하는 기법
※ 정답 : 1번 / 2번(유전알고리즘), 3번(소셜네트워크분석), 4번(머신러닝)
3. 다음 중 ‘최대의 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?’ 라는 문제 해결을 위해
사용될 분석방법으로 가장 적절한 것은?
① 소셜 네트워크 분석
② 유전 알고리즘
③ 기계학습
④ 유형분석
※ 정답 : 2번 – 최적화를 찾기 위한 분석방법
4. 다음 중 데이터 분석 테크닉에 대한 설명 중 가장 부적절한 것은?
① 개인의 신용 평가에 가장 많이 활용되는 것은 연관 규칙 학습이다.
② 기계학습은 대규모 데이터를 처리 분석할 때, 상당한 분석 인프라와 많은 시간이 소요될 수 있다.
③ 한국어의 경우 그 언어적 특성으로 인해 감정 분석에 상대적으로 어려운 측면이 있다.
④ 소셜 네트워크 분석은 최근 핀테크 기업에서 대출을 제공할 때 활용되고 있다.
※ 정답 : 1번
- 개인의 신용도 평가에 가장 많이 활용되는 것은 회귀분석이다.
5. 다음은 비즈니스 문제와 이를 해결하기 위해 주로 사용되는 기법을 연결한 것이다. 잘못 연결된 것은?
① 맥주를 사는 사람은 콜라도 같이 구매하는 경우가 많은가? – 연관규칙학습
② 고객의 만족도가 충성도에 어떤 영향을 미치는가? – 회귀분석
③ 친분관계가 승진에 어떤 영향을 미치는가? – 소셜네트워크분석
④ 택배차량을 어떻게 배치하는 것이 가장 비용 효율적인가? – 유형분석
※ 정답 : 4번
- 유전 알고리즘 등 최적화 기법을 사용하여 해결해야 한다. 유전 알고리즘은 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 매커니즘을 통해 점진적으로 진화시켜 나가는 방법이다.
<위기요인과 통제방안>
1. 빅데이터 시대의 위기 요인 중 사생활 침해 문제를 해결하기 위한 대책으로 올바른 것은 무엇인가?
① 알고리즈미스트 인력을 활용한 사생활 침해 문제 해결
② 개인정보를 사용하는 사람이 직접 책임지는 책임제의 도입
③ 개인정보 주체로부터 개인정보 사용을 위한 허락 절차 강화
④ 정보주체에게 피해가 예상되는 경우 정보를 사용할 수 없도록 제한
※ 정답 : 2번
2. 빅데이터 시대가 도래하면서 발생할 수 있는 부정적인 측면의 하나로 “책임원칙의 훼손”의 이슈가 있다.
다음 중 이에 대한 사례로 가장 적절한 것은?
① 범죄 예측 프로그램에 의해 범행 전에 체포
② 빅브라더가 개인의 일상생활 전반을 감시
③ 여행 사실을 트윗한 사람의 집에 강도가 침입
④ 검색 엔진의 검색결과의 차별적 누락에 따른 피해 발생
※ 정답 : 1번
- 2,3번 : 사생활침해 / 4번 : 데이터 오용
3. 다음 중 빅데이터의 위기요인 통제를 위해 논의되고 있는 방안에 대한 설명으로 가장 부적절한 것은?
① 개인정보 활용에 대한 동의제를 책임제로 전환하는 것은 책임원칙 훼손 위기에 대한 통제 방안으로 효과적일 수 있으며, 개인정보 사용자가 적극적인 보호장치를 강구하게 하는 효과가 기대된다.
② 개인정보의 가치가 증가하고 기술발전으로 사생활침해 가능성도 함께 증가하고 있기 때문에 개인정보 활용에 대한 가이드라인 제정에 대한 요구가 급증하고 있다.
③ 데이터 오용의 위기 요소에 대한 대응책으로 알고리즘에 대한 접근권 보장이 필요하며 알고리즈미스트의 필요성도 증대되고 있다.
④ 특정인이 채용이나 대출, 신용카드 발급 여부 결정 등에서 예측자료에 의해 불이익을 당할 가능성을 최소화하는 장치를 마련하는 것이 필요하다.
※ 정답 : 1번
- 개인정보 활용에 대한 동의제를 책임제로 전환하는 것은 사생활 침해 문제해결을 위한 방안이다. 책임원칙 훼손 위기에 대한 통제 방안으로는 결과에 대해서만 처벌하는 기존의 책임원칙을 좀 더 보강하고 강화하는 것이 논의되고 있다.
<관련 이론정리>
2023.02.14 - [자격증공부] - [ADsP] (1과목) 데이터 이해 - 데이터의 가치와 미래
ㅇ ADsP 요약+기출문제 자료 다운로드(바로가기)
'자격증공부 > 데이터분석준전문가(ADsP)' 카테고리의 다른 글
[ADsP] (1과목) 데이터 이해 - 전략 인사이트와 데이터사이언스 기출문제 (0) | 2023.02.14 |
---|---|
[ADsP] (1과목) 데이터 이해 - 전략 인사이트와 데이터사이언스 요약 (0) | 2023.02.14 |
[ADsP] (1과목) 데이터 이해 - 데이터의 가치와 미래 (0) | 2023.02.14 |
[ADsP] (1과목) 데이터 이해 - 데이터의 이해 기출문제 (0) | 2023.02.13 |
[ADsP] (1과목) 데이터 이해 - 데이터의 이해 (0) | 2023.02.02 |