본문 바로가기

자격증공부/데이터분석준전문가(ADsP)

[ADsP] (3과목) 데이터 분석 - 통계분석 Part1 기출문제

320x100

 

<통계학 개론>

1. 아래 보기에 들어갈 A와 B를 바르게 고른 것은 무엇인가?

두 개의 사건에 대하여 두 사건이 서로 공통 부분이 존재하지 않는 경우를 ( A )관계라 하며, 두 개의 사건이 공통인 부분이 존재한다 하더라도 서로가 서로에게 영향을 주지 않는 경우를 ( B )관계에 있다고 한다.

      A           B

① 독립   상관

② 배반   독립

③ 배반   상관

④ 상관   배반

 

※ 정답 : 2번

 

2. 표본조사를 실시하기 위한 표본 추출 방법의 선택은 중요한 과제다. 다음 보기에서 설명하는 표본 추출방법은 무엇인가?

모집단의 구성비율을 반영한 표본집단을 생성하기 위해 모집단을 여러 개의 이질적인 집단으로 나눈 뒤 모집단의 비율과 같은 비율로 각 군집으로부터 표본을 추출하는 방법이다.

① 집락 추출법

② 비례 층화 추출법

③ 계통 추출법

④ 불비례 층화 추출법

 

※ 정답 : 2번

 

3. 다음 중 데이터의 종류와 그 설명이 잘못 연결된 것은 무엇인가?

① 명목 척도 : 여러 개의 범주로 구성되며 각 범주 사이의 높고 낮음이 존재하지 않는다. 학급과 같이 반을 예로 들 수 있다.

② 순서 척도 : 여러 개의 범주로 구성된 이산형 변수로 각 범주사이에 높고 낮음이 존재하여 성적의 등급을 예로 들 수 있다.

③ 구간 척도 : 연속형 변수로 절대적 기준 0이 존재하며 온도와 GDP같은 지수가 이에 해당한다.

④ 비율 척도 : 비율척도의 예로는 키와 몸무게를 들 수 있다.

 

※ 정답 : 3번 – 구간척도는 절대적 기준 0이 존재하지 않음, 비율척도가 절대적 기준 0이 존재

 

4. 다음 중 공분산과 상관계수에 대한 설명으로 잘못된 것은 무엇인가?

① 상관계수는 두 변수에 대하여 서로의 선형관계를 나타내는 측도이다.

② 공분산은 최댓값과 최솟값이 존재하지 않는다.

③ 상관계수 값 0은 두 변수의 선형관계가 존재하지 않음을 의미한다.

④ 공분산은 하나의 변수에 대한 선형관계를 나타내는 측도이다.

 

※ 정답 : 4번 - 2개의 변수에 대한 선형관계임

 

5. 다음 중 왜도가 양수인 경우 평균, 중앙값, 최빈값의 대소 관계를 바르게 표현한 것은?

① 최빈값 < 평균 < 중앙값

② 최빈값 < 중앙값 < 평균

③ 평균 < 중앙값 < 최빈값

④ 중앙값 < 평균 < 최빈값

 

※ 정답 : 2번

반응형

6. 아래 표는 확률 변수 X에 대한 확률분포를 나타낸 것이다. 아래 표를 보고 확률변수 X의 기댓값과 분산을 계산하시오.

E(X) : (      ) ,  Var(X) : (      )

 

※ 정답
E(X) = X * P(X)의 합계 = 0*1/8 + 1*1/8 + 2*1/4 + 3*1/2 = 17/8 = 2.125
Var(X) = X제곱 * P(X)의 합계 = 0*1/8 + 1*1/8 + 4*1/4 + 9*1/2 = 71/64 = 1.109375

 

7. 다음 중 이산형 확률분포가 아닌 것은 무엇인가?

① 포아송 분포

② 균일 분포

③ 기하 분포

④ 베르누이 분포

 

※ 정답 : 2번 - 이산형 / 연속형 확률분포 구분

 

8. 다음은 어느 확률분포에 대한 설명인지 고르시오.

발생할 수 있는 사건이 0과 1인 두 개의 확률분포로 n번 시행할 때 처음으로 성공인 시행이 나올때까지 n번 시행할 확률을 나타내는 분포이다.

① 기하 분포

② 베르누이 분포

③ 정규 분포

④ 포아송 분포

 

※ 정답 : 1번 – 처음으로 라는 단어가 나온다면 기하분포가 정답

 

9. 다음 중 추정과 가설검정에 대한 설명 중 가장 부적절한 것은 무엇인가?

① 모든 데이터를 조사하는 전수조사는 불가능하여 표본조사로부터 모집단을 파악하는 것이 그 목적이다.

② 점 추정이란 모집단이 어느 특정한 값일 것이라 여기는 값을 예측하는 것이다.

③ 귀무가설이란 대립가설에 반하는 가설로 흔히 모집단이 어떤 값일 것이라 특정하는 가설이다.

④ 제 1종 오류와 제 2종 오류 모두를 줄이기 위해 유의수준을 사용한다.

 

※ 정답 : 4번 – 더 위험하다고 생각되는 1종 오류만 조정

 

10. 다음은 A와 B라는 두 학교의 학생들 수학 점수에 대하여 T 검정을 수행한 결과이다. 결과를 올바르게 해석한 것은 무엇인가?

① 유의확률이 0.5515로 유의수준 0.05 이내에서 귀무가설을 기각한다.

② 기각되는 귀무가설은 ‘두 학교의 성적에 차이가 없다.’ 이다.

③ conf.level = 0.95 를 생략하면 다른 결과를 얻는다.

④ 이 표본 양측 t검정을 수행하였다.

 

※ 정답 : 4번

 

11. 다음은 공장에서 제조하는 초콜릿의 무게에 대한 가설검정을 진행한 결과이다. 다음 중 결과를 잘못 해석한 것은 무엇인가?

① 귀무가설은 ‘초콜릿의 무게가 52g이다.’ 이다.

② 귀무가설을 기각하여 초콜릿의 무게가 52g이 아니라고 할 수 있다.

③ 공장에서 생산되는 초콜릿의 평균 무게는 약 52.4g이다.

④ 일 표본 단측 t검정을 수행하였다.

 

※ 정답 : 4번 – 일 표본 양측 검정 수행

12. 다음은 몇 개의 반을 대상으로 실시한 시험에서 각 반의 성적에 대하여 분산분석을 실시한 결과이다. 다음 중 결과를 잘못 해석한 것은 무엇인가?

① 시험을 치른 반은 2개의 반이다.

② 유의확률은 0.345로 유의수준 0.05 이내에서 귀무가설을 기각할 수 없다.

③ 시험을 치른 전체 학생 수는 90명이다.

④ 귀무가설은 ‘각 반의 성적 차이는 없다.’ 이다.

 

※ 정답 : 1번 - 3개의 반
  a = 집단수 -1 =2 / class는 3개의 반

  b = 전체수 - 집단수(3) = 87 / 전체 학생 수는 90명

 

13. 모집단에서 표본을 추출하는 방법이 아닌 것은 무엇인가?

① 단순랜덤추출법

② 계통추출법

③ 층화추출법

④ 깁스추출법

 

※ 정답 : 4번

 

14. 데이터의 한 부분으로 특정 사용자가 관심을 갖고 있는 데이터를 담은 비교적 작은 규모의 데이터웨어하우스는 무엇이라고 하는가?

 데이터베이스

 데이터마트

 데이터마이닝

④ 데이터프레임

 

 정답 : 2번

 

13. 확률이란 "특정사건이 일어날 가능성의 척도"라고 정의할 수 있다. 통계적 실험을 실시할 때 나타날 수 있는 모든 결과들의 집합을 표본공간이라고 하고, 사건이란 표본공간의 부분집합을 말한다. 다음 중 확률 및 확률분포에 대한 설명으로 가장 부적절한 것은?

모든 사건의 확률값은 0과 1 사이에 있다.

서로 배반인 사건들의 합집한의 확률은 각 사건들의 확률의 합이다.

③ 두 사건 A, B가 독립이라면 사건 B의 확률은 A가 일어난다는 가정하에서의 B의 조건부확률과 동일하다. 

④ 확률변수 X가 구간 또는 구간들의 모임인 숫자 값을 갖는 확률분포함수를 이산형 확률밀도 함수라 한다.

 

 정답 : 4번 - 연속형 밀도함수에 대한 설명

 

14. 다음 중 데이터의 정규성을 확인하기 위한 방법으로 부적절한 것은?

 히스토그램

Q-Q Plot

Shapiro Wilk test

④ Durbin Watson test

 

 정답 : 4번 - 회귀모형 오차항의 자기상관이 있는지에 대한 검정

320x100

15. 이상형 확률분포 중 주어진 시간 또는 영역에서 어떤 사건의 발생 횟수를 나타내는 확률 분포는 무엇인가?

 

 정답 : 포아송분포

 

16. P(A) = 0.3, P(B) = 0.4이고, 두 사건이 독립일 경우 P(B|A)는 얼마인가?

 

 정답 : 0.4 

 

17. 실험 결과가 단지 성공과 실패만 있다고 가정하자. 성공일 경우 확률변수는 1의 값을 가지며, 실패일 경우 확률변수는 0의 값을 가진다. 이때 성공일 확률은 0.3이다. 이 경우 기댓값은 얼마인가?

 

 정답 : 0.3

 

18. 아래에서 설명하는 표본 추출방법은 무엇인가?

상당히 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 표본을 추출하는 방법이다. 이질적인 모집단의 원소들로 서로 유사한 컷끼리 몇 개의 층을 나눈 후 각 계층에서 표본을 랜덤하게 추출한다.

 

 정답 : 층화추출법

 

19. 만족도 5점 척도 조사는 어떤 척도를 사용한 것인가?

 

 정답 : 순서척도

 

20. 다음 중 두 확률변수 X와 Y의 공분산에 대한 것으로 옳지 않은 것은?

X, Y 방향의 선형성이다.

cov(X,Y) = E [(X - u)*(Y-u)]

X, Y가 독립이면 cov(X,Y) = 0

④ -1 <= cov(X,Y) <= 1

 

 정답 : 4번

 

21. 다음 중 두 종류의 수면 유도제를 복용 전과 후의 평균 체중 비교에 사용할 수 있는 분석은 무엇인가?

쌍체 t검정

독립 t검정

 일원배치분산분석

④ 카이제곱 검정

 

 정답 : 1번

 

<관련 이론 요약정리>

2023.02.19 - [자격증공부] - [ADsP] (3과목) 데이터 분석 - 통계분석 Part1 요약

 

[ADsP] (3과목) 데이터 분석 - 통계분석 Part1 요약

1. 통계와 통계분석 ㅇ 통계 : 분석하고자 하는 집단에 대해 조사하거나 실험을 통해 자료의 요약된 형태의 데이터를 추출, 불확실한 상황에서 효과적인 의사결정을 할 수 있도록 수치자료를 수

inform.workhyo.com

 

<ADsP 요약+기출문제 자료 다운로드(바로가기)>

 

ADsP 빅데이터분석준전문가 자격증 대비 요약 및 기출 | 10000원부터 시작 가능한 총 평점 0점의 자

0개 총 작업 개수 완료한 총 평점 0점인 WorkHYO의 자료·템플릿, 취업·입시 자료, 기타 서비스를 0개의 리뷰와 함께 확인해 보세요. 자료·템플릿, 취업·입시 자료, 기타 제공 등 10000원부터 시작 가

kmong.com

 

320x100
반응형