본문 바로가기

자격증공부/데이터분석준전문가(ADsP)

[ADsP] (3과목) 데이터 분석 - 통계분석 Part3 기출문제

320x100

 

<기타 통계분석>

1. 다음 중 상관분석에 대한 설명으로 부적절한 것은 무엇인가?

① 양적척도에 대한 상관분석을 수행하기 위해서는 피어슨 상관계수를 사용해야 한다.

② 상관분석의 귀무가설은 ‘두 변수간 상관관계는 존재하지 않는다.’ 이다.

③ 상관분석을 통해 두 변수의 선형관계 여부를 파악할 수 있다.

④ 서열척도에 대해서 상관계수를 구할 때 동일 석차가 존재하면 분석을 수행할 수 없다.

 

※ 정답 : 4번

 

2. 다음 중 다차원 척도법에 대하여 잘못 설명한 것은 무엇인가?

① 데이터를 저차원 공간에 배열하는 시각화 기법 중 하나이다.

② STRESS 값이 0인 경우 적합이 매우 잘 된 것이다.

③ 데이터의 변수는 연속형 변수 또는 서열척도여야 한다.

④ 좌표 평면에 나타내었을 때 x축, y축이 데이터 해석에 도움을 줄 수 있다.

 

※ 정답 : 4번

 

3. 다음 중 주성분 분석에 대한 설명 중 바르지 못한 것은 무엇인가?

① 변수 요약 기법 중 하나로 기존 데이터의 선형결합으로 주성분을 생성한다.

② 기존 데이터의 분산이 가장 작은 축을 첫 번째 주성분으로 한다.

③ 누적 기여율이 70 ~ 90%가 되도록 주성분의 개수를 선택한다.

④ n개의 변수를 n개의 주성분으로 요약할 때 누적 기여율은 100%이다.

 

※ 정답 : 2번

 

4. 다음은 주성분 분석을 수행한 결과를 나타낸 것이다. 다음 중 결과에 대하여 잘못 해석한 것은 무엇인가?

① scale. = T 는 변수들의 평균을 0으로, center = T 는 변수들의 분산을 1로 조절하기 위함이다.

② princomp(data, cor = TRUE)를 활용해도 같은 결과를 얻는다.

③ 첫 번째 주성분은 분산이 가장 큰 새로운 축을 찾는다.

④ 두 개의 주성분을 활용할 경우 전체 데이터의 약 94%를 설명할 수 있다.

 

※ 정답 : 1번 – 평균 1, 분산 0

 

5. 다음은 주성분 분석의 결과를 biplot에 의하여 시각화한 결과를 나타내고 있다. 다음 중 잘못 해석한 것은 무엇인가?

① a값이 커질수록 PC1 값은 감소한다.

② c값이 커질수록 PC2 값은 감소한다.

③ PC1도 0, PC2도 0 근처에 위치한 데이터3은 기존 변수의 모든 값이 0이다.

④ 데이터 16은 c라는 요소에 가장 큰 영향을 받는 데이터이다.

 

※ 정답 : 3번 (a,c는 음의 상관관계, 16은 c와 가까이 있음)

 

6. 시계열 분석의 정상성에 대한 설명 중 부적절한 것은 무엇인가?

① 모든 시점 t에 대해서 일정한 평균을 갖는다.

② 모든 시점 t에 대해서 일정한 분산을 갖는다.

③ 평균이 일정하지 못한 경우 변환을 통해 정상 시게열로 만들 수 있다.

④ 공분산은 특정 시점이 아닌 시차에 의존한다.

 

※ 정답 : 3번 (차분을 통해 정상 시계열로 만들 수 있다.)

 

7. 시계열 분석을 수행하기에 앞서 시계열 모형 선택은 중요한 과제 중 하나이다. 다음 중 특정 시점에서의 시계열 자료의 값은 이전 시점 n개에 의해서 결정 지을 수 있는 모델은 무엇인가?

① AR 모형

② ARMA 모형

③ ARIMA 모형

④ MA 모형

 

※ 정답 : 1번

 

8. 다음 중 시계열 자료를 설명하기 위한 분해 시계열 요소가 아닌 것은 무엇인가?

① 회귀 요인

② 순환 요인

③ 계절 요인

④ 불규칙 요인

 

※ 정답 : 1번

 

9. 다음 중 한 변수를 단조 증가 함수로 변환하여 다른 변수를 나타낼 수 있는 정도를 나타내며 두 변수의 선형 관계의 크기 뿐만 아니라 비선형적인 관계도 나타낼 수 있는 상관계수는 무엇인가?

① 코사인 유사도

② 피어슨 상관계수

③ 스피어만 상관계수

④ 자카드 인덱스

 

※ 정답 : 3번

 

10. 시계열의 요소분해법은 시계열 자료가 몇 가지 변동들의 결합으로 이루어져 있다고 보고 변동요소별로 분해하여 쉽게 분석하기 위한 것이다. 다음 중 분해 요소에 대한 설명이 부적절한 것은?

① 추세분석은 장기적으로 변해가는 큰 흐름을 나타내는 것으로 자료가 장기적으로 커지거나 작아지는 변화를 나타내는 요소이다.

② 계절변동은 일정한 주기를 가지고 반복적으로 같은 패턴을 보이는 변화를 나타내는 요소이다.

③ 순환변동은 경제 전반이나 특정 산업의 부침을 나타내 주는 것을 말한다.

④ 불규칙변동은 불규칙하게 변동하는 급격한 환경변화, 천재지변 같은 것으로 발생하는 변동을 말한다.

 

※ 정답 : 3번

 

11. 주성분분석은 p개의 변수들을 중요한 m(p)개의 주성분으로 표현하여 전체 변동을 설명하는 방법을 사용한다. 다음 중 주성분 개수(m)를 선택 방법에 대한 설명으로 가장 부적절한 것은?

① 전체 변이 공헌도 방법은 전체 변이의 70~90% 정도가 되도록 주성분의 수를 결정한다.

② 평균 고유값 방법은 고유값들의 평균을 구한 후 고유값이 평균값 이상이 되는 주성분을 제거하는 방법이다.

③ Scree graph를 이용하는 방법은 고유값의 크기순으로 산점도를 그린 그래프에서 감소하는 추세가 원만해지는 지점에서 1을 뺀 개수를 주성분의 개수로 선택한다.

④ 주성분은 주성분을 구성하는 변수들의 계수 구조를 파악하여 적절하게 해석되어야 하며, 명확하게 정의된 해석 방법이 있는 것은 아니다.

 

※ 정답 : 2번

 

12. 시계열 분석을 위해서는 정상성을 만족해야 한다. 따라서 주어진 자료가 정상성을 만족하는지 판단하는 과정이 필요하다. 자료가 추세를 보이는 경우에는 현 시점의 자료 값에서 전 시점의 자료를 빼는 방법을 통해 비정상시계열을 바꾸어 준다. 이 방법은 무엇인가?

 

※ 정답 : 차분

 

13. 다음 중 주성분분석에서 변수의 중요도 기준이 되는 값은 무엇인가?

① 고윳값

② 특이값

③ 표준편차

④ 스칼라

 

※ 정답 : 1번

 

14. 아래는 시계열 데이터를 분석하기 위한 절차들이다. 다음 중 시계열 데이터의 분석 절차 순서로 가장 적절한 것은?

ㄱ. 시간 그래프 그리기

ㄴ. 추세와 계절성을 제거하기

ㄷ. 잔차를 예측하기

ㄹ. 잔차에 대한 모델 적합하기

ㅁ. 예측된 잔차에 추세와 계절성을 더하여 미래 예측하기

 

※ 정답 : ㄱ-ㄴ-ㄷ-ㄹ-ㅁ

 

15. 다음 중 시계열 데이터에 대한 설명으로 가장 부적절한 것은?

① 시계열 데이터의 모델링은 다른 분석모형과 같이 탐색 목적과 예측 목적으로 나눌 수 있다.

② 짧은 기간 동안의 주기적인 패턴을 계절변동이라 한다.

③ 잡음은 무작위적인 변동이지만 일반적으로 원인은 알려져 있다.

④ 시계열분석의 주목적은 외부인자와 관련해 계절적인 패턴, 추세와 같은 요소를 설명할 수 있는 모델을 결정하는 것이다.

 

※ 정답 : 3번 - 원인은 알려져있지 않다.

 

16. 다음은 다차원척도법에 대한 설명이다. 설명이 가장 부적절한 것은?

다차원척도법은 여러 대상들 간의 관계를 개체들 사이의 유사성/비유사성을 상대적 거리로 측정하여 개체들을 2차원 또는 3차원 공간상에 점으로 표현하는 분석 방법이다.

다차원척도법의 목적은 데이터 속에 잠재한 패턴을 찾기위해 복잡한 구조를 소수 차원의 공간에 기하학적으로 표현하는 것이다.

일반적인 다차원척도법은 계량적 다차원척도법이라고도 부르며 순서척도의 데이터로 이루어진 개체들의 거리를 계산한다.

④ 스트레스 값이 0.05이하이면 적합 정도가 아주 좋은 것으로 해석하고 반복 분석과정을 중단해도 된다.

 

 정답 : 3번 - 계량적 다차원척도법은 비율척도, 구간척도 데이터를 활용하고, 비계량적 다차원척도법은 순서척도의 데이터를 활용

 

<관련 이론정리 요약>

2023.02.20 - [자격증공부] - [ADsP] (3과목) 데이터 분석 - 통계분석 Part3 요약

 

[ADsP] (3과목) 데이터 분석 - 통계분석 Part3 요약

1. 상관분석 ㅇ 상관계수를 활용한 분석방법으로 두 변수간 선형적 관계 존재 유무를 파악하기 위함 ㅇ 상관분서 귀무가설은 ‘두 변수간 상관관계는 존재하지 않는다’ 이다. ㅇ 상관계수 r의

inform.workhyo.com

<ADsP 요약+기출문제 자료 다운로드(바로가기)>

 

ADsP 빅데이터분석준전문가 자격증 대비 요약 및 기출 | 10000원부터 시작 가능한 총 평점 0점의 자

0개 총 작업 개수 완료한 총 평점 0점인 WorkHYO의 자료·템플릿, 취업·입시 자료, 기타 서비스를 0개의 리뷰와 함께 확인해 보세요. 자료·템플릿, 취업·입시 자료, 기타 제공 등 10000원부터 시작 가

kmong.com

 

320x100
반응형