안녕하세요

빅데이터 컴퓨팅 기술 연습문제 5장 본문

Study_exam/빅데이터 컴퓨팅 기술 연습문제

빅데이터 컴퓨팅 기술 연습문제 5장

godxxy1229 2023. 6. 15. 03:40

01 텍스트 마이닝 기술을 설명하시오.

비·반정형 텍스트 데이터로 구성된 빅데이터에서 자연어 처리기술에기반하여 의미 있는 정보를 추출하는 기술. 


02 오피니언 마이닝 기술을 설명하시오.

빅데이터에 포함된 어떤 사안이나 인물, 이슈, 이벤트에서 사람들의의견이나 평가 등을 분석하는 것.


03 리얼리티 마이닝 기술을 설명하시오.

데이터 마이닝 기술의 일종으로, 모바일 기기로 사용자의 인간관계, 행동 방식, 라이프 스타일 등을 분석함. ‘현실 마이닝’ 이라고도함.


04 계층적 군집화 기법을 설명하시오.

각 데이터 점을 하나의 군집으로 설정한 후 이들 간의 거리를 기반으로 하여 분할·합병해 가는 방식.


05 분할적 군집화 기법을 설명하시오.

k개의 분할 영역을 결정하는 방법으로 유클리디안 거리(Euclidean Distance) 계산법에 기반함.


06 소셜 네트워크 분석을 설명하시오.

이벤트 로그 데이터를 작업자(Resource), 사회적 관점에서 분석하는 것.


07 그래프 마이닝 기술을 설명하시오.

그래프에서 마이닝 기술을 적용하는 기술, 그래프 마이닝 기술은 일정빈도수 이상의 특정 패턴을 모두 찾아내는 방법.


08 다음 중 빅데이터 분석에서 새롭게 주목 받는 기술이 아닌 것은?

① 텍스트 마이닝

② 연관 규칙
③ 의사 결정 마이닝

④ 군집 분석
⑤ 기계 학습

② 연관 규칙


09 아파치에서 제공하는 라이브러리로, 비정형화된 텍스트에서 사람이나 기관의 이름, 특정 장소, 시간 등을 추출하는 작업을 간편하게 실행할 수 있는 모델을 포함한 기술은?

OpenNLP (오픈NLP)


10 아파치 Mahout의 주요 기능을 서술하시오.

확장 가능한 기계 학습 알고리즘을 만드는 것이 주목적으로, 아파치 라이선스가있으면 무료로 사용할 수 있다.

방대한 양의 데이터 집합에서 기계 학습 알고리즘을 실행할 수 있는 오픈 소스프레임워크로, 확장성과 처리량을 보장하려고 하둡 기반의 병렬 형식으로 구성한다

공통 작업이 많은알고리즘에 적합하며, 군집화, 분류, 사용자 행동을 기반으로품목을추천해 주는 시스템 등 분석환경에도 적합하다.


11 다음 중 scikits_learn을 잘못 설명한 것은?
① Python 기반의 오픈소스 기계 학습 라이브러리이다.

② 서포트 벡터 머신, 회귀분석, 군집화 등 여러 분석 기법을 제공한다.

③ 복잡한 문제보다는 간단한 문제를 해결하는 알고리즘에 더 적합하다.

④ 기계 학습 기술을 연동하는 프로토타입을 제작하려고 샌드박스를 제공한다.

③ 복잡한 문제보다는 간단한 문제를 해결하는 알고리즘에 더 적합하다.