목록Study_exam/빅데이터 컴퓨팅 기술 연습문제 (8)
안녕하세요
01 국내의 빅데이터 기술 개발 현황을 서술하시오. 02 국외의 빅데이터 기술 개발 현황을 선진국 중심으로 기술적 응용 관점에서 서술하시오. 03 빅데이터 산업체 중 국외 유명 산업체의 기술적 동향을 서술하시오. 04 빅데이터 산업체 발전 방향을 국내 포털 사이트 및 기술 개발 산업체의 관점에서 제시하시오. 05 국내외 국가 공공기관에서 빅데이터 활용 사례를 나열하시오. 06 인간생활의 헬니스 관점에서 활용 사례들을 조사하시오. 07 빅데이터 기술이 과학적 발전에 어떠한 영향을 미쳤는지 설명하시오. 08 앞으로의 빅데이터가 삶의 질을 높이려면 어떤 방향으로 나아가야 하는지 다양한 관점에서 작성 해 보시오. 09 현 시점에서 공공·정부·과학 분야 내의 다양한 응용 분야 중 빅데이터를 접목시켰을 때 높은 경..
01 빅데이터 플랫폼 요소 기술을 설명하고 각 요소 기술의 예를 조사하시오. • 빅데이터 수집 및 정제(Cleaning) • 빅데이터 저장 및 관리 • 빅데이터 처리 • 빅데이터 분석 • 빅데이터 표현 02 빅데이터 플랫폼 구조를 설계하고 세부 컴포넌트를 설명하시오. 생략 03 가상화를 종류별로 설명하시오. • 서버 가상화 물리적 서버 하나에 여러 개의 가상 서버를 구축하는 방법으로 서버 하나에서각응용프로그램과 운영체제가 독립된 환경을 보장받으며 사용할 수 있도록 함. • 데스크톱 가상화 데스크톱 환경을 잘게 쪼개어 이기종의 가상 데스크톱 환경을 여러 개로 나누는 기술. • 스토리지 가상화 저장 장치의 실제 위치를 파악하지 않아도 여러 대의 이기종 저장 장치를 저장풀하나로 만들어 여러 기기 간 데이터 이..
01 메타데이터에서 얻은 정보들을 중요도, 빈발도, 인기도 등 주제에 따라 분석하여 글자 색상이나 굵기 등에 변화를 주어 시각적으로 표현하는 기술은? ① Clustergram ② Tableau ③ R ④ Tag Cloud ⑤ Processing ④ Tag Cloud 02 정제나 가공하지 않은 그래프 데이터를 네트워크 형태로 생성하고 이를 시각화하는 오픈소스기반의 Java 응용 프로그램으로, 주로 LikedIn의 데이터를 시각화하는 데 많이 활용하는 빅데이터 표현 기술은? Gephi (게피) 03 AT&T에서 개발한 Graph Viz를 간략하게 서술하시오. DOT 스크립트 언어를 사용하여 다이어그램을 그리려고 만든 오픈 소스 프로그램으로, CPL(Common Public License)을 사용. 데이터를 ..
01 텍스트 마이닝 기술을 설명하시오. 비·반정형 텍스트 데이터로 구성된 빅데이터에서 자연어 처리기술에기반하여 의미 있는 정보를 추출하는 기술. 02 오피니언 마이닝 기술을 설명하시오. 빅데이터에 포함된 어떤 사안이나 인물, 이슈, 이벤트에서 사람들의의견이나 평가 등을 분석하는 것. 03 리얼리티 마이닝 기술을 설명하시오. 데이터 마이닝 기술의 일종으로, 모바일 기기로 사용자의 인간관계, 행동 방식, 라이프 스타일 등을 분석함. ‘현실 마이닝’ 이라고도함. 04 계층적 군집화 기법을 설명하시오. 각 데이터 점을 하나의 군집으로 설정한 후 이들 간의 거리를 기반으로 하여 분할·합병해 가는 방식. 05 분할적 군집화 기법을 설명하시오. k개의 분할 영역을 결정하는 방법으로 유클리디안 거리(Euclidean ..
01. 대표적인 빅데이터 플랫폼인 하둡은 분산 처리하는 데 ( 맵 리듀스 (MapReduce) )를 사용한다. 이는 하나의 큰 데이터를 여러 조각으로 나눠 처리하는 ( 맵 (Map) ) 단계와 처리된 결과를 하나로 취합하여 최종 결과를 도출해 내는( 리듀스 (Reduce) )단계로 구성되어 있다. 02. 데이터 처리 언어 프레임워크로 하둡에서 쉽게 데이터를 분석할 수 있도록 고수준 프로그래밍 환경을 제공하는 기술을 모두 고르시오. ① EC2 ② Pig ③ Chukwa ④ HDFS ⑤ Hive ① EC2는 아마존 웹 서비스에서 제공하는 클라우드 컴퓨팅 인프라이다. 데이터 처리 언어 프레임워크나 고수준 프로그래밍 환경을 제공하는 기술은 아니며, EC2 인스턴스를 이용하여 다양한 애플리케이션을 실행할 수 있다..
01. RDBMS와 NoSQL의 차이점을 CAP 이론을 이용하여 설명하시오. RDBMS(Relational Database Management System)과 NoSQL(Not Only SQL)은 데이터를 저장하고 처리하기 위한 서로 다른 방식의 데이터베이스 시스템이다. CAP 이론은 분산 시스템에서 일관성(Consistency), 가용성(Availability), 네트워크 분할 허용성(Partition tolerance)의 3가지 속성 중 2가지만을 보장할 수 있다는 것을 말한다. 먼저, RDBMS는 일관성(Consistency)과 네트워크 분할 허용성(Partition tolerance)을 보장한다. 일관성을 보장하기 위해 ACID 트랜잭션(Transaction)을 사용하며, 데이터를 정규화하여 관계..
01. 다음 중 로그 수집용 환경이 아닌 것은? ① Flume ② Chukwa ③ Scribe ④HDFS Flume, Chukwa, Scribe는 HDFS를 로그 데이터의 데이터 싱크로 활용하는 로그 수집 및 배포 프레임워크이다. HDFS는 하둡 분산 파일 시스템으로, 데이터 저장을 위한 시스템이다. 02. 아파치에서 2009년에 시작한 SQOOP 프로젝트를 설명하시오. 기존 RDBMS 에서 하둡으로 데이터를 이전하려고 시작한 프로젝트이다. JDBC인터페이스를 사용하므로 MySQL, PostgreSQL, 오라클 등 다양한 데이터베이스 시스템을 지원한다. 아파치 하둡 기반 프로젝트인 Hive, Pig, Hbase 등과도 호환이 잘되어RDMS와 NoSQL 간의 데이터 연동에 많이 사용된다. 03. Linke..

01. 정보 기술의 패러다임을 PC 시대, 인터넷 시대, 모바일 시대, 스마트 시대로 구분하여 패러다임 기술과 핵심 기술 이슈를 설명하시오. PC시대 인터넷시대 모바일시대 스마트시대 패러다임 기술 디지털화, 전산화 온라인화, 정보화 소셜화, 모바일화 지능화, 개인화, 사물정보화 핵심 기술 이슈 PC, PC통신, 데이터베이스 초고속 인터넷, www, 웹 서버 모바일 인터넷, 스마트폰 빅데이터, 차세대 PC, 사물 네트워크 정보 기술의 패러다임은 PC 시대, 인터넷 시대, 모바일 시대, 스마트 시대로 구분할 수 있다. PC 시대의 패러다임 기술은 디지털화와 전산화이며, 핵심 기술 이슈는 PC, PC통신, 데이터베이스이다. 인터넷 시대의 패러다임 기술은 온라인화와 정보화이며, 핵심 기술 이슈는 초고속 인터넷,..