(2021년 교재로 공부)

 

■ 빅데이터의 주요 특징

  - Volume : 규모의 증가

  - Variety : 다양성

  - Velocity : 처리속도

  - Value : 가치

  - Veracity : 정확성

 ※ 추가로 Validity(유효성)와 Volatility(휘발성) 까지 7V로 표현하기도 함

 

빅데이터의 유형

  - 정형 데이터(Structured Data)

    · 업무 처리, 매개 거래, 로그 데이터, 시계열 데이터 등

  - 반정형 데이터(Semi-Structured Data)

    · 데이터 내부에 데이터 구조에 대한 메타 정보 포함 (HTML, XML, JSON, RSS, 웹로그 등)

  - 비정형 데이터(Unstructured Data)

    · SNS, 고객 서비스, 품질보증, 이메일 등 - 일반 데이터

    · 온도, QR코드, RFID, GPS 등 - 센서 데이터

    · 오디오, 정지화상, 비디오, GPS 매칭 등 - 새로운 데이터 유형

 

■ 빅데이터 시스템 조직 및 운영 체계

  - 조직

    · 시스템 운영을 위한 시스템 엔지니어

    · 데이터베이스 엔지니어

    · 소프트웨어 엔지니어 조직 구성

    · 분석결과의 사용자, 데이터 분석팀, 데이터 시스템 운영팀 사이의 협업을 원활하게 하기 위한 조직 구성

  - 운영체계

    · 시스템 상시 모니터링 체계

    · 장애 발생 시 장애 대응 시나리오 체계

    · 데이터 복구 체계

    · 주기적인 백업 체계 및 복구 테스트 수행

    · 정보보호 규정을 고려한 운영 체

 

■ 빅데이터 분석 기획 능력 (NCS, 국가직무능력표준에서의 정의)

  - 대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로

    정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업무

    · 도메인 이슈 도출하기

    · 분석목표 수립하기

    · 프로젝트 계획하기

    · 보유데이터 자산 확인하

 

 

■ 데이터 마이닝의 개념

  - 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기법

  - 데이터 마이닝 기법의 활용 사례

    · 분류(Classification)

    · 군집화(Clustering)

    · 연관성(Association) : 동시에 발생한 사건들 사이의 관계 정의 (인터넷 쇼핑몰 장바구니에 있는 상품들 사이의 연관성)

    · 연속성(Sequencing) : 특정 기간에 걸쳐 발생하는 관계 규명 (특정 기간 내 동일 상품에 대한 반복 구매 성향 분석)

    · 예측(Forecasting) 

 

(머신러닝, 딥러닝 관련 내용 Skip)

 

★ 개인정보보호 법률 관련 Part는 시험 전에 한번 보고 가기

 

 

'지성 > IT' 카테고리의 다른 글

[빅데이터분석기사] 공부 3일차  (0) 2023.03.13
[빅데이터분석기사] 공부 2일차  (0) 2023.03.12

+ Recent posts