(컴퓨터 개론) 10-3 객체지향 DB와 빅데이터

업데이트:
2 분 소요

컴퓨터 개론 - 객체지향 DB와 빅데이터

1. 객체지향 DB

  • 객체를 기반으로 객체의 특성인 메소드, 클래스, 캡슐화와 상속등을 활용한 객체지향 데이터베이스의 특성

1) 객체지향 DB의 개념

(1) 객체와 메소드

  • 객체지향 데이터베이스는 현실 세계의 개체(Entity)를 객체지향 패러다임의 객체(Object)로
    규정하고 객체 식별자, 속성(애트리튜브), 메소드, 클래스, 클래스 계층 및 상속, 복합 객체 개념을 모두 포함
  • 연산은 모두 메세지를 통해 수행
  • SQL과 유사한 OQL(Obejct Query Language)

alt

(2) 클래스 계층과 상속 (슈퍼클래스와 클래스)

alt

(3) 객체-관계 데이터베이스(ORDB)

  1. 1990년대 후반, 관계형 데이터베이스에 객체 지향 개념이 통합된 객체-관계 데이터베이스가 제안
  2. ORDB는 관계, 질의어, 객체, 메소드, 클래스, 상속, 복합 객체를 지원
  3. ORDBMS를 스트웨어 회사에 따라 Universal DBMS라 부름

2) 멀티미디어 DB

(1) 멀디미디어 DB의 개념

  • 과거에는 멀티미디어 데이터(이미지, 사운드, 비디오, 텍스트/문서, 애니메이션, 그래픽 등)를
    외부 파일 형태로 저장
  • 멀티미디어 데이터의 양이 급증하면서 데이터베이스를 이용하여 저장, 검색, 관리해야 하는 단계
  • 관계형 데이터베이스: 정형화 데이터베이스 멀티미디어 데이터는 용이하지만 비정형화 데이터는
    내용의 수학적 특성이나 주요 특징(Features)과 유사도로 검색
  • 내용기반 검색(CBIR: Contents-Based Information Retrieval)

alt

2. 빅데이터와 데이터 분석

  • 여론조사, 통계, 의사결정 등에 수많은 자료가 생성되고 분석하는 기법을 빅데이터 처리기술

1) 빅데이터

(1) 빅데이터의 특성과 배경

  • 인터넷, 스마트폰, 소셜 미디어, GPS 등의 센서데이터, 디지털 카메라, 엄청난 양의 빅데이터가 생성되어 활용
  • 인터넷 속도의 증가와 SNS 발달
  • 프로세서 가격 하락과 처리속도의 가파른 증가 메모리 가격의 하락과 용량 증가

(2) 빅데이터 특성의 3V

  • Volume, Variety, Velocity

alt

(3) 빅데이터의 출현 배경

  • 소셜네트워크와 사물 간의 통신 증대로 데이터의 증가, 다양한 센서 등의 디바이스 증가로 빅데이터가 출현

(4) 빅데이터의 3요소 (자원, 기술, 인력)

alt

  • 디지털 정보량이 기하급수적으로 폭증하여, 2014년도 3.2EB(엑사바이트), 2020년에는 25EB → 5G의 필요성 대두
  • 1KB가 1page, 1MB가 1000p 책 1권, 1GB가 책 1000권, 1TB가 영화 1000편

alt

2) 빅데이터의 분석과 활용

(1) 빅데이터의 3요소(자원, 기술, 인력)

  • RDBMS는 일반적인 기업의 데이터 업무처리에 적합, 비구조적 데이터로 구성된 빅데이터에는 부적합
  • 비구조적 데이터베이스는 분산되어 저장, 처리되므로 항상 데이터 간의 일관성 유지가 어려움
  • 이러한 이유로 NoSQL(‘Not only SQL’) 데이터베이스가 따로 개발되어 빅데이터 분석에 사용

(2) 데이터 웨어하우스와 데이터 마이닝

  • 내부 또는 외부 데이터베이스로부터 ETL(Extract/Transform/Load)도구를 사용하여 데이터 활용을 위한
    분석에 필요한 데이터들을 모아 놓은 저장소
  • 대규모 데이터처리를 복수의 노드에서 벙렬 처리
  • 행이 아니라 컬럼 단위로 처리하여 분석기법 향상
  • 데이터량이 급증 되도 저비용으로 스케일 아웃

alt

(3) 데이터 웨어하우스 (Data Warehouse)

  • 빅데이터의 특징인 3V를 지원하기 위하여 하둡과 NoSQL 데이터베이스는 ‘데이터 양(Volume)’과
    ‘다양성(Variety)’을 지원, 발생 빈도를 의미하는 ‘속도(Velocity)’는 이러한 기술로 감당할 수 없음
  • 스트림 데이터 처리에서는 데이터를 실시간으로 처리하기 위하여 입력된 데이터를 하드디스크에 저장하지
    않고 메모리에서 데이터를 처리, (활용 분야) 주식의 실황 데이터, 교통상황 데이터, 센서에 의한 실시간 감시,
    POS 데이터의 수집 및 분석 등

(4) 데이터 분석 기술

  • 기계 학습이나 데이터 마이닝 기술 적용
  • 대량의 데이터를 분석하여 데이터 속에 내재되어 있는 변수 사이의 상호관계를 규명하여 일정한 패턴을 찾는 기법
  • 클러스터링, 신경만 네트워크, 회귀 분석, 결정 트리 및 연관분석 등의 방법으로 적용
  • 자연어 처리 기술을 이용하여 대용량 소셜 미디어의 테긋트 데이터로부터 유용한 정보 추출

(5) 빅데이터의 활용

  • 검색 엔진, 패턴 인식, 번역 서비스, 음성 인식 서비스 등의 분야
  • 전자상거래의 추천 시스템, 사용자 행동 분석, 고객 구매 행동 예측
  • 에너지 소비패턴 분석, 고객의 구매행동 예측 및 마케팅, 위치정보 등

댓글남기기