컴퓨터 개론 - 객체지향 DB와 빅데이터
1. 객체지향 DB
- 객체를 기반으로 객체의 특성인 메소드, 클래스, 캡슐화와 상속등을 활용한 객체지향 데이터베이스의 특성
1) 객체지향 DB의 개념
(1) 객체와 메소드
- 객체지향 데이터베이스는 현실 세계의 개체(Entity)를 객체지향 패러다임의 객체(Object)로
규정하고 객체 식별자, 속성(애트리튜브), 메소드, 클래스, 클래스 계층 및 상속, 복합 객체 개념을 모두 포함
- 연산은 모두 메세지를 통해 수행
- SQL과 유사한 OQL(Obejct Query Language)
(2) 클래스 계층과 상속 (슈퍼클래스와 클래스)
(3) 객체-관계 데이터베이스(ORDB)
- 1990년대 후반, 관계형 데이터베이스에 객체 지향 개념이 통합된 객체-관계 데이터베이스가 제안
- ORDB는 관계, 질의어, 객체, 메소드, 클래스, 상속, 복합 객체를 지원
- ORDBMS를 스트웨어 회사에 따라 Universal DBMS라 부름
2) 멀티미디어 DB
(1) 멀디미디어 DB의 개념
- 과거에는 멀티미디어 데이터(이미지, 사운드, 비디오, 텍스트/문서, 애니메이션, 그래픽 등)를
외부 파일 형태로 저장
- 멀티미디어 데이터의 양이 급증하면서 데이터베이스를 이용하여 저장, 검색, 관리해야 하는 단계
- 관계형 데이터베이스: 정형화 데이터베이스 멀티미디어 데이터는 용이하지만 비정형화 데이터는
내용의 수학적 특성이나 주요 특징(Features)과 유사도로 검색
- 내용기반 검색(CBIR: Contents-Based Information Retrieval)
2. 빅데이터와 데이터 분석
- 여론조사, 통계, 의사결정 등에 수많은 자료가 생성되고 분석하는 기법을 빅데이터 처리기술
1) 빅데이터
(1) 빅데이터의 특성과 배경
- 인터넷, 스마트폰, 소셜 미디어, GPS 등의 센서데이터, 디지털 카메라, 엄청난 양의 빅데이터가 생성되어 활용
- 인터넷 속도의 증가와 SNS 발달
- 프로세서 가격 하락과 처리속도의 가파른 증가 메모리 가격의 하락과 용량 증가
(2) 빅데이터 특성의 3V
- Volume, Variety, Velocity
(3) 빅데이터의 출현 배경
- 소셜네트워크와 사물 간의 통신 증대로 데이터의 증가, 다양한 센서 등의 디바이스 증가로 빅데이터가 출현
(4) 빅데이터의 3요소 (자원, 기술, 인력)
- 디지털 정보량이 기하급수적으로 폭증하여, 2014년도 3.2EB(엑사바이트), 2020년에는 25EB → 5G의 필요성 대두
- 1KB가 1page, 1MB가 1000p 책 1권, 1GB가 책 1000권, 1TB가 영화 1000편
2) 빅데이터의 분석과 활용
(1) 빅데이터의 3요소(자원, 기술, 인력)
- RDBMS는 일반적인 기업의 데이터 업무처리에 적합, 비구조적 데이터로 구성된 빅데이터에는 부적합
- 비구조적 데이터베이스는 분산되어 저장, 처리되므로 항상 데이터 간의 일관성 유지가 어려움
- 이러한 이유로 NoSQL(‘Not only SQL’) 데이터베이스가 따로 개발되어 빅데이터 분석에 사용
(2) 데이터 웨어하우스와 데이터 마이닝
- 내부 또는 외부 데이터베이스로부터 ETL(Extract/Transform/Load)도구를 사용하여 데이터 활용을 위한
분석에 필요한 데이터들을 모아 놓은 저장소
- 대규모 데이터처리를 복수의 노드에서 벙렬 처리
- 행이 아니라 컬럼 단위로 처리하여 분석기법 향상
- 데이터량이 급증 되도 저비용으로 스케일 아웃
(3) 데이터 웨어하우스 (Data Warehouse)
- 빅데이터의 특징인 3V를 지원하기 위하여 하둡과 NoSQL 데이터베이스는 ‘데이터 양(Volume)’과
‘다양성(Variety)’을 지원, 발생 빈도를 의미하는 ‘속도(Velocity)’는 이러한 기술로 감당할 수 없음
- 스트림 데이터 처리에서는 데이터를 실시간으로 처리하기 위하여 입력된 데이터를 하드디스크에 저장하지
않고 메모리에서 데이터를 처리, (활용 분야) 주식의 실황 데이터, 교통상황 데이터, 센서에 의한 실시간 감시,
POS 데이터의 수집 및 분석 등
(4) 데이터 분석 기술
- 기계 학습이나 데이터 마이닝 기술 적용
- 대량의 데이터를 분석하여 데이터 속에 내재되어 있는 변수 사이의 상호관계를 규명하여 일정한 패턴을 찾는 기법
- 클러스터링, 신경만 네트워크, 회귀 분석, 결정 트리 및 연관분석 등의 방법으로 적용
- 자연어 처리 기술을 이용하여 대용량 소셜 미디어의 테긋트 데이터로부터 유용한 정보 추출
(5) 빅데이터의 활용
- 검색 엔진, 패턴 인식, 번역 서비스, 음성 인식 서비스 등의 분야
- 전자상거래의 추천 시스템, 사용자 행동 분석, 고객 구매 행동 예측
- 에너지 소비패턴 분석, 고객의 구매행동 예측 및 마케팅, 위치정보 등
댓글남기기