본문 바로가기

정보기술의 샘터........о♡/DB & 데이타마이닝

데이타베이스와 데이타웨어하우스

데이타베이스와 데이타웨어하우스
1. 정보자원관리
2. 데이타 저장 및 처리방식
3. 데이타베이스
4. 데이타웨어하우스
5. 데이타마이닝


1. 정보자원관리(Information Resource Management, IRM)
- 기업경영에 필요한 정보를 자원으로 관리하는 것

정보자원관리의 개념에 대한 요점 정리
①정보는 조직의 전략적 자원의 하나로 인식되어야 함.
②정보자원에 대한 책임소재를 명확히 규정하고 그와 관련된 권한과 의무의 계통을 상세히 정의해야 함.
③정보자원관리계획은 조직의 전략계획과 밀접하게 연결되어 있어야 함.
④여러 가지 정보관련기술은 그 생산성의 극대화를 위해서 통합적으로 관리되어야 함.
⑤정보자원관리에서는 조직의 모든 구성원 각자가 효과적인 정보생산자인 동시에 효과적인 정보소비자가 될 수 있도록 노력해야 함.
➡ 정보자원관리의 실천적 목표
    : 조직 내에서 서로 다른 과정을 거쳐 생성․발전되어 와서 다양한 형태로 각각 존재하는 정보관련기술들을 통합적으로 관리함으로써 정보활용의 효율성과 효과성을 극대화하고자 하는 것

CIO(Chief Information Officer:정보담당중역)
•기업의 정보기술과 정보시스템에 관한 모든 책임을 지고 있는 중역으로 기업의 전략 및 목적을 달성하기 위한 정보전략계획을 수립하고 정보 자원을 관리하며 정보시스템 개발과 유지에 관한 총괄적 책임과 권한을 가진 경영진의 한 사람



2. 데이타 저장 및 처리방식
1) 데이타 저장방식
(1) 자료 표현 코드



(2) 자료의 계층구조






2) 파일의 구성과 접근방법
(1) 순차접근 (sequential access)
레코드가 기본필드에 의해 차례대로 저장장치에 순차적으로 저장
ex> 마그네틱 테이프
(2) 색인순차접근 (sequential access)
레코드를 저장된 순서대로 접근할 수도 있고 , 직접 원하는 레코드에 접근할 수도 있는 접근방식
(3) 직접접근 (random access)
파일 내에 저장된 레코드의 저장순서와는 관계없이 임의로
특정 레코드에 접근하는 방식 임의 접근방식

3) 파일처리방식의 문제점
①데이타의 중복
②불일치한 데이타 (일관성 문제)
③경직성
④제한된 데이타 공유
⑤표준 적용의 부재
⑥과다한 프로그램 유지 노력

데이터베이스 접근방법


3. 데이타베이스
1) 데이타베이스의 개념
효과적인 데이타 관리를 위하여 논리적으로 관계되어 있는 레코드와 파일을 체계적으로 통합한

* 데이타베이스 접근방법의 장점
1)데이타 중복의 최소화
데이타의 일관성
데이타의 통합
데이타의 공유
2)응용 프로그램 개발의 용이
데이타의 독립성

2) 데이타베이스의 구성요소
하드웨어 , 소프트웨어, 데이타, 사람


1) 하드웨어
※컴퓨터 ,디스크,터미널,프린터,테이프 드라이브, 네트웍 하드웨어
2) 소프트웨어
※데이타베이스 관리시스템(DBMS) : DB를 관리하는 S/W
※응용프로그램 -특정한 업무처리를 위하여 DBMS의 기능을 이용하여 DB를 조작

데이타 정의어(Data Definition Language)
-데이타베이스 관리 시스템이 내부 스키마를 정의하는 언어
데이타 조작어
-데이타의 삽입, 삭제 및 갱신과 같은 조작을 하도록 하는 언어

3) 데이터
DB의 데이타는 논리적이고 효율적으로 구성되어야 함
※데이타 항목과 이들 사이의 관계는 조직의 기능과 업무에 대한 분석을 통하여 명확히 파악하고 정의되어야 함
DB는 사용자가 수행하는 업무 활동에 대한 사용자의 관점을 통합함
※적시에 정보를 제공할 수 있는 자원

4) 사람
DB관리자
시스템 개발자. . . . 시스템 분석가, 응용프그래머
사용자

3) 관계형 구조
2 차원 테이블의 형태로 표현
 행(row) : 레코드(column) : 속성



4. 데이타웨어하우스
1) 정의
운영 데이타베이스나 다른 데이타 원천에서 데이타를 넘겨 받아 필요한 데이타를 추출할 수 있도록 만든 데이타 풀(Data Pool)
데이타 웨어하우스의 데이타는 정보 생산이 단순하게 될 수 있는 구조로 저장
데이타 웨어하우스는 의사결정을 지원하는 통합되고, 주제 지향적, 시간 변수적, 그리고 비소멸성인 데이타베이스


2) 데이타웨어우스의 특성




3) 데이타웨어하우스의 구조





[ 데이타베이스와 데이타웨어하우스의 비교 ]



[ 데이타웨어하우스의 정보분석 도구 ]
데이타베이스시스템 (DBMS) 으로서 복잡한 질의 (Query)전통적인 SQL이용하여 효율적으로 지원
여러 가지 연산자들을 이용하여 특정 형태의 질의를 지원하는 시스템인 온라인 분석 (On-Line Analytic Processing, OLAP)이용
데이타 마이닝 (Data Mining) 혹은 탐색적 데이타분석 (Exploratory Data Analysis)지원하는 시스템으로 대규모 데이타베이스에서 데이타의 추세나 패턴을 찾도록 지원하는 시스템

5. 데이타마이닝
1) 데이타마이닝의 개념
데이타마이닝은 최소한의 사용자 관여로 데이타베이스의 데이타를 사용하여 지식 발견 작업을 수행토록 설계된 방법론
데이타를 분석하고, 데이타 관계성에 은폐된 문제 또는 기회를 발견 하고 , 발견된 것을 기초로 하여 컴퓨터 모델을 개발하고, 그 모델을 사용하여 비즈니스를 예측하는데 사용
데이타 마이닝 도구는 인공지능, 인공신경망, 연역적 규칙, 술어 논리의 알고리즘에 기초하여 분석을 시작하고 지식을 창조

2) 데이타마이닝의 특징
대용량 (Massive)관측 가능한 자료 (Observation D ata)다룸
컴퓨터 중심적 기법 (Computer-Intensive Method)
경험적 방법 (Adhockery Method)근거
일반화 (Generalization)초점
통계학 (Statistics), 컴퓨터과학 (Computer Science), 인공지능 (AI : Artificial Intelligence), 공학 (Engineering)같은 분야에서 개발된 특징

3) 데이타마이닝의 활용분야




4) 데이타마이닝과 데이타웨어하우스
정제된 데이타는 데이타마이닝의 필수적인 요소
마이닝된 결과의 질은 작업에 필요한 원시 데이타를 공급하는 데이타베이스의 질에 크게 의존
데이타웨어하우스는 마이닝에 필요한 형태의 정제된 데이타를 가지고 있으며 마이닝을 위한 좋은 기반을 제공
데이타웨어하우스에서 보다 새롭고 심도있는 정보를 찾아내기 위해서는 데이타마이닝을 도입하는 것이 바람직

[ 학 습 정 리 ]
※정보자원관리는 기업경영에 필요한 정보를 자원으로 관리하는 것이다.
CIO는 기업의 정보기술과 정보시스템에 관한 모든 책임을 지고 있는 중역이다.
※자료의 계층구조는 비트-바이트-워드-필드-레코드-파일-데이타베이스 로 이루어진다.
※데이타베이스는 효과적인 데이타 관리를 위하여 논리적으로 관계되어 있는 레코드와 파일을 체계적으로 통합한 것이다.
※데이타베이스 구성요소는 하드웨어, 소프트웨어, 데이타, 사람이다.
※데이타웨어하우스는 데이타 웨어하우스는 의사결정을 지원하는 통합되고, 주제 지향적, 시간 변수적, 그리고 비소멸성인 데이타베이스이다.
※데이타마이닝은 데이타를 분석하고, 데이타 관계성에 은폐된 문제 또는 기회를 발견 하고 , 발견된 것을 기초로 하여 컴퓨터 모델을 개발하고, 그 모델을 사용하여 비즈니스를 예측하는데 사용

'정보기술의 샘터........о♡ > DB & 데이타마이닝' 카테고리의 다른 글

브랜드 확장의 성공 사례  (0) 2008.12.18
데이타 마트  (0) 2008.12.05
데이타마이닝  (0) 2008.09.20
데이터 마이닝 알고리즘  (0) 2008.09.20
데이타마이닝 관련회사  (0) 2008.09.20