온라인 거래처리(OLTP ; OnLine Transaction Processing)

여러과정(또는 연산)이 하나의 단위 프로세스로 실행되도록 하는 프로세스

ex) 과정 1 : 철수의 계좌에서 50,000원을 감소시킨다
     과정 2 : 현금을 인출해 준다.
     과정 3 : 명세표를 출력해준다
     이와같은 과정은 하나의 단위로 이루어져야 함

트랜잭션 : 데이터베이스 일관성을 보존하는 프로그램 실행단위


트랜잭션의 속성

  1. 원자성 : 하나의 트랜잭션을 구성하는 단위작업들은 모두 수행되든지 아니면 모두 수행되지 않아야 함
  2. 일관성 : 하나의 트랜잭션이 수행되었을 때, 그 트랜잭션은 데이터베이스 일관성을 보전해 주어야 함
  3. 고립성 : DBMS가 여러 트랜잭션을 동시에 수행시키는 경우에도 트랜잭션들은 서로 상호 간섭을 받지 않아야 함
  4. 지속성 : 트랜잭션이 정상적으로 완료되었다면 설사 해당 변경 내용이 디스크상에 반영되기 전에 시스템 장애가 일어나더라도 트랜잭션의 완료 효과는 계속적으로 유지 되어야 함

트랜잭션 명령문

  • BEGIN TRAN[SACTION] [<트랜잭션 이름>] : 트랜잭션 시작 명시
  • COMMIT TRAN[SACTION] [<트랜잭션 이름>] : 트랜젹션의 성공적인 종료 명시
  • ROLLBACK TRAN[SACTION] [<트랜잭션 이름>] :  트랜젹션의 비성공적인 종료 명시
  • SAVE TRAN[SACTION] [<저장지점 이름>] : 트랜잭션 중간에 저장지점 설정

온라인 분석처리(OLAP ; OnLine Analytical Processing)

다차원으로 이루어진 데이터로부터 통계적인 요약정보를 제공할 수 있는 기술


OLTP 와 OLAP의 차이점

  • OLTP :  현재 업무의 효율적인 처리에만 관심이 있음
  • OLAP : 의사결정에 도움되는 데이터 분석에 관심이 있음

데이터 웨어하우스(data warehouse) : 오랜기간동안 기업의 업무 과정을 통해 수집된 데이터를 대규모의 통합 데이터베이스로 구축해 놓은 것


OLAP 데이터 모델

  • 사용자들에게 데이터의 흐름을 다차원적인 구조로 빠르게 보여주면서 몇몇 미리 계산된 값들을 제공함으로서 데이터에 대한 정보를 쉽게 제공해주는것을 목적으로 함
  • OLAP 데이터 모델에서 정보는 차원과 관측된 데이터로 구성되어 있는 데이터 큐브 형태로 표현됨
  • 큐브형태로모델링된 다차원 데이터는 주로 스타 스키마라는 관계형 데이터베이스 설계 기법을 이용하여 표현함

스타스키마

  • 사실테이블 : 분석을 요하는 변수 차원의 항목들을 포함하고 있는 테이블
  • 차원테이블 : 사실테이블의 변수들을 살펴보기 위한 범주형 속성의 계층적 또는 비계층적 정보를 포함하고 있는 테이블

데이터 마이닝

대용량의 데이터 안에 숨어있는 패턴을 찾아내는 작업

Posted by 알 수 없는 사용자
,
OLAP은 OnLine Anaytical Processing의 약자로 사용자로 하여금 데이터를 다른 관점으로 쉽게, 또한 선택적으로 추출하고 바라볼 수 있게 해주는 것을 의미한다.

일례로 어떤 사용자는 분석될 데이터로서 9월 중 같은 제품과의 매출액을 비교하기 위해 7월 중에 서울에서 팔린 모든 회사의 농구공 제품 판매량을 보여주는 스프레드시트를 요청함으로써, 같은 시기동안에 부산에서 팔린 다른 제품들과 비교해 볼 수 있다.

이러한 종류의 분석을 쉽게 하기 위해 OLAP 데이터는 다차원 데이터베이스 내에 저장된다. 관계형 데이터베이스가 2차원이라고 생각할 수 있는데 반해, 다차원 데이터베이스란 각 데이터 속성(제품, 매출지역, 기간 등과 같은)이 각기 별개의 차원으로서 간주되는 것이다.

OLAP 소프트웨어는 차원들 간의 교점을 찾아내어, 그것들을 표시할 수 있다. "기간" 등과 같은 속성들은 세부속성으로 나뉘어질 수 있다.

OLAP은 데이터 마이닝, 또는 이전에는 판별하지 못했던 데이터 항목들 간의 상관관계를 찾아내는 일 등에 활용될 수 있다.

OLAP 데이터베이스는 데이터웨어하우스 만큼 클 필요는 없는데, 왜냐하면 추이분석을 위해서 모든 트랜잭션 데이터가 필요한 것은 아니기 때문이다. ODBC를 사용하면, OLAP을 위한 다차원 데이터베이스를 만들기 위해 기존의 관계형 데이터베이스로부터 데이터를 가져올 수 있다.


관련 사이트

출처 - http://blog.naver.com/4321875.do?Redirect=Log&logNo=140015504247

-------------------

BIOLAP의 차이점

BI는 DW나 OLAP이 아니다.

현재 가장 잘못 쓰이고 있는 용어 중 하나가 BI 라는 분야이다. 지금까지 BI에 대한 정의를 자세히 보면, 좁게는 DW (Data Warehouse) tool 즉 데이터 추출, 모델링, OLAP 툴들을 의미하며, 좀 더 확장해서는 ABC, BSC를 구축하는 솔루션을 일컬어 BI 라고 하고 있다.


DW를 ‘데이터의 인프라’, 또는 ‘정보의 인프라’라고 정의한 바 있다. DW는 데이터를 보관하고 활용할 수 있도록 하는 기본 설비라는 뜻이며 그 이상도 그 이하도 아니다라고 했다. 이는 DW의 활용이라는 측면, 즉 다양한 DW 애플리케이션에 대한 기능을 DW의 기능으로 혼돈하지 말자는 뜻이 담겨있다. 다시 말해서, DW는 세 말의 구슬을 담을 수 있는 그릇에 불과한 것이다.

OLAP은 DW에 있는 데이터를 다차원적으로 아주 상세히 표현해 줄 수 있다. 그것은 과거데이터를 다양한 각도에서 분석을 해 줄 수 있다. OLAP의 다차원 분석은 ‘과거 데이터에 대한 다양한 집계’라고 할 수 있다.

그러나, 기업 경영자가 원하는 것은 비즈니스에 대한 결과로서 과거의 집계도 중요하지만, 앞으로 어떻게 될 지에 대해서 더욱 관심이 있다. 한 통신회사의 CEO는 임원회의에서 ‘우리 회사의 매출 현황에 대한 다양한 각도의 분석은 중요하다. 그러나, 내가 관심 있는 것은 다음 달, 우리회사의 매출, 6개월 후의 매출이며, 그것이 올라가고 있는지 내려가고 있는지 미리 알고 싶은 것이다. 만일 매출이 줄어들 것이라면, 그 원인을 미리 알아서 사전에 매출 감소를 방지하는 것에 내 관심이 있다.’라고 했다. 아주 당연한 이야기 이다.

모든 CEO의 관심은 미래에 있다. 단순한 미래의 매출액이라기 보다는 매출 증감의 원인을 미리 알고 싶고, 그 결과에 대한 치료 방법을 알고 싶은 것이다. 바로, BI는 경영자에게 기존 데이터를 근간으로 미래를 예측하고 그에 대한 처방을 제시하는 데 있다.


기업의 데이터는 사장되고 있다

기업이 비즈니스를 하면서 쌓이는 수 많은 데이터들이 있다. 이러한 데이터는 현장의 생생한 내용을 전달하는 것으로 얼마든지 분석하면 그 안에 경영에 매우 필요한 노하우를 뽑아낼 수 있다. 사실 현장에서 근무하는 실무자들은 이미 알고 있다. 그러나, 그들은 자기의 좁은 영역만 알고 있으며, 경영인들에게 현장에서 일어나는 시시콜콜한 이야기를 피력하는 것을 꺼려하고 있다. 그 생생한 경영 현장은 수치화되어 데이터로 올라가고 이는 DW에 통합되어 경영자는 모든 비즈니스 현장의 모습이 사라진, 단지 데이터의 합계를 볼 뿐이다.

BI는 추상적인 숫자로 그 모습이 사라지고 있는 경영 현장의 생생한 내용들을 경영인들에게 다시 돌려주는 작업을 해야 한다. 이를 위해서 필요한 모든 IT 기술을 동원하여 종합적인 솔루션을 구현해야 한다. 이것이 현재 BI가 가야 할 길이다. 기업 경영에 필요한 정보를 제공해 주는 것이 BI가 가야 할 길이다.

Posted by 알 수 없는 사용자
,
1. 전략적 경영시스템 구축 방향성

개별시스템이 독립적인 분석정보를 제공하고 있고, EDW를 중심으로 전사 통합적인 관리체계를 수립하여 데이터간 중복을 제거하고 효과적인 관리가 가능토록 개선해야 함.

  - As-Is

    * 시스템간 데이터의 흐름이 복잡하게 유지되며, 독립적인 목적에 따라 데이터간 통합이 이루어지고 있음.

  - To-Be

    * EDW를 중심으로 통합적인 공통요건 소화.

  - 시사점

    * 복잡한 인터페이스의 단순화 방안이 필요함.

      : DW의 Feedback 계층 생성을 통해 전사 차원의 정보공유 확대 필요함.

    * EDW를 활용하여 통합정보시스템의 Data Hub 역할 수행 필요.

      : EDW를 활용하여 데이터간 HUB를 구축, 효과적인 연계가 가능토록 구성해야함.


2. BI 발전 방향성 - 발전방향

최근 정보계는 BI 프레임워크상의 각 영역별로 사용자 확대, 화면/단말 통합, 기능/툴 통합, 데이터 통합을 중심으로 발전하고 있음. 전략적 경영시스템 구축을 위해서, BI 프레임워크를 구축하여 전략적 경영시스템을 효과적으로 지원할 수 있도록 하여야 함.


  - BI 프레임워크

    * 경영자, 고급분석가, 일반사용자

    * 경영정보 포털

    * EUC 도구(OLAP, 리포팅, 데이터마이닝), 분석 애플리케이션(수익관리, 성과관리, 리스크관리)

    * 데이터 서비스(DW :Data Warehouse, DM :Data Mart, ODS :Operation Data Store)

    * 데이터 흐름(ETL :Extraction Transformation Loading, EAI :Enterprise Application Integration)


  - BI 발전방향

    * 사용자 확대 : 단위조직 --> 전사차원, IT중심에서 사용자 중심으로.

    * 화면/단말 통합 : 단위업무 중심에서 사용자 중심의 화면구성, 전사관점의 화면표준 적용

    * 기능/툴 통합 : 전사표준 EUC(End User Computing) 도구 적용(OLAP, Report), 유사/중복 분석업무 기능 통합

    * 데이터 통합 : 전사관점의 데이터 통합, TOOL 기반하의 데이터 흐름관리 일원화.


3. BI 발전 방향성 - BI 동향

기존 BI 및 DW 분야는 기존 DW를 기반으로, 실시간정보의 확대, 전사차원의 정보 통합, 사용자 활용환경을 강화하는 형태로 추진되고 있음.

  - 정보 제공주기

    * 일/월 단위의 Batch 정보 --> 실시간/Batch 방식의 병행

  - 제공정보 범위

    * 시스템 단위위주의 정보통합 --> 전사적 차원의 정보통합

  - 정보제공 방식

    * 소극적 사용자 환경 --> 사용자 활용 환경 강화


4. BI 데이터 아키텍처 - ODS의 역할

ODS의 본질적인 역할은 운영데이터 통합, 속보성 정보 제공, Feedback정보 구축, Staging Area 구축 및 연관시스템 인터페이스의 기능을 수행함.

  - ODS 정의

    * 주체지향성 : 주제중심적으로 데이터 수집/통합/변경

    * 통합성 : 산재되어 있는 데이터 일괄적으로 취합

    * 적시성 : 현재의 속성 및 값으로 역할 수행

    * 휘발성 : 자료가 계속적으로 Update되며 관리

    * 상세성 : 가장 상세하고 동적인 자료 제공


  - ODS 역할

    * 운영데이터 통합 :

      . 운영데이터를 표준화하고 주제영역별로 통합함으로써, 운영업무 지원

      . 속보성 자료 생성의 기초 데이터인 계정계 대이터를 1일~3개월 축적

    * 속보성 정보 제공:

      . 업무적 요건에 의거하여 상시감사 등의 속보성정보 실시간 제공

      . 주로 계정계에서 제공하던 준 실시간 정보조회를 계정계의 부하를 줄이면서, 신속성 확보

    * Feedback 정보 구축:

      . 분석성 Feedback 데이터 축적

      . 준 실시간성 조회와 함께 운영차원에서 필요한 분석자료에 대하여 EDW 등으로부터 Feedback 자료를 넘겨 받아 연관시스템에 제공

    * DW Staging 기능 :

      . 실시간으로 확보된 계정데이터를 DW에 신속하게 제공하는 역할 수행

      . EDW 데이터 변환 간편성 추구, 계정계와 DW간 코드체계 변환 역할


EDW는 각 레이어별로 주제영역, 요약집계, Feedback, 분석마트, 단위업무 마트별 정보 역할을 가지고 있음. 분석정보를 기반으로 각 레이어의 특성에 따라 적용해야 함.

  - 주제영역 : 분석업무 지원을 위한 주제영역 기반 통합관리, 단위 경영정보 업무, EUC분석을 위한 데이터 원천 활용

  - 요약집계 : 업무별 일/월 계수 산출 작업수행

  - Feedback : 경영정보 데이터 중 전사차원의 공유가 필요한 데이터를 관리

  - 분석마트 : 분석 주제 중심으로 다차원 모델로 구성

  - 단위업무마트 : 경영정보시스템 데이터 추출을 위한 단위업무별 작업 데이터를 관리


5. BI 데이터 아키텍처 - 접근방법

BI 구축을 위해서는 DW 주제영역 상세화, DM 주제영역 정의 접근방법은 아래와 같음.

  - DW 주제영역 상세화

    * 현행 DW 데이터 아키텍처 분석 : 현행 주제영역 분류체계 및 관리데이터 현황 파악

    * To-Be 주제영역 분류 : 데이터 활용성 및 통합성을 고려한 To-Be 상위 주제영역 분류

    * To-Be 주제영역 상세화 : 원천 데이터별 주제영역 분류

  - DM 주제영역 정의 접근방법

    * 요구사항 이해(정보성 보고서 통합 요건) : 목적성DB의 분석정보 요건 이해

    * 통합분석 주제영역 정의 : 분석정보 요건 및 분석 요구사항 구현을 위한 분석주제 요건 정의

    * 주제영역별 주요정보 정의 : 주제요건별 주요 정보 구성안 정의

Posted by 알 수 없는 사용자
,