1) 데이터 유형
(1) 데이터의 정의
- 데이터는 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실(Fact)
- 추론, 예측, 전망, 추정을 위한 근거(basis)로 기능
- 다른 객체와의 상호 관계 속에서 가치를 찾음
(2) 정성적 데이터 (qualitative data)
- 자료의 성질, 특징을 자세히 풀어쓰는 방식
- 언어, 문자로 기술된 비정형 데이터 형태로 저장, 분석에 시간과 비용이 필요
- ex. 설문조사의 주관식 응답, SNS에 올린 글, 기상특보 등
(3) 정량적 데이터 (quantitative data)
- 수치, 기호, 도형 등으로 표시할 수 있으며 데이터양이 증가하더라도 저장, 분석이 용이
- ex. 지역별 온도, 풍속, 강우량 등
2) 암묵지와 형식지의 상호작용
(1) 암묵지 vs. 형식지
- 암묵지 : 학습과 오랜 체험, 시행착오를 통해 개인에게 습득되는 무형의 지식으로 공유되기 어려움
ex. 김장김치 담그기, 자전거 타기 등
- 형식지 : 교과서, 매뉴얼, 비디오, DB 등 외부로 표출되어 여러 사람이 공유할 수 있는 형상화된 지식
ex. 회계, 재무 관련 대차대조표에 요구되는 지식에 대한 매뉴얼 등
(2) 암묵지와 형식지의 4단계 지식 전환 모드
- 1단계 공통화 (암묵지 - 암묵지) : 암묵적 지식 노하우를 다른 사람에게 알려주는 것
- 2단계 표출화 (암묵지 - 형식지) : 암묵적 지식 노하리를 책이나 교본 등 형식지로 만드는 것
- 3단계 연결화 (형식지 - 형식지) : 책이나 교본에 자신이 알고 있는 새로운 지식을 추가하는 것
- 4단계 내면화 (형식지 - 암묵지) : 만들어진 책이나 교본을 보고 다른 직원들이 암묵적 지식(노하우)를 습득하는 것
* 참고 자료
지식경영
- 개인의 암묵지와 집단에서의 형식지가 나선형의 형태로 회전하면서 생성, 발전, 전환되는 지식의 발전을 기반으로 한 기업의 경영형태
3) 데이터와 정보의 관계, 데이터베이스(DataBase)
(1) DIKW
- Data(데이터) : 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호
- Information(정보) : 데이터의 가공 및 상관/연관관계 속에서 의미가 도출된 것
- Knowledge(지식) : 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
- Wisdom(지혜) : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 아이디어
- Data → Information → Knowledge → Wisdom으로 발전하는 계층 구조
(2) 데이터베이스 (DataBase)의 특징
- 데이터베이스는 "통합, 저장, 공용, 변화되는 데이터"를 특징으로 함.
- 통합 데이터(Integrated) : 데이터베이스에서는 같은 내용의 데이터가 중복되어 있지 않다는 의미
- 저장 데이터(Stored) : 자기디스크나 자기테이프 등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장되는 것을 의미
- 공용 데이터(Shared) : 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용하는 것을 의미
- 변환되는 데이터(Changed) : 새로운 데이터의 추가, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야 한다는 것을 의미
(3) 데이터베이스 관리 시스템 (DataBase Management System)
- 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 처리해 주고 데이터베이스를 관리해 주는 소프트웨어
(4) RDBMS (Relational DataBase Management System, 관계형 데이터베이스 관리 시스템)
- 정형화된 테이블로 구성된 데이터 항목의 집합체
- ex. MySQL(오픈소스 RDBMS), Oracle DataBase(상용 RDMBS)
* 참고 자료
SQL (Structured Query Language)
- RDBMS의 데이터 관리를 위해 설계된 특수 목적 프로그래밍 언어로 챔벌린과 레이먼드 F. 보이스가 처음 개발하였음.
(5) ODBMS (Object-oriented DataBase Management System, 객체지향 데이터베이스 관리시스템)
- 객체들을 생성하여 계측에서 체계적으로 정리하고,
다시 계층들을 하위 계층이 상위계층으로부터 속성과 방법들을 물려받을 수 있는 DBMS
- 복잡한 데이터 구조를 표현 및 관리하는 DBMS
(6) 데이터베이스 설계 절차
- 요구조건분석 → 개념적 설계 → 논리적 설계 → 물리적 설계
- 요구조건분석 : 데이터베이스 사용자, 사용목적, 사용범위, 제약조건 등을 정리한 명세서를 작성
- 개념적 설계 : E-R 모델, 정보를 추상적 개념으로 표현하는 과정으로 DBMS 독립적 E-R 다이어그램을 작성
- 논리적 설계 : 자료를 컴퓨터가 이해할 수 있도록 특정 DBMS의 논리적 자료 구조로 변환
- 물리적 설계 : 논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정
* 참고자료
- E-R 모델 (개체-관계 모델, Entity-Relationship Model)
현실세계에 존재하는 데이터와 그들간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위해서 가장 널리 사용되고 있는 모델로,
개념적 모델링의 대표적인 도구
(7) NoSQL (Non-SQL, Non-Relational...)
- 관계형 DB보다 덜 제한적인 일관성 모델을 이용하는 데이터의 저장 및 검색을 위한 매커니즘 제공
- 디자인 단순화, 수평적 확장성, 세세한 통제 등 기존 RDBMS의 특성 외 부가적인 특성을 지원
- 대표 저장방식 : Mongo DB, Apache HBase, Redis
Mono DB - BSON(Binary JSON) 형태로 데이터를 저장하여 여러 서버에 분산 저장 및 확장이 용이, C++로 작성됨
Apache HBase - 하둡 플랫폼을 위한 공개 비관계형DB, 자바로 작성됨
Redis - Remote Dictionary Server 의 약자, "키-값" 구조의 비정형 데이터를 저장하고 관리하기 위한 오픈소스 기반 비관계형 DBMS