데이터 공부의 첫 단계
데이터 분석에 대해 공부를 시작하게 되면 가장 먼저 접하는 것이 데이터 분석에 대한 개념이다.
데이터 분석에 대한 개념을 배우는 단계 중에서도 가장 기본이 되는 '데이터'에 대해 가장 먼저 배우게 된다.
이 단계를 대부분 '데이터에 대한 이해'라고 표현한다.
데이터에 대한 이해 단계에서는
1. 데이터가 무엇인지?
2. 데이터의 특징은 무엇인지?
3. 빅데이터는 왜 각광받게 되었는지?
4. 데이터에 의미를 부여한다는 것이 어떤 것인지?
등과 같은 것에 대해 배울 수 있다.
이 단계에서 배운 것들 중 내게 가장 기억에 남는 것은 '데이터 → 정보 → 지식 → 지혜'로 이어지는 데이터의 흐름 구조이다.
* Data - Information - Knowledge - Wisdom
이 흐름은 현대의 빅데이터 시대에 와서 정립된 것이 아니다. 고대부터 지금까지 주욱 이어져오는 오래된 정보의 흐름과 같다. 오랜 과거에도 단순한 현상은 존재했고, 이 현상들이 많은 사람들에 의해 정보로 수집되었다. 다양한 정보를 접한 이들은 지식을 쌓게 되었고, 이 지식을 현실에 접목해본 사람들은 지혜를 가지게 되었다.
이렇게 오래 전부터 내려져 온 정보의 흐름에 '데이터' 라는 단어가 추가되었음에도 그 흐름은 변화가 없었기 때문에 내게 아주 인상적으로 다가왔다. 더불어 이 흐름은 데이터 분석에 있어 매우 중요하다는 점도 흥미로웠는데, 데이터의 흐름과 데이터 분석의 목적이 같은 맥락에 있었기 때문이다.
데이터 분석의 목적
데이터 분석의 목적은 '어떤 문제를 해결하기 위해 데이터를 수집하고 가공하여 의미있는 결과를 발견하는 것'에 있다.
즉, 데이터 분석의 핵심은 '문제 해결' 과 '의미있는 결과를 발견'하는 것이다.
'의미있는 결과를 발견'한다는 말이 우리 말로는 조금 생경할 수 있다. 이를 이해하기 쉽게 영어로 번역해보면 'discovering insight '이다. 이 말을 우리말로 다시 해석해보면 '통찰'이다. '통찰'의 사전적 정의는 '예리한 관찰력으로 사물을 꿰뚫어 봄'이다. 이를 데이터 분석에 대입해보면, 데이터를 면밀히 관찰해서 특정 패턴 또는 관계를 발견하고, 이를 활용해서 산재한 문제에 대한 해결책을 제시하는 것이라 할 수 있다.
그렇다면 통찰, 'Discovering Insight' 는 어떻게 할 수 있을까?
앞서 말한 네 단계의 구조를 이해하고 있으면 통찰에 대한 방법을 어느 정도 이해할 수 있다.
앞선 데이터의 흐름에 다르면 데이터는 '데이터 → 정보 → 지식 → 지혜' 로 갈수록 가치가 높아진다.
간략히 어떤 관계를 가지고 있는 지 살펴보자.
첫 번째, 데이터(Data)는 어떤 사건, 현상에 대한 사실(Fact)이다.
이 단계에서 각 데이터는 단순 정보로만 존재할 뿐 어떤 의미나 관계 (aka. 맥락) 도 가지고 있지 않다.
예를 들어, A마트는 연필이 500원, B마트는 연필이 1,000원이라는 사실은 정보로 존재하지만 어떤 관계도 존재하지 않는다.
두 번째는 정보(Information)이다.
데이터에 맥락을 부여하면 정보(Information)로서 가치를 지니게 된다.
정보는 누가(who), 무엇을(what), 언제(when), 어디서(where) 와 같이 사실에서 근거한 통계 자료를 제공해준다.
앞선 예시에 의미를 부여해보자. 즉, 두 마트에서 파는 연필을 비교해보면 A마트의 연필이 B마트의 연필보다 싸다는 점을 발견할 수 있다. 이 비교의 결과가 정보가 된다.
다음은 지식(Knowledge)이다.
정보(Information)에 개인적 경험, 아이디어 등이 더해지면 지식(Knowledge)이 된다. 즉, 정보를 적재적소에 활용하면 지식이 되는 것이다. 지식은 어떻게 할 것인지(how)에 대한 답을 제시해줄 수 있다.
두 마트 간의 정보는 A마트 연필이 싸니 A마트에서 연필을 사야겠다는 결론에 도달할 수 있다.
마지막은 지혜(Wisdom)이다.
지혜(Wisdom)는 축적된 지식을 종합적으로 활용하여 앞으로의 상황을 예측하거나, 현상에 대한 관계를 파악해낼 수 있는 단계이다. 즉 어떤 현상이 왜(why) 그런 것인지, 앞으로 어떤 것이 예상되는지 답을 해줄 수 있는 단계이다.
앞서 지식으로 쌓은 두 마트 간의 연필 가격을 통해 우리는 A마트에서는 다른 상품도 B마트보다 저렴할 것이라는 추측을 할 수 있다.
이 과정에 비교 또는 패턴의 분석 등을 적용하면 데이터 분석이 되는 것이다.
회사 실무에 적용해보기
회사 실무에 이 단계를 적용해보면 다음과 같다. 사례는 영업 실무 기준이다.
① 데이터 : 지점의 판매 실적
② 정보 : 각 지점들의 판매 실적을 비교
③ 지식 : 판매가 우수/부진한 지점을 분류
④ 지혜 : 판매가 부진한 지점의 상황을 개선하기 위해 우수한 지점의 원인을 파악하여 부진한 지점으로 전파
이러한 단계를 어느 정도 이해하고 있다면 일을 하면서 내가 어느 수준까지 할 수 있는 지 파악할 수 있고, 더 역량을 높이기 위해 어떤 것을 해야 할 지 계획을 수립하는 등 좀 더 의미있는 일을 하기 위한 가이드라인으로 삼을 수 있다.
또는 어떤 이슈가 발생했을 때, 조직책임자의 질문이 있을 때 그들의 기대보다 한 단계 높은 답변을 할 수 있는 교보재로 활용할 수도 있다.