본문 바로가기

분류 전체보기17

[데이터 분석] 데이터 분석의 기반, DB 구축하기 데이터 분석이란 업무를 맡게 된 이후,이론적으로만 알고 있던 데이터 분석을 실제로 해보면서 느꼈던 가장 큰 어려움은 데이터를 수집하고 전처리하는 것이었습니다. 정말 많은 데이터들이 수집되고 있지만 원하는 값을 보기 위해 데이터들을 하나로 엮는 작업이 쉽지 않았습니다. 예를 들어 보죠.어떤 회사의 홈페이지에 특정 유입 경로를 통해 방문한 고객들은 구매까지 보통 몇 회 방문을 한 뒤에 구매를 하는지, 그리고 구매를 할 때 보유하고 있는 할인 쿠폰은 어떻게 사용하는 지 알고 싶다고 해보겠습니다. 이 때 필요한 데이터는 크게 세 가지 입니다.1. 고객들의 LG전자 홈페이지 방문 데이터 2. 구매 데이터 3. 쿠폰 데이터여기서 우선 문제가 발생합니다. 1. 방문 데이터는 통상 Google Analytics(이하 .. 2025. 1. 13.
[데이터 분석] 하나의 프로모션이 고객의 구매에 어떻게 영향을 주는 지 알려면 복합적인 분석이 필요하다 온라인 쿠폰이 구매에 얼마나 영향을 주는 지 분석하는 프로젝트를 진행한 적이 있다.이 쿠폰은 비회원이 홈페이지 회원으로 가입하면 발급되며, 제품 구매시 정률 할인을 제공하는 방식으로 혜택을 제공한다. 따라서 이 쿠폰이 얼마나 구매에 영향을 주는 지 확인하기 위해 아래와 같은 분석을 진행했다.1. 가설 - 쿠폰 프로모션 운영 후 신규 가입자 수가 증가했을 것이다. - 쿠폰 프로모션 운영 이후 신규 가입자의 구매 전환율이 증가하였을 것이다. - 쿠폰 프로모션 운영 이후 신규 가입자의 평균 구매금액이 증가하였을 것이다. - 쿠폰 페이지를 한 번 이상 본 회원이 구매로 이어질 확률이 높을 것이다. - 쿠폰이 있음을 알고 있는 회원들은 그렇지 않은 회원들보다 더 비싼 제품을 구매할 것이다. 2. 결과 데이터 관점.. 2025. 1. 12.
[데이터 분석] 데이터 분석가는 데이터에만 집중해선 안 된다. PAP 블로그에서 [ 데이터에 입덕한 지 1300일째 깨달은 6가지 ] 라는 글을 읽었다.http://disq.us/t/4ezyyfo 데이터에 입덕한지 1300일째 깨달은 6가지🕵🏻 이 글의 원문은 저자의 블로그 에서 확인하실 수 있습니다. Intro 안녕하세요. 데이터 분석가 주정…playinpap.github.io 글쓴이는 데이터 분석가로서 4년간 일을 하며 경험한 것을 토대로 데이터 분석가라면 가져야 할 자세를 잘 정리해주었다.  그가 말한 것을 요약해보면 다음과 같다.   글쓴이가 깨달은 여섯 가지   1. 100% 정량 데이터보다 정량&정성 데이터를 같이 분석하는 것이 성과로 이어질 확률이 높다.  2. Kaggle은 EDA의 과정을 참고하는데 활용하는 것이 좋다. 더 정확한 모델링을 만드는.. 2025. 1. 6.
[ADSP] 데이터에 대해_Part.2 4) 기업 내부의 데이터베이스 솔루션   (1) 시대별     ① 1980년대 : OLTP, OLAP        - OLTP (On-Line Transaction Processing)          복수의 사용자 단말에서 발생한 트랜잭션을 주 컴퓨터에서 처리, 그 결과를 사용자에게 반환하는 기술 (ex. 상품 주문 등)       - OLAP (On-Line Analytical Processing)          다차원 데이터로부터 통계요약정보를 제공하는 기술로,         다차원 데이터를 대화식으로 분석하는 기술 (ex. 과거 10년간 A사의 임금 상승률)       ② 2000년대 : CRM, SCM         - CRM (Customer Relationship Management)   .. 2025. 1. 6.
[ADSP] 데이터에 대해_Part.1 1) 데이터 유형  (1) 데이터의 정의      - 데이터는 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실(Fact)       - 추론, 예측, 전망, 추정을 위한 근거(basis)로 기능       - 다른 객체와의 상호 관계 속에서 가치를 찾음 ​  (2) 정성적 데이터 (qualitative data)      - 자료의 성질, 특징을 자세히 풀어쓰는 방식       - 언어, 문자로 기술된 비정형 데이터 형태로 저장, 분석에 시간과 비용이 필요       - ex. 설문조사의 주관식 응답, SNS에 올린 글, 기상특보 등   (3) 정량적 데이터 (quantitative data)     - 수치, 기호, 도형 등으로 표시할 수 있으며 데이터양이 증가하더라도 저장, 분석이 용이   .. 2025. 1. 5.