본문 바로가기
반응형

데이터수집2

[Skill_데이터분석] 데이터 분석 실무의 현실: 수집·전처리·조인이 절반을 먹는다 1. 이론에서 실무로: '분석'보다 먼저 오는 일들데이터 분석 업무를 맡고 가장 먼저 겪은 어려움은 모델링도, 시각화도 아니었다. 실제로는 데이터를 모으고 정리하는 수집·전처리 단계가 가장 힘들고 시간이 많이 들었다. 회사 안팎에서 매일같이 수집되는 수많은 로그와 테이블 속에서, 내가 보고 싶은 값을 꺼내기 위해 서로 다른 원천을 하나의 스토리로 엮어내는 작업이 생각보다 까다로웠다. LG전자 홈페이지의 데이터를 분석한다고 해보자. 예를 들어,'특정 유입 경로로 들어온 고객은 구매까지 평균 몇 회 방문하고, 보유 쿠폰은 어떤 방식으로 사용하는가?'라는 질문에 답하려면 최소한 다음 세 가지 데이터가 필요하다.방문 데이터(세션·유입 경로·방문일자·방문횟수) - 보통 Google Analytics(GA) 등 웹.. 2025. 10. 2.
[데이터 분석] 데이터 분석의 기반, DB 구축하기 데이터 분석이란 업무를 맡게 된 이후,이론적으로만 알고 있던 데이터 분석을 실제로 해보면서 느꼈던 가장 큰 어려움은 데이터를 수집하고 전처리하는 것이었습니다. 정말 많은 데이터들이 수집되고 있지만 원하는 값을 보기 위해 데이터들을 하나로 엮는 작업이 쉽지 않았습니다. 예를 들어 보죠.어떤 회사의 홈페이지에 특정 유입 경로를 통해 방문한 고객들은 구매까지 보통 몇 회 방문을 한 뒤에 구매를 하는지, 그리고 구매를 할 때 보유하고 있는 할인 쿠폰은 어떻게 사용하는 지 알고 싶다고 해보겠습니다. 이 때 필요한 데이터는 크게 세 가지 입니다.1. 고객들의 LG전자 홈페이지 방문 데이터 2. 구매 데이터 3. 쿠폰 데이터여기서 우선 문제가 발생합니다. 1. 방문 데이터는 통상 Google Analytics(이하 .. 2025. 1. 13.
반응형