Today's Goals
1. 기초 프로젝트 - 분석 결과 해석, 디테일 조정하기, 발표자료 정리
그렇게 분석할 때는 전혀 보이지도 않던 것들이 왜 이제야 보여서 날 괴롭게 하는지..!
나는... 멍청이....
1. 기초프로젝트 진행 과정
[디테일한 오류와 의문]
ⓐ 스타벅스의 잠재 고객은 대체 어떤 사람들인가...?
- 잠재고객 조건을 다시 한번 쓰면서, 의문이 들기 시작함
- 스타벅스의 잠재 고객은 지출이 많고 구매 횟수가 많지만 최근에 오지 않은 사람인가?
- 아니면 지출은 적지만 구매 횟수가 많고 최근에 온 사람인가?
- 스타벅스의 경우 객단가가 낮은 상품에 속하므로 지출의 연관성이 떨어진다는 팀원의 의견 > 모두 동의
- 최종 잠재 고객 조건은 총 지출액 점수는 낮지만 구매 횟수와 최근성 점수가 높은 것으로 정함
ⓑ 나이를 범주화 할 때, 60대 이상을 날리는게 맞는가?
- 60대 이상으로 나이를 묶는 경우, 구매 고객이 상당히 높게 나타났으나 다양한 이상치를 고려하여 결과에서 제외
- 하지만 60대 고객을 확인한 결과 약 3000명, 70대 이상은 5000명, 과연 60대 이상 인구를 제외하는게 맞을까 의문
- 성별 값이 결측치인 경우, 나이 값이 118로 되어있는 것으로 확인하여 118을 모두 삭제하고 나머지에 대해 범주화
- 기존 40/50대 이용률이 높았다는 결과에서 50/60대로 변경
- 스타벅스를 고령 고객이 이용한다는 점에서 의문이 들 수 있지만, 특별한 오류라는 근거가 없으므로 결과 사용
'데이터 부트캠프 - Today I Learned' 카테고리의 다른 글
[스파르타 내일배움캠프 / 데이터 분석 트랙] TIL(Today I Learned)_6주차_25.01.03 (1) | 2025.01.03 |
---|---|
[스파르타 내일배움캠프 / 데이터 분석 트랙] TIL(Today I Learned)_6주차_25.01.02 (0) | 2025.01.02 |
[스파르타 내일배움캠프 / 데이터 분석 트랙] TIL(Today I Learned)_6주차_24.12.30 (0) | 2024.12.30 |
[스파르타 내일배움캠프 / 데이터 분석 트랙] WIL(Weekly I Learned)_5주차 (0) | 2024.12.29 |
[스파르타 내일배움캠프 / 데이터 분석 트랙] TIL(Today I Learned)_5주차_24.12.27 (0) | 2024.12.29 |