Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

[Week3/송재환] 구매 상품 트렌드 분석 내용 공유 #88

Open
jaehwan2 opened this issue May 17, 2021 · 0 comments
Open

[Week3/송재환] 구매 상품 트렌드 분석 내용 공유 #88

jaehwan2 opened this issue May 17, 2021 · 0 comments
Labels
EDA EDA 결과

Comments

@jaehwan2
Copy link
Collaborator

데이터 정보 확인

  • 데이터는 모두 범주형 변수로 구성되어 있다.
  • reg_date는 2017년 6월부터 2021년 3월 31일까지의 값으로 구성되어 있다.
  • order_date는 2021년 1월 1일부터 2021년 3월 31일까지 값으로 구성되어 있다.
  • 가장 많이 이용된 브랜드는 구찌이다. (총 232건)
  • 가장 많이 이용된 카테고리는 '가방(BA)'이다.
  • 가장 많이 이용된 제품은 'chevron quilted cross bag black'이다. (총 23건)
  • 가장 많이 이용한 신규 사용자는 'a1149461'이다. (총 11건)
  • 가장 많이 이용된 주문 상품 종류는 '4days'다. (총 894건)
  • 앱으로 서비스를 이용한 건수는 1295건이다.

  • order_date를 기준으로 보았을 때, brandnm, reg_date, app_yn에 결측치가 있는 것으로 보인다.

결측치 확인 및 처리

  • app_yn의 경우 binary case이기 때문에, 결측치를 'N'으로 대체
  • reg_date의 경우 user의 id가 순서대로 부여되었다고 판단되기 때문에
    직전의 user의 id에 부여된 reg_date로 대체한다.

user(신규 사용자) 데이터 특징 및 분포

  • 신규 사용자 별 주문 일자는 1:1 대응 관계이기 때문에 재구매 여부 등의 정보를 파악할 순 없다.
  • 다만, 주문 일자에 여러가지 브랜드와 제품을 이용할 수 있다.
  • 주문시 2회 이상 이용한 고객은 전체의 약 10% 정도이다.
    output_20_0

브랜드 데이터 특징 및 분포

  • 주어진 데이터 기준 클로젯셰어가 공유하는 브랜드는 245개이다.
  • 최대 이용건수 232건과 상위 75% 이용건수 3회를 비교하면, 이용 선호도가 몰려있는 브랜드가 있음을 확인할 수 있다.
  • 구찌(232건), 샤넬(90건), 생로랑(86건), 루이비통(79건), 프라다(58건)으로 명품 이용 비중이 높음을 확인할 수 있다.
  • 다만, 이용횟수가 5회 이상인 user들은 위 브랜드에 이용이 집중되지 않고, 다양한 브랜드 이용하는 것을 확인할 수 있다.
    output_25_0

제품 카테고리(sub_type) 데이터 특징 및 분포

  • 전체 이용횟수 가방(BA) 카테고리 이용이 가장 높음을 확인할 수 있다. (전체 중 47%)
  • 외투(O), 드레스(D), 상의(T)의 이용은 비슷한 정도를 보이고 있음을 확인할 수 있다.
  • 하의(B)와 투피스(TP)는 이용이 가장 저조한 카테고리이다.

  • 이용횟수가 많은 고객들은 의류 카테고리를 다양하게 이용하고 있고, 가방의 이용횟수는 오히려 낮음을 확인할 수 있다.
    output_29_0

제품(goodsnm) 데이터 특징 및 분포

  • 제품 이용횟수는 특정 제품에 편중되어 있고, 특히 가방(BA) 제품에 편중되어 있다. (전체 중 약 90%가 가방 이용 건)
  • 제품별 상위 이용횟수와 브랜드별 상위 이용 경향이 거의 일치하는 것을 확인할 수 있다.

  • 서비스가 가방 제품을 주력으로 제공하고 있고, 실제 이용도 많음을 확인할 수 있다.
  • 특히 검정색상의 제품이 가장 많이 이용되었다. (약 32% 이용)

  • 전체 user와 주문 수량이 4회 이상인 user 간 차이가 있을까?
  1. 2회 이하 주문 user들은 하이-엔드 브랜드의 주문 수량이 편중되어 있지만, 4회 이상 주문 user들은 다양한 브랜드를 골고루 주문한다.
  2. 2회 이하 주문 user들은 절반 정도의 주문이 가방 제품에서 발생되지만, 4회 이상 주문 user들은 의류를 중점적으로 주문한다.
  3. 2회 이하 주문 user들은 이용권의 사용 비중이 비슷하지만, 4회 이상 주문 user들은 4회 이용권을 더 많이 사용한다.
  4. 2회 이하 주문 user들은 앱 사용의 비중이 압도적으로 높지만, 4회 이상 주문 user들은 앱을 사용하지 않은 경우도 많다.
  5. 2회 이하 주문 user들은 검정색 제품의 주문이 압도적으로 높지만, 4회 이상 주문 user들은 비교적 다양한 색상(흰색도 포함한)의 제품을 주한다.
    output_43_0
  • 주문이 많은 상위 10위 브랜드의 카테고리별 주문 내역을 보면, 전체적으로 가방 카테고리의 주문이 많은 것을 확인할 수 있다.

  • 그 중에서 구찌의 주문량이 가장 많음을 알 수 있다.
    output_46_1

  • 4days 이용권 사용이 가장 많으며, 전체적으로는 앱 이용자가 압도적이다.

  • 4회 이상 주문 user의 경우 4days 이용권 사용이 가장 많으나, 앱을 사용하지 않은 고객들의 4days 이용권이 두 번째로 많다.
    주문을 많이 하는 고객의 경우 앱 이용이 적을 수도 있음을 확인.
    output_48_0

@chsop chsop added the EDA EDA 결과 label May 17, 2021
# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
EDA EDA 결과
Projects
None yet
Development

No branches or pull requests

2 participants