11
22==================================================
3- ## Analysis Stage: 1. 데이터 로드 및 기본 구조 파악
4- ## Execution Time: 2025-06-13 22:53:01
3+ ## Analysis Stage: 1. 데이터 로드 및 기본 구조 확인
4+ ## Execution Time: 2025-06-14 23:09:11
55--------------------------------------------------
66Result Description:
77
8- 데이터셋 크기: (128975, 24)
9- 컬럼 목록: ['index', 'Order ID', 'Date', 'Status', 'Fulfilment', 'Sales Channel ', 'ship-service-level', 'Style', 'SKU', 'Category', 'Size', 'ASIN', 'Courier Status', 'Qty', 'currency', 'Amount', 'ship-city', 'ship-state', 'ship-postal-code', 'ship-country', 'promotion-ids', 'B2B', 'fulfilled-by', 'Unnamed: 22']
10- 데이터 타입:
11- index int64
12- Order ID object
13- Date object
14- Status object
15- Fulfilment object
16- Sales Channel object
17- ship-service-level object
18- Style object
19- SKU object
20- Category object
21- Size object
22- ASIN object
23- Courier Status object
24- Qty int64
25- currency object
26- Amount float64
27- ship-city object
28- ship-state object
29- ship-postal-code float64
30- ship-country object
31- promotion-ids object
32- B2B bool
33- fulfilled-by object
34- Unnamed: 22 object
35- dtype: object
36- 결측치 현황:
8+ 데이터셋 기본 정보:
9+ - 데이터 크기: (128975, 24)
10+ - 컬럼 수: 24
11+ - 결측치 현황:
3712index 0
3813Order ID 0
3914Date 0
@@ -58,224 +33,9 @@ promotion-ids 49153
5833B2B 0
5934fulfilled-by 89698
6035Unnamed: 22 49050
61- dtype: int64
6236
63- ==================================================
64-
65- ==================================================
66- ## Analysis Stage: 2. 데이터 전처리
67- ## Execution Time: 2025-06-13 22:53:21
68- --------------------------------------------------
69- Result Description:
70-
71- 전처리 작업 내용:
72- 1. 불필요한 컬럼(index, Unnamed: 22) 제거
73- 2. 날짜 데이터를 datetime 형식으로 변환
74- 3. 결측치 처리:
75- - Courier Status: 'Not Available'로 대체
76- - currency, Amount: 결측치가 있는 행 제거
77- - 배송 정보: 'Unknown'으로 대체
78- - promotion-ids: 'No Promotion'으로 대체
79- - fulfilled-by: 'Not Specified'로 대체
80- 4. Amount를 float 타입으로 변환
81-
82- 전처리 후 데이터 크기: (121180, 22)
83-
84- 수치형 데이터 기본 통계:
85- Qty Amount
86- count 121180.000000 121180.000000
87- mean 0.961231 648.561465
88- std 0.214354 281.211687
89- min 0.000000 0.000000
90- 25% 1.000000 449.000000
91- 50% 1.000000 605.000000
92- 75% 1.000000 788.000000
93- max 8.000000 5584.000000
94-
95- ==================================================
96-
97- ==================================================
98- ## Analysis Stage: 3. 기본 통계 분석 및 시각화
99- ## Execution Time: 2025-06-13 22:55:04
100- --------------------------------------------------
101- Result Description:
102-
103- 1. 월별 판매 트렌드 분석:
104- 월별 평균 주문 건수: 30295.00
105- 월별 평균 매출액: 19648169.57
106-
107- 2. 카테고리별 분석:
108- 최고 매출 카테고리: Set
109- 최고 매출액: 39204124.03
110- 카테고리 수: 9
111-
112- 3. 판매 채널 분석:
113- 채널별 매출 비중:
114- Sales Channel Order ID Amount
115- 0 Amazon.in 121180 78592678.3
116-
117- 4. 배송 방식 분석:
118- 배송 방식별 주문 건수:
119- Fulfilment Order ID Amount
120- 0 Amazon 83639 54322151.0
121- 1 Merchant 37541 24270527.3
37+ 주요 특징:
38+ - 총 128975개의 거래 데이터
39+ - 24개의 특성(컬럼) 보유
12240
123- 5. 상위 10개 제품 분석:
124- Order ID Amount
125- Style
126- JNE3797 3995 2933482.00
127- J0230 1733 1944948.48
128- SET268 1732 1303923.56
129- J0341 1538 1275322.87
130- J0003 1491 981973.75
131- JNE3405 2104 846822.36
132- J0008 762 819169.96
133- SET345 1152 723402.79
134- SET324 1206 720096.82
135- SET278 501 719791.48
136-
137- 6. 상위 10개 주(state) 분석:
138- Order ID Amount
139- ship-state
140- MAHARASHTRA 21073 13335534.14
141- KARNATAKA 16394 10481114.37
142- TELANGANA 10637 6916615.65
143- UTTAR PRADESH 9947 6816642.08
144- TAMIL NADU 10809 6515650.11
145- DELHI 6393 4235215.97
146- KERALA 6151 3830227.58
147- WEST BENGAL 5547 3507880.44
148- ANDHRA PRADESH 5055 3219831.72
149- HARYANA 4188 2882092.99
150-
151- --------------------------------------------------
152- Generated Files:
153- - ./artifacts/monthly_sales_trend.png : 월별 판매 트렌드 그래프
154- - ./artifacts/category_sales.png : 카테고리별 매출액 그래프
155- - ./artifacts/sales_channel_distribution.png : 판매 채널별 매출 비중 그래프
156- - ./artifacts/fulfillment_analysis.png : 배송 방식별 주문 건수 그래프
157- - ./artifacts/top_products.png : 상위 10개 제품 매출액 그래프
158- - ./artifacts/top_states.png : 상위 10개 주(state) 매출액 그래프
159- ==================================================
160-
161- ==================================================
162- ## Analysis Stage: 4. 고급 분석 (RFM, 상관관계, 분포)
163- ## Execution Time: 2025-06-13 22:58:13
164- --------------------------------------------------
165- Result Description:
166-
167- 1. RFM 분석 결과:
168- 고객 세그먼트 분포:
169- Customer_Segment
170- Lost VIP 2950
171- Recent Customers 2478
172- Lost Customers 1469
173- VIP 1444
174- Loyal Customers 614
175-
176- 상위 10개 VIP 도시:
177- City Monetary
178- 6000 PENTAPADU 1013.0
179- 682 BARBIGHA 1009.0
180- 535 BADHARGHAT 1009.0
181- 1941 DHARAMSALA 1008.0
182- 5386 NERAL 1002.0
183- 7416 Sivasagar,sunpura gohain gaon 999.0
184- 5773 Ollur, Thrissur 999.0
185- 6838 SAHAWAR 999.0
186- 5843 PALGHAR( East) 999.0
187- 8662 irinjalakuda 999.0
188-
189- 2. 상관관계 분석:
190- Qty Amount
191- Qty 1.0000 0.0669
192- Amount 0.0669 1.0000
193-
194- 3. 주문 금액 통계:
195- 평균 주문 금액: 648.56
196- 중앙값: 605.00
197- 표준편차: 281.21
198- 최소값: 0.00
199- 최대값: 5584.00
200-
201- 4. 카테고리별 평균 주문 금액 (상위 5개):
202- mean count
203- Category
204- Set 833.385571 47042
205- Saree 799.572645 155
206- Western Dress 762.790580 14704
207- Ethnic Dress 723.895389 1093
208- Top 526.098603 10165
209-
210- 5. 요일별 주문 패턴:
211- Weekday
212- Monday 18568
213- Tuesday 18883
214- Wednesday 18594
215- Thursday 17069
216- Friday 17718
217- Saturday 18524
218- Sunday 19619
219-
220- 6. 프로모션 효과 분석:
221- Order ID Amount
222- count mean sum
223- has_promotion
224- False 49153 599.65 25004243.3
225- True 79822 674.22 53588435.0
226-
227- 7. 배송 서비스 레벨별 분석:
228- Order ID Amount
229- count mean sum
230- ship-service-level
231- Expedited 88615 656.23 54285183.0
232- Standard 40360 632.07 24307495.3
233-
234- --------------------------------------------------
235- Generated Files:
236- - ./artifacts/customer_segments.png : 고객 세그먼트 분포 그래프
237- - ./artifacts/correlation_matrix.png : 변수 간 상관관계 히트맵
238- - ./artifacts/amount_distribution.png : 주문 금액 분포 그래프
239- - ./artifacts/weekday_orders.png : 요일별 주문 건수 그래프
240- - ./artifacts/category_avg_amount.png : 카테고리별 평균 주문 금액 그래프
241- - ./artifacts/promotion_effect.png : 프로모션 효과 분석 그래프
242- - ./artifacts/service_level_distribution.png : 배송 서비스 레벨 분포 그래프
243- ==================================================
244-
245- ==================================================
246- ## Analysis Stage: 5. 시계열 분석
247- ## Execution Time: 2025-06-13 22:58:52
248- --------------------------------------------------
249- Result Description:
250-
251- 1. 일별 판매 트렌드:
252- 평균 일일 매출: 863655.81
253- 최대 일일 매출: 1209364.17
254- 최소 일일 매출: 101683.85
255-
256- 2. 월별 성장률:
257- 평균 월간 성장률: 9413.80%
258- 최대 성장률: 28261.15%
259- 최소 성장률: -10.68%
260-
261- 3. 월별 평균 매출:
262- Month Amount
263- 0 3 627.678086
264- 1 4 626.003046
265- 2 5 663.356858
266- 3 6 661.484424
267-
268- 4. 분기별 매출 분석:
269- Order ID Amount Qty
270- count sum mean sum
271- Quarter
272- 1 171 101683.85 627.68 156
273- 2 128804 78490994.45 648.59 116493
274-
275- --------------------------------------------------
276- Generated Files:
277- - ./artifacts/daily_sales_trend.png : 일별 매출액 추이 그래프
278- - ./artifacts/monthly_growth_rate.png : 월별 매출 성장률 그래프
279- - ./artifacts/monthly_seasonality.png : 월별 평균 매출액 그래프
280- - ./artifacts/quarterly_sales.png : 분기별 총 매출액 그래프
28141==================================================
0 commit comments