You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
이 프로젝트에서는 일반적인 ML 학습 방식인 Scikit-learn과 XGBoost를 사용하여 로컬에서 학습한 모델을 이용하여, SageMaker의 Endpoint API 추론 기능을 활용하여 모델을 배포합니다.
8
+
9
+
목표는 서로 다른 지역에 위치한 45개 매장의 역사적 판매 데이터를 기반으로 각 매장의 다음 연도 부서 전체 매출을 예측하고, 휴일 주간 할인이 미치는 영향을 모델링하며, 비즈니스에 가장 큰 영향을 주는 요인을 파악하고 권장사항을 제공하는 것입니다.
10
+
11
+
## 데이터 출처
12
+
-[Kaggle: Retail Data Analytics](https://www.kaggle.com/manjeetsingh/retaildataset)
13
+
14
+
## 데이터 세트 설명
15
+
1.**stores_data_set.csv**: 45개 매장에 대한 익명화된 정보 (매장 유형 및 규모)
16
+
2.**sales_data_set.csv**:
17
+
- Store: 매장 번호
18
+
- Dept: 부서 번호
19
+
- Date: 주
20
+
- Weekly_Sales: 해당 매장의 해당 부서 매출
21
+
- IsHoliday: 주가 특별 휴일 주인지 여부
22
+
3.**Features_data_set.csv**:
23
+
- Store: 매장 번호
24
+
- Date: 주 단위
25
+
- Temperature: 지역의 평균 온도
26
+
- Fuel_Price: 지역의 연료 가격
27
+
- MarkDown1-5: 프로모션 할인(가격인하) 관련 익명화된 데이터 (2011년 11월 이후에만 사용 가능, 모든 매장에서 사용되지 않음)
28
+
- CPI: 소비자 물가 지수
29
+
- Unemployment: 실업률
30
+
- IsHoliday: 해당 주가 특별 휴일 주인지 여부
31
+
32
+
## 모델 내용
33
+
이 프로젝트에서는 Scikit-learn과 XGBoost를 사용하여 Linear Regression 모델을 구축합니다. 모델은 역사적 판매 데이터와 다양한 피처 데이터를 활용하여 각 매장의 다음 연도 부서 전체 매출을 예측합니다. 또한, 휴일 주간 할인이 매출에 미치는 영향을 모델링하고, 비즈니스에 가장 큰 영향을 주는 요인을 파악하여 권장사항을 제공합니다.
34
+
35
+
## 사용 방법
36
+
1. 데이터 세트를 다운로드하고 준비합니다.
37
+
2. 모델 학습 및 평가 코드를 실행합니다.
38
+
3. SageMaker에 모델을 배포하고 Endpoint API를 통해 추론을 수행합니다.
39
+
40
+
## 기여
41
+
이 프로젝트에 대한 의견, 개선 사항 또는 기여를 환영합니다. 새로운 기능 요청 또는 버그 보고는 GitHub 이슈를 통해 제출해 주시기 바랍니다.
0 commit comments