当前位置:   article > 正文

时间序列分析案例 —— Rossmann 销售数据_销售量与时间的关系

销售量与时间的关系


本文翻译自 kaggle 竞赛 Rossmann Store Sales 的一篇笔记,竞赛度主题是销量数据的预测,这里总结一些数据准备与分析方法

源码在:https://github.com/elena-petrova/rossmann_TSA_forecasts

翻译的目的是为了学习商业数据分析的一些套路,师夷长技以自强!

导入必要的包

numpy,pandas,matplotlib, seaborn,statsmodels

import warnings
warnings.filterwarnings("ignore")

# loading packages
# basic + dates 
import numpy as np
import pandas as pd
from pandas import datetime

# data visualization
import matplotlib.pyplot as plt
import seaborn as sns # advanced vizs
%matplotlib inline

# statistics
from statsmodels.distributions.empirical_distribution import ECDF

# time series analysis
from statsmodels.tsa.seasonal import seasonal_decompose
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

pandas 读取 csv

# importing train data to learn
train = pd.read_csv("train.csv", 
                    parse_dates = True, low_memory = False, index_col = 'Date')

# additional store data
store = pd.read_csv("store.csv", 
                    low_memory = False)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

这里可以了解一下参数:parse_dates,low_memory的作用哦

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/109343
推荐阅读
相关标签