当前位置:   article > 正文

2023高教社数学建模国赛C题 - 蔬菜类商品的自动定价与补货决策(完整参考论文)_2023年全国建模大赛c题蔬菜类商品的自动定价与补货决策答案

2023年全国建模大赛c题蔬菜类商品的自动定价与补货决策答案

摘要

商超(超市和零售店)在现代经济中扮演着至关重要的角色,然而,它们在蔬菜商品管理中面临着多重挑战。这些挑战包括如何准确预测销售趋势、合理制定价格策略、以及有效制定补货计划等问题。

解决这些问题对于商超来说至关重要,因为它们直接影响着销售收益、库存成本和客户满意度。因此,本研究旨在为商超提供一套全面的蔬菜商品管理策略,以帮助它们更好地应对这些挑战。

针对问题一,在蔬菜商品管理中,首要问题之一是如何准确预测销售趋势。这包括了不同蔬菜品类的销售模式,如季节性销售高峰和低谷。我们需要深入了解哪些蔬菜在特定时间段内销售最活跃,以及它们之间的差异。这个问题的解决有助于商超更有针对性地制定促销策略和补货计划。

针对问题二,制定合理的价格策略对于商超至关重要,因为它们需要平衡销售利润和客户价格敏感度。我们需要建立一个定价模型,考虑商品成本、预期销售量和销售利润等因素。这个模型将为每个蔬菜品类提供合理的售价建议,确保商超实现销售利润的最大化,同时提供具有竞争力的价格。

针对问题三,如何确定每个单品的补货量以及建议的定价策略是另一个重要问题。我们需要通过组合优化方法,确定每个单品的最佳补货量和定价策略,以确保商超在未来某一天实现最佳盈利。这需要考虑预期利润、最小陈列量要求和其他约束条件。

针对问题四,更多的数据可以帮助商超更准确地预测市场需求,优化库存,制定更有效的定价策略,从而最大化收益。我们建议采集的数据包括:库存数据、竞争对手的价格数据、客户反馈、销售促销和广告活动的数据、季节性和趋势数据、供应链数据、宏观经济数据、商品的损耗数据、客户购买行为数据等。通过结合这些数据,商超可以更好地理解市场,满足客户需求,优化供应链,减少浪费,提高客户满意度,并最大化收益。

通过解决这些问题,我们的研究旨在为商超提供一套完整的蔬菜商品管理策略,以帮助它们提高销售效益、降低库存成本,并提高客户满意度。

关键词:线性回归,相关性分析,时间序列 arama,混合整数规划一、背景和问题重述

在生鲜商超中,蔬菜类商品的保鲜期短,品相随着销售时间的增加而下降,大部分如果当日未售出,隔日将无法再售。因此,商超每天会根据商品的历史销售和需求情况进行补货。但是,由于商超销售的蔬菜品种多样、产地不同,且进货交易时间通常在凌晨 3:00-4:00,商家需要在不清楚具体品种和进货价格的情况下做出补货决策。同时,蔬菜的定价一般采用“成本加成定价”方法,商超会对品质下降的商品进行打折销售。

问题重述

  1. **问题 1:** 分析蔬菜各品类及单品销售量的分布规律及它们之间的相互关系。
  2. **问题 2:** 考虑商超以品类为单位进行补货计划,分析各蔬菜品类的销售总量与成本加成定价的关系,并为 2023 年 7 月 1-7 日给出每日的补货总量和定价策略,目标是最大化商超收益。
  3. **问题 3:** 考虑蔬菜销售空间有限制,商超想要制定单品的补货计划,要求总的可售单品数在 27-33 个之间,且每个单品的订购量满足最小陈列量 2.5 千克。根据 2023 年 6 月 24-30 日的可售品种,为 7 月 1 日提供单品补货量和定价策略,目标是在满足市场需求的前提下,最大化商超收益。
  4. **问题 4:** 为了更好地制定补货和定价决策,商超还需要收集哪些相关数据,这些数据如何帮助解决上述问题。
    1. 问题一的问题分析为了分析蔬菜各品类及单品销售量的分布规律及相互关系,我们需要将这两个数据集合并,以便在一个数据框中查看每个蔬菜单品的销售情况和其所属的品类。然后,我们使用各种统计方法和可视化工具来进行了分析:首先将按品类对销售量进行总结,并可视化销售量的分布,其次计算每个单品的销售量,并进行可视化展示,然后通过时间序列分析各单品随时间变化的销售趋势,以确定哪些商品在特定时间段内的销售增长或下降和通过计算两两商品间的销售相关性,确定哪些商品经常一起购买。最终得出规律和相互关系
    2. 问题二的分析

根据题目和背景可知商超采用的是“成本加成定价”方法。由问题一可知蔬菜的供应品种在 4 月至 10 月较为丰富,而商超的销售空间有限。为了最大化收益,需要考虑的因素包括:蔬菜的进货成本、预期的销售量、市场需求、损耗率等。我们采用了线性回归方法预测未来一周的销售,然后基于预测的销售量和成本数据制定了定价策略。

2.2 问题三的分析

考虑到销售空间的限制,商超希望进一步制定单品的补货计划。需要确保可售单品总数控制在 27-33 个,且每个单品的订购量至少满足最小陈列量 2.5 千克的要求。我们使用了整个数据集的平均销售量作为预测值。使用贪心算法,我们选择了预期利润最高的 27-33 个单品,并为这些单品制定了定价策略。

2.2 问题四的分析

更多的数据可以帮助商超更准确地预测市场需求,优化库存,制定更有效的定价策略,从而最大化收益。我们建议采集的数据包括:库存数据、竞争对手的价格数据、客户反馈、销售促销和广告活动的数据、季节性和趋势数据、供应链数据、宏观经济数据、商品的损耗数据、客户购买行为数据等。通过结合这些数据,商超可以更好地理解市场,满足客户需求,优化供应链,减少浪费,提高客户满意度,并最大化收益。

三、模型假设

为了对问题一进行数学建模和分析,我们需要做出一些基本的假设。以下是一些可能的问题假设:

  1. **历史销售数据能够代表未来的销售趋势**:我们使用历史销售数据来预测未来的销售。
  2. **蔬菜的损耗是固定的**:我们使用平均损耗率来计算蔬菜的实际成本。
  3. **商品的销售量与其定价有关**:我们基于预测的销售量来制定定价策略。
  4. **商超的销售空间是固定的**:我们假设商超的销售空间在一段时间内是恒定的。
  5. **所有的商品都有相同的陈列空间**:每个商品的最小陈列量都是 2.5 千克。
  6. **趋势假设**:我们假设销售数据中可能存在长期的上升或下降趋势,这些趋势可以通过时间序列分解来识别。
  7. **数据完整性假设**:提供的销售数据被视为准确和完整,不包含任何误差或遗漏。
  8. **稳定性假设**:我们假设在观察期间,市场条件(例如消费者购买力、偏好等)保持相对稳定,这使得时间序列分析变得可行。
  9. **季节性假设**:蔬菜销售可能受到季节性影响,例如由于供应量、天气条件或节假日等原因,某些蔬菜在特定时期的销售量可能会增加或减少。
  10. **独立性假设**:除非通过数据明确显示出相关性,否则我们假设各个单品或品类之间的销售是独立的。

四、定义与符号说明

5.1 问题一的模型建立与求解

由于附件 1 提供了蔬菜的单品编码、单品名称、分类编码和分类名称,而附件 2 提供了销售日期、销售时间、单品编码、销售量、销售单价、销售类型以及是否打折销售的信息。首先将附件 1 和附件 2 进行合并,具体如下所示:

销售日期

扫码销售时间

单品编码

销量

销售单价

销售类型

是否打折销售

单品名称

分类编码

分类名称

2020-7-1

09:15:07.924

1.029E+14

0.396

7.6

销售

泡泡椒 (精品)

1011010504

辣椒类

2020-7-1

09:17:27.295

1.029E+14

0.849

3.2

销售

大白菜

1011010101

花叶类

2020-7-1

09:17:33.905

1.029E+14

0.409

7.6

销售

泡泡椒 (精品)

1011010504

辣椒类

2020-7-1

09:19:45.450

1.029E+14

0.421

10

销售

上海青

1011010101

花叶类

2020-7-1

09:20:23.686

1.029E+14

0.539

8

销售

菜心

1011010101

花叶类

2020-7-1

09:21:55.556

1.029E+14

0.277

7.6

销售

泡泡椒 (精品)

1011010504

辣椒类

2020-7-1

09:21:56.536

1.029E+14

0.338

8

销售

云南生菜

1011010101

花叶类

2020-7-1

09:22:01.274

1.029E+14

0.132

7.6

销售

泡泡椒 (精品)

1011010504

辣椒类

2020-7-1

09:22:01.476

1.029E+14

0.213

8

销售

云南生菜

1011010101

花叶类

2020-7-1

09:22:15.998

1.029E+14

0.514

8

销售

甜白菜

1011010101

花叶类

2020-7-1

09:22:21.264

1.029E+14

0.251

10

销售

高瓜

(1)

1011010402

水生根茎类

2020-7-1

09:24:21.833

1.029E+14

0.251

6

销售

云南油麦菜

1011010101

花叶类

2020-7-1

09:24:21.905

1.029E+14

0.217

18

销售

西峡香菇(1)

1011010801

食用菌

2020-7-1

09:24:57.873

1.029E+14

0.468

6

销售

云南油麦菜

1011010101

花叶类

数据预处理:对附件 1 和附件 2 的数据进行了合并之后,我们将对数据进行清洗和预处理,然后进行特征选择和转换,以便建立模型。

箱型图(Boxplot)是一种可视化数据分布和异常值特征的图表。它将数据分为四分位数(Q1、Q2、Q3)和四分位距(IQR=Q3-Q1)等几个数值。(在代码中,

Q1 代表排在前 25% 的数据所对应的数值,Q2 表示排序之后的中间值(亦即中位数),Q3 则对应着排在前 75% 的数据所对应的数值。)箱型图包含一个箱子其中,箱子的上下端分别表示数据集的上下四分位数,中线表示中位数,箱子的长度代表数据的分布区间,离群点则代表数据中的异常值。箱型图通过观察箱子的长度和箱子外部的离群点数量,可以快速判断数据是否包含异常值,并了解数据的偏斜程度和分布范围。

在本代码中,通过 matplotlib 库中的 boxplot()函数绘制每个列数据对应的箱线图,并根据图箱线图的结果计算每列数据集的异常值数量。根据箱型图原理,将数据中小于 Q1-1.5×IQR 或大于 Q3+1.5×IQR 的数据定义为异常值,这些数据需要被过滤掉,只保留合法的数据用于后续分析。最后,使用过滤后的数据再绘制一次箱型图并保存到输出目录中。通过这种方式,能够自动化地进行异常值处理,降低了处理数据时的手工干预,而且能够更加客观地识别数据的离群值,并准确计算异常值的数量。下图展示所以特征的原始数据箱型图和异常值处理后的数据箱型图首先绘制了六个蔬菜品类的箱线图销量和价格的箱线图,如下图所示:

填补结果展示如下:(以销量辣椒类和花叶类为例)

由上图可知,当我们在大类别上进行异常值处理后,小类别中仍然存在异常值,这可能是由以下原因导致的:

  1. **数据的异质性**:每个大类别下的小类别可能具有不同的数据分布。处理大类别时,我们可能考虑到了整体的数据分布,而忽略了小类别中的特殊情况。
  2. **不同的规模和分布**:小类别可能有其独特的销售规模和价格范围,这可能导致它们在大类别处理后仍然存在异常值。
  3. **大类别的处理可能太过宽泛**:当我们在大类别级别上处理数据时,可能会错过一些细节,因为我们是基于整体数据分布进行处理的,而不是基于每个小类别的特点。
  4. **小类别的数据不够稳定**:确实,如果某个小类别的数据量较小或其数据波动较大,那么这个小类别的数据可能会相对不稳定。这种不稳定性可能会导致数据中存在更多的异常值。

由上图可知,按品类销售量看:'花叶类'品类的销售量最高,其次是'辣椒类'和' 食用菌'。

由上图可知,按商品分类的销售量看,芜湖青椒(1),西兰花,和净藕(1)是销售量排在前三的产品。

接下来,我们将分析销售量随时间的变化情况,以检查是否存在周期性或趋势。

我们将首先聚焦于整体的品类销售量,然后再细分到单品销售量。

从上述图表中,我们可以观察到以下情况:

  1. **销售量时间趋势**:各个品类的销售量在一年中都有其高峰和低谷,显示出了明显的季节性。
  2. **花叶类**:这个品类的销售量在每年的特定时段内都达到高峰,可能与某些节日或季节性事件有关。

接下来,我们将使用相关性分析来探索不同蔬菜品类之间的关联关系。为此,我们将计算品类销售量之间的皮尔逊相关系数。这将帮助我们了解哪些品类的销售趋势是相关的,即当一个品类的销售量增加时,另一个品类的销售量也可能增加。

  1. **高正相关性**:例如,“果类”和“根茎类”之间存在较高的正相关性。这意味着当“果类”的销售量增加时,“根茎类”的销售量也可能增加,反之亦然。
  2. **低或无相关性**:例如,“花叶类”与其他大部分品类之间的相关性较低,这意味着它们的销售模式可能是独立的。同时得到单品销量之间的相关系数热力图,如下图所示:

然后我们找出相关性大于 0.7 的单品对,结果如下:

由上图可知,这几组单品组是在相同时间和数量上呗购买,因此我们推测他们是某种组合或套餐的一部分。

这些关联性分析结果可以为商超提供关于如何组合销售策略和促销活动的洞察,以便最大化销售和收益。

最后通过 apriori 算法进行验证

  1. 支持度(support):商品组合在所有交易中出现的频率。
  2. 置信度(confidence):如果购买了商品 A,那么也购买商品 B 的概率。
  3. 提升度(lift):商品 A 和商品 B 一起出售的概率,与它们各自独立销售的概率相比。

我们将设置一个较低的支持度阈值,以捕获更多的商品组合,然后根据置信度和提升度对结果进行筛选。

结果与上表格相同,说明我们这几组单品对是某些组合的部分。

问题 2 的模型建立与分析问题 2 要求分析蔬菜品类的销售总量与成本加成定价的关系,并为未来一周提供补货和定价策略。为此,我们首先需要加载并查看附件 3 和附件 4 的内容。

附件 3 为我们提供了不同日期和单品的批发价格信息,而附件 4 为我们提供了不同小分类的平均损耗率。

为了分析销售总量与成本加成定价的关系并为未来一周制定补货和定价策略,我们需要考虑以下因素:

1. **销售预测**:我们可以使用过去的销售数据来预测未来一周的销售量。

线性回归模型** 线性回归是一种统计方法,用于建立一个或多个自变量和因变量之间的关系模型。

模型的形式为:

**3.2 特征选择**

为了简化模型并避免过拟合,我们选择了与销售量最相关的几个特征作为自变量。

**4. 参数估计**

使用最小二乘法,我们估计了模型的参数。这些参数代表了自变量与销售量之间的关系强度。

### **5. 模型验证**

我们使用了训练集和测试集来验证模型的有效性。具体结果如下图:

通过计算预测值与实际值之间的均方误差(MSE),我们评估了模型的准确性。

如下图所示:

由上图可知,简单的线性回归进行预测对还是存在一定的误差,但在范围内。由于价格由季节的特征,可以采用时间序列模型行预测。

可以使用时间序列进行预测分析时间序列:自回归整数移动平均值,即 ARIMA,是一种使用时间序列数据预测未来趋势的统计分析模型。ARIMA 的基本思想是,随着时间的推移,由预测形成的数据序列被视为随机序列,可以使用模型来近似描述该序列。一旦确定了这个序列,模型就可以根据时间序列的过去和现在的值来预测未来的值。在这个模型中,我们试图仅根据截至当月的单价数据来预测商品的未来单价。

ARIMA 模型包括自回归(AR)模型和移动平均(MA)模型。AR 模型描

述了当前值和滞后值之间的关系,并利用历史数据预测了未来值。MA 模型利用

过去残差项的线性组合来观察未来残差。ARIMA 预测模型可写成以下公式:

这里 是自回归模型(AR)的阶数, 是移动平均模型(AM)的阶数, {}

是时间之间的误差项,范围在 和 – 1 之间,

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/548917
推荐阅读
相关标签