当前位置:   article > 正文

groupby时间的年_【MathorCup】2020年 A题 无车承运人平台线路定价问题,特征间的相关性分析...

数学建模题目及答案无车承运人
点击蓝色“不太灵光的程序员”关注我哟 加个“星标”,每天上午 08:00,干货推送! e033da63fc673d1ec4c9df9acb53ddda.png

2020年第十届MathorCup高校数学建模挑战赛题目

A题 无车承运人平台线路定价问题 

题目详情附件及源码下载请关注公众号“不太灵光的程序员”回复关键字“MC2020A”

对代码存在疑问,请在公众号留言,我会及时和您取得联系。

问题 1:通过定量分析的方法,研究影响无车承运人平台进行货运线路定价的主要因素有哪些,并说明理由。问题 2:根据附件 1 数据,通过建立数学模型,对已经成交货运线路历史交易数据中的定价进行评价。问题 3: 建立关于线路定价的数学模型,给出附件 2 的线路任务的三次报价以及总成本定价,并填充在附件3 的表格中;给出你们的调价策略;评价你们对附件 2 的线路任务所给出的定价。

其中附件 3 的表格以 Excel文件形式,连同论文答卷一起上传至参赛系统,请勿改变附件 3 中各任务ID 的原有顺序。

附件 3 将用于测试报价的准确性,对于某个确定的任务,三次报价中有一次成交,则后续价格将不再考虑。附件 1:货运线路历史交易数据附件 2:待定价的货运线路任务单附件 3:计算结果 三个问题分别是对特征间的相关性、 给出定价的评价指标、预测总成本以及三次定价三个方向进行考查的,下面我们先对问题1进行解释。 分析过程 1、数据预处理(数据清理) 数据预处理可以分为以下5个步骤,结合代码我们来说明如何进行相关性分析的:
  • 1.1 读取给定的数据

  • 1.2 处理特征数据与问题无关的特征

  • 1.3 数据整合

  • 1.4 数据分类编码

  • 1.5 清洗后的数据存储
1.1. 读取给定的数据

从不同存储文件中读取数据集,预览数据集,观察特征数据。

题目提供了附件1:货运线路历史交易数据.xlsx的数据集文件,在我们自己进行分析时,大多情况还需要自己去爬取数据,建议将数据保存成csv文件在进行分析。

做数据分析时基础数据会有多种存储形式。可能是txt、csv 、excel文件。

txt 和 csv 可以使用 pandas.read_csv 进行加载;

excel 可以使用 pandas.read_excel 进行加载,当然也可以借助模块 xlrd 和 xlwt 数据读写。

操作 excel 要比操作 csv 更耗时,推荐使用csv处理中间数据。

源代码:

def data_load(file_name):"""
加载数据
:param file_name:
:return:
"""
types = file_name.split('.')if types[-1] == 'csv':
df = pd.read_csv(file_name)elif types[-1] == 'txt':
df = pd.read_csv(file_name)elif 'xl' in types[-1]:
df = pd.read_excel(file_name)# 打开文件 需要注意 时间读取的问题# data = xlrd.open_workbook(file_name)# table = data.sheet_by_index(0)# data_lists

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/890063
推荐阅读
  

闽ICP备14008679号