赞
踩
有限的资源,最大的收益
三要素:决策变量+目标函数+约束条件
总收益最大——一般是线性规划
总收益率最大——一般是非线性规划
如泊松分布、均匀分布
随机性、统计性、近似解
下面“非线性规划”会应用蒙特卡洛法求解典型例题的初始值
利用matlab的fmincon函数
本质上和线性规划一样,适用于最优化
常见收益率、病毒传播率、经济增长率等涉及变量比值的规划问题
空间运动(如飞行管理、卫星轨道调整、还有和角度相关的电影院座位最佳视角问题)
选址问题(因为坐标点距离公式属于非线性)
非线性规划每次求解的结果都不一样
既要……又要……
正偏差变量、负偏差变量
绝对约束(必须满足)、目标约束(允许有偏差)
优先因子
序贯算法
注意多目标规划求得的叫做“满意解”而不是”最优解“
多目标规划没有最优的概念,因为在求解的过程中,三个目标的重要性的设定是具有主观性的
具体代码见multiple_target.mlx
好好反思一下自己数据结构和离散数学学得怎么样!
货物运输类问题
设备更新问题:在一定年限内,如何安排购置新设备和使用旧设备,使总支付费用最小
从某个起点到某个终点,始终围绕着起点到终点的总路径求最优
图论解决的问题大部分都是求最优解,常常与规划类模型结合
通信建设、管道铺设规划
对应图论,重点在于所有顶点两两之间都存在路径(连通),且总路径(权重之和)最小
• 最小生成树是从全局角度考虑,使两两之间连通且总路径最短,没有起点和终点的概念
• 最短路径是针对指定源点(起点)和指定终点,求两点间最短路径
方案层必须明确:必须从题目中确定所有方案
缺点是具有主观性:评价指标的权重往往是主观设定的
优点是可处理复杂系统:为多准则或无结构特性的复杂决策问题提供简便的决策方法
归一化处理
判断矩阵
不一致现象
一致性检验
算数平均法求权值
• 判断矩阵是我们自行输入的
• 初始数据要确保同一指标下单位一致,且进行归一化处理
• 归一化处理的代码实现就是双重for循环,分别对行和列进行操作
正理想解、负理想解
题目提供了足够的评价指标和数据
• 数据已知,评价指标的类型差异较大(数值、比值、百分比,且有正面指标也有负面指标)
层次分析法两两比较,TOPSIS直接给每个指标加上权重
• 用熵值判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大
• 本模型中,混乱程度低对应着熵值接近****1,评价总成绩时可给该指标赋予低权重
• 即使这门课的成绩不算进总成绩(权重为0),总成绩的排名也是不会变的
数据全面、缺少文献或主观依据的题目
• 例如评价河流水质,已知河流的含氧量、PH值、细菌密度、生物密度等数据
• 但缺乏评价水质的文献资料,或者文献内的说法不一
• 即文献很难帮助我们确定影响水质最重要的因素是哪一个
• 也很难告诉我们其余指标的重要程度如何衡量
• 此时即可使用熵权法,根据数据本身建立评价体系
熵权法与其他方法(层次分析法、TOPSIS法等)最大的区别就是完全客观
但有时“完全客观”也是缺点,难以将数据之外的因素考虑进去
• 使用熵权法时需要数据全面,有的数据是比赛提供的,有的是需要自己找
• 数据往往以excel文件存储,可在MATLAB中用readmatrix函数调用
• 注意调用的excel文件需要与代码文件在同一文件夹下!!
• 典型例子:GDP就是灰色系统
• 特点:介于黑色和白色之间,部分已知,部分未知,具有小样本数据的不确定性系统
• 我们有往年的数据和一定的理论基础(白色)
• 但无法精确计算得出下一年的值(黑色)
• 灰色无法“计算”,但并不是完全“不可知”,可以进行**“预测”**
• 根据原始数据,通过累加等方式削弱随机性、获得有规律的新序列
• 建立相应的微分方程模型,得到离散点处的解
• 再通过累减求得的原始数据的估计值,从而对原始数据预测
❑ 数列预测
• 特点:定时求量,已知xx年到xx年的数据,请预测下一年的数值
• 常见GDP、人口数量、耕地面积、粮食产量等问题
• 针对的问题往往短期波动小、可预测,但长期可能变化大、难以准确预测
❑ 灾变预测
• 特点:定量求时,已知xx年到xx年的数据和某灾变的阈值,预测下一次灾变发生的时间
• 常见洪涝灾害、虫灾等问题
• 模型中需要把超出阈值的数据(异常数据)对应的时间组成新序列
❑ 拓扑预测
• 特点:对数据波形进行预测,求的是多个模型构成的模型群,等于求解多个灾变预测
• 与灾变预测类似,不过有较详细的分级,例如虫灾“轻微”“中度”“重度”
• 需要的数据量少,而且数据量太多了没意义,例如用近100年的GDP去预测下一年毫无意义
• 只能短期预测,究竟多短没有严格限制
相对误差检验、级比偏差检验
模型假设的目的:简化问题
指数传播模型:
SI模型:未考虑病人得病后可以被治愈
SIS模型:考虑病人得病后可以治愈,但是无免疫性
传染强度
SIR模型:病愈后的人有免疫力
系统动力学问题
SEIR模型:考虑传染病的潜伏期
状态随机,下一阶段的状态只与当前有关!
两种状态转换的概率,只与时间间隔有关,与更早的过去无关,也与起始时刻无关。
是否满足时齐性,是由问题本身所决定的(查文献)!一般带有周期性的问题才会满足时齐性
马尔科夫预测需要有限种已知的可能结果!其他预测理论上是无数种可能!
可行解过多、NP-hard问题
1.初始化
2.随机产生新解
3.计算目标函数差值
4.是否接受新解
5.马尔可夫过程
6.退火过程
7.结束条件
预测类问题(一般称为回归问题)
分类问题(一般为离散问题,即输出值y是有限个离散值)
评价类问题
• 留出法:将搜集到的数据划分为训练集、验证集和测试集
• 训练集进行学习、训练参数(权重)
• 验证集来检验性能(学习率等),以调整超参数或及时停止训练
• 测试集给出客观的评价
梯度、阻尼因子和泛化能力
误差直方图
回归图
多目标优化问题,寻优问题
传统算法具有局限性:
函数优化、组合优化(不依赖于问题的背景领域,使用方便,连续/离散、单峰/多峰等等各种形式均可)
NP-Hard问题:TSP问题
在NP-Hard问题方面普遍来说各类启发式算法均可
• 相比模拟退火,相比良好的全局搜索能力,不易陷入局部最优
• 相比粒子群算法,常规的遗传算法可直接求解离散问题
• 缺点:由于变异是随机的,局部搜索能力差;相对其他算法更耗时、思路复杂抽象;
• 可多种算法结合改进,例如遗传算法优化神经网络等混合算法(新手慎用)
回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决。
回归分析的任务就是通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。
常见的回归分析有五类:线性回归、0‐1回归、定序回归、计数回归和生存回归,其划分的依据是因变量Y的类型。
1.横截面数据:在某一时点收集的不同对象的数据。
例如:
(1)我们自己发行问卷得到的数据
(2)全国各省份2018年GDP的数据
(3)大一新生今年体测的数据
2.时间序列数据:对同一对象在不同时间连续观察所取得的数据。
例如:
(1)从出生到现在,你的体重的数据(每年生日称一次)。 (2)中国历年来GDP的数据。
(3)在某地方每隔一小时测得的温度数据。
3.面板数据:横截面数据与时间序列数据综合起来的一种数据资源
例如:
2008‐2018年,我国各省份GDP的数据。
,t_70)
1.横截面数据:在某一时点收集的不同对象的数据。
例如:
(1)我们自己发行问卷得到的数据
(2)全国各省份2018年GDP的数据
(3)大一新生今年体测的数据
2.时间序列数据:对同一对象在不同时间连续观察所取得的数据。
例如:
(1)从出生到现在,你的体重的数据(每年生日称一次)。 (2)中国历年来GDP的数据。
(3)在某地方每隔一小时测得的温度数据。
3.面板数据:横截面数据与时间序列数据综合起来的一种数据资源
例如:
2008‐2018年,我国各省份GDP的数据。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。