赞
踩
提示:本人大二,第一次参加国赛,建模方法可能比较稚嫩,想看专业解答的可以点左上角了(不是)
我个人借鉴的c题答案来自川川菜鸟(c站数模人都应该知道吧)
以下是我个人的数学建模专栏(会不定时持续更新)
https://blog.csdn.net/zedkyx/category_11863143.html?spm=1001.2014.3001.5482
本次比赛从9月15日晚上6点发题开始至9月18日晚上22点最后一次提交md5码结束。
个人的时间安排如下(本人负责建模):
9.15 晚上:查找论文、1.1、1.2、2.1 建模
9.16 一天:对2.2方法进行建模和修改
9.17 早上:四级
9.17 下午+晚上:对于2.3和3.2的合理性分析和敏感性分析进行研究并辅助编程及提供论文思路,查找资料得到1.3的思路
9.18 上午~下午2点:4.1的相关系数分析 和 4.2的典型相关分析
9.18 下午~晚上:1.3 草草结束
我当时看到第一小问的时候想简单了,觉得只是作柱状图/折线图再进行分析就可以了,但实际上遇到这种类型的问题还是要进行专业的相关性分析(实际编程也很容易)。
有无风化很容易让人联想到反向使用logistic回归模型,只需要适当调整一下参数就可以了。
标答是决策树。
个人的想法:首先查找了很多化学方面的资料(以及题设里本身就有的文字),得到高钾和铅钡两个玻璃类型下分别最具代表性的化学成分,因为觉得其他的数据缺失值太多,而且受风化程度无法直从无风化和风化两个指标来计算(很显然会有风化的各个阶段),然后再根据上一问中得到的回归系数建立相应的拟合方程,实话说最后由于时间关系,系数矩阵和常数矩阵选取的蛮仓促的,尤其是系数矩阵还差很多因素还没有结果,所以最后结果也不太尽如人意。
还是和1.2一样,很快想到了支持向量机这种方式(还去多把第一问的颜色、纹饰、风化程度为三个自变量做了一遍来水字数哈哈哈哈哈),可以做的优化还有引入松弛变量(敏感性分析)和拉格朗日变换(当时没怎么看下去)
我们先确定最佳分类的数量。可以先用轮廓值对K-Means方法得到对聚类结果进行评价,并据此来确定最佳的类别数。(要聚类的对象是由2.1得到的三个具有代表性的化学元素)
具体结果就不再阐述了,如果有matlab在数学建模中的应用这本书的话就知道和葡萄酒的评价很想(优化方案就是和别的例如层次聚类和c-means进行比较)
合理性: 对于总样本以及高钾和铅钡两个类型分别进行轮廓值分析,确定最佳类别数的合理性
敏感性: 原来有想过k- means的距离优化用图论的相关知识套,但最后知识改了距离的计算公式(manhattan和切比雪夫)
将这八个文物的数据进行(2.1)类似的处理,将八个文物分别归到高钾和铅钡两个大类中。
进行(2.3)类似的处理,在采用不同的距离计算方法以及得到的不同聚点中心的前提下,对划分结果进行比较。
第三问主要就是第二问的延伸,敏感性分析也差不多。
用相关系数法:用斯皮尔曼相关系数(皮尔逊相关系数由于数据非正太分布的关系,而且斯皮尔曼不容易出问题)ps:找了相关的论文,所以基本原理可以直接“引用”
典型相关分析不多解释了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。