赞
踩
2021年美国大学生数学建模竞赛MCMC题目,为大数据类。
就本题而言,基础算法为二分类和Logistic回归。
二分类用于数据的预处理
Logistic回归用于数据的处理
目标事件的ID标识,作为预处理和数据后期处理的重要基准
检测日期
记录者的笔记
对事件的可信度的划分,由题意,分为3类:
1.确定的亚洲大黄蜂目击事件
2.错误目击事件
3.未确定事件
提交日期
记录事件的位置(经纬度),作为分类的重要标准
简要来说,就是4440次报告中,确定有媒体信息的只有3305次数据,这样就给后期的数据带来一点复杂。
根据两个数据表的Golbal ID 将图片与目击事件数据集连接起来
构建图片二分类训练标签
建立预测模型
进行优化
其中有几点需要注意的点:
这里要说明的是,可以用Logistic回归,根据生物属性数据表,从翅膀,腿等等构建0-1回归,根据数据的可信度,划分界限(基本以0.5为主,也可0.4或者0.6),从而完成分类
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。