当前位置: 大黄蜂 >> 大黄蜂的种类 >> 2021美赛C题大黄蜂传播规律和目击准确
一.胡蜂预测模型
二.目击准确性的深度学习模型
2.数据分析/预处理
2.2问题解答
三.模型评估
四.模型优化
五.建议模型
赛题目的
预测胡蜂的传播规律,研究公众报道胡蜂踪迹的准确性,并且利用模型研究消灭胡峰的方法问题描述由于胡蜂(Vespamandarinia)对当地蜜蜂种群的潜在严重影响,胡蜂的存在会引起很大的焦虑。华盛顿州已经建立了帮助热线和一个网站,供人们报告这些黄蜂的目击情况。根据这些来自公众的报告,国家必须决定如何将其有限的资源优先用于后续补充调查。虽然一些报告已被确定为胡蜂,许多其他目击已证明是其他类型的昆虫。你的论文应该探讨和解决以下几个方面:
()说明并讨论是否可以预测这种有害生物随时间的传播,以及精确程度如何。(2)大多数报道的目击都把其他黄蜂误认为是胡蜂。仅使用提供的数据集文件和(可能)提供的图像文件来创建、分析和讨论预测错误分类可能性的模型。(3)使用你的模型讨论你的分类分析如何导致优先调查最有可能是正面目击的报告。(4)说明随着时间的推移,如果有额外的新报告,如何更新模型,以及更新的频率。(5)使用你的模型,有什么证据可以证明该害虫已被消灭在华盛顿州
胡蜂预测模型
问题分析分析大黄蜂的出现量随时间的变化、创新点:考虑空间分布的差异。预测模型选择:LSTM、RNN、ARIMA、MLR、SVR目击准确性的深度学习模型
2.数据分析/预处理#问题分析=;通过题目给的公众报告准确度情况excel表格,上图可见PositiveID、NegativeID、Unverified数据中PositiveID数据很少。数据严重不均衡会影响深度学习模型的偏好,也就是说给你新公众报道信息,模型更容易预测为NegativeID、Unverified两种情况,这是我们不希望的。针对这样的问题又两种解决办法:()数据扩充,数据为文本数据:、传统文本数据增强的技术:EDA().同义词替换(SR:SynonymsReplace):不考虑stopwords,在句子中随机抽取n个词,然后从同义词词典中随机抽取同义词,并进行替换。Eg:“我非常喜欢这部电影”—“我非常喜欢这个影片”,句子仍具有相同的含义,很有可能具有相同的标签。(2).随机插入(RI:RandomlyInsert):不考虑stopwords,随机抽取一个词,然后在该词的同义词集合中随机选择一个,插入原句子中的随机位置。该过程可以重复n次。Eg:“我非常喜欢这部电影”—“爱我非常喜欢这部影片”。(3).随机交换(RS:RandomlySwap):句子中,随机选择两个词,位置交换。该过程可以重复n次。(4).随机删除(RD:RandomlyDelete):句子中的每个词,以概率p随机删除。2.深度学习数据增强技术.半监督Mixmatch2.无监督数据增强UDA
(2)加权损失函数让对PositiveID预测错误的惩罚更重,即下面的公式中w设置的更大点:w*LossPositive+w2*LossNegative+w3*LossUnverified对NegativeID、Unverified数据预测错误的惩罚更轻,最后w+w2+w3=2.2问题解答方法:训练图像分类模型,模型需要构建深度学习框架:()首先将数据分为训练数据和验证数据,(2)然后利用深度学习网络进行特征提取。(3)建立损失函数,方向传播进行训练模型选择:CNN、SVM、决策树等
模型评估
问题分析:即对第二个模型进行评估,可以从准确率方面说明
模型优化
解释模型的更新机制、复杂度、时效性、不同区域的适用性等。
建议模型
给出黄蜂数量减少至认定的安全范围的证据
往期回顾
.高教社杯全国大学生数学建模竞赛各赛区成绩汇总
2.下半年逆袭参加的数学建模,评奖评优,加分必备
3.数学建模之流程图和数据可视化
4.保研加分项▎参加2美赛干货分享
5.关于年全国大学生数学建模竞赛中部分参赛论文相似度较高的通报