赞
踩
现在创新类竞赛很多,其中规模较大的竞赛,一般采用两阶段(网评、现场评审)或三阶段(网评、现场评审和答辩)评审。创新类竞赛的特点是没有标准答案,需要评审专家根据命题人(组)提出的评审框架(建议)独立评审。所以,对同一份作品,不同评委的评分可能存在较大差异。事实上,当竞赛规模大,评委的人数众多时,极差(定义见附件1)大的问题更为突出。显然,简单地依据多位评委评分的总和进行排序并不是创新类竞赛评审的好方案。因此,探讨大规模创新类竞赛评审方案的公正性、公平性和科学性具有深远意义。
目前,各项创新类竞赛都在摸索、调整自己的评审方案。现有方案包括:(1)对每位评审专家的评分进行标准化(公式见附件1),按作品将标准分相加得每件作品总分,然后依总分排序;(2)去掉同一份作品得分中的最高分、最低分,再将剩余评分相加,最后依总分排序;(3)同一份作品如果专家的评分差异(极差)较大,组织相关专家协商调整,将调整后得分相加,再依总分排序;(4)当竞赛规模很大时,首先利用上述方案(1)或(2)或(3)对作品进行初选,再对初选入围的作品组织专家评审(第二阶段评审)或经过答辩等环节确定获奖名单。这些方案都有一定的合理性,但也有局限性。特别是针对大规模创新类竞赛评审,现有方案偏简单,研究不多。
在大规模创新类竞赛中,增加评审每份作品的专家人数,显然有利于评审工作的公正、公平。然而,由于种种原因,参与评审工作的专家数目是受限的。评审专家少了,评审工作的误差会变大。不过,考虑到大规模创新类竞赛获奖比例通常小于50%,有些误差并不影响是否获奖。因此,在不影响获奖等级的前提下,为了适应评审专家人数较少的现状,不少竞赛采用两阶段评审办法。
为探索大规模创新类竞赛评审的好方法,附件给出模拟大规模创新类竞赛的数据。其包含两阶段评审,第一阶段由五位专家对作品评审,取标准分后,将五位专家的标准分取均值后排序,按事先约定的比例取排名在前的作品,进入第二阶段评审。第二阶段由三位专家对作品评审,分别取标准分,并对少数极差大作品的标准分进行必要的调整后,再将第一阶段五位专家评审标准分的均值、第二阶段三位专家的评审标准分共4份成绩求和,依最终总成绩再排序。请利用这批数据建立数学模型,探讨建立更为合理、公平的评审方案。
这个问题的核心是如何平衡每位评审专家评审作品集合的交集,使得所有评审的评分具有较高的可比性。以下是建模的一个具体方案:
分析标准化分数方案的问题
评审的作品集合不同:如你所说,大规模的创新类竞赛中,每位评审专家评审的作品集合往往有很大的差异。如果每位专家评审的作品难易程度不同,标准分的计算可能会受到影响,因为它们是基于每位评审员的均值和标准差来计算的。
评审专家的标准化方法:标准分计算需要每位专家的平均分和标准差,但由于每位专家评审的作品集合不同,它们的平均分和标准差也可能存在很大差异。
两种评审方案
固定参考集合法:选择一部分作品作为参考,每位评审员都必须评审这部分作品。这部分作品的分数用于调整评审员的其他作品的分数。
两阶段评审:初步评审所有作品,选出一部分高分和有争议的作品进入第二轮评审,所有评审员都参与第二轮评审。
分析提供的数据
你提供的数据包括了不同专家对不同作品的原始分数和标准分。我们可以对这些数据进行以下分析:
计算每位专家的均值和标准差,以了解各位专家评分的趋势和分散程度。
对比每位专家的评分与其他专家的评分,寻找可能的系统性差异或偏见。
对比每份作品的原始成绩与其标准分,以了解标准化过程对作品排名的影响。
设计新的标准分计算模型
考虑到在大规模创新类竞赛中,每位评审员只能看到一部分作品,可以考虑以下标准分计算方法:
标准分=(原始分−每位评审员的所有作品的均值)/ 每位评审员的所有作品的标准差
这样,每份作品的标准分反映了它相对于该评审员评审的所有作品的位置。
利用附件2提供的数据进行改进
多次评审结果的加权平均:可以考虑将第一次评审和第二次评审的结果进行加权平均,以提高评审的准确性。
考虑复议分数:对于有复议的作品,可以考虑将复议分数和原始分数结合,例如,取两者的平均或加权平均。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。