通过统计得分来实现更好的方法
我有7000个数据实例。
我有这些实例人工评分(参考)。
我有不同的引擎来自动确定数据的分数。
我有一个Excel表格,每列描述了某个引擎的得分和一列手动得分的数据。
我想知道哪些引擎更接近人类的得分使用Excel的function,编程,或只是给我简单的math,我会解决它。
数据评分从-3.0到+3.0
我使用该应用程序的C#和.NET Excel COM库来访问Excel表。
-UPDATE-
从统计的angular度来说,描述错误的最好方法是什么,我的意思是人的分数趋于接近于中性(0),但是发动机的分数往往有偏差(高于1.5 +/-),我希望能够确定以正确的方式描述和夸大错误的最佳方程。
我会build议使用均方误差。 对于每个数据实例计算每个引擎的差异的平方。 这会夸大错误,并给出正数。 然后你为每个引擎取平均误差。 最低的是对人类“最接近的”估计量。
通常通过从人类分数中减去引擎分数,取绝对值,然后将所有7000进行求和。总和最小的引擎是最接近的。
如果每个数据点在相同的范围内,数据集之间的欧几里得距离应该足够好。 为了清楚起见,数据实例将被编号,并且引擎将被标注。 如果数据点i
上的人给出的分数是H_i
,并且引擎a
给出的分数是Ea_i
,那么对于引擎a
的错误(如何“不闭合”给定的引擎)是:
ERROR(a) = (H_1 - Ea_1)^2 + (H_2 - Ea_2)^2 + … + (H_7000 - Ea_7000)^2
最接近的引擎是错误最小的引擎。
- 使用c#在excel中select工作表
- 错误! (使用Excel中C#命名的范围)
- EPPlus在DataField上sorting数据透视表,而不是RowField
- 如果有任何链接可以免费为C#的Excel“帮手”类库?
- 我可以在Word或Excel中创build撤消事务吗? (VSTO)
- 尽pipe使用IMEX = 1,OleDb不会读取Excel文件中的所有行
- Excel / EPPlus数字格式是否与DateTimeFormat.ShortDatePattern兼容?
- 我应该参考哪个Microsoft Word(和Excel)Interop程序集或DLL?
- 如何编辑或取消保护C#中受保护的Excel工作表中的单个单元格?