赞
踩
中文描述评价指标(blue,rouge,meteor,cider)_wzxkkdm的博客-CSDN博客
NLP评估指标之ROUGE - 知乎
困惑度PPL (perplexity)_ppl困惑度_hxxjxw的博客-CSDN博客NLP常见任务及评估指标_nlp评价指标_牵制有心碎的博客-CSDN博客
evaluate-metric (Evaluate Metric)
1、perplexity
perplexity = e**(sum(losses) / num_tokenized_tokens),遵循深度学习框架中的最新约定。
文章目录
四大类常见的任务:
评估指标
1、PPL
2、BLEU
3、ROUGE
4、METEOR
5、CIDEr
6、Edit Distance
四大类常见的任务:
以下很多内容均为参考,链接放于文末~
评估指标
一、分类任务常见评估:
准确度(Accuracy) 评估预测正确的比例,精确率(Precision) 评估预测正例的查准率,召回率(Recall) 评估真实正例的查全率。如果是多分类,则每个类别各自求P、R最终求平均值。❤️
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。