赞
踩
感觉这一系列课程是环环相扣的,第四天的目标是对五位选手进行图像识别。
最终识别结果如图下:
可以看到模型会把安崎错认为是许佳琪…
个人觉得对于图像识别的准确率主要有以下三点影响因素:
通过改变和增大数据集之后,对安崎选手的识别能力依然不佳。在以后有精力的时候会尝试着改进模型。
最后的综合大作业实际上是前几天任务的总结。
遇到的问题主要是在绘制词频统计图时,发生了如下的情况:
图中我们可以看出:欣虞书!很显然这是在分词过程中出现了问题。
解决方法是采用jieba分词,通过加载自定义词典,使之可以正确分词。
def fenci(text):
jieba.load_userdict('add_words.txt')
seg_list_exact = jieba.lcut(text, cut_all = False) # 精确模式分词
return seg_list_exact
最后附上最终的词云,嘿嘿嘿~
另外,绘制词云时的图片背景尽量要选择白色的,如果图片本身有白色的部分,则这些部分不会有词条。比如下图这个迪迦奥特曼…
本次学习让我对paddle框架产生了浓厚的兴趣。在课程中,给我留下印象最深的是第四天自己动手制作简单的数据集。(ps:小姐姐的图片真的不好收集,最关键的是,她们有的真的好像)也要为老师的讲解点赞,对新手非常友好。后续一定会深入学习这次学习的文档资料。也希望课程组在完成基本的教学任务之后,分享更多训练效果较好的模型供大家学习。
总而言之,这次学习体验很佳,希望飞桨课程越做越好。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。