当前位置:   article > 正文

paddle之《Python小白逆袭大神》小记(下)_paddle add_words

paddle add_words

paddle之《Python小白逆袭大神》小记(下)

paddle之《Python小白逆袭大神》小记(上)

Day4-《青春有你2》选手识别

感觉这一系列课程是环环相扣的,第四天的目标是对五位选手进行图像识别

遇到的问题

最终识别结果如图下:
在这里插入图片描述
可以看到模型会把安崎错认为是许佳琪…
个人觉得对于图像识别的准确率主要有以下三点影响因素:

  1. 训练模型本身
  2. 数据集的大小和质量
  3. 批处理的大小batch_size

通过改变和增大数据集之后,对安崎选手的识别能力依然不佳。在以后有精力的时候会尝试着改进模型。

Day5- 综合大作业

最后的综合大作业实际上是前几天任务的总结。

  1. 爱奇艺《青春有你2》评论数据爬取
  2. 词频统计并可视化展示
  3. 绘制词云

遇到的问题

遇到的问题主要是在绘制词频统计图时,发生了如下的情况:
23333
图中我们可以看出:欣虞书!很显然这是在分词过程中出现了问题。
解决方法是采用jieba分词,通过加载自定义词典,使之可以正确分词。

def fenci(text):
    jieba.load_userdict('add_words.txt')
    seg_list_exact = jieba.lcut(text, cut_all = False) # 精确模式分词
    return seg_list_exact
  • 1
  • 2
  • 3
  • 4

最后附上最终的词云,嘿嘿嘿~
在这里插入图片描述
另外,绘制词云时的图片背景尽量要选择白色的,如果图片本身有白色的部分,则这些部分不会有词条。比如下图这个迪迦奥特曼…

结课感受

本次学习让我对paddle框架产生了浓厚的兴趣。在课程中,给我留下印象最深的是第四天自己动手制作简单的数据集。(ps:小姐姐的图片真的不好收集,最关键的是,她们有的真的好像)也要为老师的讲解点赞,对新手非常友好。后续一定会深入学习这次学习的文档资料。也希望课程组在完成基本的教学任务之后,分享更多训练效果较好的模型供大家学习。
总而言之,这次学习体验很佳,希望飞桨课程越做越好。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/318843
推荐阅读
相关标签
  

闽ICP备14008679号