当前位置:   article > 正文

Python脚本 抓取/翻译动漫角色名字的罗马音或外文名(用于搜索图片)_怎么查动漫的罗马音名

怎么查动漫的罗马音名

https://danbooru.donmai.us 搜索色图的时候,因为老美的网站的缘故,不支持中文和日文输入,只能输入平假名对应罗马音来寻找人物.像我虽然日语N1了,但是遇到人名有时依然会念错.所以需要一个可以直接翻译角色名的API.不过找了一圈,什么有道翻译,谷歌翻译(googleTranslate for py),都是坑=,=
例如:宝多六花->Treasure six flowers
我佛了,什么精致翻译
所以不考虑机翻考虑人翻,立刻想到可以用百度百科或者萌娘百科的翻译,于是不用翻译直接用爬虫爬下来不就好了吗?
所以立刻写完测试,拿来使用(好像没啥问题)
图一:输入框中输入角色的罗马音
在这里插入图片描述
图二:百科翻译

在这里插入图片描述

测试结果

1.动漫角色
在这里插入图片描述

其他

另外,还能搜现实人物的外文名。因为百度百科的网页样式比较统一,所以不用修改爬虫就能得到,但是萌百的页面普遍有三种1.角色 2.重名->重定向 3.现实人物,而这里只做了对角色的搜索页面,所以现实人物会GG。另外没有对没有平假名的页面也会GG
在这里插入图片描述
在这里插入图片描述
我觉得可以走NLP方向研究下平假名翻译这个问题

Python代码

import requests
  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/969017
推荐阅读
相关标签
  

闽ICP备14008679号