赞
踩
项目缘起
最近准备重新拾起英文学习,背背英文文章啥的,然后发现对我这种英语学得还可以的学生来说,最怕遇到得其实是长到根本看不清的句子,再加上一些生词或者生词组,真的是查词典都没法查,看翻译吧又没法知道具体某个词或者词组的意思,真的是痛不欲生 。
这个时候我突然想我的专业是自然语言处理哇 ,直接自己动手做一个语法解析器出来就好了嘛(~ ̄▽ ̄)~。(说是自己动手做,其实就是调调别人写好的包包啦 )
效果展示在线英文语法解析器https://www.zhihu.com/video/1193121335465955328
环境搭建
可以在自己电脑上安装,或者是使用 Google Colab 提供的在线编程环境【强烈推荐】。
软件需要:python3, 以及最新版的 spacy 和 Jupyter Widgets。
我做了什么
利用spacy中的可视化功能,并将可视化中的可调参数暴露出来,使用widgets封装成交互式的jupyter python程序。
直接在交互部分的文本框中粘贴你需要的文本,就能实时进行解析。
Spacy 中的Tag的意义
标签词性意义描述形态学注释
$SYM标点符号
``PUNCT开引号PunctType=quot PunctSide=ini
''PUNCT闭引号PunctType=quot PunctSide=fin
,PUNCT逗号PunctType=comm
-LRB-PUNCT左圆括号PunctType=brck PunctSide=ini
-RRB-PUNCT右圆括号PunctType=brck PunctSide=fin
.PUNCT标点符号,句号PunctType=peri
:PUNCT标点符号,冒号或省略号
ADDX电子邮件记号“@”
AFXADJ词缀Hyph=yes
CCCCONJ连词ConjType=comp
CDNUM基数NumType=card
DTDET定语
EXPRON存在在那里AdvType=ex
FWX外来词Foreign=yes
GWX多词表达中的附加词
HYPHPUNCT标点符号,连字符PunctType=dash
INADP连词,从属词或介词
JJADJ形容词Degree=pos
JJRADJ形容词,比较级Degree=comp
JJSADJ形容词,最高级Degree=sup
LSX列表中的元素NumType=ord
MDVERB动词,情态辅助VerbType=mod
NFPPUNCT多余的标点
NILX缺少标签
NNNOUN名词,单数或质量Number=sing
NNPPROPN名词,专有单数NounType=prop Number=sing
NNPSPROPN名词,专有复数NounType=prop Number=plur
NNSNOUN名词,复数Number=plur
PDTDET定语
POSPART所有格结尾Poss=yes
PRPPRON人称代词PronType=prs
PRP$DET代词,所有格PronType=prs Poss=yes
RBADV副词Degree=pos
RBRADV副词,比较级Degree=comp
RBSADV副词,最高级Degree=sup
RPADP副词,原型
SPSPACE空格
SYMSYM符号
TOPART不定式的“to”PartType=inf VerbForm=inf
UHINTJ叹词
VBVERB动词,基本形式VerbForm=inf
VBDVERB动词,过去式VerbForm=fin Tense=past
VBGVERB动词,动名词或现在分词VerbForm=part Tense=pres Aspect=prog
VBNVERB动词,过去分词VerbForm=part Tense=past Aspect=perf
VBPVERB动词,非第三人称单数形式VerbForm=fin Tense=pres
VBZVERB动词,第三人称单数形式VerbForm=fin Tense=pres Number=sing Person=three
WDTDETwh-定语
WPPRONwh-人称代词
WP$DETwh-人称代词,所有格Poss=yes
WRBADV副词
XXX未知
_SPSPACE空格
参考资料
【整理不易,点个赞吧~ 】
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。