赞
踩
本文详细介绍了jieba库里的字典中常用的各词性
1.名词 (n):
用于指示人、事、物或抽象概念的词汇。
1.1 人名(nr)
在jieba库中,词性标注中的nr表示人名。
当使用allowPOS参数时,包含nr的词汇将被允许出现在分词的结果中。
人名通常是文本中具有特殊意义的词汇,包括个人的姓氏和名字。
1.2 地名 (ns)
在jieba库中,词性标注中的ns表示地名。
1.3 机构团体(nt)
在jieba库中,词性标注中的nt表示机构团体。
1.4 其他专有名词(nz)
在jieba库中,词性标注中的nz表示其他专有名词。
下面是代码:
import jieba
text = "张三和李四是好朋友。"
result = jieba.cut(text, allowPOS=('n', 'nr'))
print(" ".join(result))
下面的所有词性,需要的只需要添加到allowPOS中即可。
2.动词 (v): 描述动作、状态、或发生的过程。 2.1 vn–动名词 3.形容词 (a): 用于描述名词的特征或性质。 4.副词 (ad): 修饰动词、形容词或其他副词,表示程度、时间、地点等关系。 5.数词 (m): 表示数量或顺序的词。 6.量词 (q): 用于表示数量的词。 7.代词 (r): 用于代替名词的词汇。 8.介词 (p): 表示名词之间、名词与其他词之间的关系。 9.连词 (c): 用于连接词语或句子成分。 10.助词 (u): 用于表示语气、时态等辅助功能的词。 11.感叹词 (e): 表示强烈感情或意愿的词。 12.方位词 (f): 表示方向、位置关系的词。 13.成语 (i): 四字以上的固定词组。 14.习惯用语 (l): 习惯性使用的固定表达。 15.拟声词 (o): 模拟声音的词汇。 16.前缀 (h): 词语前缀部分。 17.后缀 (k): 词语后缀部分。 18.未知词 (un): 未知或无法识别的词。 19.时间(t) 20.标点(w)
当在jieba库中使用分词时,可以通过allowPOS参数来指定允许的词性。在你提供的例子中,allowPOS=(‘n’, ‘nz’, ‘v’, ‘vd’, ‘vn’, ‘l’, ‘a’, ‘d’)表示只允许分词结果中包含名词、专有名词、动词、副动词、名动词、习惯用语、形容词和副词这几种词性。
以下是对这些词性的简要说明:
名词 (n):用于指示人、事、物或抽象概念的词汇。
专有名词 (nz):专有的名称、地名等。
动词 (v):描述动作、状态、或发生的过程。
副动词 (vd):表语动词,用于表示状态。
名动词 (vn):表示具有名词和动词性质的词。
习惯用语 (l):习惯性使用的固定表达。
形容词 (a):用于描述名词的特征或性质。
副词 (d):修饰动词、形容词或其他副词,表示程度、时间、地点等关系。
通过限定词性,你可以更精确地控制分词的结果,使其符合特定的需求或任务。在实际使用中,根据具体场景和目标,可以灵活调整allowPOS参数。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。