背景
作用
影响
2算法分类
字符匹配
理解法
统计法
3技术难点
歧义识别
新词识别
4应用
5常见项目
SCWS
FudanNLP
ICTCLAS
HTTPCWS
CC-CEDICT
IK
Paoding
MMSEG4J
盘古分词
Jcseg
friso
6中文分词API
-
参数说明可传参数,如下:
参数
|
类型
|
是否可选
|
意义
|
枚举
|
备注
|
---|---|---|---|---|---|
text
|
String
|
是
|
需要分词文字或文章
|
默认:
Foxapi 是一个针对开发者提供一些预先定义的接口,通过该接口开发者可以获取到相应的数据信息,方便开发者调用数据,从而间接减少代码编写。 | |
separator
|
String
|
是
|
分词符号
|
默认:/
| |
freqfirst
|
Boolean
|
是
|
优先判断词频。
如果一个长的单词由多个短的单词组成,而长的单词词频较低则忽略长的单词。 如:香格里拉酒店的词频比香格里拉和酒店的词频都要低,则忽略香格里拉酒店。 |
默认:true
| |
matchname
|
Boolean
|
是
|
是否匹配汉语人名
|
默认:true
| |
multiselect
|
Boolean
|
是
|
多元分词选项,分词将更细致。
如:微软是大公司。 true 则分为 微软/是/大/公司 false 则分为 微软/是/大公司 |
默认:false
| |
apiid
|
String
|
否
|
API标识码
|
FOXAPI的每个应用都必须使用APIID,用来记录API操作。
请到用户中心获取APIID | |
alt
|
Alt
|
是
|
返回的数据格式
|
1.xml → XML形式展示数据;
2.json → json形式展示数据; |
默认:xml
|
-
返回内容该API返回的网站信息,如下:<?xml version="1.0" encoding="UTF-8"?><root><text>Foxapi/ /是/一个/针对/开发者/提供/一些/预先/定义/的/接口/,/通过/该/接口/开发者/可以/获取/到/相应/的/数据/信息/,/方便/开发者/调用/数据/,/从而/间接/减少/代码/编写/。/</text></root>参数说明:
参数
|
类型
|
意义
|
备注
|
---|---|---|---|
text
|
String
|
返回的分词后内容
| |
errormsg
|
String
|
API错误信息
|
当访问API出现错误时,数据里面将出现此节点,否则不出现。
|