当前位置:   article > 正文

基于讯飞开放平台API服务构建集成大模型能力_科大讯飞星火模型api

科大讯飞星火模型api

在前面的一篇文章中实测体验了讯飞开放平台发布的V2.0版本大模型的能力,感兴趣的话可以自行移步阅读即可:

《科大讯飞发布星火认知大模型2.0版——体验实测》

这里一并发布的还有API接口,如下所示:

 点击【API测试申请】即可自动跳转至新建工单页面,如下所示:

 填写自己的对应信息即可提交工单,等待平台审核通过。

APPID的获取方法在这里。安装提示进行操作创建1个应用即可。如下所示:

 接下来就可以通过编写程序来调用接口进行大模型能力的调用了。这里程序其实也是不需要自己去重头开发的,官方的实例里面还是比较详细的。 文档地址在这里,如下所示:

 请求参数构造实例如下所示:

  1. # 参数构造示例如下
  2. {
  3. "header": {
  4. "app_id": "12345",
  5. "uid": "12345"
  6. },
  7. "parameter": {
  8. "chat": {
  9. "domain": "general",
  10. "temperature": 0.5,
  11. "max_tokens": 1024,
  12. }
  13. },
  14. "payload": {
  15. "message": {
  16. # 如果想获取结合上下文的回答,需要开发者每次将历史问答信息一起传给服务端,如下示例
  17. # 注意:text里面的所有content内容加一起的tokens需要控制在8192以内,开发者如有较长对话需求,需要适当裁剪历史信息
  18. "text": [
  19. {"role": "user", "content": "你是谁"} # 用户的历史问题
  20. {"role": "assistant", "content": "....."} # AI的历史回答结果
  21. # ....... 省略的历史对话
  22. {"role": "user", "content": "你会做什么"} # 最新的一条问题,如无需上下文,可只传最新一条问题
  23. ]
  24. }
  25. }
  26. }

接口请求字段由三个部分组成:header,parameter, payload。 字段解释如下

header部分

参数名称类型必传参数要求参数说明
app_idstring应用appid,从开放平台控制台创建的应用中获取
uidstring最大长度32每个用户的id,用于区分不同用户

parameter.chat部分

参数名称类型必传参数要求参数说明
domainstring取值为[general,generalv2]指定访问的领域,general指向V1.5版本 generalv2指向V2版本。注意:不同的取值对应的url也不一样!
temperaturefloat取值为[0,1],默认为0.5核采样阈值。用于决定结果随机性,取值越高随机性越强即相同的问题得到的不同答案的可能性越高
max_tokensint取值为[1,4096],默认为2048模型回答的tokens的最大长度
top_kint取值为[1,6],默认为4从k个候选中随机选择⼀个(⾮等概率)
chat_idstring需要保障用户下的唯一性用于关联用户会话

payload.message.text部分

注:text下所有content累计内容 tokens需要控制在8192内

参数名称类型必传参数要求参数说明
rolestring取值为[user,assistant]user表示是用户的问题,assistant表示AI的回复
contentstring所有content的累计tokens需控制8192以内用户和AI的对话内容

接口响应实例如下所示:

  1. # 接口为流式返回,此示例为最后一次返回结果,开发者需要将接口多次返回的结果进行拼接展示
  2. {
  3. "header":{
  4. "code":0,
  5. "message":"Success",
  6. "sid":"cht000cb087@dx18793cd421fb894542",
  7. "status":2
  8. },
  9. "payload":{
  10. "choices":{
  11. "status":2,
  12. "seq":0,
  13. "text":[
  14. {
  15. "content":"我可以帮助你的吗?",
  16. "role":"assistant",
  17. "index":0
  18. }
  19. ]
  20. },
  21. "usage":{
  22. "text":{
  23. "question_tokens":4,
  24. "prompt_tokens":5,
  25. "completion_tokens":9,
  26. "total_tokens":14
  27. }
  28. }
  29. }
  30. }

接口返回字段分为两个部分,header,payload。字段解释如下

header部分

字段名类型字段说明
codeint错误码,0表示正常,非0表示出错;详细释义可在接口说明文档最后的错误码说明了解
messagestring会话是否成功的描述信息
sidstring会话的唯一id,用于讯飞技术人员查询服务端会话日志使用,出现调用错误时建议留存该字段
statusint会话状态,取值为[0,1,2];0代表首次结果;1代表中间结果;2代表最后一个结果

payload.choices部分

字段名类型字段说明
statusint文本响应状态,取值为[0,1,2]; 0代表首个文本结果;1代表中间文本结果;2代表最后一个文本结果
seqint返回的数据序号,取值为[0,9999999]
contentstringAI的回答内容
rolestring角色标识,固定为assistant,标识角色为AI
indexint结果序号,取值为[0,10]; 当前为保留字段,开发者可忽略

payload.usage部分(在最后一次结果返回)

字段名类型字段说明
question_tokensint保留字段,可忽略
prompt_tokensint包含历史问题的总tokens大小
completion_tokensint回答的tokens大小
total_tokensintprompt_tokens和completion_tokens的和,也是本次交互计费的tokens大小

 这里官方给出来很多语言版本的调用实例方便大家直接上手使用,不需要完全从零开始开发,可能需要根据自己的实际业务场景进行调整接口。

我这里选择的是Python版本的调用程序。

 SparkApi.py模块是核心调用请求实现模块

test.py模块主要需要自己填写对应的APPID、API_SECRET和API_KEY三个字段,即可直接启动。

我在本地做了简单的测试如下所示:

 最后还是老样子,问一下这个数学问题,感觉模型回答得依旧是不行的,我还特意在问题最后写了一句提醒的话【要考虑实际情况】,结果模型回答还是不尽人意。

 不过这些不是开发者一时半会能去改善的,这里主要的目的是为了基于API接口请求来走通大模型调用的流程,为后面可能使用到的场景做一点铺垫,感兴趣的话都可以自行尝试一下!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/482253
推荐阅读
相关标签
  

闽ICP备14008679号