当前位置:   article > 正文

Unity+百度文心大模型驱动AI小姐姐数字人_unity+百度文心一言

unity+百度文心一言

1.简述

        最近看到新闻,说是百度、字节、商汤、百川、智普等几家企业及机构所发布的生成式大语言模型,通过了《生成式人工智能服务管理暂行办法》,成为首批获得官方备案的大语言模型服务提供商。虽然一直在使用包括文心一言、chatglm这些大语言模型的,但这次好像用着合法合规,有了保障的感觉。

        关于百度的文心一言,也是继chatgpt发布以来国内首发跟进,发布的大语言模型了。从文心一言的官方应用上,并没有找到api的使用入口,让我一度以为百度没有开放相关的接口服务。文心一言官方传送门:

https://yiyan.baidu.com/icon-default.png?t=N7T8https://yiyan.baidu.com/        直到有一天下午接到百度AI开放平台的客户回访,顺便咨询了一下文心一言的API相关的问题,才了解到,在百度的千帆大模型平台上,是有提供针对百度自研模型的API服务的。所以简单看了一下千帆大模型平台,果然是有大语言模型的API入口,不止提供有百度的文心一言大模型,也提供了几个主流大语言模型的公共服务。所以,就将百度文心大模型的API服务集成到我的AI二次元姐姐项目里,这样大家又多了一个国内合法的选择了,百度智能云平台传送门:

https://cloud.baidu.com/icon-default.png?t=N7T8https://cloud.baidu.com/        接下来,我将介绍一下如何在百度智能云平台上,开通大语言模型服务,以及如何使用我的AI工具包,在Unity上部署实现AI二次元小姐姐聊天应用。

2.开通大语言模型应用

       2.1 千帆大模型平台

        使用百度文心大模型应用,首先我们需要注册一个百度账号,这里就不再赘述了。注册账号后,根据上节内容中提到的百度智能云平台,点击链接进入到官方站点。

        进入到官方平台页面后,我们可以在顶部的菜单栏里找到【产品->AI开发平台->文心千帆大模型】,从这个入口就可以找到我们需要的文心大模型服务了。

        点击文心千帆大模型平台,进入到大模型平台页面,这里我们可以查看文心千帆大模型所提供的各种能力。

        能够提供的大语言模型,根据官方文档我们可以了解到,千帆大语言模型平台支持的生成式AI模型包括百度自研的文心一言、文心一格,也包含了多个第三方大模型,如chatGLM、Llama、RWKV,也支持stable diffusion图片生成模型,总体上看还是很强大的。

        这里,我们需要的是利用文本生成模型来驱动我们的AI数字人的,所以只需要使用文本生成模型就可以满足我们的需求。百度智能云平台提供了若干种大语言模型的公共服务,我们可以直接使用,包括文心大模型以及一些第三方模型。可支持的大语言模型可详细查看官方文档。

       2.2 创建大模型应用

        在使用文心大模型之前,我们首先需要创建一个大模型应用,只需要点击文心大模型主页上的【立即使用】按钮,就可以跳转到控制台界面(请先登录账号),在控制台页面中,找到“应用接入”,点击进入到应用创建的页面。

        在应用创建视图下,点击“创建应用”,进入到应用创建页面。根据平台的提示,填写应用名称和描述信息,可用的大模型公共服务,平台默认全部勾选了,可以不用管,直接提交创建,这样我们就完成了应用的创建操作。

        应用创建成功之后,就可以在控制台界面中找到应用的api key以及secret key这两个密钥,妥善保管好,后面我们会用到。

        2.3 开通模型付费

        平台所提供大语言模型公共服务,需要我们开通付费后,才能使用。百度千帆大模型平台的模型服务采用的是,按量计费模式,我们先开通模型服务付费之后,再根据使用的token数量,计算费用。我们可以在控制台界面的上方,找到计费管理按钮,点击就可以进入到计费开通界面了。

        平台提供的公共模型服务的价格,可以在视图中查看,100万token的价格在几块钱至十几块钱不等,可以根据自己的需求,选择模型进行开通即可。

        开通模型付费后,咱们就可以使用相应的模型服务了,接下来,咱们就可以在unity端,进行API对接的代码实现了。

3.API服务对接

        千帆大模型平台的API对接流程,和百度AI开放平台的其他服务对接的流程是类似,首先,需要使用应用创建后,拿到的api key以及secret key,通过百度的鉴权api,拿到授权token,这个access token的有效期是30天,可以根据需要更新即可。获取到token后,在大语言模型API对接流程中,我们需要根据所选择的语言模型的访问地址,将token拼接到url中,再进行服务的访问。

        接下来,我们来看看详细的对接过程的代码实现吧。

3.1 鉴权接口

        百度应用服务的鉴权接口访问,需要提供应用的api key以及secret key,这两个密钥在我们创建应用后,可以在控制台找到。获取access token的api地址如下:

https://aip.baidubce.com/oauth/2.0/tokenicon-default.png?t=N7T8https://aip.baidubce.com/oauth/2.0/token

        代码示例:

  1. using Newtonsoft.Json.Linq;
  2. using System.Collections;
  3. using System.Collections.Generic;
  4. using UnityEngine;
  5. using UnityEngine.Networking;
  6. public class BaiduSettings : MonoBehaviour
  7. {
  8. #region 参数定义
  9. /// <summary>
  10. /// API Key
  11. /// </summary>
  12. [Header("填写应用的API Key")] public string m_API_key = string.Empty;
  13. /// <summary>
  14. /// Secret Key
  15. /// </summary>
  16. [Header("填写应用的Secret Key")] public string m_Client_secret = string.Empty;
  17. /// <summary>
  18. /// 是否从服务器获取token
  19. /// </summary>
  20. [SerializeField] private bool m_GetTokenFromServer = true;
  21. /// <summary>
  22. /// token值
  23. /// </summary>
  24. public string m_Token = string.Empty;
  25. /// <summary>
  26. /// 获取Token的地址
  27. /// </summary>
  28. [SerializeField] private string m_AuthorizeURL = "https://aip.baidubce.com/oauth/2.0/token";
  29. #endregion
  30. private void Awake()
  31. {
  32. if (m_GetTokenFromServer)
  33. {
  34. StartCoroutine(GetToken(GetTokenAction));
  35. }
  36. }
  37. /// <summary>
  38. /// 获取到token
  39. /// </summary>
  40. /// <param name="_token"></param>
  41. private void GetTokenAction(string _token)
  42. {
  43. m_Token = _token;
  44. }
  45. /// <summary>
  46. /// 获取token的方法
  47. /// </summary>
  48. /// <param name="_callback"></param>
  49. /// <returns></returns>
  50. private IEnumerator GetToken(System.Action<string> _callback)
  51. {
  52. //获取token的api地址
  53. string _token_url = string.Format(m_AuthorizeURL + "?client_id={0}&client_secret={1}&grant_type=client_credentials"
  54. , m_API_key, m_Client_secret);
  55. using (UnityWebRequest request = new UnityWebRequest(_token_url, "GET"))
  56. {
  57. request.downloadHandler = (DownloadHandler)new DownloadHandlerBuffer();
  58. yield return request.SendWebRequest();
  59. if (request.isDone)
  60. {
  61. string _msg = request.downloadHandler.text;
  62. TokenInfo _textback = JsonUtility.FromJson<TokenInfo>(_msg);
  63. string _token = _textback.access_token;
  64. _callback(_token);
  65. }
  66. }
  67. }
  68. /// <summary>
  69. /// 返回的token
  70. /// </summary>
  71. [System.Serializable]
  72. public class TokenInfo
  73. {
  74. public string access_token = string.Empty;
  75. }
  76. }

3.2 大语言模型API对接

       3.2.1 请求参数说明

        获取到access token之后,我们就可以根据文心大模型的api文档,进行接口对接了。不同模型的接口地址略有差异,我们可以通过查阅API文档,获取到各个模型的访问地址,API文档地址如下:

https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Nlks5zkzuicon-default.png?t=N7T8https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Nlks5zkzu        通过文档查阅,我们可以发现,千帆大模型平台提供的公共模型服务的访问地址,前面的地址是一样,只有模型名称的差异,注意这点就可以了,我们具体看一下接口的要求。

请求地址(示例):

 https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/根据模型而定
名称
Content-Typeapplication/json

        关于access token,我们将token拼接在url里即可,以下是url示例:

 https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/根据模型而定?access_token=token值

        需要发送的报文结构

名称类型必填描述
messagesList(message)聊天上下文信息。说明:
(1)messages成员不能为空,1个成员表示单轮对话,多个成员表示多轮对话
(2)最后一个message为当前请求的信息,前面的message为历史对话信息
(3)必须为奇数个成员,成员中message的role必须依次为user、assistant
(4)最后一个message的content长度(即此轮对话的问题)不能超过2000个字符;如果messages中content总长度大于2000字符,系统会依次遗忘最早的历史会话,直到content的总长度不超过2000个字符
temperaturefloat说明:
(1)较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定
(2)默认0.95,范围 (0, 1.0],不能为0
(3)建议该参数和top_p只设置1个
(4)建议top_p和temperature不要同时更改
top_pfloat说明:
(1)影响输出文本的多样性,取值越大,生成文本的多样性越强
(2)默认0.8,取值范围 [0, 1.0]
(3)建议该参数和temperature只设置1个
(4)建议top_p和temperature不要同时更改
penalty_scorefloat通过对已生成的token增加惩罚,减少重复生成的现象。说明:
(1)值越大表示惩罚越大
(2)默认1.0,取值范围:[1.0, 2.0]
streambool是否以流式接口的形式返回数据,默认false
user_idstring表示最终用户的唯一标识符,可以监视和检测滥用行为,防止接口恶意调用

message说明

名称类型描述
rolestring当前支持以下:
user: 表示用户
assistant: 表示对话助手
contentstring对话内容,不能为空
 3.2.2 响应参数说明

        以下是后台响应的报文结构

名称类型描述
idstring本轮对话的id
objectstring回包类型
chat.completion:多轮对话返回
createdint时间戳
sentence_idint表示当前子句的序号。只有在流式接口模式下会返回该字段
is_endbool表示当前子句是否是最后一句。只有在流式接口模式下会返回该字段
is_truncatedbool当前生成的结果是否被截断
resultstring对话返回结果
need_clear_historybool表示用户输入是否存在安全,是否关闭当前会话,清理历史会话信息
true:是,表示用户输入存在安全风险,建议关闭当前会话,清理历史会话信息
false:否,表示用户输入无安全风险
ban_roundint当need_clear_history为true时,此字段会告知第几轮对话有敏感信息,如果是当前问题,ban_round=-1
usageusagetoken统计信息,token数 = 汉字数+单词数*1.3 (仅为估算逻辑)

usage说明

名称类型描述
prompt_tokensint问题tokens数
completion_tokensint回答tokens数
total_tokensinttokens总数

注意 :同步模式和流式模式,响应参数返回不同,详细内容参考示例描述。

  • 同步模式下,响应参数为以上字段的完整json包。
  • 流式模式下,各字段的响应参数为 data: {响应参数}。
3.2.3 代码示例

        以下是访问大语言模型API服务的完整代码示例

  1. /// <summary>
  2. /// token脚本
  3. /// </summary>
  4. [SerializeField] private BaiduSettings m_Settings;
  5. /// <summary>
  6. /// 历史对话
  7. /// </summary>
  8. private List<message> m_History = new List<message>();
  9. /// <summary>
  10. /// 选择的模型类型
  11. /// </summary>
  12. [Header("设置模型名称")]
  13. public ModelType m_ModelType = ModelType.ERNIE_Bot_turbo;
  14. /// <summary>
  15. /// 初始化
  16. /// </summary>
  17. private void OnInit()
  18. {
  19. m_Settings = this.GetComponent<BaiduSettings>();
  20. GetEndPointUrl();
  21. }
  22. /// <summary>
  23. /// 发送消息
  24. /// </summary>
  25. /// <returns></returns>
  26. public override void PostMsg(string _msg, Action<string> _callback)
  27. {
  28. base.PostMsg(_msg, _callback);
  29. }
  30. /// <summary>
  31. /// 发送数据
  32. /// </summary>
  33. /// <param name="_postWord"></param>
  34. /// <param name="_callback"></param>
  35. /// <returns></returns>
  36. public override IEnumerator Request(string _postWord, System.Action<string> _callback)
  37. {
  38. stopwatch.Restart();
  39. string _postUrl = url + "?access_token=" + m_Settings.m_Token;
  40. m_History.Add(new message("user", _postWord));
  41. RequestData _postData = new RequestData
  42. {
  43. messages = m_History
  44. };
  45. using (UnityWebRequest request = new UnityWebRequest(_postUrl, "POST"))
  46. {
  47. string _jsonData = JsonUtility.ToJson(_postData);
  48. byte[] data = System.Text.Encoding.UTF8.GetBytes(_jsonData);
  49. request.uploadHandler = (UploadHandler)new UploadHandlerRaw(data);
  50. request.downloadHandler = (DownloadHandler)new DownloadHandlerBuffer();
  51. request.SetRequestHeader("Content-Type", "application/json");
  52. yield return request.SendWebRequest();
  53. if (request.responseCode == 200)
  54. {
  55. string _msg = request.downloadHandler.text;
  56. ResponseData response = JsonConvert.DeserializeObject<ResponseData>(_msg);
  57. //历史记录
  58. string _responseText = response.result;
  59. m_History.Add(new message("assistant", response.result));
  60. //添加记录
  61. m_DataList.Add(new SendData("assistant", response.result));
  62. //回调
  63. _callback(response.result);
  64. }
  65. }
  66. stopwatch.Stop();
  67. Debug.Log("chat百度-耗时:" + stopwatch.Elapsed.TotalSeconds);
  68. }
  69. /// <summary>
  70. /// 获取资源路径
  71. /// </summary>
  72. private void GetEndPointUrl()
  73. {
  74. url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/" + CheckModelType(m_ModelType);
  75. }
  76. /// <summary>
  77. /// 获取资源
  78. /// </summary>
  79. /// <param name="_type"></param>
  80. /// <returns></returns>
  81. private string CheckModelType(ModelType _type)
  82. {
  83. if (_type == ModelType.ERNIE_Bot){
  84. return "completions";
  85. }
  86. if (_type == ModelType.ERNIE_Bot_turbo)
  87. {
  88. return "eb-instant";
  89. }
  90. if (_type == ModelType.BLOOMZ_7B)
  91. {
  92. return "bloomz_7b1";
  93. }
  94. if (_type == ModelType.Qianfan_BLOOMZ_7B_compressed)
  95. {
  96. return "qianfan_bloomz_7b_compressed";
  97. }
  98. if (_type == ModelType.ChatGLM2_6B_32K)
  99. {
  100. return "chatglm2_6b_32k";
  101. }
  102. if (_type == ModelType.Llama_2_7B_Chat)
  103. {
  104. return "llama_2_7b";
  105. }
  106. if (_type == ModelType.Llama_2_13B_Chat)
  107. {
  108. return "llama_2_13b";
  109. }
  110. if (_type == ModelType.Llama_2_70B_Chat)
  111. {
  112. return "llama_2_70b";
  113. }
  114. if (_type == ModelType.Qianfan_Chinese_Llama_2_7B)
  115. {
  116. return "qianfan_chinese_llama_2_7b";
  117. }
  118. if (_type == ModelType.AquilaChat_7B)
  119. {
  120. return "aquilachat_7b";
  121. }
  122. return "";
  123. }
  124. #region 数据定义
  125. //发送的数据
  126. [Serializable]
  127. private class RequestData
  128. {
  129. public List<message> messages = new List<message>();//发送的消息
  130. public bool stream = false;//是否流式输出
  131. public string user_id=string.Empty;
  132. }
  133. [Serializable]
  134. private class message
  135. {
  136. public string role=string.Empty;//角色
  137. public string content = string.Empty;//对话内容
  138. public message() { }
  139. public message(string _role,string _content)
  140. {
  141. role = _role;
  142. content = _content;
  143. }
  144. }
  145. //接收的数据
  146. [Serializable]
  147. private class ResponseData
  148. {
  149. public string id = string.Empty;//本轮对话的id
  150. public int created;
  151. public int sentence_id;//表示当前子句的序号。只有在流式接口模式下会返回该字段
  152. public bool is_end;//表示当前子句是否是最后一句。只有在流式接口模式下会返回该字段
  153. public bool is_truncated;//表示当前子句是否是最后一句。只有在流式接口模式下会返回该字段
  154. public string result = string.Empty;//返回的文本
  155. public bool need_clear_history;//表示用户输入是否存在安全
  156. public int ban_round;//当need_clear_history为true时,此字段会告知第几轮对话有敏感信息,如果是当前问题,ban_round=-1
  157. public Usage usage = new Usage();//token统计信息,token数 = 汉字数+单词数*1.3
  158. }
  159. [Serializable]
  160. private class Usage
  161. {
  162. public int prompt_tokens;//问题tokens数
  163. public int completion_tokens;//回答tokens数
  164. public int total_tokens;//tokens总数
  165. }
  166. #endregion
  167. /// <summary>
  168. /// 模型名称
  169. /// </summary>
  170. public enum ModelType
  171. {
  172. ERNIE_Bot,
  173. ERNIE_Bot_turbo,
  174. BLOOMZ_7B,
  175. Qianfan_BLOOMZ_7B_compressed,
  176. ChatGLM2_6B_32K,
  177. Llama_2_7B_Chat,
  178. Llama_2_13B_Chat,
  179. Llama_2_70B_Chat,
  180. Qianfan_Chinese_Llama_2_7B,
  181. AquilaChat_7B,
  182. }

4. Unity端数字人配置

        项目的源码已经发布到Github了,我们可以直接下载,并导入到unity中使用,要求unity版本在2020.3.44及以上。导入工具包之后,可以在Scene文件夹下,找到示例场景,在场景中找到LLM->chatBaidu对象,这里就维护了百度文心大模型的驱动脚本。

        在unity编辑器端,选择chatBaidu对象之后,在属性面板里填写前面创建的应用密钥,并且选择好已经开通付费的大语言模型。

        配置一下聊天服务脚本,将AI驱动的脚本改成百度文心大模型的脚本。如果不需要使用语音服务的话,可以在配置栏里,关掉语音服务,这样就可以填写语音服务相关的东西了。

        上述配置完成,我们就可以使用百度文心大模型来驱动AI二次元小姐姐了。

5.结束语
       

        这次的文章简单介绍了百度文心大模型平台API的对接流程,并针对接口对接的流程进行了介绍,包括接口的鉴权、以及发送报文、响应报文的结构说明,并提供了针对全流程在unity端的实现代码示例。通过上述的代码实现,我们就可以在unity引擎中,使用百度文心大模型的api来驱动AI二次元小姐姐的对话交互。完整的代码工程可以从我的开源项目下载使用,项目包含了针对多种GPT应用的集成工具,以及语音服务的集成,对我这个项目感兴趣的朋友,可以上我的B站号查看,我也做有详细的教程,相关源码可以在的哔哩哔哩主站找到相关视频,在视频介绍以及评论区获取。

【Unity+文心一言】文心大模型API驱动AI小姐姐,Unity开源工具包,打造AI二次元小姐姐~


项目地址传送门:

AI二次元老婆开源项目(unity-AI-Chat-Toolkit):

Github地址:https://github.com/zhangliwei7758/unity-AI-Chat-Toolkit

Gitee地址:https://gitee.com/DammonSpace/unity-ai-chat-toolkit
 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/69625
推荐阅读
相关标签
  

闽ICP备14008679号