当前位置:   article > 正文

Android科大讯飞TTS语音合成实例详细步骤_科大讯飞tts引擎调语速

科大讯飞tts引擎调语速

第一步:到科大讯飞官网注册并下载自己的Android SDK

网站:离线语音合成 - 语音合成 - 讯飞开放平台

第二步:

完成注册后获取到右侧红线上的APPID,!!有重要作用,

点击下载获取你需要的SDK版本

下载并解压后如图

sample:是官网给予的dome;

libs文件中的文件拷贝到Android项目中的lib包中并ADD;

assets文件拷贝到Main包中;

res文件夹中除了layout文件都要拷贝到assets文件中;

由于我选择的是离线(高质量版)所以将res文件夹中的xtts文件夹拷贝到Android项目中的assets包里;

第三步:

清单文件中加入权限

  1. <uses-permission android:name="android.permission.INTERNET" />
  2. <uses-permission android:name="android.permission.RECORD_AUDIO" />
  3. <uses-permission android:name="android.permission.READ_PHONE_STATE" />
  4. <!--连接网络权限,用于执行云端语音能力 -->
  5. <uses-permission android:name="android.permission.INTERNET"/>
  6. <!--获取手机录音机使用权限,听写、识别、语义理解需要用到此权限 -->
  7. <uses-permission android:name="android.permission.RECORD_AUDIO"/>
  8. <!--读取网络信息状态 -->
  9. <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE"/>
  10. <!--获取当前wifi状态 -->
  11. <uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>
  12. <!--允许程序改变网络连接状态 -->
  13. <uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/>
  14. <!--读取手机信息权限 -->
  15. <uses-permission android:name="android.permission.READ_PHONE_STATE"/>
  16. <!--读取联系人权限,上传联系人需要用到此权限 -->
  17. <uses-permission android:name="android.permission.READ_CONTACTS"/>
  18. <!--外存储写权限,构建语法需要用到此权限 -->
  19. <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
  20. <!--外存储读权限,构建语法需要用到此权限 -->
  21. <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>
  22. <!--配置权限,用来记录应用配置信息 -->
  23. <uses-permission android:name="android.permission.WRITE_SETTINGS"/>
  24. <!--手机定位信息,用来为语义等功能提供定位,提供更精准的服务-->
  25. <!--定位信息是敏感信息,可通过Setting.setLocationEnable(false)关闭定位请求 -->
  26. <uses-permission android:name="android.permission.ACCESS_FINE_LOCATION"/>
  27. <!--如需使用人脸识别,还要添加:摄相头权限,拍照需要用到 -->
  28. <uses-permission android:name="android.permission.CAMERA" />

首先启动的程序中需要添加以下代码用于初始化其中xxxx使用你的APPID替换

 SpeechUtility.createUtility(this, SpeechConstant.APPID +"=xxxxx");

主要代码如下

  1. package com.example.ttstestapplication;
  2. import android.app.Activity;
  3. import android.content.Intent;
  4. import android.content.SharedPreferences;
  5. import android.os.Bundle;
  6. import android.util.Log;
  7. import android.widget.Button;
  8. import android.widget.RadioGroup;
  9. import android.widget.TextView;
  10. import android.widget.Toast;
  11. import androidx.appcompat.app.AppCompatActivity;
  12. import com.iflytek.cloud.ErrorCode;
  13. import com.iflytek.cloud.InitListener;
  14. import com.iflytek.cloud.SpeechConstant;
  15. import com.iflytek.cloud.SpeechError;
  16. import com.iflytek.cloud.SpeechEvent;
  17. import com.iflytek.cloud.SpeechSynthesizer;
  18. import com.iflytek.cloud.SpeechUtility;
  19. import com.iflytek.cloud.SynthesizerListener;
  20. import com.iflytek.cloud.util.ResourceUtil;
  21. public class ShowActivity extends AppCompatActivity {
  22. private Button mBtnPreference,mBtnStart,mBtnStop;
  23. private TextView mTvContent;
  24. private SharedPreferences mSharedPreferences;
  25. private static String TAG = ShowActivity.class.getSimpleName();
  26. // 语音合成对象
  27. private SpeechSynthesizer mTts;
  28. // 默认云端发音人
  29. // 默认本地发音人
  30. public static String voicerLocal = "xiaofeng";
  31. // 引擎类型
  32. private String mEngineType = SpeechConstant.TYPE_LOCAL;
  33. private Toast mToast;
  34. @Override
  35. protected void onCreate(Bundle savedInstanceState) {
  36. super.onCreate(savedInstanceState);
  37. setContentView(R.layout.activity_show);
  38. SpeechUtility.createUtility(this, SpeechConstant.APPID +"=xxxx");
  39. initUi();
  40. mTts = SpeechSynthesizer.createSynthesizer(this,mTtsInitListener);
  41. mBtnPreference.setOnClickListener(v ->{
  42. Intent intent = new Intent(this,MainActivity.class);
  43. startActivity(intent);
  44. });
  45. mBtnStart.setOnClickListener( v ->{
  46. String text =mTvContent.getText().toString();
  47. // 设置参数
  48. setParam();
  49. Log.d(TAG, "准备点击: " + System.currentTimeMillis());
  50. int code = mTts.startSpeaking(text, mTtsListener);
  51. if (code != ErrorCode.SUCCESS) {
  52. showTip("语音合成失败,错误码: " + code + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案");
  53. }
  54. });
  55. mBtnStop.setOnClickListener( v ->{
  56. mTts.stopSpeaking(); });
  57. }
  58. private void initUi() {
  59. mBtnPreference = findViewById(R.id.btn_preference);
  60. mBtnStart = findViewById(R.id.btn_start);
  61. mBtnStop = findViewById(R.id.btn_stop);
  62. mTvContent = findViewById(R.id.tv_content);
  63. mSharedPreferences = getSharedPreferences(MainActivity.PREFER_NAME, Activity.MODE_PRIVATE);
  64. }
  65. /**
  66. * 初始化监听。
  67. */
  68. private InitListener mTtsInitListener = new InitListener() {
  69. @Override
  70. public void onInit(int code) {
  71. Log.d(TAG, "InitListener init() code = " + code);
  72. if (code != ErrorCode.SUCCESS) {
  73. showTip("初始化失败,错误码:" + code + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案");
  74. } else {
  75. // 初始化成功,之后可以调用startSpeaking方法
  76. // 注:有的开发者在onCreate方法中创建完合成对象之后马上就调用startSpeaking进行合成,
  77. // 正确的做法是将onCreate中的startSpeaking调用移至这里
  78. }
  79. }
  80. };
  81. /**
  82. * 合成回调监听。
  83. */
  84. private SynthesizerListener mTtsListener = new SynthesizerListener() {
  85. @Override
  86. public void onSpeakBegin() {
  87. //showTip("开始播放");
  88. Log.d(ShowActivity.TAG, "开始播放:" + System.currentTimeMillis());
  89. }
  90. @Override
  91. public void onSpeakPaused() {
  92. showTip("暂停播放");
  93. }
  94. @Override
  95. public void onSpeakResumed() {
  96. showTip("继续播放");
  97. }
  98. @Override
  99. public void onBufferProgress(int percent, int beginPos, int endPos,
  100. String info) {
  101. // 合成进度
  102. mPercentForBuffering = percent;
  103. }
  104. @Override
  105. public void onSpeakProgress(int percent, int beginPos, int endPos) {
  106. // 播放进度
  107. mPercentForPlaying = percent;
  108. }
  109. @Override
  110. public void onCompleted(SpeechError error) {
  111. if (error == null) {
  112. showTip("播放完成");
  113. } else {
  114. showTip(error.getPlainDescription(true));
  115. }
  116. }
  117. @Override
  118. public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {
  119. // 以下代码用于获取与云端的会话id,当业务出错时将会话id提供给技术支持人员,可用于查询会话日志,定位出错原因
  120. // 若使用本地能力,会话id为null
  121. if (SpeechEvent.EVENT_SESSION_ID == eventType) {
  122. String sid = obj.getString(SpeechEvent.KEY_EVENT_AUDIO_URL);
  123. Log.d(TAG, "session id =" + sid);
  124. }
  125. //实时音频流输出参考
  126. /*if (SpeechEvent.EVENT_TTS_BUFFER == eventType) {
  127. byte[] buf = obj.getByteArray(SpeechEvent.KEY_EVENT_TTS_BUFFER);
  128. Log.e("MscSpeechLog", "buf is =" + buf);
  129. }*/
  130. }
  131. };
  132. private void showTip(final String str) {
  133. runOnUiThread(() -> {
  134. if (mToast != null) {
  135. mToast.cancel();
  136. }
  137. mToast = Toast.makeText(getApplicationContext(), str, Toast.LENGTH_SHORT);
  138. mToast.show();
  139. });
  140. }
  141. private void setParam() {
  142. // 清空参数
  143. mTts.setParameter(SpeechConstant.PARAMS, null);
  144. //设置使用本地引擎
  145. mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_XTTS);
  146. //设置发音人资源路径
  147. mTts.setParameter(ResourceUtil.TTS_RES_PATH, getResourcePath());
  148. //设置发音人
  149. mTts.setParameter(SpeechConstant.VOICE_NAME, voicerLocal);
  150. //mTts.setParameter(SpeechConstant.TTS_DATA_NOTIFY,"1");//支持实时音频流抛出,仅在synthesizeToUri条件下支持
  151. //设置合成语速
  152. mTts.setParameter(SpeechConstant.SPEED, mSharedPreferences.getString("speed_preference", "50"));
  153. //设置合成音调
  154. mTts.setParameter(SpeechConstant.PITCH, mSharedPreferences.getString("pitch_preference", "50"));
  155. //设置合成音量
  156. mTts.setParameter(SpeechConstant.VOLUME, mSharedPreferences.getString("volume_preference", "50"));
  157. //设置播放器音频流类型
  158. mTts.setParameter(SpeechConstant.STREAM_TYPE, mSharedPreferences.getString("stream_preference", "3"));
  159. // mTts.setParameter(SpeechConstant.STREAM_TYPE, AudioManager.STREAM_MUSIC+"");
  160. // 设置播放合成音频打断音乐播放,默认为true
  161. mTts.setParameter(SpeechConstant.KEY_REQUEST_FOCUS, "true");
  162. // 设置音频保存路径,保存音频格式支持pcm、wav,设置路径为sd卡请注意WRITE_EXTERNAL_STORAGE权限
  163. mTts.setParameter(SpeechConstant.AUDIO_FORMAT, "wav");
  164. mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH,
  165. getExternalFilesDir("msc").getAbsolutePath() + "/tts.pcm");
  166. }
  167. //获取发音人资源路径
  168. private String getResourcePath() {
  169. StringBuffer tempBuffer = new StringBuffer();
  170. String type = "xtts";
  171. //合成通用资源
  172. tempBuffer.append(ResourceUtil.generateResourcePath(this, ResourceUtil.RESOURCE_TYPE.assets, type + "/common.jet"));
  173. tempBuffer.append(";");
  174. //发音人资源
  175. tempBuffer.append(ResourceUtil.generateResourcePath(this, ResourceUtil.RESOURCE_TYPE.assets, type + "/" + ShowActivity.voicerLocal + ".jet"));
  176. return tempBuffer.toString();
  177. }
  178. @Override
  179. protected void onDestroy() {
  180. if (null != mTts) {
  181. mTts.stopSpeaking();
  182. // 退出时释放连接
  183. mTts.destroy();
  184. }
  185. super.onDestroy();
  186. }
  187. }

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/830469
推荐阅读
相关标签
  

闽ICP备14008679号