当前位置:   article > 正文

Vue+SpringBoot+Audio+科大讯飞 语音合成技术_科大讯飞 tts springboot

科大讯飞 tts springboot

最终思路

思路就是vue前端向后台发送需要播放的语音信息(文字),然后后台返回语音流数据,通过URL.createObjectURL(data) 这个API生成一个URL,然后给audio标签附上url,网页进行语音播放,在网页播放语音就可以避免用户的本地语音库的安装。

 

 

在Vue项目中用Audio实现语音的播放(基础版)

 

  1. 1.axios 拦截处理
  2. // respone拦截器
  3. service.interceptors.response.use(
  4. response => {
  5. const headers = response.headers
  6. if (headers['content-type'] === 'application/octet-stream;charset=UTF-8') {
  7. return response.data
  8. }
  9. }
  10. )
  11. 2.接口请求
  12. /**
  13. * 文字转语音接口
  14. */
  15. export function textToAudio(text) {
  16. let jsonData = {
  17. text: text,
  18. }
  19. return request({
  20. url: '/api/audio/text_to_audio',
  21. method: 'post',
  22. data: Qs.stringify(jsonData),
  23. responseType: "blob"//后台返回的为语音的流数据
  24. })
  25. }
  26. 3.请求后台接口
  27. //调用后台
  28. getAudio(text) {
  29. textToAudio(text).then(response => {
  30. let url = URL.createObjectURL(response);//通过这个API让语音数据转为成一个url地址
  31. let audio = new Audio();//在VUE中使用audio标签
  32. audio.src = url;//设置audio的src为上面生成的url
  33. let playPromiser = audio.play();//进行播放
  34. //在谷歌内核中,audio.play()会返回一个promise的值,在IE内核中就不会返回任何的值
  35. //所以如果你要分浏览器,可以判断playPromiser的值来进行操作哦
  36. audio.onended = () => {
  37. //onended可以检测语音是否播完
  38. //dosometin
  39. };
  40. }).catch(err => {});
  41. },

4.springboot

  1. @ApiOperation(value = "文字转语音", notes = "文字转语音")
  2. @RequestMapping(value = "text_to_audio")
  3. public void textToAudio(String text, HttpServletRequest request , HttpServletResponse response) throws IOException {
  4. if (StringUtils.isNotBlank(text)) {
  5. //过滤图片,h5标签
  6. text = text.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll("<[^>]*>", "").replaceAll("[(/>)<]", "").trim();
  7. //调用微服务接口获取音频base64
  8. String result = "";
  9. try {
  10. JSONObject json = new JSONObject();
  11. JSONObject params = new JSONObject();
  12. params.put("content", text);
  13. json.put("params", params);
  14. String resultStr = HttpClientUtil.postJson(TEXT_TO_ADUIO, json.toString());
  15. JSONObject resultJson = JSON.parseObject(resultStr);
  16. System.out.println(resultJson.toJSONString());
  17. boolean success = resultJson.getInteger("result") == 0;
  18. if (!success) {
  19. throw new ExternalCallException(resultJson.getString("message"));
  20. }
  21. result = resultJson.getJSONArray("datas").getJSONObject(0).getString("audioBase64");
  22. } catch (Exception e) {
  23. log.error("【文字转语音接口调用异常】", e);
  24. // throw new ExternalCallException(e.getMessage());
  25. }
  26. //音频数据
  27. byte[] audioByte = Base64.getDecoder().decode(result);
  28. response.setContentType("application/octet-stream;charset=UTF-8");
  29. OutputStream os = new BufferedOutputStream(response.getOutputStream());
  30. SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMddHHmmssSSS");
  31. String date = sdf.format(new Date());
  32. try {
  33.   //音频流
  34. os.write(audioByte);
  35. } catch (IOException e) {
  36. e.printStackTrace();
  37. } finally {
  38. if (os != null) {
  39. os.flush();
  40. os.close();
  41. }
  42. }
  43. }
  44. }

 

防止因为快速的请求语音数据造成语音播放叠在一起

 
  1. data() {
  2. return {
  3.   audio:true,
  4. callmsg:[],
  5. }
  6. }
  1. //排队队列 data 是文本信息
  2. queue(data){
  3. this.callmsg.push(data);//this.callmsg就是排队队列,点击一次,放进去一个需要播放的信息
  4. if (this.audio) {//如果没人
  5. this.audio = false;//改为有人排队了
  6. this.getAudio();//进行播放操作
  7. }
  8. },
  9. //语音播放
  10. getAudio() {
  11. if (this.callmsg.length > 0) {//如果队列是有人在排队的,这进行播放操作
  12. textToAudio(this.callmsg[0]).then(response => {
  13. let url = URL.createObjectURL(response);//通过这个API让语音数据转为成一个url地址
  14. let audio = new Audio();//在VUE中使用audio标签
  15. audio.src = url;//设置audio的src为上面生成的url
  16. let playPromiser = audio.play();//进行播放
  17. //在这里我用一个标志,设置语音开始播放
  18. /* localStorage.setItem("audio", "1");*/
  19. //在谷歌内核中,audio.play()会返回一个promise的值,在IE内核中就不会返回任何的值
  20. //所以如果你要分浏览器,可以判断playPromiser的值来进行操作哦
  21. audio.onended = () => {
  22. //onended可以检测语音是否播完
  23. //dosometing
  24. this.callmsg.splice(0, 1);//队列的第一个播放完毕,所以删除
  25. /* localStorage.setItem("audio", "0");//这里是语音播放完毕*/
  26. this.getAudio();//进行下一个请求并播放
  27. };
  28. }).catch(err => {});
  29. } else {
  30. //this.audio是一个data数据,用来记录是否有人排队
  31. this.audio = true; //如果队列没人排队,就告诉外面已经读完啦
  32. }
  33. },

 

 

最终实现前端功能代码

  1. <!--语音播放-->
  2. <template>
  3. <div class="audio">
  4. <div>
  5. <svg-icon v-if="audioPlayVisible" icon-class="play" @click.native="pause"
  6. :class="{'audio-play-style':true, 'audio-play-style-pc': pc}"/>
  7. <svg-icon v-if="!audioPlayVisible" icon-class="stop_play" @click.native="play"
  8. :class="{'audio-play-style':true, 'audio-play-style-pc': pc}"/>
  9. </div>
  10. </div>
  11. </template>
  12. <script>
  13. import {textToAudio} from '@/api/file'
  14. import {isPc} from '@/utils/common'
  15. export default {
  16. name: "audioPlay",
  17. props: {},
  18. components: {},
  19. mounted() {
  20. this.audioObj = new Audio();//在VUE中使用audio标签
  21. },
  22. created() {
  23. },
  24. data() {
  25. return {
  26. //语音播放开关
  27. audioPlayVisible: true,
  28. mAudioVisible: true,
  29. // 是否是PC端
  30. pc: isPc(),
  31. audioObj:null
  32. }
  33. },
  34. methods: {
  35. //暂停
  36. pause() {
  37. this.audioObj.pause();
  38. this.audioPlayVisible=false;
  39. },
  40. //播放
  41. play(){
  42. this.audioPlayVisible=true;
  43. },
  44. //调用后台
  45. getAudio(text) {
  46. if(!this.audioPlayVisible){
  47. return
  48. }
  49. textToAudio(text).then(response => {
  50. console.log('response', response)
  51. let url = URL.createObjectURL(response);//通过这个API让语音数据转为成一个url地址
  52. this.audioObj.src = url;//设置audio的src为上面生成的url
  53. let playPromiser = this.audioObj.play();//进行播放
  54. //在谷歌内核中,audio.play()会返回一个promise的值,在IE内核中就不会返回任何的值
  55. //所以如果你要分浏览器,可以判断playPromiser的值来进行操作哦
  56. this.audioObj.onended = () => {
  57. };
  58. }).catch(err => {});
  59. },
  60. }
  61. }
  62. </script>
  63. <style lang="less">
  64. .audio {
  65. .audio-play-style {
  66. position: absolute;
  67. top: 10px;
  68. right: 0;
  69. font-size: 26px;
  70. }
  71. .audio-play-style-pc {
  72. top: 65px;
  73. }
  74. }
  75. </style>
// 音频方式二 ----- 初始化
audioInit() {
    let AudioContext = window.AudioContext || window.webkitAudioContext
    if (AudioContext) {
        this.audioContext = new AudioContext()
        this.audioContext.resume()
    }
},

/**
 *  AudioContext 播放方式
 *
 * @param response  后台返回音频流
 */
playAudioMethodTwo(response) {
    var _this=this;
    //将Blob音频流转换成 ArrayBuffer
    var reader = new FileReader();
    reader.readAsArrayBuffer(response);
    reader.onload = function (e) {
        let arrayBuffer=reader.result;
        _this.audioContext.decodeAudioData(arrayBuffer).then(function (buffer) {
            var source = _this.audioContext.createBufferSource();
            source.buffer = buffer;
            source.connect(_this.audioContext.destination);
            source.start();
        }, function (e) {
            console.log("FAIL:" + arrayBuffer);
        });
    }
},
科大讯飞java 流demo 接口

 

注意事项:记得导入相关依赖包,hutool 直接maven库搜索

package com.ylz.springboot.modules.external.service.impl;

import com.google.common.collect.Lists;

import com.google.gson.Gson;
import com.google.gson.JsonObject;
import okhttp3.*;
import okio.ByteString;
import org.springframework.data.redis.util.ByteUtils;

import javax.crypto.Mac;
import javax.crypto.spec.SecretKeySpec;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.net.URL;
import java.nio.charset.Charset;
import java.text.SimpleDateFormat;
import java.util.*;

/**
 * 科大讯飞语音合成
 *
 * @author lhh
 * @Date 2020/5/7 11:06
 */
public class WebTTSWS {
    private static final String hostUrl = "https://tts-api.xfyun.cn/v2/tts"; //http url 不支持解析 ws/wss schema
    private static final String appid = "xxxx";//到控制台-语音合成页面获取
    private static final String apiSecret = "xxxxxx";//到控制台-语音合成页面获取
    private static final String apiKey = "xxxx";//到控制台-语音合成页面获取
    private static final String text = "蜡烛有心,杨柳有心,于是它能低首沉思";
    public static String base64 = "";
    public static final Gson json = new Gson();
    private volatile boolean lock = true;


    public static void main(String[] args) throws Exception {
        for (int i = 0; i < 1; i++) {
            new Thread(() -> {
                WebTTSWS w = new WebTTSWS();
                try {
                    String send = w.send();
                    System.out.println(send);
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }).start();
        }
    }

    public String send() throws Exception {
        lock = true;
        base64 = "";
        // 构建鉴权url
        String authUrl = getAuthUrl(hostUrl, apiKey, apiSecret);
        OkHttpClient client = new OkHttpClient.Builder().build();
        //将url中的 schema http://和https://分别替换为ws:// 和 wss://
        String url = authUrl.toString().replace("http://", "ws://").replace("https://", "wss://");
        Request request = new Request.Builder().url(url).build();

        List<byte[]> list = Lists.newArrayList();
        WebSocket webSocket = client.newWebSocket(request, new WebSocketListener() {
            @Override
            public void onOpen(WebSocket webSocket, Response response) {
                super.onOpen(webSocket, response);
                try {
                    System.out.println(response.body().string());
                } catch (IOException e) {
                    e.printStackTrace();
                }
                //发送数据
                JsonObject frame = new JsonObject();
                JsonObject business = new JsonObject();
                JsonObject common = new JsonObject();
                JsonObject data = new JsonObject();
                // 填充common
                common.addProperty("app_id", appid);
                //填充business
                business.addProperty("aue", "lame");
                business.addProperty("sfl", 1);
                business.addProperty("tte", "UTF8");//小语种必须使用UNICODE编码
                business.addProperty("vcn", "aisxping");//到控制台-我的应用-语音合成-添加试用或购买发音人,添加后即显示该发音人参数值,若试用未添加的发音人会报错11200
                business.addProperty("pitch", 50);
                business.addProperty("speed", 50);
                //填充data
                data.addProperty("status", 2);//固定位2
                try {
                    data.addProperty("text", Base64.getEncoder().encodeToString(text.getBytes("utf8")));
                    //使用小语种须使用下面的代码,此处的unicode指的是 utf16小端的编码方式,即"UTF-16LE"”
                    //data.addProperty("text", Base64.getEncoder().encodeToString(text.getBytes("UTF-16LE")));
                } catch (UnsupportedEncodingException e) {
                    e.printStackTrace();
                }
                //填充frame
                frame.add("common", common);
                frame.add("business", business);
                frame.add("data", data);
                webSocket.send(frame.toString());
            }

            @Override
            public void onMessage(WebSocket webSocket, String text) {
                super.onMessage(webSocket, text);
                //处理返回数据
                System.out.println("receive=>" + text);
                ResponseData resp = null;
                try {
                    resp = json.fromJson(text, ResponseData.class);
                } catch (Exception e) {
                    e.printStackTrace();
                }
                if (resp != null) {
                    if (resp.getCode() != 0) {
                        System.out.println("error=>" + resp.getMessage() + " sid=" + resp.getSid());
                        return;
                    }
                    if (resp.getData() != null) {
                        String result = resp.getData().audio;
                        byte[] audio = Base64.getDecoder().decode(result);
                        list.add(audio);
                        // todo  resp.data.status ==2 说明数据全部返回完毕,可以关闭连接,释放资源
                        if (resp.getData().status == 2) {
                            String is = base64Concat(list);
                            base64 = is;
                            lock = false;
                            webSocket.close(1000, "");
                        }
                    }
                }
            }

            @Override
            public void onMessage(WebSocket webSocket, ByteString bytes) {
                super.onMessage(webSocket, bytes);
            }

            @Override
            public void onClosing(WebSocket webSocket, int code, String reason) {
                super.onClosing(webSocket, code, reason);
                System.out.println("socket closing");
            }

            @Override
            public void onClosed(WebSocket webSocket, int code, String reason) {
                super.onClosed(webSocket, code, reason);
                System.out.println("socket closed");
            }

            @Override
            public void onFailure(WebSocket webSocket, Throwable t, Response response) {
                super.onFailure(webSocket, t, response);
                System.out.println("connection failed" + response.message());
            }
        });

        while (lock) {
        }
        return base64;
    }

    /**
     * base64拼接
     */
    String base64Concat(List<byte[]> list) {
        int length = 0;
        for (byte[] b : list) {
            length += b.length;
        }
        byte[] retByte = new byte[length];
        for (byte[] b : list) {
            retByte = ByteUtils.concat(retByte, b);
        }
        return cn.hutool.core.codec.Base64.encode(retByte);
    }

    /**
     * 获取权限地址
     *
     * @param hostUrl
     * @param apiKey
     * @param apiSecret
     * @return
     */
    public static String getAuthUrl(String hostUrl, String apiKey, String apiSecret) throws Exception {
        URL url = new URL(hostUrl);
        SimpleDateFormat format = new SimpleDateFormat("EEE, dd MMM yyyy HH:mm:ss z", Locale.US);
        format.setTimeZone(TimeZone.getTimeZone("GMT"));
        String date = format.format(new Date());
        StringBuilder builder = new StringBuilder("host: ").append(url.getHost()).append("\n").
                append("date: ").append(date).append("\n").
                append("GET ").append(url.getPath()).append(" HTTP/1.1");
        Charset charset = Charset.forName("UTF-8");
        Mac mac = Mac.getInstance("hmacsha256");
        SecretKeySpec spec = new SecretKeySpec(apiSecret.getBytes(charset), "hmacsha256");
        mac.init(spec);
        byte[] hexDigits = mac.doFinal(builder.toString().getBytes(charset));
        String sha = Base64.getEncoder().encodeToString(hexDigits);
        String authorization = String.format("hmac username=\"%s\", algorithm=\"%s\", headers=\"%s\", signature=\"%s\"", apiKey, "hmac-sha256", "host date request-line", sha);
        HttpUrl httpUrl = HttpUrl.parse("https://" + url.getHost() + url.getPath()).newBuilder().
                addQueryParameter("authorization", Base64.getEncoder().encodeToString(authorization.getBytes(charset))).
                addQueryParameter("date", date).
                addQueryParameter("host", url.getHost()).
                build();
        return httpUrl.toString();
    }


    public static class ResponseData {
        private int code;
        private String message;
        private String sid;
        private Data data;

        public int getCode() {
            return code;
        }

        public String getMessage() {
            return this.message;
        }

        public String getSid() {
            return sid;
        }

        public Data getData() {
            return data;
        }
    }

    public static class Data {
        //标志音频是否返回结束  status=1,表示后续还有音频返回,status=2表示所有的音频已经返回
        private int status;
        //返回的音频,base64 编码
        private String audio;
        // 合成进度
        private String ced;
    }

}
 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/531161
推荐阅读
相关标签
  

闽ICP备14008679号