当前位置:   article > 正文

Web Speech API(2)—— SpeechSynthesis

Web Speech API(2)—— SpeechSynthesis

Web Speech API 使你能够将语音数据合并到 Web 应用程序中。Web Speech API 有两个部分:SpeechSynthesis 语音合成(文本到语音 TTS)和 SpeechRecognition 语音识别(异步语音识别)。

Speech synthesis

语音合成 (也被称作是文本转为语音,英语简写是 tts) 包括接收 app 中需要语音合成的文本,再在设备麦克风播放出来这两个过程。

Web Speech API 对此有一个主要控制接口——SpeechSynthesis ,外加一些处理如何表示要被合成的文本 (也被称为 utterances),用什么声音来播出 utterances 等工作的相关接口。

语音合成

1.SpeechSynthesis

语音合成服务的控制器接口,可用于获取设备上可用的合成语音,开始、暂停以及其他相关命令的信息。

属性

SpeechSynthesis.paused 只读

SpeechSynthesis 处于暂停状态时, Boolean 值返回 true

SpeechSynthesis.pending 只读

当语音播放队列到目前为止保持没有说完的语音时, Boolean 值返回 true

SpeechSynthesis.speaking 只读

当语音谈话正在进行的时候,即使SpeechSynthesis处于暂停状态, Boolean 返回 true

事件操作

SpeechSynthesis.onvoiceschanged

当由SpeechSynthesis.getVoices()方法返回的SpeechSynthesisVoice列表改变时触发。

方法

SpeechSynthesis.cancel()

移除所有语音谈话队列中的谈话。

SpeechSynthesis.getVoices()

返回当前设备所有可用声音的 SpeechSynthesisVoice列表。

SpeechSynthesis.pause()

SpeechSynthesis 对象置为暂停状态。

SpeechSynthesis.resume()

SpeechSynthesis 对象置为一个非暂停状态:如果已经暂停了则继续。

SpeechSynthesis.speak()

添加一个 utterance 到语音谈话队列;它将会在其他语音谈话播放完之后播放。

2.SpeechSynthesisErrorEvent

包含了在发音服务处理 SpeechSynthesisUtterance 对象过程中的信息及报错信息。

3.SpeechSynthesisEvent

包含了经由发音服务处理过的 SpeechSynthesisUtterance 对象当前状态的信息。

4.SpeechSynthesisUtterance

表示一次发音请求。其中包含了将由语音服务朗读的内容,以及如何朗读它(例如:语种、音高、音量)。

5.SpeechSynthesisVoice

表示系统提供的一个声音。每个 SpeechSynthesisVoice 都有与之相关的发音服务,包括了语种、名称 和 URI 等信息。

Window.speechSynthesis

由规格文档指定的,被称为 SpeechSynthesisGetter[NoInterfaceObject] 接口的一部分,在 Window 对象中实现,speechSynthesis 属性可用于访问 SpeechSynthesis 控制器,从而获取语音合成功能的入口。

浏览器兼容性

目前主流浏览器版本(截止2024-5-21)

Firefox (126.0)

Chrome(125.0.6422.61)

Safari(15.6.1)

  1. <template>
  2. <div class="s-s-wrap">
  3. <textarea
  4. id="text-to-speak"
  5. rows="10"
  6. cols="50"
  7. placeholder="Enter text here"
  8. ></textarea>
  9. <br /><br />
  10. <label for="voices">Voice:</label>
  11. <select id="voices"></select>
  12. <br /><br />
  13. <label for="rate">Rate:</label>
  14. <input type="range" id="rate" min="0.5" max="2" value="1" step="0.1" />
  15. <span id="rate-value">1</span>
  16. <br /><br />
  17. <label for="pitch">Pitch:</label>
  18. <input type="range" id="pitch" min="0" max="2" value="1" step="0.1" />
  19. <span id="pitch-value">1</span>
  20. <br /><br />
  21. <label for="volume">Volume:</label>
  22. <input type="range" id="volume" min="0" max="1" value="1" step="0.1" />
  23. <span id="volume-value">1</span>
  24. <br /><br />
  25. <button id="speak-btn" @click="speak" style="margin-right: 10px">
  26. Speak
  27. </button>
  28. <button id="cancel-btn" @click="cancel" style="margin-right: 10px">
  29. cancel
  30. </button>
  31. <button id="pause-btn" @click="pause" style="margin-right: 10px">
  32. pause
  33. </button>
  34. <button id="resume-btn" @click="resume" style="margin-right: 10px">
  35. resume
  36. </button>
  37. </div>
  38. </template>
  39. <script>
  40. /*
  41. 大千世界,无奇不有。我陈平安,唯有一剑,可搬山,倒海,降妖,镇魔,敕神,摘星,断江,摧城,开天!<mark name="highlight">我叫陈平安</mark>,平平安安的平安。我是一名剑客。
  42. */
  43. let voices = []
  44. export default {
  45. mounted() {
  46. this.populateVoices()
  47. let synth = window.speechSynthesis
  48. /*
  49. 因为 Firefox 不支持SpeechSynthesis.onvoiceschanged ,
  50. 所以很常规地只是返回语音对象列表当SpeechSynthesis.getVoices() 被触发。
  51. 但是 Chrome 就有点不同了,在SpeechSynthesis.getVoices() 被触发时,
  52. 先要等待事件触发 (有点绕~按照下面代码,populateVoices 函数在 Firefox 运行一次,在 Chrome 中运行两次):
  53. */
  54. if (synth.onvoiceschanged !== undefined) {
  55. synth.onvoiceschanged = this.populateVoices
  56. }
  57. // 监听
  58. const rate = document.getElementById('rate')
  59. rate.addEventListener('change', this.setRateValue)
  60. const pitch = document.getElementById('pitch')
  61. pitch.addEventListener('change', this.setPitchValue)
  62. const volume = document.getElementById('volume')
  63. volume.addEventListener('change', this.setVolumeValue)
  64. },
  65. methods: {
  66. // 使用设备可使用的不同的语音选项展示
  67. populateVoices() {
  68. // 引用window.speechSynthesis这个api
  69. let synth = window.speechSynthesis
  70. // 调用SpeechSynthesis.getVoices()
  71. // 这个函数返回包含所有可用语音 (SpeechSynthesisVoice对象) 的列表
  72. voices = synth.getVoices()
  73. const voicesDropdown = document.getElementById('voices')
  74. // 循环填入声音的名称(从SpeechSynthesisVoice.name获取),语音的语言(从SpeechSynthesisVoice.lang获取)
  75. // 引擎默认的 (SpeechSynthesisVoice.default属性是true)
  76. voicesDropdown.innerHTML = voices
  77. .map(
  78. (voice, i) =>
  79. `<option value="${i}">${voice.name} (${voice.lang})</option>`
  80. )
  81. .join('')
  82. },
  83. // 设置语速
  84. setRateValue() {
  85. const rate = document.getElementById('rate')
  86. const rateValue = document.getElementById('rate-value')
  87. rateValue.textContent = rate.value
  88. },
  89. setPitchValue() {
  90. const pitch = document.getElementById('pitch')
  91. const pitchValue = document.getElementById('pitch-value')
  92. pitchValue.textContent = pitch.value
  93. },
  94. setVolumeValue() {
  95. const volume = document.getElementById('volume')
  96. const volumeValue = document.getElementById('volume-value')
  97. volumeValue.textContent = volume.value
  98. },
  99. speak() {
  100. let synth = window.speechSynthesis
  101. console.log('speak', synth)
  102. if (synth.speaking) {
  103. console.error('speechSynthesis.speaking')
  104. return
  105. }
  106. const textArea = document.getElementById('text-to-speak')
  107. const voicesDropdown = document.getElementById('voices')
  108. // 创建一个新的SpeechSynthesisUtterance() 实例——把文本输入框中的值作为参数传递。
  109. const utterThis = new SpeechSynthesisUtterance(textArea.value)
  110. // const utterThis = new SpeechSynthesisUtterance()
  111. // utterThis.text = '这是一段<mark name="highlight">重要的</mark>文本。'
  112. console.log(voices, 'voices', voices[voicesDropdown.value])
  113. // 使用哪种语音
  114. // 把匹配的语音对象设置为SpeechSynthesisUtterance.voice 的属性值
  115. utterThis.voice = voices[voicesDropdown.value]
  116. const rate = document.getElementById('rate')
  117. const pitch = document.getElementById('pitch')
  118. const volume = document.getElementById('volume')
  119. // 设置语速
  120. utterThis.rate = rate.value
  121. // 设置音高(音调)
  122. utterThis.pitch = pitch.value
  123. // 设置音量(响度)
  124. utterThis.volume = volume.value
  125. // 错误监听
  126. utterThis.onerror = event => {
  127. console.log(`speech-synthesis-错误监听: ${event}`)
  128. }
  129. // 暂停操作监听
  130. utterThis.onpause = event => {
  131. const char = event.utterance.text.charAt(event.charIndex)
  132. console.log(
  133. event,
  134. `当前暂停位置的字符索引:${event.charIndex}, 文本内容:"${event.utterance.text}", 具体字符: "${char}".`
  135. )
  136. }
  137. // 边界监听
  138. utterThis.onboundary = event => {
  139. console.log(event, `${event.name} 时间: ${event.elapsedTime} 秒.`)
  140. }
  141. // 标记监听
  142. utterThis.onmark = event => {
  143. console.log('标记监听', event)
  144. if (event.name === 'highlight') {
  145. console.log('朗读到达标记:' + event.name)
  146. // 在这里执行您想要的操作,比如高亮显示文本、播放声音等
  147. }
  148. }
  149. // 调用 SpeechSynthesis.speak() 开始说话
  150. // 把 SpeechSynthesisUtterance 实例作为参数传递
  151. synth.speak(utterThis)
  152. },
  153. cancel() {
  154. let synth = window.speechSynthesis
  155. console.log('cancel', synth)
  156. synth.cancel()
  157. },
  158. pause() {
  159. let synth = window.speechSynthesis
  160. console.log('pause', synth)
  161. synth.pause()
  162. },
  163. resume() {
  164. let synth = window.speechSynthesis
  165. console.log('resume', synth)
  166. synth.resume()
  167. }
  168. }
  169. }
  170. </script>
  171. <style>
  172. .s-s-wrap {
  173. width: 370px;
  174. margin: auto;
  175. }
  176. </style>

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/619072
推荐阅读
相关标签
  

闽ICP备14008679号