当前位置:   article > 正文

摆脱客户端?网页发起直播势在必行!_保利威 webrtc 推流

保利威 webrtc 推流

背景

近几年直播行业飞速发展,但是由于Web端这方面功能的长时间缺失,使得直播端以客户端为主;WebRTC 的出现使得网页也可以成为直播端。那么究竟WebRTC是什么呢?

WebRTC,即Web Real-Time Communication,web实时通信技术。简单地说就是在web浏览器里面引入实时通信,包括音视频通话等,它使得实时通信变成一种标准功能,任何Web应用都无需借助第三方插件和专有软件,而是通过JavaScript API即可完成;而且WebRTC提供了视频会议的核心技术,包括音视频的采集、编解码、网络传输、展示等功能,还支持跨平台,包括主流的PC和移动端设备。

下面介绍下需要用到的几个API:

getUserMedia

我们可以通过调用navigator.mediaDevices.getUserMedia(constraints)去初始化一个本地的音视频流,然后把直播流通过video标签播放。代码如下:

html:

  1. <div id="container">
  2. <video id="gum-local" autoplay playsinline></video>
  3. <button id="showVideo">Open camera</button>
  4. <button id="switchVideo">switch camera</button>
  5. </div>

js:

  1. const constraints = {
  2. audio: false,
  3. video: true
  4. };
  5. async function init(e) {
  6. try {
  7. const stream = await navigator.mediaDevices.getUserMedia(constraints);
  8. const video = document.querySelector('video');
  9. video.srcObject = stream;
  10. } catch (e) {
  11. console.log(e, 'stream init error');
  12. }
  13. }
  14. document.querySelector('#showVideo').addEventListener('click', (e) => init(e));

示例效果:

当然,如果有多个设备,就需要考虑设备选择和设备切换的问题。那就需要用到下面的这个API。

设备

我们看看如何用原生的Web API去获取设备(以下示例代码可适用于Chrome,其他浏览器暂未测试;具体浏览器兼容性可参考官方文档,本文档底部有链接)。

navigator.mediaDevices.enumerateDevices()

如果枚举成功将会返回一个包含MediaDeviceInfo实例的数组,它包含了可用的多媒体输入输出设备的信息。

下面是调用代码示例。

  1. navigator.mediaDevices.enumerateDevices().then((devices) => {
  2. console.log(devices, '-----enumerateDevices------');
  3. });

设备参数说明:

  1. deviceId:设备id,具有唯一性
  2. groupId:设备组id,不具有唯一性
  3. kind:设备类别(audioinput:音频输入设备,audiooutput:音频输出设备,videoinput:视频输入设备)
  4. label:设备名称(未经过授权允许的设备,label值为空,授权允许后可拿到label的值,如下两图所示)

获取的所有设备截图(未授权):

deviceInfo--所有设备信息(未授权)

videoinput已授权截图:

videoinput授权后截图

获取到设备列表后,可设置navigator.mediaDevices.getUserMedia(constraints)的constraints参数选择所用设备。

  1. const { audioList, videoList } = await getDevices();
  2. const constraints = {
  3. audio: {
  4. deviceId: audioList[0].deviceId
  5. },
  6. video: {
  7. deviceId: videoList[0].deviceId
  8. }
  9. };
  10. navigator.mediaDevices.getUserMedia(constraints);
  11. ...

然而,我们在更换deviceId切换设备的时候发现一些异常情况。在某些deviceId之间切换时,摄像头画面或者是麦克风采集处并没有发生变化。进一步调试发现,这些切换后没有发生变化的deviceId都具有相同的groupId。因此,相同groupId下的设备,选择一个用于切换即可。

筛选麦克风、摄像头设备示例:

  1. function getDevices() {
  2. return new Promise((resolve) => {
  3. navigator.mediaDevices.enumerateDevices().then((devices) => {
  4. const audioGroup = {};
  5. const videoGroup = {};
  6. const cameraList = [];
  7. const micList = [];
  8. devices.forEach((device, index) => {
  9. if ((!device.groupId || !audioGroup[device.groupId]) && device.kind === 'audioinput') {
  10. micList.push(device);
  11. audioGroup[device.groupId] = true;
  12. }
  13. if ((!device.groupId || !videoGroup[device.groupId]) && device.kind === 'videoinput') {
  14. cameraList.push(device);
  15. videoGroup[device.groupId] = true;
  16. }
  17. });
  18. resolve({ cameraList, micList });
  19. });
  20. });
  21. }

注意:在Chrome下,电脑外接摄像头后拔出设备,此时还有可能获取到拔出的设备信息,在进行切换的时候会有问题,可以采用在页面进行友好提示处理这种情况。

屏幕共享

MediaDevices.getDisplayMedia

Chrome 72+、Firefox 66+版本已经实现了WebRTC规范中的MediaDevices.getDisplayMedia,具备屏幕共享功能。

  1. navigator.mediaDevices.getDisplayMedia({
  2. video: true,
  3. audio: false
  4. }).then(stream => {
  5. video.srcObject = stream;
  6. }).catch(err => {
  7. console.error(err);
  8. });

示例效果:

对于Chrome 72以下的版本,想要实现屏幕共享的功能需要借助Chrome插件去获取screen(显示器屏幕)、application windows(应用窗口)和browser tabs(浏览器标签页)。 Chrome插件:由manifest.json和script.js组成。

manifest.json 填入一些基本数据。

  1. background中scripts传入需执行的js文件。
  2. 添加permissions: ['desktopCapture'],用来开启屏幕共享的权限。
  3. externally_connectable用来声明哪些应用和网页可以通过`runtime.connect``runtime.sendMessage`连接到插件。
  4. {
  5. "manifest_version": 2,
  6. "name": "Polyv Web Screensharing",
  7. "permissions": [ "desktopCapture" ],
  8. "version": "0.0.1",
  9. "background": {
  10. "persistent": false,
  11. "scripts": [ "script.js" ]
  12. },
  13. "externally_connectable": {
  14. "matches": ["*://localhost:*/*"]
  15. }
  16. }

script.js

  1. // script.js
  2. chrome.runtime.onMessageExternal.addListener(
  3. function(request, sender, sendResponse) {
  4. if (request.getStream) {
  5. // Gets chrome media stream token and returns it in the response.
  6. chrome.desktopCapture.chooseDesktopMedia(
  7. ['screen', 'window', 'tab'], sender.tab,
  8. function(streamId) {
  9. sendResponse({ streamId: streamId });
  10. });
  11. return true; // Preserve sendResponse for future use
  12. }
  13. }
  14. );

在页面中开始屏幕共享。通过chrome.runtime.sendMessage发送消息到Chrome插件调起屏幕共享。获取到streamId后,通过mediaDevices.getUserMedia得到stream。

  1. const EXTENSION_ID = '<EXTENSION_ID>';
  2. const video = $('#videoId');
  3. chrome.runtime.sendMessage(EXTENSION_ID, { getStream: true }, res => {
  4. console.log('res: ', res);
  5. if (res.streamId) {
  6. navigator.mediaDevices.getUserMedia({
  7. video: {
  8. mandatory: {
  9. chromeMediaSource: 'desktop',
  10. chromeMediaSourceId: res.streamId
  11. }
  12. }
  13. }).then((stream) => {
  14. video.srcObject = stream;
  15. video.onloadedmetadata = function(e) {
  16. video.play();
  17. };
  18. })
  19. } else {
  20. // 取消选择
  21. }
  22. });

而Firefox 66版本以下,不需要像Chrome借助插件才能实现屏幕共享。Firefox 33之后可以直接通过使用mediaDevices.getUserMedia,指定约束对象mediaSource为screen、window、application来实现屏幕共享。不过在Firefox中,一次只能指定一种mediaSource。

  1. navigator.mediaDevices.getUserMedia({
  2. video: {
  3. mediaSource: 'window'
  4. }
  5. }).then(stream => {
  6. video.srcObject = stream;
  7. });

传输

WebRTC的RTCPeerConnection可以建立点对点连接通信,RTCDataChannel提供了数据通信的能力。

WebRTC的点对点连接的过程为:

  1. 呼叫端给接收端发送一个offer信息。在发送给接收端之前先调用setLocalDescription存储本地offer描述。
  2. 接收端收到offer消息后,先调用setRemoteDescription存储远端offer,再创建一个answer信息给呼叫端。

RTCDataChannel提供了send方法和message事件。使用起来与WebSocket类似。

由于没有服务器,以下代码为呼叫端和接收端在同一页面上,RTCPeerConnection对象之间是如何进行数据交互。

  1. // 创建数据通道
  2. sendChannel = localConnection.createDataChannel('通道名称', options);
  3. sendChannel.binaryType = 'arraybuffer';
  4. sendChannel.onopen = function() {
  5. sendChannel.send('Hi there!');
  6. };
  7. sendChannel.onmessage = function(evt) {
  8. console.log('send channel onmessage: ', evt.data);
  9. };
  10. // 远端接收实例
  11. remoteConnection = new RTCPeerConnection(servers);
  12. remoteConnection.onicecandidate = function(evt) {
  13. if (evt.candidate) {
  14. localConnection.addIceCandidate(new RTCIceCandidate(evt.candidate));
  15. }
  16. };
  17. // 当一个RTC数据通道已被远端调用createDataChannel()添加到连接中时触发
  18. remoteConnection.ondatachannel = function() {
  19. const receiveChannel = event.channel;
  20. receiveChannel.binaryType = 'arraybuffer';
  21. //接收到数据时触发
  22. receiveChannel.onmessage = function(evt) {
  23. console.log('onmessage', evt.data); // log: Hi there!
  24. };
  25. receiveChannel.send('Nice!');
  26. };
  27. // 监听是否有媒体流
  28. remoteConnection.onaddstream = function(e) {
  29. peerVideo.srcObject = e.stream;
  30. };
  31. localConnection.addStream(stream);
  32. // 创建呼叫实例
  33. localConnection.createOffer().then(offer => {
  34. localConnection.setLocalDescription(offer);
  35. remoteConnection.setRemoteDescription(offer);
  36. remoteConnection.createAnswer().then(answer => {
  37. remoteConnection.setLocalDescription(answer);
  38. // 接收到answer
  39. localConnection.setRemoteDescription(answer);
  40. })
  41. });

至此我们已经介绍完毕浏览器设备检测采集和屏幕分享的基本流程,但是光有这些可还远远不够,一套完整的直播体系包括音视频采集、处理、编码和封装、推流到服务器、服务器流分发、播放器流播放等等。如果想节省开发成本,可以使用第三方SDK。下面简单介绍下使用声网SDK发起直播的流程。

浏览器要求:

  1. Chrome 58+
  2. Firefox 56+
  3. Safari 11+(屏幕共享不可用)
  4. Opera 45+(屏幕共享不可用)
  5. QQ 10+(屏幕共享不可用)
  6. 360 安全浏览器 9.1+(屏幕共享不可用)

设备检测

调用AgoraRTC.getDevices获取当前浏览器检测到的所有可枚举设备,kind为'videoinput'是摄像头设备,kind为'audioinput'是麦克风设备,然后通过createStream初始化一个本地的流。 获取设备:

  1. AgoraRTC.getDevices((devices) => {
  2. const audioGroup = {};
  3. const videoGroup = {};
  4. const cameraList = [];
  5. const micList = [];
  6. devices.forEach((device, index) => {
  7. if ((!device.groupId || !audioGroup[device.groupId]) && device.kind === 'audioinput') {
  8. micList.push(device);
  9. audioGroup[device.groupId] = true;
  10. }
  11. if ((!device.groupId || !videoGroup[device.groupId]) && device.kind === 'videoinput') {
  12. cameraList.push(device);
  13. videoGroup[device.groupId] = true;
  14. }
  15. });
  16. return { cameraList, micList };
  17. });

初始化本地流:

  1. // uid:自定义频道号,cameraId设备Id
  2. const stream = AgoraRTC.createStream({
  3. streamID: uid,
  4. audio: false,
  5. video: true,
  6. cameraId: cameraId,
  7. microphoneId: microphoneId
  8. });
  9. stream.init(() => {
  10. // clientCamera <div id="clientCamera" ></div>
  11. stream.play('clientCamera', { muted: true });
  12. }, err => {
  13. console.error('AgoraRTC client init failed', err);
  14. });

stream.init()初始化直播流;如果当前浏览器摄像头权限为禁止,则调用失败,可捕获报错Media access NotAllowedError: Permission denied; 若摄像头权限为询问,浏览器默认弹窗是否允许使用摄像头,允许后调用play()可看到摄像头捕获的画面。 如果不传入cameraId,SDK会默认获取到设备的deviceId,如果权限是允许,同样会显示摄像头画面。

采集

摄像头

顺利拿到cameraId和microphoneId后就可以进行直播。通过SDK提供的createStream创建一个音视频流对象。执行init方法初始化成功之后,播放音视频(见上文)。最后通过client发布流以及推流到CDN(见下文)。

屏幕共享

Web 端屏幕共享,通过创建一个屏幕共享的流来实现的。Chrome屏幕共享需要下载插件,在创建的流的时候还需要传入插件的extensionId。

  1. const screenStream = AgoraRTC.createStream({
  2. streamID: <uid>,
  3. audio: false,
  4. video: false,
  5. screen: true,
  6. extensionId: <extensionId>, // Chrome 插件id
  7. mediaSource: 'screen' // Firefox
  8. });

传输

通过AgoraRTC.createStream创建的音视频流,通过publish发送到第三方服务商的SD-RTN(软件定义实时传输网络)。

  1. client.publish(screenStream, err => {
  2. console.error(err);
  3. });

别的浏览器可以通过监听到stream-added事件,通过subscribe订阅远端音视频流。

  1. client.on('stream-added', evt => {
  2. const stream = evt.stream;
  3. client.subscribe(stream, err => {
  4. console.error(err);
  5. });
  6. });

再通过startLiveStreaming推流到CDN。

  1. // 编码
  2. client.setLiveTranscoding(<coding>);
  3. client.startLiveStreaming(<url>, true)

在推摄像头流的时候,关闭摄像头,需要推一张占位图。这个时候先用canvas画图,然后用WebRTC提供的captureStream捕获静态帧。再调用getVideoTracks,制定AgoraRTC.createStream的videoSource为该值。视频源如来自 canvas,需要在 canvas 内容不变时,每隔 1 秒重新绘制 canvas 内容,以保持视频流的正常发布。

  1. const canvas = document.createElement('canvas');
  2. renderCanvas(canvas);
  3. setInterval(() => {
  4. renderCanvas(canvas);
  5. }, 1000);
  6. canvasStream = canvas.captureStream();
  7. const picStream = AgoraRTC.createStream({
  8. streamID: <uid>,
  9. video: true,
  10. audio: false,
  11. videoSource: canvasStream.getVideoTracks()[0]
  12. });
  13. // 画图
  14. function renderCanvas(canvas) {
  15. ...
  16. }

一个client只能推一个流,所以在进行屏幕共享的时候,需要创建两个client,一个发送屏幕共享流,一个发送视频流。屏幕共享流的video字段设为false。视频流的video字段设为true。然后先通过setLiveTranscoding合图再推流。

  1. const users = [
  2. {
  3. x: 0, // 视频帧左上角的横轴位置,默认为0
  4. y: 0, // 视频帧左上角的纵轴位置,默认为0
  5. width: 1280, // 视频帧宽度,默认为640
  6. height: 720, // 视频帧高度,默认为360
  7. zOrder: 0, // 视频帧所处层数;取值范围为 [0,100];默认值为 0,表示该区域图像位于最下层
  8. alpha: 1.0, // 视频帧的透明度,默认值为 1.0
  9. uid: 888888, // 旁路推流的用户 ID
  10. },
  11. {
  12. x: 0,
  13. y: 0,
  14. width: 1280,
  15. height: 720,
  16. zOrder: 1,
  17. alpha: 1.0,
  18. uid: 999999
  19. }
  20. ];
  21. var liveTranscoding = {
  22. width: 640,
  23. height: 360,
  24. videoBitrate: 400,
  25. videoFramerate: 15,
  26. lowLatency: false,
  27. audioSampleRate: AgoraRTC.AUDIO_SAMPLE_RATE_48000,
  28. audioBitrate: 48,
  29. audioChannels: 1,
  30. videoGop: 30,
  31. videoCodecProfile: AgoraRTC.VIDEO_CODEC_PROFILE_HIGH,
  32. userCount: user.length,
  33. backgroundColor: 0x000000,
  34. transcodingUsers: users,
  35. };
  36. client.setLiveTranscoding(liveTranscoding);

因为业务需求是摄像头和屏幕共享可以切换,摄像头和屏幕共享的分辨率和码率均不相同,屏幕共享需要更高的分辨率和码率。但是开发中发现切换时设置码率无效。SDK那边给的答复是:因为缓存问题,会以第一次推流设置的参数为准,将会在下个版本中修复。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/195245
推荐阅读
  

闽ICP备14008679号