WebRTC走向成熟

常规网络浏览器的视频通话

什么是WebRTC,它是如何开始的?

近20年来,人们已经清楚地认识到“语音通话的未来”将不再仅是电话通话,而是发展出更多样化的应用和用例。之前的企业软电话、IP联络中心、音视频会议和协作工具大多很粗糙,用户体验不佳。

VoIP应用或视频浏览器扩展的表现时好时坏,使得用户对其失望,会话效率低。而那时VoIP信令、声学和图像处理技能还是不多见的专业 “黑科技”。

十年前,也就是2011年6月,一个由W3C和IETF提出的新标准WebRTC出现了。它旨在将实时音视频通信插入网络浏览器中。该标准带来了三个关键创新点。

  • 使我们能够在互联网上运行低延迟的实时通信(RTC)通道;能自动处理深层技术问题,如选择编解码器和处理防火墙问题。该操作完全加密。
  • JavaScript API。它使这些RTC功能能够轻松插入到网络中,也就是使音视频功能变成网页原有的功能,不再需要插件。
  • 通过创建库和软件开发工具包(SDK),允许这些功能独立于浏览器使用。这意味着WebRTC音视频可以插入到手机或电脑桌面应用程序中。

基于云的供应商开始提供这些功能服务。基于WebRTC的视频cPaaS播放器实现了植入式网络视频聊天,或视频联络中心初期形式。

过去十年里,WebRTC经历了一段缓慢曲折的发展过程,但也已经在个体消费者和商业领域产生了一定影响。该标准实现了音视频功能的自由化。如今,创建一个新的通信应用或一次新体验,亦或是添加网络/应用通信作为辅助功能到现有系统中,都变得更加容易了。

该标准能应用于数十亿台设备中,是因为得到了全部当代浏览器和其他平台(尤其是安卓系统)在操作系统中的直接支持。通过SDK和库,WebRTC还被 “内置”到成千上万的移动应用中。众多基础设施供应商提供了网关、工具、测试平台和许多其他功能。

也就是说,WebRTC并不是全部通用的。市场上有很多独立的语音应用和软电话,以及独立的视频应用。特别是Zoom有自己的方法和技术。微软Teams使用WebRTC进行浏览器访问,但不会在原生客户端使用 WebRTC。

对于大多数音视频开发者来说,WebRTC是一个很好的选择,但有些开发者有特定的需求,或者他们是技术领域的专家或IPR,他们可以自己实现基础设施和优化。

借WebRTC网关实现视频通话的门禁对讲

WebRTC 的用例和纵向市场

在个体消费者和企业通信领域,WebRTC有大量用例。大致分为以下两类:

仅WebRTC

指那些设计成全程使用WebRTC的应用,或者说是用户场景。也就是说,连接的两端都在浏览器中使用WebRTC,或将其内置于专用应用程序中。一个新的、独立的视频会议服务,或集成到社交媒体应用中的视频聊天就属于这个类别。其中可能涉及到专业的平台供应商(cPaaS),也可能只是由应用开发者使用WebRTC “库”(软件组件)直接设计的。

WebRTC 网关

指在连接的一端使用WebRTC,另一端不使用,需要某种网关或边界功能。常见的例子是用户使用网络浏览器连接到企业平台,如联络中心或云通信UCaaS平台。这通常涉及将信令转换为商业电话,或视频会议系统中使用的通用SIP协议,还可能涉及不同音视频格式(编解码器)之间的转码。服务提供商可能会运行网关,并将互连功能作为一项基于云的服务来提供。但如果他们本身也在提供UCaaS或CCaaS服务,可能会将其作为一项额外功能提供。

有些应用同时使用上述这两种模式。例如一个会议平台,它在内网用户之间使用SIP,但也需要与外部互联。这两种用例的用量在新冠疫情期间都急剧增长,下文将就其进一步讨论。

从行业垂直市场来看,WebRTC 的一些主要用户主要有:

商业UCaaS

即一般的企业UCaaS用户,特别是用台式机的用户。

联络中心

包括许多垂直市场的联络中心,特别是那些有远程代理的联络中心(如外包客户服务和支持)。

社交媒体

即使用社交媒体应用的消费者,该应用使用WebRTC进行流媒体、广播或应用内视频播放。

保健和远程医疗

医疗保健和远程医疗,特别是网上问诊。

金融服务

金融服务应用,比如通过视频进行身份验证,或在手机中通过视频进行保险索赔评估。

零售和旅游行业

零售和旅游行业已有人将WebRTC用于点击呼叫功能,偶尔用于 “共同浏览”功能,即销售代表向客户介绍应用程序或网页上显示的选项。

电信/服务提供商行业的WebRTC发展较为缓慢。在某些情况下,它成了新兴音视频应用的基础,或作为访客托管电话和UCaaS服务的额外入口。虽然各种网关扩展了内网电话或视频的基础功能,但在部署和采用方面,WebRTC与IMS世界之间的互动相当零散。

通过WebRTC应用的医护人员视频会诊

疫情期间发生了什么变化?

在使用量和应用多样性方面,WebRTC发生了巨大变化。2020年,我们见证了用户由手机转向使用笔记本电脑和台式电脑,特别是在家工作者的交互需要增长。但疫情期间也有很多消费者喜欢大屏幕设备。

重要的是,人们对双向视频通信的接受程度发生了巨大转变。人们更加适应众多场合下的视频通话了。他们安装好摄像头和麦克风,插上电源,随时可以使用;也更熟悉如何管理隐私、静音、使用背景滤镜,某些情况下适甚至还会给自己打光。

此外,由于在办公室工作的人越来越少,会议室会议系统也发生了变化。语音通信也是如此,很少有员工会使用公司的桌面电话,或者对着大型联络中心的专用设置说话了。

理论上上述设备都可以被 “云原生 “的UCaaS和CCaaS服务所取代,但现实中这种转变相当缓慢。现在的需求是重新利用和扩展现有的“传统”平台。使用WebRTC的软件客户端对此提出了一种重要的解决方案。

换句话说,与2019年相比,现在对话的两端/所有人更依赖笔记本电脑和浏览器了。同时,智能手机/平板电脑用户也扩大了自己的通信范围,特别是在面对面社交活动受限或被禁止的国家。此种现象更为多见。

其它使用WebRTC的方式有:

会议协作

Google Meet和Jitsi Meet等“纯”WebRTC会议协作系统大规模增长。

访客和台式机用户

大量访客和台式机/浏览器用户使用WebRTC访问,将其接入传统的UC/UCaaS平台(如WebEx),省去了插件或单独的应用程序下载这一麻烦。

客户个例和销售市场

客户个例和销售市场中广泛使用WebRTC,因为现在呼叫中心操作员和客户更依赖电脑。

新型联络中心互动

某些类型的联络中心互动可承载更复杂的呼叫,持续时间上也更长。此时视频通话更为合适,例如零售业“线上购物线下取货”的服务、社会关怀以及就业/福利讨论等。在网页内(比如产品描述或网页表格旁)能使用视频很方便,这样就不再只有单独的应用程序中才能使用视频了。

医疗保健、远程护理和远程医疗

保健、远程护理和远程医疗WebRTC用例大量增加,涵盖众多不同的应用场景和用户背景。从定期视频问诊,到为被忽视的弱势群体患者提供远程问诊等更专业的应用和工具。其范围非常广泛。

机动工作人员

市场对像自由职业者、顾问和主题专家等灵活劳动力的需求日益增长。他们可能也会纳入公司的通信系统。这对那些想快速扩大/缩减规模,或出于合规性的原因(如记录)的公司来说是非常重要的。当外部用户经由公司平台,而不是“端对端”客户通话时,记录会变得更加容易。

线上查看和检查

如今“线上查看”和“线上检查”应用广泛,比如买房、技术人员远程操作工具来维修飞机发动机,或安装数据中心的服务器等。

社交、教育与培训

基于浏览器的视频互动和聊天在社交、教育、培训和类似场景中的使用越来越多。虽然有时用户会选择如Zoom(不基于WebRTC)等商业会议应用,但还是有相当一部分用户选择在网站和移动应用中内置的音视频互动。

流媒体类应用

使用WebRTC的流媒体类应用越来愈多,特别是游戏领域。谷歌的Stadia平台就使用了该技术。

物联网应用案例

如今搭载WebRTC的物联网用例越来越多。比如远程视频控制门铃和门锁,即使主人不在家或无法开门,快递也会安全送到。

公共场所的互动屏幕

现在,公共场所的交互式屏幕越来越多。例如大楼或办公室里的线上“前台”,配备有线上视频服务员,甚至还可以显示/捕捉二维码以获取权限。

消费者通信应用

新的消费通信应用和体验层出不穷。例如家庭健身教练(Peloton很早就开始了线上动感单车课程)、群组语音聊天和“合作播客”。

(资料来源:Google在2020年Krankygeek大会的发言。https://www.krankygeek.com

如今有这么一种趋势,6、7年前最初容易描述的“单一”WebRTC用例再次出现,但这些用例要么是实施很棘手,要么是不符合用户的行为和偏好。

虽然网页中“点击呼叫”选项已经很常见,但大多数用户更喜欢文字聊天,因为他们不太习惯这种情况下的实时音/视频。现在这种情况已经发生了变化,这也使之前的设想成为现实,可以由基于云的第三方(通常与更广泛的cPaaS供应相关联)实现。

使用线上视频服务员的虚拟“前台”

WebRTC 的未来

现在萌生的许多趋势会在明年及更远的未来继续发展,技术和用例方面也将继续迭代。WebRTC会从许多方面反映出通信领域更广泛的应用前景,为应用和开发人员提供更容易嵌入音/视频功能或创造新体验的方法。

将来的注意事项包括:

实时用户

未来会有更多用户同时在线。例如一个视频会议或活动中,有10几个或100多人同时使用音视频服务。

性能

WebRTC性能的总体改善,例如功效。

混合型活动

创办混合活动。为个性化通信应用和cPaaS/其他基于云的应用带来新的机遇。

从传统的PBX到云

从传统的PBX和呼叫中心平台,转向更灵活的云计算。

健康与社会关怀

继续关注涉及音视频和集成传感器的健康和社会护理应用。

对权衡的认识

对安全、隐私、合规性和实用性之间的权衡有了更多的认识。例如,多路对话如何做到端到端加密的同时又能集中记录?

音视频处理

音视频处理使用量增加,特别是背景模糊方面。但也有适用于特定应用的定制版降噪(如音乐课与线上聚会)功能。未来会细化WebRTC的一些内部功能,使用新的标准,如更容易实现的WebAssembly。

物联网用例

未来会出现以物联网为中心的用例,因为摄像头、显示器和麦克风在智能家居设备、工业和智能建筑系统以及新形式的互动形式中更常见了。

面向未来应用的新型视频编解码器

未来会继续研究新的视频编解码器,如VP9和AV1,以便更好地在网络要求和处理性能之间进行权衡。该研究可能会促成如AR/VR类的新应用出现,特别是在可以使用GPU和硬件加速器的设备上。

综上所述,WebRTC的音视频通信自主化工程已经有10年了。它促成了大量的新应用,并使现有的通信服务(尤其是基于SIP的服务)通过浏览器和智能手机应用扩展到电脑和手机中。

WebRTC不是打造视频体验和服务的唯一方法,但现在它已经成为该行业的中流砥柱,也是消费者、企业和服务提供商创新的核心来源。

文章地址:https://iotcomms.io/webrtc-reaches-maturity/

原文作者:Dean Bubley

推荐阅读
相关专栏
开源技术
106 文章
本专栏仅用于分享音视频相关的技术文章,与其他开发者和声网 研发团队交流、分享行业前沿技术、资讯。发帖前,请参考「社区发帖指南」,方便您更好的展示所发表的文章和内容。