“9月26日,第19届亚运会乒乓球项目女子团体决赛在杭州举行,中国队以3比0战胜日本队获得金牌,实现亚运五连冠。同在当天,乒乓球男子团体决赛中,中国队以3:0横扫韩国队,连续8次卫冕。”
在全亚洲的体坛健将与全世界热情观众面前,许多前沿的能力与技术在西子湖畔登台亮相,走入大众视野——零碳甲醇,三维烟花,数字巨人手持火炬步入会场……无数观众为比赛欢呼,线上直播观赛,线上连麦加油呐喊也成为一种别样的观赛体验。
近日,即构科技已经将实时互动的人数规模提升至万人实时互动,为线上直播提供更多玩法和可能。平台可以随心设置选路规则:拉取有兴趣、对自己有价值的音频流,实现万人规模房间用户产生的所有信令准确不丢失,真正的万人实时互动成为现实。
早在2017,即构首创推出了支持32人实时互动的视频通话连麦技术,比苹果的FaceTime早一年实现多人实时场景通话。但时至今日,在大多数用户的感知中,支持同时上麦互动的人数也并未显著提升。
为何实时连麦所支持的在线人数增长缓慢?在当前小规模互动居多的线上交流中,追求实时连麦的人数规模有哪些应用场景?
大规模连麦在何处体现价值?
第19届的杭州亚运,数字人、虚拟烟花已经置身其中,我们不妨设想在20届、21届亚运会上,XR设备彻底在消费级市场铺开,除了身处举办地的健将与观众,其他人也能通过虚拟空间“置身”开幕式现场,感受亚运风采。
而那时,最多只能同时拉取20到50路其他用户音频流的连麦能力,想必难以让我们真正体会到数万人同场欢呼雀跃的激动心情。
在已有实例参考的线上会议、直播等场景中,大规模连麦能够扩大互动规模,让部门会议变为公司、集团会议;能让一起看球、看电影的一起X场景,从数十人的小型同好会变成超大型的俱乐部、论坛,与更多人分享激动、喜悦。
不仅如此,大规模连麦技术的出现,还为元宇宙中的大规模实时互动提供了基座能力。在类RPG的网游中,同场景同屏出现几百上千玩家的情况并不少见,在玩家间互动仅支持IM消息、世界喇叭的时代,玩家间的互动距离沉浸感还有相当的距离。
而大规模连麦的出现,则让每一个身处虚拟空间的用户有了自由交流,畅所欲言的可能。
为何实时连麦人数难以突破?
首先是要考虑流量成本。在原有的技术路径中去实现多人实时连麦,是每一位用户同时拉取其他所有在线用户的音视频流。以100人为例,即使他们仅通过语音连麦,按照会议场景的常用规格16kbps计算,100人实时语音连麦的千分钟流量消耗接近1.2TB ,而流量消耗还并非音视频通讯成本的全部。
其次,同时拉取几十上百条音视频流是对用户端设备性能的挑战。通过移动端设备实时开会原本是一众线上会议平台刻在基因中的优势,但同时移动端有限的算力也成为了限制并发数量提升的瓶颈。
第三,当我们真正深入去思考多人实时连麦的使用场景,就能发现让10000个人同时开口说话既不现实,也无法形成有效的信息交换。更有可能出现的情况是,少数人在讨论,更多人在聆听并伺机发言提出自己的建议。
大规模的连麦真正带给所有人的是可以随时开口交流并且被人听到的权利。在一场大规模的线上连麦交流中,受到考验的不仅是用户端设备的性能,服务商的节点资源分配、负载均衡、扩容以及网络连通等关键技术都在经历一场大考,传统的音视频云服务架构难以支撑。
万人实时互动,即构如何突破限制?
如前所述,同时拉取万人规模的音视频流的操作从成本和用户端性能来看殊为不易,所以即构科技针对纯线上和虚拟空间两种场景推出了动态语音活跃度监测、动态用户兴趣范围两种云端智能选路策略,能帮助平台客户解决万人实时互动面临的成本高昂、用户端设备性能、云服务节点资源分配的挑战。
动态语音活跃度监测能对所有用户的语音活跃度进行监测,将语音活跃度最高的x条(x可自定义设置)音视频流拉取到用户端,并随着活跃度的变化实时更新,在节省流量的同时保证有效沟通。
动态用户兴趣范围可以基于虚拟空间中用户的实时位置与AOI(Area of Interest),将用户AOI范围内的距离用户最近的x条(x可自定义设置)拉取到用户端,同时借助空间音频能力,实现声音近大远小、左右前后的方向感,还原现实世界中的听觉感受,让音质体验更具沉浸感。
通过语音活跃度&用户兴趣范围这样的智能选路策略,就能够在大规模实时互动场景中避免同时拉取房间(区域)内全部音频流所产生的的海量流量消耗,同时又能筛选拉取一定数量的用户音频来保证氛围体验,减轻用户端机器性能负担。
除了通过即构预设好的语音活跃度/用户兴趣范围来进行选路拉流,我们已经实现万人规模房间用户产生的所有信令准确不丢失,用户或平台可以通过丰富的各项信息随心设置选路规则:拉取有兴趣、对自己有价值的音频流,实现真正的万人实时互动。
对于单房间超高并发对云服务的考验,即构科技凭借自研海量有序数据网络MSDN,覆盖全球212个国家和地区,实现了全球范围内优质的智能调度系统保证用户在任意时间地点都能使用最优节点,用无状态的分布式、多中心、多层音视频服务架构轻松应对超大并发场景。
接入万人实时互动功能详细文档请访问:https://doc-zh.zego.im/article/16339