(赵法彬/数字通信世界)目前,5G已经在包括中国在内的多个国家正式商用,各大运营商也都在加快5G基础设施建设与5G网络部署。由于5G是新一代移动通信系统,在其建设与商用初期必然会出现各种各样的问题,这就需要运营商、设备商、系统商等产业链上的各个环节通力合作,共同解决解决上述问题。日前,赛灵思有线与无线事业部技术市场高级总监Harpinder Singh Matharu接受了本刊记者的专访,针对相关热点话题进行了分析与回答。
Harpinder Singh Matharu
多快好省加快5G网络部署
针对5G基础设施建设与网络部署,Harpinder Singh Matharu说,以6GHz以下的中频段波束为中心的5G NR大规模MIMO系统可提供更高的容量,并具备将容量定向到所需位置的独有能力,而低频段中的宏无线电具有高覆盖率特性。因此,由协调良好的6GHz以下的大容量大规模MIMO系统和具有高覆盖范围的低位宏无线电组成的移动网络,将是提供具有规模、性能和低成本优势的服务部署的理想组合。为了最大限度地发挥网络潜力,5G基带系统需要具备智能功能(AI/ML法),使组网能够以协调良好的方式工作,从而最大限度地发挥每个无线电节点的性能,同时高效地平衡这些节点之间的负载流量。此外,5G毫米波无线电应部署在需要低成本大容量且无线电环境非常适合毫米波传播的位置,作为对6GHz以下网络的紧密补充。5G毫米波无线电正在世界上的一些地区进行早期试验和部署。这项技术有望在未来几年内得到改进,为移动网络中的多个站点提供成本最低的数据容量。需要注意的是,5G核心网络尚未部署,随着基于服务的5G核心网络出现,向5G核心网络的转变将加速众多新应用、新服务和相关需求的出现。为了满足这些未来需求,拥有灵活应变的无线电和基带系统至关重要,这样才能在不错过尚未出现的5G服务的收益流的同时,保持并最大化资本支出的回报。
Harpinder Singh Matharu强调,32T32R大规模MIMO系统已经成为5G不同部署的首选形态。对于密集的城市地区,特别是信号覆盖高层建筑的应用,将需要64T64R大规模MIMO系统;而16T16R或传统的8T8R无线电系统或许足以满足农村地区的需求。要针对所有这些规格重复使用固件、软件和模块,以节省成本并缩短上市时间。
为了解决5G的快速覆盖,尤其是农村等用户稀少区域的5G覆盖,包括中国在内的很多国家都在探索通过低轨道卫星实现覆盖。Harpinder Singh Matharu非常赞同这种探索,他认为卫星非常适合解决乡村和人口稀少地区的连通性需求,利用低轨宽带卫星弥补5G网络覆盖具有最低的部署成本和最少的部署时间。需要指出的是,底层数字信号处理要求与4G和5G基站系统中使用的技术和算法非常相似,由于这些卫星系统的容量很低,ASIC是不可行的。赛灵思技术(包括RFSoC)非常适合以较低成本解决高级算法和系统实现问题,赛灵思的7nmVersal ACAP以更低的功耗和成本提供了更高的计算密度和硬化连接功能,为新一代卫星系统设计提供了更优质的解决方案。此外,赛灵思的16nm UltraScale+ MPSoC已经广泛部署在卫星通信中。
5G早期部署的经验与需求变化
5G已经在不少国家开始部署与商用,那么,在5G网络在实际部署与应用过程中有哪些经验或者需要改进的地方呢?Harpinder Singh Matharu回答说,随着越来越多的运营商尝试进行5G部署和3GPP第16版标准的准备工作,对下一代5G设备的需求发生了变化:占用的带宽从100 MHz的典型系统带宽翻了一番,达到200 MHz;运营商的数量和运营商组合也在上升;前端的目标是为6 GHz以下的无线电提供更高的带宽;下一代5G系统对中频或C频段的典型带宽要求是400 MHz瞬时带宽,占用带宽为200 MHz。这是为了实现多运营商设备共享,以及减少系统排队,满足不同国家/地区的客户需求而做的考虑。在宽带无线电应用方面,业界也在考虑采用新功放技术,尤其是氮化镓功放,可将功率效率再提高5-10%。这些功放系统的预失真线性化要复杂得多,也需要大量的计算。在实施所有这些变革的同时,必须保持频谱的每MHz功率占用不变。对于现在必须支持4-5倍以上计算密度的波束成形和DFE设备来说,这是一个具有挑战性的要求。运营商和系统OEM厂商已经从第一波5G NR的部署中吸取了宝贵经验,系统OEM厂商/供应商将针对新一代5G NR系统的设计做出一系列改善。其中,调度程序(MAC层)与波束成型(低PHY)之间的跨层协同优化,进一步优化的波束成型管理的功能划分改善,以及机器学习算法的应用是领先的研究和实施领域。采用更加高效的GaN功率放大器、改善功率放大器线性化算法,并使用集成的数字和ADC/DAC功能,是降低功耗和降低5G NR大规模MIMO天线面板成本的开发方向。
Harpinder Singh Matharu认为,基于波束成型技术的5G NR 6 GHz以下大规模MIMO系统(32T32R和64T64R)已经成为全球商业5G部署的主流。第一轮5G部署的主要用例是增强型移动宽带应用,这是为了解决网络中快速增长的吞吐量需求,平均每15-18个月翻一番。大规模MIMO系统提供可扩展的容量增强功能,实现了更加统一的频谱效率改善。仿真和现场研究表明,如果我们继续提高传统宏基站的密度,那么频谱效率将无法实现统一缩放,容量和覆盖率缺口持续存在。然而,大规模MIMO系统能够通过使用波束成型同时调度多个用户和频谱的频率资源。与传统的MIMO无线电相比,大规模MIMO系统的目标性能是将其吞吐量提高3-5倍。
然而,大规模MIMO系统在场测中的实际表现如与仿真结果并不一致。不仅下行链路性能处于预期带宽的低端,上行链路性能、功耗与覆盖范围更是低于预期,对于小区边缘信噪比较低的UE情况尤其如此。此外,并非所有时刻都有多个用户供系统调度,当小区负载较轻时,大规模MIMO系统提供的容量难以得到充分利用,需要调度增强特性和跨层优化来弥补这些缺点。改进大规模MIMO系统的研发领域包括:天线面板创新、改进波束成型管理、更好的调度算法和跨层优化,以及跨相邻片区的协调多点传输。
Harpinder Singh Matharu表示,需要指出的是,我们正处于5G NR商业推广的早期阶段,增强型移动宽带应用是解决移动网络中快速增长的带宽需求的主要用例。当前部署中不存在基于颠覆性服务的5G核心架构,随着5G部署从非独立模式(为控制信号而锚定LTE)转变为独立模式,我们将见证基于服务的5G核心网络的涌现。向5G核心网络的转变将加速新应用和用例的问世,这种转变反过来会在时延、吞吐量、可靠性等方面对5G NR基站提出进一步的要求。5G NR基站的安装基础能否适应未来3-5年的新兴需求,对部署新服务来说至关重要。
全力以赴助力5G设备改进创新
既然锁定了现有5G基础设施的改进方向,设备商与系统商如何才能更快更好地研发出符合需求的产品呢?Harpinder Singh Matharu回答说,赛灵思提供了灵活应变的SoC平台、软件工具和IP,可以助力无线系统供应商快速设计和创新解决方案,并通过轻松地现场升级以及显著的TTM优势实现其解决方案的差异化。尤其是赛灵思确立了对大规模MIMO系统进行改进所需的一些算法与功能,目前提出的许多方法显著提高了计算需求和波束成型要求,以及额外的前端设备数量。
他进一步介绍说,赛灵思解决方案聚焦5G无线电技术,包括波束形成、前传连接以及L1和PDCP加速等虚拟化5G基带的加速功能,系统OEM厂商无需为开发ASIC(具有15-18个月的典型开发周期和3-5年的较短使用寿命)在前期进行巨额投资。赛灵思的16nm UltraScale+ MPSoC产品实现了早期5G商业化,并且在第一波5G NR商业部署中得到广泛应用;赛灵思的16nm UltraScale+ RFSoC集成了直接射频DAC/ADC,实现大规模MIMO、8T8R宏和多频带FDD无线电的关键集成,不仅降低了功耗,而且尺寸也得到了改善;赛灵思的7nm Versal ACAP SoC平台引入了颠覆性自适应智能向量引擎(称为AI引擎),助力实现宽带5G大规模MIMO和宏观无线电、波束成型和ML应用,以便进行MAC调度程序的协同优化和波束形成管理;赛灵思的7nm Versal ACAP平台可支持AI引擎的原生C/C++编程工具,显著提高了设计生产力,该平台非常适合解决新一代5G无线电、波束形成和AI/ML应用的要求,同时为新算法的创新、现场升级和上市进程优势的实现提供了绝佳途径。
Harpinder Singh Matharu说,赛灵思的7nm Versal自适应计算加速平台(ACAP)是一种新型可编程SoC,旨在满足新一代5G设备的需求。赛灵思于2018年3月宣布推出ACAP平台,该器件自2019年6月开始上市。赛灵思Versal是一种异构计算架构,添加了自适应智能向量引擎(被称为AI引擎),以执行波束形成和DFE功能。此外,AI引擎也适用于机器学习应用。Versal系列器件配备了数十个甚至上百个向量引擎,以满足不同用例的多样化计算要求。Versal器件中的AI向量引擎在1GHz+时钟频率下运行,提供32GMAC/s的性能。上市的第一款Versal器件配备了400个AI向量引擎,因此在单个器件上可实现12.8TMAC/s的性能。因此,与赛灵思在第一代5G基站中使用的UltraScale+器件相比,Versal将5G信号处理计算密度提高了5倍。AI引擎可支持定点和单精度浮点运算,与赛灵思16nm的UltraScale+器件相比,AI引擎将机器学习计算能力提升了20倍,机器学习可用于增强调度程序的性能。需要指出的是,所有上述性能改善还使得每芯片面积的功耗降低了40%。
除了以最佳方式实现数字信号处理算法以外,AI引擎本身还可通过C/C++进行编程,专门设计用于加速计算密集型波束形成、数字前端和机器学习功能。每个AI引擎都与相邻的向量引擎共享128KB的数据存储器,以实现高效的处理器间通信。此外,AI引擎还支持针对源数据和接收数据的高速连接架构。这种连接架构配备了DMA引擎(由软件工具根据内核设计和布局约束条件自动编程)。赛灵思Versal ACAP平台采用了平衡的可编程逻辑,可实现连接性和系统集成功能,从而将系统集成在单个芯片上。Versal ACAP面向多速率以太网MAC提供了硬ASIC模块,能够以毫微秒级的时间戳精度高效地为25G前传连接的多个端口提供支持。器件中的可编程逻辑支持精细粒度的存储器层级,以存储流媒体用户I/Q数据和波束形成权重。根据需要,芯片上的DDR控制器允许将波束形成字典存储在外部存储器中。赛灵思Versal平台提供片上网络功能,能够在位于可编程逻辑、AI引擎阵列、外部存储器和硬ASIC块中的不同功能或内核之间高效传输数据。芯片上的双核ARM A72处理器用于初始系统配置。在系统启动后,除OAM和使用实时操作系统或Linux的控制功能以外,A72处理器还可用于运行时系统配置。