2024年3月2日发(作者:寿志明)
LTE终端能力等级之“猫”系列大揭密
还记得90年代56K拨号用的那只“猫”吗?小时候不懂英语,被人误导只有用那只“猫”才能上网是因为那个叫调整解调器的东西拨号上网时会有猫一样的叫声Orz…
非要把LTE终端和喵星人扯上些关系的话,那么华为荣耀手机满大街PPT式的巨幅广告当然是首当其冲的。笔者在机场、火车车、公交站等等各路广告牌下每每看见华为荣耀手机广告中显眼的“cat6”标识,总隐隐感到华为难道是找自家工程师设计的广告咩?总之,今天就带大家剥开猫系列背后的故事,还原它背后省略表达的一万字。
一、什么是“猫6”?
LTE以快著称,根据LTE终端无线传输性能,可将其分为多种能力等级,这就是LTE category,简称CAT。著名的移动通信标准组织3GPP目前将终端能力划分为15个等级,能力等级越高对应着终端能够具备的无线传输性能越强,直白说就是达到的峰值速率越高。我们常说的LTE下载峰值速率100Mbps,上传峰值50Mbps对应为CAT3能力等级。而实际上,目前大部分终端均为CAT4能力等级,对应LTE下载峰值速率150Mbps,上传峰值50Mbps。
随着LTE芯片处理能力的增强,众多具备更高能力等级LTE终端纷纷面世,不断刷新4G速率极限,华为荣耀6凭借全球首款支持CAT6的海思芯片,成为全球首款上市的Cat6手机。意味着它能够支持下行峰值速率达到300Mbps。
CAT6之所以能够达到CAT4峰值速率的两倍,只因CAT6在LTE界首次引
入了载波聚合技术(Carrier Aggregation),该技术能够将多个载波聚合成一个更宽的频谱,说直白点就是CAT6能让两段20Mhz带宽合并为一个终端所用,而CAT4终端没这能力只能最大用一段20Mhz。
二、峰值速率谁说了算?(此段非可作为LTE圈内人士判断标准段)
总的来说,LTE终端的峰值速率由以下因素决定:系统带宽、子帧配比、特殊子帧配比、TM模式、控制信道开销、终端能力等级等等。结合终端能力等级,笔者和大家一起计算一遍20M带宽下,CAT6终端的下行理论峰值速率。请跟紧:
1. 首先打开3GPP标准TS 36.213中表7.1.7.2.1-1,我们看到100RB,最高调制模式下对应TB size为75376bits,再看表7.1.7.2.4-1将其映射到二流时(下行2天线收),TB size为149776bits。这里作简单说明:TB size表示一个子帧上一个码流上的数据块大小,它由RB数量和MCS以及码率共同决定。
2. 接着打开TS 36.306查到表4.1-1规定CAT6每TTI接收到的TB比特数为301504bits(每TTI 301504bits)。因此我们此时已经得到,CAT6终端在双流下CA的情况下每TTI(0.001s)可传输的数据量,因此我们可以轻易计算下行的理论峰值速率:FDD双工模式下,下行峰值速率=301504bits/0.001s=301.5Mbps。这就是我们常常在广告中看到的宣传语所映射出的信息,CAT6最高下行速率为300Mbps。事实上这个下行速率仅在FDD下能够达到。
3. 在TDD双工模式下,TD-LTE下,如果选定帧格式为1:3,特殊子帧格式为10:2:2,则下行峰值速率为(10ms内6个下行子帧,2个特殊子帧,其中特殊子帧DwPTS可用于传输下行数据):
下行峰值速率=301504bits*(6+1.5)*100=223.1Mbps。
4. 这里说明一下,也就是说中国移动LTE手机在CAT6下是无法达到300Mbps的,根本原因是TDD下1个无线帧下是无法全部工作在下行的,还有一部分要分给上行。但是对于FDD而言,300Mbps的速率比起TDD付出了2倍的系统带宽(上下行各40M,2个20M载波聚合),而TDD仅仅是40Mbps,也就是说TDD在频谱利用率的确上呈现出超高的优势。
以上计算流程一定会引发你的几个问题,下面来一一解答:
问题一、3GPP TS 36.213中单流TB size75376bits从何而来?
答:这个数值可以计算得到。下面开始计算:
1200子载波* 11个符号 (假设PDCCH占用3个符号)=13200个RE
单流下,参考信号占用(时域是每时隙2个,频域是6子载波1个,交叉看是每3载波1个 ),又因为前两个RS落在PDCCH中,因此:(4RS - 2 RS) + 4RS
= 6RS即每TTI数据部分传输6个RS信号,则100个RB需600个RE资源。
因此剩下13200-600=12600个RE来传输数据
采用64QAM调制方式,一个符号对应6个bit,得到:
12600*6=75600
这个结果和3GPP提供的75376相差224bit,主要用于PSS和SSS同步以及BCH的传输。需要说明的是实际上每个子帧的情况不同,不是每个子帧都能够达到75376这个传输能力,例如TDD下的特殊子帧因为可携带的数据bit数有限再考虑码率(CR)不能超过0.93,可能会选用更低TBS的能力。
BCH每40ms 占用4符号*72个子载波=288RE 如果某一TTI落入BCH传输的周期中,则需要减掉288*6=bit
每10ms PSS SSS占用2个符号*72 =144个RE 共288个RE
288*6=864bit 172bit
问题二、单流75536、双流149776、CAT6最大TB比特数301504的关系?
首先我们看一下3GPP TS36.306表格4.1-1:
UE Category Maximum number of DL-SCH
transport block bits received
within a TTI (Note 1)
Maximum number of bits
of a DL-SCH transport
block received within a
TTI
Category 0 (Note 2)
Category 1
Category 2
Category 3
Category 4
Category 5
1000
10296
51024
102048
150752
299552
1000
10296
51024
75376
75376
149776
Category 6
Category 7
Category 8
Category 9
Category 10
301504
301504
2998560
452256
452256
149776 (4 layers)
75376 (2 layers)
149776 (4 layers)
75376 (2 layers)
299856
149776 (4 layers)
75376 (2 layers)
149776 (4 layers)
75376 (2 layers)
首先表格第二列表示各种CAT等级下终端在每TTI下传输的TB块的最大bit数,第三列是每TTI下传输的最大的TB size。此时关注CAT6在第三列有两种选项,这两种选项分别是75376(2 layers)和149776(4 layers)。分别对应着20M带宽+4天线收、20M+20M CA+2天线收的情况。只有20M+20M CA+2天线收的情况对应着CAT6 第二列的301504bit。而在20M带宽+4天线收的情况下每TTI传输的最大bit数其实和CAT5下是一样的,为299552。细微差别来自于这两种情况下参考信号所占资源不同。这样就回答了这个问题。
接着解释一下3GPP TS 36.306 表4.1-1 中“Total number of soft channel bits”的含义:可翻译为“接收端HARQ缓存大小”,但凡是采用了HARQ技术的终端,都有这个参数配置。他指的是基站侧应该为该手机终端留出多大的buffer。主要原因是手机采用HARQ技术,但是不同手机接收缓存能力不同,所以基站需要确切知道手机的最大接收能力。这样才能在基站侧基带芯片中合理预留。因为成本因素,系统侧的基带芯片里的ram是有空间限制的,不可能给每一个终端都开的很大,所以手机自己上报能力需求很必要。
最后说一说终端的缓存能力。从TS 36.306 表4.1-1中我们看到CAT6终端的缓存能力是3654144bits,即446KB。总的来说缓存是一种高速存储器,主要是为了协调速度相差较大的两种硬件/软件之间的速度差异的,也就是说终端接收的缓存大小主要是解决了译码模块的速度和读取内存数据的速度差异,即缓存的大小决定着译码的速度,而CAT能力等级不同导致一定时间内需要译码的数据量不同。既然缓存的作用这么重要,为什么终端的缓存大小一直做的比较小呢?(具体大小大家可以搜索手机处理器的缓存指标)
这是由于高速缓存的工作频率一般和处理器一致,这使得缓存基本上做在处理器的片内(一般来说片外缓存的工作频率都会有所降低),片内缓存的大小会明显影响到处理器芯片的散热、面积,可以想象缓存如果做的巨大,芯片光是驱动这些缓存就需要消耗额外的驱动模块,并消耗一定的电量,高功耗的芯片势必影响芯片的散热和高温工作指标,这些都会切实的影响到芯片的整体性能,而更重要的是片内缓存的大小影响到芯片的成本(芯片的流片成本非常高,高到一次失败的大规模投片可能会使得一家规模一般的芯片公司彻底关张)。因此缓存一般不
会做的太大。
三、高CAT终端复杂度究竟体现在哪?
以LTE终端的下行物理层处理为例说明该问题:
由图看到,LTE终端的下行物理层处理流程包括了同步、FFT、信道估计、MIMO算法、Demapper和解码等运算过程,这些运算过程随着数据量的增加都会增加运算规模和复杂度,而这仅仅是随着CAT能力要求增强复杂度增加的一个方面,LTE协议栈的各个层次对于数据的处理都将增加复杂度。以下给出LTE下行处理运算量的一个分析结果:
模块
同步
fft点数
CAT1
12K复乘加
256
15.36M复Fft运算量
2RX TDD收
乘
30.72M复加
信道估计 120K除法
2.9M复乘
1.5M复加
15K求倒数
25.92M减法
301M加减,比选
200K除法
4.85M复乘
2.5M复加
25k求倒数
43.2M减法
1500M加减,比选
400K除法
9.7M复乘
5M复加
50K求倒数
86.4M减法
3000M加减,比选
600K除法
14.55M复乘
7.5M复加
75K求倒数
129.6M减法
4503M加减,比选
800K除法
19.4M复乘
10M复加
100K的求倒数
172.8M减法
9001M加减,比选
34.56M复乘
69.12M复加
76.8M复乘
153.6M复加
168.96M复乘
338M复加
168.96M复乘
338M复加
CAT2
12K复乘加
512
CAT3
12K个复乘加
1024
CAT4 CAT5
ChannelestimationRemoveCPFFTMIMOdetectorRemoveCPFFTChannelestimationDemapperDecoder12K个复乘加 12K个复乘加
2048 2048
MIMO
Demapper
(QAM64)
Decoder
Turbo
60运算/bit
接收链处理量估计
390MO /s 1660MO /s 3340MO /s 5200MO /s 9750MO /s
接着给出终端处理复杂度从2G到4G的变化曲线:
由此可见,终端能力等级的增强带来了对芯片处理能力以及缓存能力等的多重要求,所以在LTE产业的发展初期,我们经常看到的是支持CAT3或CAT4的终端。而随着芯片工艺制程的发展,最近我们看到了能够支持更高能力等级的LTE终端面世,下一节就给大家介绍市面上可见典型终端的支持情况。
三、终端能力够了,还等看网络能力行不行
四、更高能力的LTE终端问世啦
2024年3月2日发(作者:寿志明)
LTE终端能力等级之“猫”系列大揭密
还记得90年代56K拨号用的那只“猫”吗?小时候不懂英语,被人误导只有用那只“猫”才能上网是因为那个叫调整解调器的东西拨号上网时会有猫一样的叫声Orz…
非要把LTE终端和喵星人扯上些关系的话,那么华为荣耀手机满大街PPT式的巨幅广告当然是首当其冲的。笔者在机场、火车车、公交站等等各路广告牌下每每看见华为荣耀手机广告中显眼的“cat6”标识,总隐隐感到华为难道是找自家工程师设计的广告咩?总之,今天就带大家剥开猫系列背后的故事,还原它背后省略表达的一万字。
一、什么是“猫6”?
LTE以快著称,根据LTE终端无线传输性能,可将其分为多种能力等级,这就是LTE category,简称CAT。著名的移动通信标准组织3GPP目前将终端能力划分为15个等级,能力等级越高对应着终端能够具备的无线传输性能越强,直白说就是达到的峰值速率越高。我们常说的LTE下载峰值速率100Mbps,上传峰值50Mbps对应为CAT3能力等级。而实际上,目前大部分终端均为CAT4能力等级,对应LTE下载峰值速率150Mbps,上传峰值50Mbps。
随着LTE芯片处理能力的增强,众多具备更高能力等级LTE终端纷纷面世,不断刷新4G速率极限,华为荣耀6凭借全球首款支持CAT6的海思芯片,成为全球首款上市的Cat6手机。意味着它能够支持下行峰值速率达到300Mbps。
CAT6之所以能够达到CAT4峰值速率的两倍,只因CAT6在LTE界首次引
入了载波聚合技术(Carrier Aggregation),该技术能够将多个载波聚合成一个更宽的频谱,说直白点就是CAT6能让两段20Mhz带宽合并为一个终端所用,而CAT4终端没这能力只能最大用一段20Mhz。
二、峰值速率谁说了算?(此段非可作为LTE圈内人士判断标准段)
总的来说,LTE终端的峰值速率由以下因素决定:系统带宽、子帧配比、特殊子帧配比、TM模式、控制信道开销、终端能力等级等等。结合终端能力等级,笔者和大家一起计算一遍20M带宽下,CAT6终端的下行理论峰值速率。请跟紧:
1. 首先打开3GPP标准TS 36.213中表7.1.7.2.1-1,我们看到100RB,最高调制模式下对应TB size为75376bits,再看表7.1.7.2.4-1将其映射到二流时(下行2天线收),TB size为149776bits。这里作简单说明:TB size表示一个子帧上一个码流上的数据块大小,它由RB数量和MCS以及码率共同决定。
2. 接着打开TS 36.306查到表4.1-1规定CAT6每TTI接收到的TB比特数为301504bits(每TTI 301504bits)。因此我们此时已经得到,CAT6终端在双流下CA的情况下每TTI(0.001s)可传输的数据量,因此我们可以轻易计算下行的理论峰值速率:FDD双工模式下,下行峰值速率=301504bits/0.001s=301.5Mbps。这就是我们常常在广告中看到的宣传语所映射出的信息,CAT6最高下行速率为300Mbps。事实上这个下行速率仅在FDD下能够达到。
3. 在TDD双工模式下,TD-LTE下,如果选定帧格式为1:3,特殊子帧格式为10:2:2,则下行峰值速率为(10ms内6个下行子帧,2个特殊子帧,其中特殊子帧DwPTS可用于传输下行数据):
下行峰值速率=301504bits*(6+1.5)*100=223.1Mbps。
4. 这里说明一下,也就是说中国移动LTE手机在CAT6下是无法达到300Mbps的,根本原因是TDD下1个无线帧下是无法全部工作在下行的,还有一部分要分给上行。但是对于FDD而言,300Mbps的速率比起TDD付出了2倍的系统带宽(上下行各40M,2个20M载波聚合),而TDD仅仅是40Mbps,也就是说TDD在频谱利用率的确上呈现出超高的优势。
以上计算流程一定会引发你的几个问题,下面来一一解答:
问题一、3GPP TS 36.213中单流TB size75376bits从何而来?
答:这个数值可以计算得到。下面开始计算:
1200子载波* 11个符号 (假设PDCCH占用3个符号)=13200个RE
单流下,参考信号占用(时域是每时隙2个,频域是6子载波1个,交叉看是每3载波1个 ),又因为前两个RS落在PDCCH中,因此:(4RS - 2 RS) + 4RS
= 6RS即每TTI数据部分传输6个RS信号,则100个RB需600个RE资源。
因此剩下13200-600=12600个RE来传输数据
采用64QAM调制方式,一个符号对应6个bit,得到:
12600*6=75600
这个结果和3GPP提供的75376相差224bit,主要用于PSS和SSS同步以及BCH的传输。需要说明的是实际上每个子帧的情况不同,不是每个子帧都能够达到75376这个传输能力,例如TDD下的特殊子帧因为可携带的数据bit数有限再考虑码率(CR)不能超过0.93,可能会选用更低TBS的能力。
BCH每40ms 占用4符号*72个子载波=288RE 如果某一TTI落入BCH传输的周期中,则需要减掉288*6=bit
每10ms PSS SSS占用2个符号*72 =144个RE 共288个RE
288*6=864bit 172bit
问题二、单流75536、双流149776、CAT6最大TB比特数301504的关系?
首先我们看一下3GPP TS36.306表格4.1-1:
UE Category Maximum number of DL-SCH
transport block bits received
within a TTI (Note 1)
Maximum number of bits
of a DL-SCH transport
block received within a
TTI
Category 0 (Note 2)
Category 1
Category 2
Category 3
Category 4
Category 5
1000
10296
51024
102048
150752
299552
1000
10296
51024
75376
75376
149776
Category 6
Category 7
Category 8
Category 9
Category 10
301504
301504
2998560
452256
452256
149776 (4 layers)
75376 (2 layers)
149776 (4 layers)
75376 (2 layers)
299856
149776 (4 layers)
75376 (2 layers)
149776 (4 layers)
75376 (2 layers)
首先表格第二列表示各种CAT等级下终端在每TTI下传输的TB块的最大bit数,第三列是每TTI下传输的最大的TB size。此时关注CAT6在第三列有两种选项,这两种选项分别是75376(2 layers)和149776(4 layers)。分别对应着20M带宽+4天线收、20M+20M CA+2天线收的情况。只有20M+20M CA+2天线收的情况对应着CAT6 第二列的301504bit。而在20M带宽+4天线收的情况下每TTI传输的最大bit数其实和CAT5下是一样的,为299552。细微差别来自于这两种情况下参考信号所占资源不同。这样就回答了这个问题。
接着解释一下3GPP TS 36.306 表4.1-1 中“Total number of soft channel bits”的含义:可翻译为“接收端HARQ缓存大小”,但凡是采用了HARQ技术的终端,都有这个参数配置。他指的是基站侧应该为该手机终端留出多大的buffer。主要原因是手机采用HARQ技术,但是不同手机接收缓存能力不同,所以基站需要确切知道手机的最大接收能力。这样才能在基站侧基带芯片中合理预留。因为成本因素,系统侧的基带芯片里的ram是有空间限制的,不可能给每一个终端都开的很大,所以手机自己上报能力需求很必要。
最后说一说终端的缓存能力。从TS 36.306 表4.1-1中我们看到CAT6终端的缓存能力是3654144bits,即446KB。总的来说缓存是一种高速存储器,主要是为了协调速度相差较大的两种硬件/软件之间的速度差异的,也就是说终端接收的缓存大小主要是解决了译码模块的速度和读取内存数据的速度差异,即缓存的大小决定着译码的速度,而CAT能力等级不同导致一定时间内需要译码的数据量不同。既然缓存的作用这么重要,为什么终端的缓存大小一直做的比较小呢?(具体大小大家可以搜索手机处理器的缓存指标)
这是由于高速缓存的工作频率一般和处理器一致,这使得缓存基本上做在处理器的片内(一般来说片外缓存的工作频率都会有所降低),片内缓存的大小会明显影响到处理器芯片的散热、面积,可以想象缓存如果做的巨大,芯片光是驱动这些缓存就需要消耗额外的驱动模块,并消耗一定的电量,高功耗的芯片势必影响芯片的散热和高温工作指标,这些都会切实的影响到芯片的整体性能,而更重要的是片内缓存的大小影响到芯片的成本(芯片的流片成本非常高,高到一次失败的大规模投片可能会使得一家规模一般的芯片公司彻底关张)。因此缓存一般不
会做的太大。
三、高CAT终端复杂度究竟体现在哪?
以LTE终端的下行物理层处理为例说明该问题:
由图看到,LTE终端的下行物理层处理流程包括了同步、FFT、信道估计、MIMO算法、Demapper和解码等运算过程,这些运算过程随着数据量的增加都会增加运算规模和复杂度,而这仅仅是随着CAT能力要求增强复杂度增加的一个方面,LTE协议栈的各个层次对于数据的处理都将增加复杂度。以下给出LTE下行处理运算量的一个分析结果:
模块
同步
fft点数
CAT1
12K复乘加
256
15.36M复Fft运算量
2RX TDD收
乘
30.72M复加
信道估计 120K除法
2.9M复乘
1.5M复加
15K求倒数
25.92M减法
301M加减,比选
200K除法
4.85M复乘
2.5M复加
25k求倒数
43.2M减法
1500M加减,比选
400K除法
9.7M复乘
5M复加
50K求倒数
86.4M减法
3000M加减,比选
600K除法
14.55M复乘
7.5M复加
75K求倒数
129.6M减法
4503M加减,比选
800K除法
19.4M复乘
10M复加
100K的求倒数
172.8M减法
9001M加减,比选
34.56M复乘
69.12M复加
76.8M复乘
153.6M复加
168.96M复乘
338M复加
168.96M复乘
338M复加
CAT2
12K复乘加
512
CAT3
12K个复乘加
1024
CAT4 CAT5
ChannelestimationRemoveCPFFTMIMOdetectorRemoveCPFFTChannelestimationDemapperDecoder12K个复乘加 12K个复乘加
2048 2048
MIMO
Demapper
(QAM64)
Decoder
Turbo
60运算/bit
接收链处理量估计
390MO /s 1660MO /s 3340MO /s 5200MO /s 9750MO /s
接着给出终端处理复杂度从2G到4G的变化曲线:
由此可见,终端能力等级的增强带来了对芯片处理能力以及缓存能力等的多重要求,所以在LTE产业的发展初期,我们经常看到的是支持CAT3或CAT4的终端。而随着芯片工艺制程的发展,最近我们看到了能够支持更高能力等级的LTE终端面世,下一节就给大家介绍市面上可见典型终端的支持情况。
三、终端能力够了,还等看网络能力行不行
四、更高能力的LTE终端问世啦