Siwei MA, Li ZHANG, Shiqi WANG, Chuanmin JIA, Shanshe WANG, Tiejun HUANG, Feng WU & Wen GAO. Evolution of AVS video coding standards: twenty years of innovation and development. Sci China Inf Sci, DOI: 10.1007/s11432-021-3461-9
AVS視頻編碼標準的演變:20年來的創(chuàng)新與發(fā)展

1 研究意義
20世紀90年代至21世紀初,MPEG和VCEG等國際標準工作組制定了系列視頻編碼標準,如MPEG-1,H.261,MPEG-2/H.262標準等。
在這些編碼標準中幾乎沒有我國專利的影子,這意味著我們國家的企業(yè)如果要使用這些先進的編解碼技術,需要對外支付高昂的專利費用。
為了填補這一空白,原國家信息產(chǎn)業(yè)部科學技術司于2002年6月批準成立中國數(shù)字音視頻編解碼技術標準工作組(AVS工作組),目標是制定具有自主知識產(chǎn)權的音視頻編解碼標準。
自成立以來,AVS工作組一直致力于以高效的編解碼技術推動和創(chuàng)新數(shù)字音視頻產(chǎn)業(yè)的發(fā)展。在這20年里,AVS工作組制定了三代音視頻編碼標準,為我國音視頻產(chǎn)業(yè)自主發(fā)展奠定了堅實的基礎。
最新一代AVS3標準發(fā)布于國際標準VVC之前,在8K產(chǎn)業(yè)應用方面實現(xiàn)了領跑布局。在AVS3標準支持下, 今年的北京冬奧會和冬殘奧會也成為了奧運史上首次通過8K視頻技術直播開幕式和轉播重要比賽的賽事。
2 本文工作
本文先整體介紹了AVS視頻編碼標準過去20年的發(fā)展歷程和應用情況。
2006年發(fā)布的第一代AVS國家標準主要面向高清數(shù)字電視廣播,第一代AVS國家標準的增強版本AVS+發(fā)布于2012年。
2016年發(fā)布的AVS2國家標準主要面向4K超高清應用,壓縮效率與國際同期HEVC/H.265相當。
最新制定完成并發(fā)布的AVS3標準主要面向8K超高清視頻(UHD)電視廣播和虛擬現(xiàn)實(VR)等新興應用場景。
AVS系列編碼標準制定中,采用從整體到局部的技術路線,即先提出一個由若干模塊組成的混合編碼框架,通過對每一個模塊進行技術創(chuàng)新來帶動整體的性能提升。 AVS視頻編碼框架由塊劃分、幀內預測、幀間預測、變換、量化、熵編碼和環(huán)路濾波等模塊組成,本文對各模塊進行簡要介紹。
2.1 塊劃分
塊劃分的目的是將待編碼的視頻幀按照其紋理內容分割成更宜于編碼的小塊,適合的塊劃分方法可以有效提升預測編碼效率。
考慮到編解碼實現(xiàn)的復雜度約束,早先的塊劃分方法一般是將圖像分割成固定大小的小塊,但是這樣的劃分策略對視頻內容的適應性比較差,無法應對一些紋理比較復雜的情況。
在最新一代AVS3標準中提出了更靈活的擴展四叉樹劃分方式,能夠更好地適應復雜的視頻內容變化,極大地提升了編碼效率。歷代AVS視頻壓縮標準的塊劃分技術演進路線如圖1所示。

2.2 幀內預測
幀內預測指的是在視頻編碼過程中,通過左方和上方相鄰像素來預測當前待編碼塊的像素值,這一技術可以有效地消除視頻信息在空域上的冗余。
如圖2所示,幀內預測的角度從第一代AVS中的8種拓展到了AVS3中的65種,越來越復雜的幀內預測模式可以大大提升預測的準確度,幀內預測也是單幅圖像編碼效率提升的關鍵。

2.3 幀間預測
幀間預測指的是在視頻編碼過程中,通過已編碼幀和相鄰幀之間的運動匹配來估計待編碼幀。幀間預測可以有效降低視頻內容的時域信息冗余,是整個編碼框架中最重要的性能提升模塊。
圖3展示了AVS系列標準中幀間預測工具的發(fā)展歷程,三代標準在預測結構,預測單元粒度和預測模式設計等方面做出諸多優(yōu)化提升,大幅增加了預測編碼的準確性。

3 壓縮效率
本文詳細介紹了AVS3標準的壓縮效率,提供與歷代標準的技術討論和對比分析,主要包括兩部分:第一部分是AVS3標準采納的各項編碼工具性能,第二部分是AVS3標準和其他視頻壓縮標準的率失真性能對比。
在AVS3標準編碼工具實驗分析中,把每一個編碼模塊的關鍵技術進行了消融實驗,通過開啟/關閉工具開關的方式來對比每一項技術對于整體性能的貢獻,進行了深入討論,詳見論文原文。
選取上一代標準AVS2為對比對象,以隨機訪問(Random Access, RA)配置和全幀內編碼(All Intra, AI)兩種最常用的編碼模式作為對比配置。
實驗結果表明,AVS3和AVS2相比,在降低解碼復雜度的同時在YUV三個通道都獲得了顯著的編碼性能提升,綜合性能提升超過40%。
同時在標清、高清和超高清分辨率測試視頻上和國際標準VVC/H.266進行了壓縮效率對比,結果表明AVS3標準在各種分辨率上性能均超過VVC編碼標準。


4 實際應用
AVS建立了從技術標準到芯片終端,再到系統(tǒng)應用的完整產(chǎn)業(yè)鏈。
2019年3月AVS3標準技術制定完成。同年9月,海思即發(fā)布全球首款基于AVS3標準的8K@120fps超高清視頻編碼芯片。
2021年2月,央視開通了8K超高清電視試播頻道,在春晚5G+8K直播中取得圓滿成功。


在今年剛剛結束的北京冬奧會和冬殘奧會中,AVS3 8K超高清技術助力冬奧會和冬殘奧會提供極致清晰的賽事轉播服務(圖4和圖5), 并為冰雪項目交互式多維度觀賽帶來了全新體驗(圖6)。
