-
NAL Header頭部解析
查看全部 -
H264碼流每層的關系圖
查看全部 -
切片與宏塊的關系:每個切片都包括切片頭和切片數據,每個切片數據又包括了很多宏塊,每個宏塊又包括了宏塊的類型、宏塊的預測、編碼的殘渣數據等
查看全部 -
一個H264幀最少要有一個切片(NAL Unit)
查看全部 -
H264編碼分層:1、NAL層(Network Abstraction Layer),視頻數據網絡抽象層。2、VCL層(Video Coding Layer),視頻數據編碼層
碼流基本概念:1、SODB(String Of Data Bits),原始數據比特流,長度不一定是8的倍數,它是由VCL層產生的。2、RBSP(Raw Byte Sequence Payload,SODB+trailing bits),算法是在SODB最后一位補1,不按字節對齊則補0。3、EBSP(Encapsulate Byte Sequence Payload),需到兩個連續的0x00就增加一個0x03。4、NALU,NAL Header(1B)+EBSP
H264結構圖
查看全部 -
幀分組(一組連續的圖片,一幅圖片為一幀)
查看全部 -
(1)幀內預測壓縮,解決的是空域數據冗余問題(將一幅圖里的人眼不是很敏感的色彩、光亮等數據剔除)
(2)幀間預測壓縮,解決的是時域數據冗余問題(將一組圖里面連續的重復性高的幀剔除)
(3)整數離散余弦變換(DCT),將空間上的相關性變為頻域上無關的數據然后進行量化。
(4)CABAC壓縮(無損壓縮)
查看全部 -
H264宏塊劃分與子塊劃分:宏塊里面可以再包含很多子塊
查看全部 -
GOF(group of frame):一組幀,可以將一段時間內畫面變化不大的所有幀劃為一組幀
SPS與PPS(這兩種都劃為I幀):
SPS(Sequence Parameter Set):序列參數集,存放幀數、參考幀數目、解碼圖像尺寸、幀場編碼模式選擇標識等。
PPS(Picture Parameter Set):圖像參數集,存放熵編碼模式選擇標識、片組數目、初始量化參數和去方塊濾波系統數調整標識等
視頻花屏/卡頓原因:1、如果GOP分組中的P幀丟失會造成解碼端的圖像發生錯誤(于是形成了花屏)。2、為了避免花屏問題的發生,一般如果發現P幀或者I幀丟失,就不顯示本GOP內的所有幀,直到下一個I幀來后重新刷新圖像(因為丟了一組數據,所以形成了卡頓)
視頻編碼器:1、x264/x265。2、openH264(支持SVC技術)。3、vp8/vp9
查看全部 -
AAC格式:1、ADIF(Audio Data Interchange Format):只能從頭開始解碼,常用在磁盤文件中。2、ADTS(Audio Data Transport Stream):這種格式每一幀都有一個同步字,可以在音頻流的任何位置開始解碼,它似于數據流格式(缺點:文件比ADIF大,優點:每個幀都可以被單獨解碼播放)
查看全部 -
AAC規格描述(AAC、AAC HE、AAC HE V2)--> AAC+SBR=AAC HE V1, AAC + SBR + PS = AAC HE V2
查看全部 -
音頻壓縮技術
1、消除冗余數據(有損壓縮技術)。
壓縮的主要方法是去除采集到的音頻冗余信息,所謂冗余信息包括人耳聽覺范圍外的音頻信號以及被掩蔽掉的音頻信號
信號的掩蔽可分為頻域掩蔽和時域掩蔽
頻域掩蔽:一個強純音會掩蔽在其附近同時發聲的弱純音。也稱同時掩蔽
時域掩蔽:在時間上相鄰的聲音之間也有掩蔽現象,主要原因是人的大腦處理信息需要花費時間。
同步掩蔽效應和不同頻率聲音的頻率和相對竟是有關,而時間掩蔽則僅僅和時間有關。如果兩個聲音在時間上特別接近,分辨會有困難(如兩個聲音音量相差較大且兩個聲音間隔時間低于5毫秒,則其中弱的那個聲音會聽不到)。
2、哈夫曼無損編碼
查看全部 -
公式:采樣率*采樣大小*聲道數
查看全部 -
量化基本概念:1、采樣大?。阂粋€采集用多少bit存放。常用的是16bit。2、采樣率:采樣頻率8k/秒、16k/秒、32k/秒、44.1k/秒、48k/秒。3、聲道數:單聲道、雙聲道、多聲道
查看全部 -
聲音三要素:1、音調(也就是音頻)。2、音量:振動的幅度。3、音色:它與材質有很大關系,本質是諧波
圖一音量:甲乙的振動頻率相同、振幅不同。圖二音調:甲乙振幅相同、頻率不同
查看全部
舉報