GY/T 420-2025 超高清音视频编码码流网络传输封装技术要求 ,该文件为pdf格式 ,请用户放心下载!
尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错的话,可以收藏并分享给你周围的朋友。
如果你觉得网站不错,找不到本网站,可以百度、360搜搜,搜狗, 神马搜索关键词“文档天下”,就可以找到本网站。也可以保存到浏览器书签里。
收费文件即表明收集不易,也是你们支持,信任本网站的理由!真心非常感谢大家一直以来的理解和支持!
中华人民共和国广播电视和网络视听行业标准
GY/T 420—2025
超高清音视频编码码流网络传输封装技术要求
Technical requirements of ultra-high-definition video and audio encoding streams encapsulation for network transmission
2025 - 04 - 03发布
2025 - 04 - 03实施
国家广播电视总局发布
GY/T 420—2025
I
目 次
前言 ................................ ................................ ............... III
1 范围 ................................ ................................ .............. 1
2 规范性引用文件 规范性引用文件 规范性引用文件 规范性引用文件 ................................ ................................ .... 1
3 术语和定义 术语和定义 术语和定义 ................................ ................................ ........ 1
4 缩略语 缩略语 ................................ ................................ ............ 2
5 约定 ................................ ................................ .............. 3
5.1 助记符 助记符 ................................ ................................ ........ 3
5.2 保留 ................................ ................................ .......... 3
6 通则 ................................ ................................ .............. 3
7 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 TS 中的封装要求 中的封装要求 中的封装要求 ................................ ............. 3
7.1 概述 ................................ ................................ .......... 4
7.2 AVS2AVS2 视频编码流在 视频编码流在 视频编码流在 视频编码流在 TS 中的封装要求 中的封装要求 中的封装要求 ................................ ............. 4
7.3 AVS3AVS3 视频编码流在 视频编码流在 视频编码流在 视频编码流在 TS 中的封装要求 中的封装要求 中的封装要求 ................................ ............. 5
7.4 Audio VividAudio Vivid Audio Vivid Audio Vivid 音频编码流在 音频编码流在 音频编码流在 音频编码流在 TS 中的封装要求 中的封装要求 中的封装要求 中的封装要求 ................................ ..... 12
8 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 SMT 中的封装要求 中的封装要求 中的封装要求 ................................ ........... 18
8.1 概述 ................................ ................................ ......... 18
8.2 AVS2AVS2 视频编码流在 视频编码流在 视频编码流在 视频编码流在 SMT 中的封装要求 中的封装要求 中的封装要求 ................................ ........... 18
8.3 AVS3AVS3 视频编码流在 视频编码流在 视频编码流在 视频编码流在 SMT 中的封装要求 中的封装要求 中的封装要求 ................................ ........... 19
8. 4 Audio VividAudio Vivid Audio Vivid Audio Vivid 音频编码流在 音频编码流在 音频编码流在 音频编码流在 SMTSMT 中的封装要求 中的封装要求 中的封装要求 中的封装要求 ................................ .... 25
附录 A(规范性) (规范性) (规范性) 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 ISOBMFF ISOBMFFISOBMFF 文件中的封装要求 文件中的封装要求 文件中的封装要求 文件中的封装要求 文件中的封装要求 ..................... 28
A.1 概述 ................................ ................................ ......... 28
A.2 AVS2AVS2 视频编码流在 视频编码流在 视频编码流在 视频编码流在 ISOB ISOBMFF 文件中的封装要求 文件中的封装要求 文件中的封装要求 文件中的封装要求 ................................ ... 28
A.3 AVS3AVS3 视频编码流在 视频编码流在 视频编码流在 视频编码流在 ISOBMFF ISOBMFF 文件中的封装要求 文件中的封装要求 文件中的封装要求 文件中的封装要求 ................................ ... 32
A.4 Audio VividAudio Vivid Audio Vivid Audio Vivid 音频编码流在 音频编码流在 音频编码流在 音频编码流在 ISOBMFFISOBMFF ISOBMFF 文件中的封装要求 文件中的封装要求 文件中的封装要求 文件中的封装要求 ............................ 40
附录 B(资料性) (资料性) (资料性) 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 HLS 中的封装 中的封装 ................................ . 45
附录 C(资料性) (资料性) (资料性) 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 RTMP RTMP中的封装 中的封装 ................................ 46
C.1 概述 ................................ ................................ ......... 46
C.2 AVS2AVS2 视频编码流在 视频编码流在 视频编码流在 视频编码流在 FLV 中的封装 中的封装 ................................ ............... 46
C.3 AVS3AVS3 视频编码流在 视频编码流在 视频编码流在 视频编码流在 FLV 中的封装 中的封装 ................................ ............... 46
C.4 Audio VividAudio Vivid Audio Vivid Audio Vivid 音频编码流在 音频编码流在 音频编码流在 音频编码流在 FLVFLV 中的封装 中的封装 中的封装 ................................ ........ 47
附录 D(资料性) (资料性) (资料性) 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 超高清音视频编码流在 DASH DASH中的封装 中的封装 ................................ 49
D.1 概述 ................................ ................................ ......... 49
D.2 AVS3AVS3 视频编码流在 视频编码流在 视频编码流在 视频编码流在 DASH DASH中的封装 中的封装 中的封装 ................................ .............. 49
GY/T 420—2025
II
D.3 Audio VividAudio Vivid Audio Vivid Audio Vivid 音频编码流在 音频编码流在 音频编码流在 音频编码流在 DASHDASH 中的封装 中的封装 ................................ ....... 52
附录 E(资料性) (资料性) (资料性) MIME 类型 的‘codecs codecs ’参数 ................................ .......... 54
E.1 概述 ................................ ................................ ......... 54
E.2 AVS2AVS2 视频编码参数 视频编码参数 视频编码参数 ................................ ............................. 54
E.3 AVS3AVS3 视频编码参数 视频编码参数 视频编码参数 ................................ ............................. 54
E.4 Audio VividAudio Vivid Audio Vivid Audio Vivid 音频编码参数 音频编码参数 音频编码参数 ................................ ...................... 54
参考文献 参考文献 ................................ ................................ ............ 55
GY/T 420—2025
III
前 言
本文件按照 GB/T 1.1 —2020202020202020《标准化工作导则 第 1部分:标准化文件的结构和起草规则》定 部分:标准化文件的结构和起草规则》定 部分:标准化文件的结构和起草规则》定 起草。
请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。 发布机构不承担识别责任请注意本文件的某些内容可能涉及专利。
发布机构不承担识别责任本文件由全国广播电视和网络视听标准化技术委员会(SAC/TC 239)归口。
本文件起草单位:国家广播电视总局广播电视科学研究院、杭州当虹科技股份有限公司、鹏城实验室、中兴通讯股份有限公司、华为技术有限公司、上海交通大学、中央广播电视总台、北京广播电视台、广东广播电视台、湖南广播电视台、广东南方新媒体股份有限公司、国家广播电视总局广播电视规划院、咪咕文化科技有限公司、浙江大学、上海海思技术有限公司、北京数码视讯软件技术发展有限公司、广东博华超高清创新中心有限公司、央视频融媒体发展有限公司、湖南快乐阳光互动娱乐传媒有限公司、北京爱奇艺科技有限公司、优酷网络技术(北京)有限公司、杭州微帧信息科技有限公司、四川传媒学院、四川新视创伟超高清科技有限公司、北京中视广信科技有限公司、北京流金岁月传媒科技股份有限公司、寰宇信任(北京)技术有限公司、北京全景声信息科技有限公司。
本文件主要起草人员:周芸、郭晓强、王雪辉、郑建铧、黄成、刘帅、徐异凌、潘晓菲、胡潇、王东飞、付光涛、毕江、曾志群、方林、李小雨、黎政、覃毅力、刘文翰、王兵、陈志业、焦健波、庞超、王琦、于化龙、邹志铭、周骋、张伟民、李日、胡颖、高原、王立冬、朱易、管云峰、王振中、李康敬、袁乐、严玄、孙剑、周骋、罗准、雷威、梅大为、朱政、左旭舟、冉峡、宋小民、卢剑平、宁黎、赵鹏、许舒敏、陈丽丽、李凯东、温竹、周士琪、汪喜。
GY/T 420—2025
1
超高清音视频编码码流网络传输封装技术要求
1 范围
本文件规定了以GY/T 299.1—2016(简称“AVS2”)、GY/T 368—2023(简称“AVS3”)、GY/T 363—2023(简称“Audio Vivid”)等方式编码的超高清音视频编码流在传输流(TS)、智能媒体传输(SMT)等网络传输协议中的封装技术要求。
本文件适用于广播电视和网络视听超高清音视频编码传输系统开发、生产、应用、测试和维护。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 17975.1—2010 信息技术 运动图像及其伴音信息的通用编码 第1部分:系统
GB/T 33475.6—2024 信息技术 高效多媒体编码 第6部分:智能媒体传输
GY/T 299.1—2016 高效音视频编码 第1部分:视频
GY/T 363—2023 三维声编解码及渲染
GY/T 368—2023 先进高效视频编码
ISO/IEC 14496-12:2022 信息技术 音视频对象编码 第12部分:ISO基本媒体文件格式(Information technology – Coding of audio-visual objects – Part 12: ISO base media file format)
3 术语和定义
下列术语和定义适用于本文件。
3.1
节目流 program stream
由具有共同时间基准的一个或多个PES分组包合并而成的单一流。
3.2
位流 bitstream
编码图像所形成的二进制数据流。
[来源: 来源: GY/T 368 GY/T 368 GY/T 368—20232023 ,3. 74 ]
3.3
主位流 sequence stream
由该位流以外的 由该位流以外的 由该位流以外的 知识位流 知识位流 提供的知识图像进行解码位流。 提供的知识图像进行解码位流。 提供的知识图像进行解码位流。 提供的知识图像进行解码位流。 提供的知识图像进行解码位流。 提供的知识图像进行解码位流。 提供的知识图像进行解码位流。
[来源: 来源: GY/T 368 GY/T 368 GY/T 368—20232023 ,3. 102 ]
GY/T 420—2025
2
3.4
独立主位流 independent sequence stream
在不参考该 在不参考该 位流 以外的 以外的 知识位流 知识位流 提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码提供的 知识图像情况下可以完全解码位流。
3.5
非独立主位流 dependent sequence stream
使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。 使用了该位流以外的知识提供图像才能解码。
3.6
片段 segment
媒体呈现描述中的HTTP统一资源定位符引用的媒体数据单元。
3.7
知识图像 library picture
知识位流中的图像,可以被其他位流中的图像参考。
[来源: 来源: GY/T 368 GY/T 368 GY/T 368—20232023 ,3.100 ,有修改 ,有修改 ]
3.8
知识位流 library stream
包含知识图像的位流。 包含知识图像的位流。 包含知识图像的位流。 包含知识图像的位流。 包含知识图像的位流。
[来源: 来源: GY/T 368 GY/T 368 GY/T 368—20232023 ,3.101]
4 缩略语
下列缩略语适用于本文件。
AATF AVS音频传输格式(AVS Audio Transport Format)
AU 访问单元(Access Unit)
BBV 位流缓冲区校验(Bitstream Buffer Verifier)
bslbf 位串,左位在先(bit string,left bit first)
CEU 通用封装单元(Common Encapsulation Unit)
CPB 编码图像缓冲区(Coded Picture Buffer)
DASH 基于HTTP的动态自适应流(Dynamic Adaptive Streaming over HTTP)
DPB 解码图像缓冲区(Decoded Picture Buffer)
DTS 解码时间戳(Decoding Time Stamp)
FIFO 先进先出(First Input Fist Output)
HLS 基于HTTP的实时流媒体(HTTP Live Streaming)
HOA 高阶立体声场(High Order Ambisonics)
LBM 知识位流数据缓存模型(Library Buffer Model)
LBMF 知识位流数据缓存模型反馈(Library Buffer Model Feedback)
LFU 最不常使用(Least Frequently Used)
LRAP 知识随机访问点(Library Random Access Point)
LRU 最近最少使用(Least Recently Used)
MFU 媒体最小分割单元(Media Fragment Unit)
MIME 多用途互联网邮件扩展(Multipurpose Internet Mail Extensions)
MP SMT包(SMT Packet)
MPD 媒体呈现描述(Media Presentation Description)
GY/T 420—2025
3
PES 分组的基本流(Packetized Elementary Streams)
PMT 节目映射表(Program Map Table)
PTS 显示时间戳(Presentation Time Stamp)
RL 参考层(Refrence Layer)
RTMP 实时消息协议(Real-Time Messaging Protocol)
SAP 流访问点(Stream Access Point)
SMT 智能媒体传输(Smart Media Transport)
STD 系统目标解码器(System Target Decoder)
TS 传输流(Transport Stream)
URI 统一资源标识符(Uniform Resource Identifier)
URL 统一资源定位符(Uniform Resource Locator)
UUID 通用唯一标识符(Universally Unique Identifier)
uimsbf 无符号整数,最高有效位在前(unsigned integer,most significant bit first)
XML 可扩展标记语言(eXtensible Markup Language)
5 约定
5.1 助记符
助记符定义见表1。
表1 助记符定义
助记符
定义
bslbf
位串,左位在前。位串是带单引号的1和0串。如‘1000 0001’。位串内的空格是便于阅读的,无特殊意义
uimsbf
无符号整数,最高有效位优先
UI8
无符号8位整数
SI24
有符号24位整数
UB
无符号位
5.2 保留
“保留”(reserved)定义了一些特定语法元素值用于将来对本文件的扩展。除非本文件另有规定,否则所有保留位应设置为‘1’。码流解析处理应忽略这些位。
6 通则
超高清AVS2/AVS3视频和Audio Vivid音频编码码流在TS中的封装应符合第7章的规定;在SMT中的封装应符合第8章的规定,对应ISOBMFF文件格式应符合附录A的规定;在HLS、RTMP、DASH中的封装见附录B~附录E。
7 超高清音视频编码码流在TS中的封装要求
GY/T 420—2025
4
7.1 概述
基于GB/T 17975.1—2010,对超高清音视频编码码流在TS中的封装进行扩展。
7.2 AVS2视频编码码流在TS中的封装要求
7.2.1 流标识
AVS2视频编码码流对应的stream_id和stream_type赋值应符合表2的规定。
表2 stream_id和stream_type赋值
字段名称
赋值
streamstreamstreamstreamstreamstream_id_id_id
1110 xxxx110 xxxx110 xxxx110 xxxx110 xxxx110 xxxx110 xxxx110 xxxxa
stream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_type
0x D2 b
a 符号 x表示‘ 0’或‘ 1’均被允许且可产生相同的流类型,号码由 ’均被允许且可产生相同的流类型,号码由 x的取值决定。
b 应配有 descriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tag为 64 (0x 40 )的 AVS2_video_descriptor。
7.2.2 注册描述符
PMT 中应包含 中应包含 registration_descriptor registration_descriptor registration_descriptor registration_descriptor registration_descriptor registration_descriptor () 。registration_descriptor() registration_descriptor() registration_descriptor()registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() 的定义见 的定义见 的定义见 GB/T 17975.1 GB/T 17975.1 GB/T 17975.1GB/T 17975.1 GB/T 17975.1 — 2010 , 其中, 其中, 其中registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor()registration_descriptor() registration_descriptor() registration_descriptor() 的 Tag Tag值应为 值应为 5(0x05) 5(0x05) ,AVS 2视频 的 format_identifier format_identifier format_identifier format_identifier format_identifier format_identifier应 为 0x41 0x41-56 -53 -56( ‘AVSV AVSV’)。
7.2.3 AVS2视频流描述符
AVS2视频流描述符定义应符合表3的规定。
表3 AVS2视频流描述符定义
AVS2视频流描述符定义
位数
助记符
AVS2_video_descriptor () {
descriptor_tag
8
uimbsf
descriptor_length
8
uimbsfuimbsfuimbsfuimbsfuimbsfuimbsf
profile_id
8
uimbsfuimbsfuimbsfuimbsfuimbsfuimbsf
level_id
8
uimbsfuimbsfuimbsfuimbsfuimbsfuimbsf
extension_layer_number
8
uimbsfuimbsfuimbsfuimbsfuimbsfuimbsf
multiple_frame_rate_flag
1
bslbfbslbfbslbfbslbfbslbf
frame_rate_code
4
uimbsfuimbsfuimbsfuimbsfuimbsfuimbsf
AVS_still_present
1
bslbfbslbfbslbfbslbfbslbf
chroma_format
2
uimbsfuimbsfuimbsfuimbsfuimbsfuimbsf
sample_precision
3
uimbsfuimbsfuimbsfuimbsfuimbsfuimbsf
reserved
5
bslbfbslbfbslbfbslbfbslbf
}
描述符标签 descriptor_tag
8位无符号整数。值为64(0x40),表示该描述符为AVS2视频流描述符。
GY/T 420—2025
5
描述符长度 descriptor_length
8位无符号整数。表示紧跟在该字段之后的描述符的字节数。
类标识 profile_id
8位无符号整数。表示AVS2视频编码码流的类,该字段与GY/T 299.1—2016中profile_id字段相同。
级标识 level_id
8位无符号整数。表示AVS2视频编码码流的级,该字段与GY/T 299.1—2016中level_id字段相同。
扩展层数 extension_layer_number
8位无符号整数。表示比特流的扩展层数,该字段为0。
复合帧率标志 multiple_frame_rate_flag
二值变量。值为‘1’表示AVS2视频编码码流中可能有多个帧率,值为‘0’表示只有单一帧率。
帧率代码 frame_rate_code
4位无符号整数。该字段与GY/T 299.1—2016中frame_rate_code字段类似,不同点在于multiple_frame_rate_flag值为‘1’时,一个特定的帧率意味着视频流中允许有某些其他的帧率,具体应符合表4的规定。
表4 帧率代码
frame_rate_code
帧率
multiple_frame_rate_flag字段置‘1’时,允许的其他帧率
0000
禁止
—
0001
23.976
—
0010
24
23.976
0011
25
—
0100
29.97
23.976
0101
30
23.976、24、29.97
0110
50
25
0111
59.94
23.976、29.97
1000
60
23.976、24、29.97、30、59.94
1001
100
50
1010
120
59.94、60、119.88119.88119.88119.88119.88119.88、120120120
1011~1111
保留
—
AVS静态图像标识 AVS_still_present
二值变量。值为‘1’表示该视频编码码流只含静态图像数据;值为‘0’表示可包含运动的或静态的图像数据。
色度格式 chroma_format
2位无符号整数。表示色度分量的格式,该字段与GY/T 299.1—2016中chroma_format字段相同。
采样精度 sample_precision
3位无符号整数。表示亮度和色度样本的精度,该字段与GY/T 299.1—2016中sample_precision字段相同。
7.3 AVS3视频编码码流在TS中的封装要求
7.3.1 基本要求
AVS3视频编码码流约束如下。
GY/T 420—2025
6
a) AVS3视频编码码流应是GB/T 17975.1—2010中节目的一个节目元素,基本流的stream_type字段值应等于‘0xD4’。
b) AVS3视频编码码流的序列头应存在于承载该视频流的基本流中。
c) 在stream_type等于‘0xD4’且具有GB/T 17975.1—2010中层次描述符的基本流中,层次描述符中的hierarchy_type字段值应等于‘3’(时域可扩展性)。
d) AVS3视频编码码流的最高“级”以及所符合的“类”等编码参数应使用AVS3视频流描述符标识。如果存在与AVS3视频编码码流相关联的AVS3视频流描述符,则该描述符应包含在节目映射表中对应于基本流条目的描述符循环中。
如果AVS3视频编码码流包含主位流及其依赖的知识位流,约束如下:
a) 当AVS3视频编码码流被封装为传输流时,主位流及其依赖的知识位流应被封装在同一个传输流中;
b) 当AVS3视频编码码流被封装为节目流时,主位流及其依赖的知识位流应被封装在同一个节目流中。
7.3.2 PES分组
7.3.2.1 流标识
AVS3视频编码码流应作为PES_packet_data_bytes携带在PES分组数据包中,并通过节目映射表中分配的stream_type字段值(0xD4)标识。
以下约束适用于 以下约束适用于 以下约束适用于 以下约束适用于 AVS3 AVS3视频的 PES 数据包使用的 数据包使用的 数据包使用的 数据包使用的 stream_id:
a) PES分组中的stream_id取值‘1111 1101’(extended_stream_id),表示PES分组数据包采用扩展语法标识AVS3视频流;
b) PES分组包头中stream_id_extension_flag取值‘0’,stream_id_extension的取值范围应从‘0x41’到‘0x4F’,stream_id_extension字段的取值设置为‘0x41’用于表示AVS3视频主位流,该字段取值设置为‘0x42’用于表示AVS3视频知识位流。
具体应符合表 具体应符合表 具体应符合表 5的规定。 的规定。
表5 AVS3视频编码码流在PES分组中的流标识
字段名称
值
streamstreamstreamstreamstreamstream_id_id_id
1111 11011111 11011111 11011111 11011111 11011111 11011111 11011111 11011111 1101
stream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flag
0
stream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extension
0x410x410x410x41a
0x420x420x420x42b
stream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_type
0x D4 c
a 表示 AVS3AVS3AVS3AVS3视频 编码主位流。
b 表示 AVS3AVS3AVS3AVS3视频 编码知识位流。
c 应配有 descriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tag为 209(09(09(0xD1 )的 AVS3_video_descriptor。
7.3.2.2 数据对齐指示
AVS3 视频编码流的 视频编码流的 视频编码流的 视频编码流的 PES 分组使用 分组使用 data_alignment_indicator data_alignment_indicator data_alignment_indicator data_alignment_indicator data_alignment_indicator data_alignment_indicator 和 7.3.3.3 7.3.3.3 中定义的数据流对齐描 中定义的数据流对齐描 中定义的数据流对齐描 中定义的数据流对齐描 中定义的数据流对齐描 述符 data_stream_alignment_descriptordata_stream_alignment_descriptor data_stream_alignment_descriptor data_stream_alignment_descriptor data_stream_alignment_descriptor data_stream_alignment_descriptordata_stream_alignment_descriptor data_stream_alignment_descriptor data_stream_alignment_descriptor data_stream_alignment_descriptor来标识 来标识 PES 分组包头后数据的对齐方式: 分组包头后数据的对齐方式: 分组包头后数据的对齐方式: 分组包头后数据的对齐方式: 分组包头后数据的对齐方式: 分组包头后数据的对齐方式:
GY/T 420—2025
7
a) 如果data_alignment_indicator值为‘1’,并且存在7.3.3.3中定义的数据流对齐描述符data_stream_alignment_descriptor,表示PES分组包头之后紧跟着该数据流对齐描述符所指出的视频起始码;
b) 如果data_alignment_indicator值为‘1’且不存在7.3.3.3中定义的数据流对齐描述符data_stream_alignment_descriptor,则使用本文件表8中alignment_type取值‘01’时所指示的对齐方式;
c) 当data_alignment_indicator值为‘0’时,表示没有定义是否有任何对齐方式。
7.3.2.3 解码时间约束
对于知识位流,PES分组包的包头中的PTS_DTS_flags字段设置为‘11’,此时知识位流PES分组包的包头中携带的PTS的值应被忽略,解码后的知识图像应不被用于显示。
知识位流的PES分组包的包头中携带的DTS,应小于或等于AVS3视频主位流中依赖该PES分组包的所有PES分组包中携带的最小的DTS。
7.3.3 节目和节目元素描述符
7.3.3.1 注册描述符
PMT 中应包含 中应包含 中应包含 registration_descriptor registration_descriptor registration_descriptor registration_descriptorregistration_descriptor registration_descriptor registration_descriptor() 。registration_descriptor() registration_descriptor() registration_descriptor()registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() 的定义见 的定义见 的定义见 GB/T 17975.1 GB/T 17975.1GB/T 17975.1 GB/T 17975.1 — 2010 , 其中registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor()的Tag Tag值应为 5(0x05) 5(0x05) 5(0x05),AVS3AVS3 AVS3视频 的format_identifierformat_identifier format_identifier format_identifier format_identifier 应为 0x41 -56 -53 -56( ‘AVS AVSV’)。
7.3.3.2 AVS3视频流描述符
AVS3视频流描述符语法应符合表6的规定。该描述符给出了基本信息(例如“类”和“级”)以标识AVS3视频流的编码参数。对于AVS3视频时域分层子码流,AVS3视频流描述符提供在其所适用的基本流中的AVS3视频最高时域层级的信息。
表6 AVS3视频流描述符定义
AVS3视频流描述符定义
位数
助记符
AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {AVS3_video_descriptor () {
descriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tag
8
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length descriptor_length
8
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
profile_idprofile_idprofile_idprofile_idprofile_idprofile_idprofile_idprofile_idprofile_idprofile_id
8
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
level_idlevel_idlevel_idlevel_idlevel_idlevel_idlevel_idlevel_id
8
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
multiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flagmultiple_frame_rate_flag
1
bslbfbslbfbslbfbslbfbslbf
frame_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_codeframe_rate_code
4
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
sample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precisionsample_precision
3
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
chroma_formathroma_formathroma_formathroma_formathroma_formathroma_formathroma_formathroma_formathroma_formathroma_formathroma_formathroma_format
2
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
temporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flagtemporal_id_flag
1
bslbfbslbfbslbfbslbfbslbf
td_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flagtd_mode_flag
1
bslbfbslbfbslbfbslbfbslbf
library_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flaglibrary_stream_flag
1
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
library_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flaglibrary_picture_enable_flag
1
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
reservedreservedreservedreservedreservedreservedreservedreserved
2
bslbfbslbfbslbfbslbfbslbf
GY/T 420—2025
8
表6(续)
AVS3视频流描述符定义
位数
助记符
colour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primariescolour_primaries
8
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
transfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristicstransfer_characteristics
8
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
matrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficientsmatrix_coefficients
8
uimsbfuimsbfuimsbfuimsbfuimsbfuimsbf
reservedreservedreservedreservedreservedreservedreservedreserved
8
bslbf
}
描述符标签 descriptor_tag
8位无符号整数,值为209(0xD1)。表示该描述符为AVS3视频描述符。
描述符长度 descriptor_length
8位无符号整数。表示紧跟在该字段之后的AVS3视频描述符的字节数。
类标识 profile_id
8位无符号整数。表示AVS3视频编码码流的类,该字段与GY/T 368—2023中profile_id字段相同。
级标识 level_id
8位无符号整数。表示AVS3视频编码码流的级,该字段与GY/T 368—2023中level_id字段相同。
复合帧速率标志 multiple_frame_rate_flag multiple_frame_rate_flag multiple_frame_rate_flag multiple_frame_rate_flag
二值变量。值为‘1’表示AVS3视频编码码流中可能有多种帧速率,值为‘0’表示只有单一帧速率。
帧率代码 frame_rate_code
4位无符号整数。该字段与GY/T 368— 2023中frame_rate_code字段类似,不同点在于multiple_frame_rate_flag值为‘1’时,一个特定的帧率意味着视频流中允许有某些其他的帧率,具体应符合表7的规定。
表7 帧率代码
frame_rate_code
帧率
multiple_frame_rate_flag字段置‘1’时,允许的其他帧率
0000
禁止
—
0001
23.976
—
0010
24
23.976
0011
25
—
0100
29.97
23.976
0101
30
23.976、24、29.97
0110
50
25
0111
59.94
23.976、29.97
1000
60
23.976、24、29.97、30、59.94
1001
100
50
1010
120
59.94、60、119.88119.88119.88119.88119.88119.88、120120120
1011~1111
保留
—
样本精度字段 sample_precision sample_precision
3位无符号整数。表示亮度和色度样本的精度,该字段与GY/T 368—2023中sample_precision字段相同。
GY/T 420—2025
9
色度格式字段 chroma_format
2位无符号整数。表示色度分量的格式,该字段与GY/T 368—2023中chroma_format字段相同。
时间层标识允许志 temporal_id_flag temporal_id_flag
二值变量。表示视频流是否允许使用时间层标识,该字段与GY/T 368— 2023中temporal_id_enable_flag字段相同。
立体视频模式标志 td_mode_flag td_mode_flag td_mode_flag
2位位串。表示视频流是单目视频流或多视点视频流,该字段与GY/T 368—2023中td_mode_flag字段相同。
知识位流标志 library_stream_flag library_stream_flag
二值变量。表示在包含此描述符的节目特定信息的生效范围内的基本流是否为知识位流,该字段与GY/T 368—2023中library_stream_flag相同。
知识图像允许标志 library_picture_enable_flag library_picture_enable_flag library_picture_enable_flag library_picture_enable_flag
二值变量。表示描述符对应的主位流中是否存在帧间预测图像使用知识图像作为参考图像,该字段与GY/T 368—2023中library_picture_enable_flag相同。
彩色 三基colour_primaries
8位无符号整数。表示AVS3视频编码码流中源图像三基色的色度坐标。该字段与GY/T 368—2023中colour_primaries字段相同。
光电转移特性 transfer_characteristics transfer_characteristics
8位无符号整数。表示AVS3视频编码码流中源图像的光电转移特性。该字段与GY/T 368—2023中transfer_characteristics字段相同。
彩色信号转换矩阵 matrix_coefficients matrix_coefficients matrix_coefficients
8位无符号整数。表示从红绿蓝三基色转换为亮度和色度信号时采用的转换矩阵。该字段与GY/T 368—2023中matrix_coefficients字段相同。
7.3.3.3 数据流对齐描述符
如果PES分组包头中的data_alignment_indicator的值为‘1’并且存在数据流对齐描述符,则需要由描述符data_stream_alignment_descriptor指示对齐类型,对应语义定义如下。
对齐类型字段 alignment_type
该字段是数据流对齐描述符中的8位字段,它描述了AVS3视频基本流中存在的对齐类型。当PES分组包头中的data_alignment_indicator为‘1’时,具体对齐类型应符合表8的规定。如果PES分组包是一个视频流的起始,对齐应发生在第一个序列头的起始码处。
表8 AVS3视频流对齐类型
对齐类型
描述
00
保留
01
AVS3AVS3AVS3AVS3视频存取单元
02
AVS3AVS3AVS3AVS3视频片
03
AVS3AVS3AVS3AVS3视频存取单元或 AVS3AVS3AVS3AVS3视频片 视频片
04
AVS3AVS3AVS3AVS3序列
05 ~255255255
保留
GY/T 420—2025
10
一个AVS3视频存取单元包含一个图像的所有编码数据,以及紧随其后的任意填充数据,直到下一个存取单元的起始位置为止且不包含下一个存取单元。如果一个图像前面没有视频序列起始码(video_sequence_start_code),那这个图像的存取单元以图像起始码开始。如果一个图像前面有视频序列起始码,那这个图像的存取单元以这些起始码中的第一个起始码的第一个字节开始。如果一个图像是码流中在视频序列结束码(video_sequence_end_code)之前的最后一个图像,那该编码图像的最后一个字节和视频序列结束码之间的所有字节(包括视频序列结束码)属于该编码图像的存取单元。
7.3.4 DPB缓存管理
使用本文件携带AVS3视频编码码流不影响DPB的大小。当在STD中解码AVS3视频编码码流时,DPB的大小由GY/T 368—2023定义。DPB应按照GY/T 368—2023中9.2.4的规定进行管理。在一个AVS3视频存取单元被解码之后,即在该AVS3视频存取单元从CPB中被移除的时刻,该被解码的AVS3视频存取单元立即进入DPB。
一个被解码的AVS3主位流的存取单元在DPB输出时间所指示的时刻被显示,一个被解码的AVS3知识位流的存取单元在其被解码之后立即从DPB中被输出。DPB输出时间是执行GY/T 368—2023中9.2.6中的图像输出操作的时间所指示的时刻。
如果AVS3视频码流不能提供足够信息用于决定AVS3主位流的存取单元的CPB移除时间和DPB输出时间,那么这些时间戳应在STD模型中根据PTS和DTS时间戳被决定,方法如下:
a) AVS3主位流的存取单元n的CPB移除时间是由DTS(n)指示的时刻,其中DTS(n)是AVS3主位流的存取单元n的DTS值;
b) AVS3主位流的存取单元n的DPB输出时间是由PTS(n)指示的时刻,其中PTS(n)是AVS3主位流的存取单元n的PTS值。
如果AVS3视频码流不能提供足够信息用于决定AVS3知识位流的存取单元的CPB移除时间,那么该时间戳应在STD模型中根据DTS时间戳被决定,方法如下:AVS3知识位流的存取单元n的CPB移除时间是由DTS(n)指示的时刻,其中DTS(n)是AVS3知识位流存取单元n的DTS值。
7.3.5 面向AVS3的T-STD扩展
7.3.5.1 AVS3传输模型
对于一个符合本文件的节目,当该节目中的码流是AVS3视频编码码流或包含最低时域层级的AVS3视频编码码流时,T-STD模型见图1。
图1 面向AVS3的T-STD模型扩展
图1中下列符号用于描述T-STD模型扩展:
——t(i):表示传输流的第i个字节进入系统目标解码器的时间,以秒为单位;
——TBn:基本流n的传输缓存;
t(i)t(i)t(i)t(i)
传输流解复用
Demux
其他基本流
TB n
…
MB n
EBn
D
DPB
Rx n
Rbx n
An(j ), td n(j )
GY/T 420—2025
11
——TBS:传输缓存TBn的大小,以字节为单位;
——MBn:基本流n的复用缓存;
——EBn:AVS3视频编码码流的基本流缓存;
——j:AVS3视频编码码流中AVS3视频存取单元的索引;
——An(j):AVS3视频编码码流的第j个存取单元;
——tdn(j):An(j)在系统目标解码器中的解码时间,以秒为单位;
——Rxn:从传输缓存TBn到复用缓存MBn的传输速率;
——Rbxn:从复用缓存MBn到基本流缓存EBn的传输速率;
——D:虚拟AVS3视频解码器;
——DPB:解码图像缓冲区。
7.3.5.2 缓存管理
缓存管理符合下列约束。
a) 仅有一个传输缓存 仅有一个传输缓存 仅有一个传输缓存 仅有一个传输缓存 TB n用于接收 用于接收 AVS3 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 AVS3 视频编码 视频编码 视频编码 流,其 流,其 TBS 大小 固定为 固定为 512 字节。 字节。
b) 仅有一个复用缓存 仅有一个复用缓存 仅有一个复用缓存 仅有一个复用缓存 MB n用于接收 用于接收 AVS3 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 AVS3 视频编码 视频编码 视频编码 流,该复用缓存的大小 流,该复用缓存的大小 流,该复用缓存的大小 流,该复用缓存的大小 流,该复用缓存的大小 MBS n约束见公式( 约束见公式( 约束见公式( 1)。
MBS n = BS= BS mux + BS + BSoh + MaxCPB[level_id] + MaxCPB[level_id] + MaxCPB[level_id] + MaxCPB[level_id] + MaxCPB[level_id] -BBSBBS ……………… ……………… ……………… (1)
式中:
MBSn
——
复用缓存,单位为二进制位(bit);
BSoh
——
包头缓存,单位为二进制位(bit),定义见公式(2);
MaxCPB[level_id]
——
最大BBV缓冲区大小,单位为二进制位(bit),根据AVS3视频编码码流或包含最低时域层级的AVS3视频编码码流的级别level_id由GY/T 368—2023中的B.3的参数限制中得到;
BBS
——
BBV缓冲区大小,单位为二进制位(bit),根据AVS3视频编码码流或包含最低时域层级的AVS3视频编码码流中由GY/T 368—2023中7.1.2.2和7.2.2.2定义的序列头参数bbv_buffer_size得到;
BSmux
——
额外复用缓存,单位为位(bit),定义见公式(3)。
BS oh = (1/750) = (1/750) = (1/750) max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… max{MaxBR[level_id], 2 000 000}……………… (2)
BS mux = 0.004 = 0.004 = 0.004 max{max{ MaxBR[level_id], 2 000 000} MaxBR[level_id], 2 000 000} MaxBR[level_id], 2 000 000} MaxBR[level_id], 2 000 000} MaxBR[level_id], 2 000 000} MaxBR[level_id], 2 000 000} MaxBR[level_id], 2 000 000} ……………… ……………… ……………… (3)
式中:
MaxBR[level_id]——最大位速率,单位为位每秒(bit/s),根据AVS3视频编码码流或包含最低时域层级的AVS3视频编码码流的级别level_id由GY/T 368—2023中的B.3的参数限制中得到。
c) 仅有一个基本流缓存 仅有一个基本流缓存 仅有一个基本流缓存 仅有一个基本流缓存 仅有一个基本流缓存 EB n用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 用于接收分层描述子对应的基本流集合中所有,该缓 存的总大小 存的总大小 存的总大小 EBS n定义 见公式( 公式( 4)。
EBS EBSn= BBS = BBS …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( 4)
式中 :
EBSn——基本流缓存的总大小,单位为二进制位(bit);
BBS —— BBV BBV缓冲区大小,单位为二进制( 缓冲区大小,单位为二进制( 缓冲区大小,单位为二进制( 缓冲区大小,单位为二进制( 缓冲区大小,单位为二进制( 缓冲区大小,单位为二进制( 缓冲区大小,单位为二进制( 缓冲区大小,单位为二进制( bitbit ),根据 ),根据 ),根据 AVS3AVS3 视频编码流或包含最低时域层 视频编码流或包含最低时域层 视频编码流或包含最低时域层 视频编码流或包含最低时域层 视频编码流或包含最低时域层 视频编码流或包含最低时域层 视频编码流或包含最低时域层 级的 AVS3 AVS3 视频编码流中由 视频编码流中由 视频编码流中由 视频编码流中由 视频编码流中由 GY/T 368 GY/T 368GY/T 368 —2023 2023 中 7.1.2.2 7.1.2.2 和 7.2.2.27.2.2.2 7.2.2.2 定义的 定义的 序列头参 序列头参 数 bbv_buffer_size bbv_buffer_size bbv_buffer_size bbv_buffer_size 得到。 得到。
d) 从 TB n到 MB n的传输应按照如下方式执行: 的传输应按照如下方式执行: 的传输应按照如下方式执行: 的传输应按照如下方式执行: 的传输应按照如下方式执行: 的传输应按照如下方式执行:
GY/T 420—2025
12
• 当TBn中没有数据时,Rxn设为0;
• 否则,计算方式见公式(5)。
Rx n = BitRate = BitRate = BitRate 400 …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( …………………………………………( 5)
式中 :
Rx n —— 从传输缓存 从传输缓存 从传输缓存 TB n到复用缓存 到复用缓存 MB n的传输速率, 的传输速率, 的传输速率, 单位为 单位为 位每秒( 位每秒( bit/s bit/s);
BitRate BitRate—— AVS3 AVS3视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 视频编码流或包含最低时域层级的 AVS3 AVS3视频编码流中的比特率参 视频编码流中的比特率参 视频编码流中的比特率参 视频编码流中的比特率参 视频编码流中的比特率参 视频编码流中的比特率参 视频编码流中的比特率参 数, 单位为 单位为 位每秒( 位每秒( 位每秒( bit/sbit/s )。当 )。当 )。当 AVS3AVS3 视频编码流不支持时间分层,比特 视频编码流不支持时间分层,比特 视频编码流不支持时间分层,比特 视频编码流不支持时间分层,比特 视频编码流不支持时间分层,比特 视频编码流不支持时间分层,比特 视频编码流不支持时间分层,比特 视频编码流不支持时间分层,比特 率参数根据 率参数根据 GY/T 368GY/T 368 GY/T 368GY/T 368 —2023 2023 中 7.1.2.2 7.1.2.2 和 7.2.2.2 7.2.2.2 定义的比 特率低位和定义的比 特率低位和定义的比 特率低位和定义的比 特率低位和定义的比 特率低位和特率高位计算得到;当 特率高位计算得到;当 特率高位计算得到;当 特率高位计算得到;当 特率高位计算得到;当 AVS3 AVS3AVS3视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 视频编码流支持时间分层,比特率参数根据 GY/T 368 GY/T 368GY/T 368 —2023 2023中 7.1.2.7 7.1.2.7 7.1.2.7和 7.2.2.7 7.2.2.7 7.2.2.7定义 的时间层比 特率低位和的时间层比 特率低位和的时间层比 特率低位和的时间层比 特率低位和的时间层比 特率低位和的时间层比 特率低位和的时间层比 特率低位和特率高位计算得到。 特率高位计算得到。 特率高位计算得到。 特率高位计算得到。
e) 从 MB n到 EB n的传输应按照公式( 的传输应按照公式( 的传输应按照公式( 的传输应按照公式( 6)执行。 )执行。 )执行。
Rbx n = MaxBR[level_id] = MaxBR[level_id] = MaxBR[level_id] = MaxBR[level_id] = MaxBR[level_id]= MaxBR[level_id] ………… ………… ………… ………… ……………( ……………( ……………( 6)
式中 :
Rbx n n n —— 从复用缓存MBn到基本流缓存EBn的传输速率,单位为位每秒(bit/s);
MaxBR[level_id] MaxBR[level_id] MaxBR[level_id] MaxBR[level_id]—— 最大位速率 最大位速率 最大位速率 ,单位为每秒( ,单位为每秒( ,单位为每秒( ,单位为每秒( ,单位为每秒( bit/sbit/s ),根据 ),根据 ),根据 ),根据 AVS3AVS3 视频编码流或包含最 视频编码流或包含最 视频编码流或包含最 视频编码流或包含最 视频编码流或包含最 低时域层级的 低时域层级的 低时域层级的 AVS3AVS3 视频编码流的级别 视频编码流的级别 视频编码流的级别 视频编码流的级别 视频编码流的级别 level_idlevel_id level_id ,由 GY/T 368 GY/T 368 GY/T 368 —2023 2023 中的 B.3B.3 的参数限制中得到。 的参数限制中得到。 的参数限制中得到。 的参数限制中得到。 的参数限制中得到。
如果 MB n中存在 中存在 PES PES分组包负载数据且 分组包负载数据且 分组包负载数据且 分组包负载数据且 分组包负载数据且 EB n没有充满, 没有充满, 没有充满, PES 分组包负载以速率 分组包负载以速率 分组包负载以速率 分组包负载以速率 分组包负载以速率 Rbx Rbxn从 MB n被传输 被传输 到 EB n。如果 。如果 EB n已经被充满, 已经被充满, 已经被充满, MB n中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 中的数据不应被移除。当一个字节从 MB n被传输到 被传输到 被传输到 EB n时, MB n中位于该字节之前的 中位于该字节之前的 中位于该字节之前的 中位于该字节之前的 PESPES 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 分组包头的所有字节被立即移除和丢弃。当 MB n中不存在 中不存在 PES 分组包 分组包 负载数据时,没有被从 负载数据时,没有被从 负载数据时,没有被从 负载数据时,没有被从 负载数据时,没有被从 负载数据时,没有被从 负载数据时,没有被从 MB n中移除。所有进入 中移除。所有进入 中移除。所有进入 中移除。所有进入 中移除。所有进入 中移除。所有进入 MB n的数据都应从其中离开 。所有的数据都应从其中离开 。所有的数据都应从其中离开 。所有的数据都应从其中离开 。所有的数据都应从其中离开 。所有的数据都应从其中离开 。所有的数据都应从其中离开 。所有的数据都应从其中离开 。所有MB n的 PESPES 分组包负载数据都要立即进入 分组包负载数据都要立即进入 分组包负载数据都要立即进入 分组包负载数据都要立即进入 分组包负载数据都要立即进入 分组包负载数据都要立即进入 EB n。
7.3.5.3 STD延时
STD 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 延时是数据通过系统目标解码器中的 TB n、MB n和 EB n缓存的时间,符合 缓存的时间,符合 缓存的时间,符合 缓存的时间,符合 缓存的时间,符合 GY/T 368GY/T 368 GY/T 368 GY/T 368—20232023 的任何 的任何 数据的 数据的 STD 延时应满足: 延时应满足: 延时应满足: 对于所有的 对于所有的 对于所有的 j对应的存取单元 对应的存取单元 对应的存取单元 对应的存取单元 An(j) 中的所有字节 中的所有字节 中的所有字节 i,td n(j)(j) –t(i) ≤10 s。
7.3.5.4 缓存管理条件
传输流的构建缓存管理条件如下: 传输流的构建缓存管理条件如下: 传输流的构建缓存管理条件如下: 传输流的构建缓存管理条件如下: 传输流的构建缓存管理条件如下: 传输流的构建缓存管理条件如下: 传输流的构建缓存管理条件如下:
a) 每个TBn不应上溢,且应在每一秒中至少有一次处于被清空的状态;
b) 每个MBn、EBn和DPB不应上溢;
c) EBn不应下溢。当AVS3视频存取单元An(j)中一个或多个字节在解码时间tdn(j)不存在于EBn中时,EBn对于An(j)发生下溢。
7.4 Audio Vivid音频编码码流在TS中的封装要求
7.4.1 基本要求
Audio Vivid Audio Vivid Audio Vivid音频编码流应满足以下约束。 音频编码流应满足以下约束。 音频编码流应满足以下约束。 音频编码流应满足以下约束。 音频编码流应满足以下约束。 音频编码流应满足以下约束。 音频编码流应满足以下约束。 音频编码流应满足以下约束。
a) Audio Vivid音频编码码流应是GB/T 17975.1—2010中节目的一个节目元素,基本流的stream_type字段值应等于‘0xD5’。
b) Audio Vivid音频使用AATF的封装格式,即封装成aatf_frame()。
GY/T 420—2025
13
c) Audio Vivid音频编码码流的常见编码参数,如audio_codec_id,应使用Audio Vivid音频流描述符标识。如果存在与Audio Vivid音频流相关联的Audio Vivid音频流描述符,则该描述符应包含在节目映射表中相应基本流条目的描述符循环中。
7.4.2 PES分组流标识
Audio Vivid音频应作为PES_packet_data_bytes携带在PES分组数据包中,并通过节目映射表中分配的stream_type字段值(0xD5)标识。
Audio Vivid Audio Vivid Audio Vivid音频 的PESPES 数据包应满足以下约束: 数据包应满足以下约束: 数据包应满足以下约束: 数据包应满足以下约束: 数据包应满足以下约束: 数据包应满足以下约束:
a) PES分组的stream_id取值‘1111 1101'(extended_stream_id);
b) PES分组包头中stream_id_extension_flag取值‘0',stream_id_extension字段的取值‘100 1111'用于表示AVS3音频;
c) elementary stream在PES payload里字节对齐,即AVS3音频的首字节位于PES payload的首字节中;
d) 一个PES包包含一帧或多帧aatf_frame()。
Audio Vivid音频编码码流在PES分组中的流标识应符合表9的规定。
表9 Audio Vivid音频编码码流在PES分组中的流标识
字段名称
值
streamstreamstreamstreamstreamstream_id_id_id
1111111111111111 1101110111011101
stream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flagstream_id_extension_flag
0
stream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extensionstream_id_extension
100 1111100 1111100 1111100 1111100 1111100 1111100 1111100 1111
stream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_typestream_type
0x D5 a
a 应配有 descriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tagdescriptor_tag为 210 (0xD2 )的 AVS3_audio_descriptor。
7.4.3 节目和节目元素描述符
7.4.3.1 注册描述符
PMT 中应包含 中应包含 中应包含 registration_descriptor registration_descriptor registration_descriptor registration_descriptorregistration_descriptor registration_descriptor registration_descriptor() 。registration_descriptor() registration_descriptor() registration_descriptor()registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() 的定义见 的定义见 的定义见 GB/T 17975.1 GB/T 17975.1GB/T 17975.1 GB/T 17975.1 — 2010 , 其中, 其中, 其中registration_descriptor()registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() registration_descriptor() 的Tag 值应为 值应为 5(0x05) 5(0x05) ,Audio Vivid Audio Vivid Audio Vivid 音频的 音频的 format_identifier format_identifier format_identifier format_identifier format_identifier 应为 0x41 0x41 -56 -53 -41 (‘AVSA') AVSA')AVSA') 。
7.4.3.2 Audio Vivid音频流描述符
Audi o Vivid o Vivid o Vivid音频流描述符 音频流描述符 音频流描述符 音频流描述符 AVS3_audio_descriptor() AVS3_audio_descriptor() AVS3_audio_descriptor() AVS3_audio_descriptor() AVS3_audio_descriptor() AVS3_audio_descriptor()位于 PMT PMT中的 ES_info_length ES_info_length ES_info_length ES_info_lengthES_info_length 字段后面,语法 字段后面,语法 字段后面,语法 字段后面,语法 应符合表 应符合表 10 的规定。 的规定。
表10 Audio Vivid音频流描述符定义
Audio Vivid音频流描述符定义
位数
助记符
AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){AVS3_audio_descriptor(){
descriptor_tagdescr
评论