GB/T20090.11-2015

信息技术先进音视频编码第11部分:同步文本

Informationtechnology—Advancedcodingofaudioandvideo—Part11:Synchronoustext

本文分享国家标准信息技术先进音视频编码第11部分:同步文本的全文阅读和高清PDF的下载,信息技术先进音视频编码第11部分:同步文本的编号:GB/T20090.11-2015。信息技术先进音视频编码第11部分:同步文本共有16页,发布于2016-08-01
  • 中国标准分类号(CCS)L71
  • 国际标准分类号(ICS)35.040
  • 实施日期2016-08-01
  • 文件格式PDF
  • 文本页数16页
  • 文件大小555.15KB

信息技术先进音视频编码第11部分:同步文本


国家标准 GB/T20090.11一2015 信息技术先进音视频编码 第11部分同步文本 Informationtechnology一Advancedeodingofaudioandvideo Part11:Synchronoustext 2015-12-10发布 2016-08-01实施 中毕人民共和国国家质量监督检验检疫总局 发布 中 国国家标准化管厘委员会国家标准
GB/T20090.11一2015 目 次 前言 范围 规范性引用文件 术语和定义 缩略语 文本显示属性 5.1UTF-8支持 5.2字节、字符 5.3字符集支持 5.4字体支持 5.5颜色支持 5.6文本显示位置 5.7字幕滚动 5.8语言 5.9书写方向 ,.10文本换行 5.11高亮、,附加说明和卡拉oK *++ 同步文本格式 6.1约定 6.2同步文本序列 6.3文本序列头格式 6.3.1概述 6.3.2language元素 6.3.3Layer元素 6.3.4Timeinfo元素 6.3.5Position元素 6.4样本描述集格式 6.4.1概述 6,4.2样本描述格式 6.5文本样本格式 6.5.1概述 6.5.2Text元素 6.5.3Dur元素 6.5.4SD_id元素 6.5.5Modifers元素
GB/T20090.11一2015 前 言 GB/T20090《信息技术先进音视频编码》预计分为以下13个部分 -第1部分:系统; 第2部分;视频 第3部分;音频 第4部分;符合性测试; 第5部分:参考软件; 第6部分;面向数字版权管理的可信解码器与访问协议; 第7部分;面向交互应用的视频编解码; 第8部分:在IP网络上传输AVS; 第9部分;AVS文件格式; 第10部分:移动语音和音频 第11部分:同步文本 第12部分;综合场景 第13部分:可重构视频编码工具集 可能还会增加其他后续部分 本部分为GB/T20090的第11部分 本部分按照GB/T1.1一2009给出的规则起草 请注意本文件的某些内容可能涉及专利 本文件的发布机构不承担识别这些专利的责任 本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口 本都分起市单位,北京大学科学院计算技木研究所、北京部电大学 本部分主要起草人:牟伦田、霍龙社、周晓聪、陈熙霖、王雷、黄铁军、高文 业
GB/T20090.11一2015 信息技术先进音视频编码 第11部分同步文本 范围 GB/T20090的本部分规定了在终端设备上与音视频等其他媒体同步呈现的文本(同步文本)的 格式 本部分适用于数字电视广播、数字存储媒体、因特网流媒体,多媒体通信等应用 规范性引用文件 下列文件对于本文件的应用是必不可少的 凡是注日期的引用文件,仅注日期的版本适用于本文 件 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件 GB/T1988一1998信息技术信息交换用七位编码字符集 GB2312一1980信息交换用汉字编码字符集基本集 GB/T4880.32009语种名称代码第3部分;所有语种的3字母代码 GB130002010信息技术通用多八位编码字符集(UCS) GB/T18793一2002信息技术可扩展置标语言(XML)1.0 transformationformatofISO10646 RFC36298位通用字符集转换格式(UTF-8,at 术语和定义 下列术语和定义适用于本文件 3.1 同步文本 nchronoustext 哈 具有时间属性、与音频或视频同步呈现的文本 3.2 symehrustextseqenee 同步文本序列 由一系列连续的同步文本样本所组成的序列 3.3 样本sample 组成同步文本序列的基本单元 3.4 样本描述sampledescription 定义文本字符串显示特性的模板 缩略语 下列缩略语适用于本文件 XML 可扩展置标语言 (ExtensibleMarkupL.anguage)
GB/T20090.11一2015 Ucs 通用字符集 UniversalCharacterSet) UTF-88位通用字符集转换格式 8-bitUnicodeTransformationFormat 文本显示属性 5.1UIF-8支持 同步文本采用GB/T18793一2002(XML1.0)进行描述,XML文件统一采用RFC3629(UTF-8)编 码 终端应支持UTF-8解码 如果终端收到一个它不能显示的字符,则应显示一个预定的结果(如用 *号代替那些不能显示的字符) 5.2字节,字符 因为允许多字节字符,所以一个字符申串的实际字符数并不等于字节数 字符串首字符的偏移值为0 当在一个文本字符串中同时指定了起始偏移值和结束偏移值时,结 束偏移值应大于或等于起始偏移值 如果对应于一个样本中的文本字符串有数个偏移说明,那么一个 元素(用于描述同步文本的XMI元素)的起始偏移值的位置应大于等于前一个元素结束偏移值的位 置 注意,所有偏移值均以字符而不是字节为单位 5.3字符集支持 所有终端宜支持完整的GB130002010(UC'S)字符集的显示,应能够显示以下范围内的UC'S 字符 GB2312一1980; a bGB/T19881998 对于私有字符和未定义绘画行为的控制字符,终端都不需要显示 5.4字体支持 字体通过其名称、尺寸和风格来进行指定 终端应识别几个名称Serif,Sans-Serif,Monospace和 宋体 建议将它们作为不同的字体来显示相应的西文字符和中文字符 对于很多字符来说,终端可能 只有一个比较有限的字体集或仅仅只有一种字体 当终端不支持某一选定字体时,需要有一个合适的 字体来替代,从而能够显示那些仅仅只有一种字体的语言或者只有一种字型的符号 字体通过字体列表中的名称来指定,应为文本字符串指定列表中的某一字体名称 终端应支持大小为12磅的字体尺寸 如果一个要求的字体尺寸不为终端所支持,则终端所支持的 次小尺寸将会被使用 如果所要求的字体尺寸小于终端所支持的最小尺寸,终端将使用它所支持的最 小尺寸来代替 终端应支持显示无风格的文本,同时支持加粗、斜体和粗斜体等风格 如果终端不支持某一风格显 示,则应选择一个替代的风格 在样本描述中应包含一个完整的字体列表,从而使得终端可以预先加载这些字体,或者选择相应的 字体替代策略 5.5颜色支持 文本和背景的颜色使用RGB值来指定 不要求终端必需显示RGB空间中的所有颜色 只有有限 颜色显示能力甚至只有黑白色显示的终端都是允许的 如果终端能够显示的颜色有限,它需要选择一 种合适的颜色来进行替代 一旦选定了替代颜色,则该替代策略应始终保持一致 当选择颜色替代策 略时,终端应当尽量为文本和背景分别映射不同的颜色以保证文本可见
GB/T20090.11一2015 每个颜色有一个透明度值 透明度值为0表示完全透明,为255则表示完全不透明 可以部分支 持透明或完全支持透明 具有一定透明度的可视区域在视觉层次上比那些较暗的区域更接近于观 看者 5.6文本显示位置 -个同步文本序列对应一个文本显示区域 同步文本显示于文本显示区域中的一个文本框内 不 同样本可使用同一个默认文本框(通过样本描述来指定),也可通过样本修饰器自定义文本框来替代默 认文本框 在用相应的颜色描画出文本之后,文本显示区域和文本框都使用背景色进行填充 如果支 持高亮显示,这些颜色可能发生改变 终端可以选择是否对文本进行平滑处理 当将文本与视频叠加显示时,使用一个层次(layer)值来表示不同媒体流叠放的次序 层次值越小 则表示越接近于观看者 文本显示区域的位置和大小由两对参数(tx,ty)和(width,height)唯一确定,见图1 其中(tx,ty 表示文本显示区域左上角像素相对于视频显示窗口坐标原点(即视频显示窗口的左上角像素)的偏移量 (规定xX轴自左向右增长,Y轴自上向下增长),width表示文本显示区域的宽度,height表示文本显示 区域的高度,单位均为像素 文本框的位置通过它相对于文本显示区域左上角像素的位置来定义 0.0 显示区域 视频显示窗口 tx,ty 文本显示区域 Gp height 文本框 right,bottom widh 图1文本显示位置示意图 字幕滚动 5.7 支持滚动式文本字幕显示 当显示滚动效果的时候,终端首先计算无滚动效果情况下文字所在的 位置(正常位置),然后再执行以下步骤 对于字幕滚人,初始时文本在文本框之外,是不可见的,然后按照指定的方向逐渐滚动进人文 a 本框,直到正常位置为止; b)对于字幕滚出,初始时文本位于文本框内正常位置,然后按照指定的方向逐渐滚动离开,直到 完全位于文本框之外 需要显示的文本在显示区域内可以被截断 这意味着可以将一个长度超过文本框的字符串滚动进 人/离开显示区域,逐步地显示它们 例如文本开始时位于文本框之外,然后滚动进人到正常位置,最后 再继续以离开初始位置的方向滚出文本框 如果定义了滚动延时,在延时期间文本会稳定在正常位置不动,即该延时指的是滚人与滚出之间的
GB/T20090.11一2015 延时 这表示文本的滚动可以是不连续的 如果没有定义延时,则文本在当前样本期间总是处于运动 状态 对于滚人,文本在样本持续期的末尾到达正常位置;如果有延时,则它会提前到达正常位置,然后 停留在正常位置直到样本持续期的末尾 与滚人相似,对于滚出,延时发生于文本滚动离开之前 如果 同时定义了滚人和滚出,则文本首先从外面滚动进人,然后在正常位置停留一段时间(滚动延时),最后 再滚动离开 需要预先计算好滚动速度以使整个操作能够在样本持续期内完成,因此滚动时间应等于样本持续 期减去滚动延时 此外滚动速度还取决于实际字符串的长度 终端可以使用简单的算法来确定实际的滚动速度,例如可以通过在每个更新周期移动文本整数个 像素来确定滚动速度 终端应确保选定的速度能够使滚动操作在样本持续期内完成 对于滚动文本,不要求终端必需处理高亮,动态高亮或者超链接等文本效果 5.8语言 在同步文本的序列头信息中声明所使用的语言,其值为GB/T4880.3一2009中规定的3字母语种 代码 语言选项可辅助搜索和语音合成 文本显示与语言无关 注意值'und'(不确定)和‘mul'多语 言)都是允许的 5.9书写方向 书写方向定义了字符显示位置的先后关系,同时它也隐含了文本框中的起始显示位置 终端需要对其所支持的字符集提供书写方向的支持 注意,必选字符总是可以按照自左向右的方 向进行显示 对于支持自右向左书写规则的字符,终端需要支持Ucs中对应的自右向左组成规则 终 端可以设置或者允许用户设置书写方向 如果需要显示垂直文本,则字符自顶向下排列 终端可以为这个书写方向选择显示不同的符号(例 -个水平的括号),但需要旋转这个符号 从哪个方向开始显示是通过终端来设置的,例如通过一个 如一 直接的或者间接的用户接口(例如语言设置) 对于需要垂直显示的文本,如果终端不能支持,则终端可 以视这些字符不存在 5.10文本换行 从行到行的自动文本换行比较复杂,可以采用连字规则或者其他复杂的语言定义标准 基于这些 原因,软文本换行是可选的 文本换行定义可以通过一个TextwrapMod文本修饰器进行 终端如果 不支持这一特性将不能支持软文本换行 如果不使用文本换行,则一个过长的字符串将会被截断 终 端可以选择是在像素边界进行截断,还是仅仅显示完整的字形 个样本可能包含多行文本硬换行) 当遇到UCS字符集中的行分隔符、段落分隔符和换行符 时,终端需要开始新的一行 终端应把回车,新行和回车换行当作新起一行来看待 5.11高亮、附加说明和卡拉oK 可通过高亮显示来重点突出文本 用于附加说明和卡拉OK的动态高亮效果是对普通高亮效果的 扩展 同步文本格式 约定 6.1 采用XMI语言来描述同步文本格式 在下面的XML语法描述中,正体字表示在文本正文中实际 出现的内容,包括各元素及其相关属性;斜体字表示变量,在实际的文本正文中这些变量将由一个xXML
GB/T20090.11一2015 元素值或者一到多个嵌套的XML子元素来替换;省略号()用于表示对前一个元素的不限定次数重 在xXML语法中所有元素的值都以字符串的形式出现,注释中的变量类型(取值范围)用于指导终 复 端在解码时该如何对该元素值的内容进行解释 6.2同步文本序列 一个同步文本序列由文本序列头(TexisalHleader).样本描述集(SsampldeDeriptions)以及一系列 的文本样本(TextSample)所组成 文本序列头位于同步文本序列的最开始,用于声明该文本序列的全局信息 样本描述集位于文本序列头之后,其中包含一到多条预先定义好的样本描述,供后续各文本样本 引用 文本样本是同步文本序列的主体,每一个文本样本中包括一个文本字符串以及相应的文本修饰器 用XMI语言描述的同步文本序列框架见表1,同步文本的根节点是AVSTimedText元素 表1同步文本序列 xML语法 说明 ? ?xmlversion=“1.0”encoding=“UTF-8” AVSTimedText 根元素 TextSegHeader 文本序列头内容,见6. body_oTextSeqHeader /TextSeqHeader GB/T20090.11一2015 6.3文本序列头格式 6.3.1概述 文本序列头内容定义于TextSeqHeader元素之中,包含Language、Layer、Timeinfo和Position四 个子元素,下面依次介绍这四个元素及其属性 6.3.2Language元素 声明文本所用的语言 语言名称采用GB/T4880.3一2009表示 6.3.3Layer元素 声明文本的层次值 层次值越低表示文本在视觉上越接近于观看者 6.3.4Timeinfo元素 通过三个属性来声明同步文本的一些时间信息,各属性含义如下 etime属性;表示同步文本的创建时间,值的形式为;“YYYYMMDDhhmmss”,其中YYYY代 表年份,MM代表月份,DD代表日期,h代表小时,mm代表分钟,ss代表秒; 属性:表示同步文本的最近修改时间,值的形式为;“YYYYMMDDhhmmss”,其中 b mtime YYYrY代表年份,MM代表月份,DD代表日期,hh代表小时,mm代表分钟,ss代表秒 duration属性;整个同步文本序列的持续时间,单位为1/90000s 6.3.5Position元素 通过四个属性来声明同步文本的一些基本位置情况,各属性含义如下 a)tx属性;表示文本显示区域左上角像素相对于视频显示窗口左上角像素的X轴偏移量, b ty属性;表述文本显示区域左上角像素相对于视频显示窗口左上角像素的Y轴偏移量; width属性;表示文本显示区域的宽度; d)height属性;表示文本显示区域的高度 示例: 文本序列头模板 TextSegHeader) Language>value_of_language(/Language') Timeinfoctime=“value”mtime=“value”duration=“value”八 L.ayer)value_of_layer(/L.ayer GB/T20090.11一2015 表2样本描述集格式 XMl语法 说明 GB/T20090.11一2015 齐,值为2表示底端对齐 6.4.2.3Bg_color_rgba元素 可选元素 用来指定背景的颜色,包含四个属性;red,green,blue和transpareney,分别表示背景颜 色的RGB色值(红、绿、蓝)和透明度值,取值范围均为:0255 四个属性描述如下: a)red属性:表示背景颜色的RGB色值中的红色值,取值范围为:0255; b) green属性;表示背景颜色的RGB色值中的绿色值,取值范围为:0255; e)blue属性:表示背景颜色的RGB色值中的蓝色值,取值范围为:0255: d transparency属性;表示背景颜色的透明度值,取值范围为:0255. 6.4.2.4FontTable元素 字体列表,其中包含一到多个字体名称FontName子元素 每个FontName元素的值声明一种字 体的名称 该元素包含有一个id属性,用来唯一识别该字体 终端应使用列表中它所支持的第一个字 体;如果某些字体无法支持,则应选择一个它能够支持的字体来代替 终端需考虑字体显示的连续性 即尽量为连续的字符使用相同的字体 6.4.2.5stylekeeord元素 指定文本的显示风格 该元素有两个属性;startChar和endChar,如果这两个属性缺省则表示该 风格适用于当前文本串的全部字符 startChar属性:指定该StyleRecord元素起作用的起始字符位置偏移值; a b)endChar属性指定该StyleRecord元素起作用的结束字符位置偏移值,即endChar位置的前 个字符是StyleRecord元素起作用的最后一个字符 StyleRecord元素同时嵌套包含了Fontlnfo,FaceStyle和Text_color_rgba三个子元素,具体说明 如下 Fontlnfo子元素;指定字体信息,包含font_id和font_size两个属性 a onLid属性:从FontTable中得到的相应字体的id,在样本描述中表示文本样本使用的 默认字体,如果文本样本修饰器中使用了其他字体,则文本样本修饰器中的字体优先级 更高 font_size属性;字体大小(通常是像素大小,本质上和宽度高度相同. b)FaceStyle子元素;可选元素 表示文本显示的风格,缺省则表示正常显示文本 该元索包含 bold,italie和underline这三个属性 1bold属性;值为1表示加粗显示,为0或其他值则表示不加粗显示; 2)italic属性;值为1表示斜体显示,为0或其他值则表示非斜体显示; underline属性值为1表示文本带下划线显示,为0或其他值则表示无下划线显示 3 exL.colrrgha子元素;表示文本的颜色 与Bg_color_rgba元素类似,包括四个属性;red、 green,blue和transparency,分别表示文本颜色的RGB色值(红、绿、蓝)和透明度值,取值范 围均为;0255 上述文本风格需要终端的支持 如果不能支持,终端需要用其他的风格来代替 6.4.2.6BosRecord元素 指定文本框的位置,用文本框的左上角和右下角相对于文本显示区域左上角的坐标位置偏移(单位 为像素)来表示,包括四个属性;top,left,bottom和right,含义如下 top:文本框左上角在Y轴上的偏移量
GB/T20090.11一2015 b)left:;文本框左上角在X轴上的偏移量; e)botom;文本框右下角在Y轴上的偏移量; d)right;文本框右下角在X轴上的偏移量 示例: 样本描述SD模板 (SDid=“id”"y DiepE 1=“value”continouskaraoke= lagsscroll_in=“value”scroll_out=“value”scroll_direction一 ".esx_.esion- “vaue”write_text_vertically=“vaue” “vaue”horizontal_justifieation “value”vertiealjustification=“value” Bg_color_rgbared=“value”green=“value”blue=“value”transpareney=“value” FontTable》 value_of_FontNameGB/T20090.11一2015 元素包含以下九个子元素;TextStyleMod、TextHighlightMod、TextKaraokeMod、TextHilightColorMod、 TextSerolDelayMod,TextHyperTextMod、TextboxMod,BHinkMod和TextwrapMod 例如,当某个 字符要求显示的大小和其他字符不同时,对于该样本就需要一个TextStyleMod文本修饰器来对这个 字符进行描述 这个描述信息将会覆盖由sD_id元素所指定的样本描述中的相关内容 如果所有的文 本显示时都采用相应的样本描述定义的内容,则可以不要这些文本修饰器 综上所述,文本样本元素TextSample的格式定义如表3所示 在文本修饰器集合元素Modfers 之中可以包含一到多个文本修饰器元素,详见后续各条介绍 表3文本样本元素格式定义 XMIL语法 变量类型 说明 (TextSample 《Text ehar口 文本字符串 value_of_text /Text》 GB/T20090.11一2015 表4(续 xML语法 说明 SyleRecord 见6.4.2.5 body_o" GB/T20090.11一2015 6.5.5.5IextHilihtCoorMod修饰器 如果在一个文本样本中存在TextHighlightMod或者TextKaraokeMod,那么就可能同时存在 TextHlightColorMod 当文本要求高亮显示的时候,它用来决定高亮显示的效果, 如果没有指定高亮颜色,那么需要高亮显示的文本将会使用一个合适的技术,例如反色显示 ? 文本和背景的颜色都改变 b如果指定了高亮颜色,则为了高亮显示字符,背景色被设置为高亮颜色,文本的颜色不改变 终端不需要处理同时滚动并且高亮显示(分为动态和静态)的文本 在创建同步文本时应避免这种 情况的发生 TextHlightColorMod元素有四个属性;red,green,blue和transparencey,分别表示RGB颜色和透 明度 示例 TextHlightCoorMod修饰器模板 TextlHIlghtColorModred=“value”green=“value”transparency=“value”) 6.5.5.6TextSerolIDelayMod修饰器 定义滚动文本中的延时 该修饰器有一个属性erolInelay,用来表示延时,时间单位为1/9000、 示例 人 cxtSerolIDelayMod修饰器模板 GB/T20090.11一2015 a)startChar:;闪烁显示的开始位置偏移值 bendChar;闪烁显示的结束位置偏移值,即第一个不用闪烁显示的字符位置偏移值 示例 BinkMod修饰器模板 BlinkModstartChar=“value”endChar=“value”) 6.5.5.10IextwrapMod修饰器 指定文本是否软换行 该元素包含一个属性wrapFlag wrapFlag属性;换行模式标志 0代表不换行,1代表软换行 示例 TextWrapMod修饰器模板 《Textwra ranMhdwnpHiua lag=“value”)

信息技术先进音视频编码第11部分:同步文本GB/T20090.11-2015解析

一、同步文本的定义

同步文本是指在音视频播放过程中,与音视频内容同步出现的文字信息。这些文字信息可以是字幕、标题、注释等,能够为用户提供更加丰富的视听体验。

二、同步文本的分类

按照同步方式不同,同步文本可以分为内置同步文本和外挂同步文本。

内置同步文本是指将同步文本直接嵌入到音视频文件中,在播放时自动显示。而外挂同步文本则需要用户手动添加,并通过特定软件实现同步显示。

三、同步文本的应用场景

同步文本广泛应用于视频网站、电影、电视剧等领域,为用户提供更加便利的观看体验。另外,在教育、培训等领域,同步文本也扮演着重要的角色,帮助学习者更好地理解和掌握知识。

四、GB/T20090.11-2015标准介绍

该标准是《信息技术先进音视频编码》系列标准之一,主要对同步文本相关的术语做出了明确的定义和解释。该标准规定了同步文本的格式、内容、编码方式、传输方式等方面的要求,有助于在信息技术领域中统一同步文本的标准和规范。

五、同步文本的编码方式

同步文本的编码方式主要包括ASCII码、Unicode、UTF-8等。其中,UTF-8编码方式兼容了ASCII码,同时还支持多种语言字符集,被广泛应用于网络通信和文件存储。

六、总结

本文主要介绍了信息技术中音视频编码的同步文本部分,以及相关标准GB/T20090.11-2015。通过本文可以更好地了解同步文本的定义、分类、应用场景以及编码方式等方面的内容,为同步文本的应用和发展提供参考和指导。

和信息技术先进音视频编码第11部分:同步文本类似的标准

矿山机械术语第8部分:焙烧设备
上一篇 本文分享国家标准矿山机械术语第8部分:焙烧设备的全文阅读和高清PDF的下载,矿山机械术语第8部分:焙烧设备的编号:GB/T7679.8-2015。矿山机械术语第8部分:焙烧设备共有68页,发布于2017-01-01
信息技术先进音视频编码第12部分:综合场景
本文分享国家标准信息技术先进音视频编码第12部分:综合场景的全文阅读和高清PDF的下载,信息技术先进音视频编码第12部分:综合场景的编号:GB/T20090.12-2015。信息技术先进音视频编码第12部分:综合场景共有26页,发布于2016-08-01 下一篇
相关推荐