监控摄像头通常固定安装,并且力图监控更为宽广的视觉区域,视频背景基本不会发生变化,运动片段由运动目标的移入、移出,以及在监视区域内的运动形成的。在微小物体长时间运动后,像素累积变化会对分割结果造成影响。因此,视频运动片段的分割主要取决于运动目标移入和移出监控区域,而与目标在监控区域内的运动状态无关。......
2023-11-23
1.场景分割的定义
场景是镜头的集合,包含更丰富更完整的视觉信息,在视频序列中叙述了一个完整的视频内容。场景在同一环境中的一段时间内展示了一个事件。因此,场景包含事件、时间和环境3个属性,且在同一个场景中这3个属性基本是不变的,我们也可以将这3个属性归结为同一主题,即具有同一主题的视频片段为一个场景。
大多数文献中的视频时域分割是在视频镜头或其以下结构单元中进行的,然而人们在观看视频时,更加关注视频中描述的完整事件,因此基于场景的视频时域分割同样具有一定的现实意义。场景分割就是按照视频序列中所描述的内容,将视频分成多个片段,每一个片段代表一个场景。
2.场景分割算法
将一个视频序列分割成多个场景的方法有很多。文献[20]通过视觉上的相似性进行场景分割,他们定义了3个条件来判断帧是否属于同一场景:一是当前场景视觉内容与下一个场景视觉内容不同;二是在同一场景内的镜头在视觉上具有相似性;三是如果两个镜头A和B在视觉上相似,则其被判定为同一场景,且在A和B之间的所有镜头也都属于这一场景。下面我们将详细介绍常用的场景检测原理。
1)场景内镜头单元具有相似性
同一场景的事件、环境和时间是一致的,其所描述的主题也是一致的。同一逻辑单元内的镜头具有相同的语义特性,即相同的视觉、音频和文本内容。在视觉方面,因为同一逻辑单元内的镜头具有相同的环境,所以不同镜头具有相似的背景和前景目标,在视觉上是相似的;在音频方面,我们可以在同一个背景环境中找到相似的噪声,而且相同前景目标所发出的声音的特性也是相同的,所以其在音频上是相似的;在文本方面,因为同一场景内的镜头所描述的主题是相同的,不同镜头间所出现的关键字是相似的,所以其在文本上是相似的。
2)场景之间镜头单元具有不相似性
如果两个镜头具有相似的语义特性,那么它们属于同一逻辑单元,而相邻的逻辑单元之间的镜头具有不同的语义特性,否则它们属于同一逻辑单元。逻辑单元之间的不相似性表现为两个相邻逻辑单元内的镜头在视觉、音频以及文本上的不连续性。
3)场景边界具有标识符
逻辑单元通常具有较为固定的结构,靠近逻辑单元边界的镜头一般具有特定的作用。逻辑单元内的第一个镜头的作用通常是引入并介绍逻辑单元的主题,而最后一个镜头的作用是结束逻辑单元。例如,我们会使用新闻节目中主持人的镜头引入和结束一个新闻事件的报道,有时也会使用新闻节目主持人的暂时停止播报表示潜在的逻辑单元边界。
4)逻辑单元内具有连续标识符(www.chuimin.cn)
与场景边界使用具有特定功能的镜头相似,电影制作人使用相同的方法来标记逻辑单元内的连续性镜头,例如重复使用相同的镜头转换类型来标记镜头之间的连续性。例如,在一段视频中,连续3个以上的镜头之间的转换类型为淡入淡出,那么我们可以将这些镜头归为一个场景。如果连续3个或3个以上的简单镜头具有相同的状态,且是同一台摄像机拍摄的,那么我们可以将这些镜头归为同一个逻辑单元。
5)特定视频场景具有特定的结构
在一些特定的领域,视频是具有特定的结构和模型。新闻节目视频场景分割通常会利用它具有的特定结构的特性,一般先用第一个镜头引入新闻事件,然后对新闻事件进行详细报道。文献[21]详细描绘了新闻视频的具体模型。
6)是否将镜头判定为同一场景具有时间限制
本质上,在使用镜头相似性作为视频场景检测算法标准的同时,我们也对相似镜头之间的时间间隔做了限定。视频序列中的某一种相似性发生在一定的时间限制内,镜头A和镜头B相似,并且时间间隔短,则我们可以将A和B看作一个场景,如果镜头C与A、B也相似,但是与镜头A、B的时间间隔长,则C和A、B不属于同一场景。文献[22]采用时间窗口的方法,即设定一个一定长度的时间窗口,令时间窗口从第一帧开始滑动,如果在时间窗口内的两个镜头相似,则认为其属于同一场景。
7)时间连续性
在逻辑单元内部时间是连续的,不会出现一个逻辑单元将另一个逻辑单元一分为二的情况。如果镜头A和镜头B属于同一场景,那么A和B中间的所有镜头都属于这一场景。
3.现有方法的局限性
(1)每一种场景检测算法都具有其适合使用的特定视频类型,目前为止并没有一种场景检测方法可以同时应用于多种视频类型。
(2)现有方法并没有将镜头渐变转换类型作为场景检测的一项可以利用的信息,有大量数据集显示,镜头渐变转换类型与场景边界位置具有一定的关系。
有关时空域视频运动片段分割理论及应用的文章
监控摄像头通常固定安装,并且力图监控更为宽广的视觉区域,视频背景基本不会发生变化,运动片段由运动目标的移入、移出,以及在监视区域内的运动形成的。在微小物体长时间运动后,像素累积变化会对分割结果造成影响。因此,视频运动片段的分割主要取决于运动目标移入和移出监控区域,而与目标在监控区域内的运动状态无关。......
2023-11-23
镜头的视觉内容通常不能完全用单个关键帧来表示。复合镜头可以包括多个较小的时间片段,将复合镜头分割成小的时间片段可以为用户提供直观的基于关键帧的浏览,而不会丢失镜头内片段的时间顺序。关键帧可以通过为这个镜头选择2组关键帧解决,一组描绘人物A,一组描绘人物B,这2组关键帧代表整个镜头。......
2023-11-23
本书5.1~5.4节的方法是建立在像素域中的。如今,越来越多的视频以压缩形式进行存储和传输,所以出现了一些在压缩域中进行运动片段分割的算法。文献[7]提到了一种基于帧运动量计算的压缩域监控视频运动片段分割算法。视频的运动活动性是指视频序列给用户视觉上的感知运动强弱程度,目前出现了多种视频运动活动性的评判方法。通过以上3个参数综合衡量帧的运动活动性,将视频帧分为运动片段和静止片段两部分。......
2023-11-23
例如,我们欣赏电视节目时,就是电视机将接收的电台信号,还原为图像信号的过程,那么该过程中视频信号就始终贯穿在“处理”的过程中,如亮度、色度信号处理电路等。图6-20 处理数字视频信号的电路及相关信号波形......
2023-06-26
模拟视频是一种用于传输图像和声音的并且随时间连续变化的电信号。模拟视频具有以下特点:①以模拟电信号的形式来记录。传统的视频信号都是以模拟方式进行存储和传送的,然而模拟视频不适合网络传输,在传输效率方面先天不足,而且图像随时间和频道的衰减较大,不便于分类、检索和编辑。电视信号是视频处理的重要信息源。目前各国的电视制式不尽相同,不同制式之间的主要区别在于不同的刷新速度、颜色编码系统、传送频率等。......
2023-10-22
从“本体—工夫”的理论架构来看,标举天理为本体,是为了确立道德伦常及道德修养的形上根据,因而,为了对杨时的修养工夫有一更为精准的把握,必须先厘清其理本论。从现存杨时的文献来看,杨时并没有明确对“道”作出本体意义的规定,但从程朱理学本身而言,以“道”为本体是很自然的。另一方面,杨时以中为道之至极,实质上也赋予“中”以本体义。杨时同样将“天理”看作天地万物的本原。......
2023-11-20
具有放大器的数据采集卡可配置成差分测量系统。然而,实际应用的板卡却限制了差分测量系统抵抗共模电压的能力,数据采集卡的共模电压的范围限制了相对于测量系统地的输入电压的波动范围。图3-6描绘了一个16通道的RSE测量系统。测量接地信号最好采用DEF或NRSE测量系统。在差分测量系统中,应该保证相对于测量地信号的共模电压在测量系统设备允许的范围之内。......
2023-07-02
相关推荐