首页 理论教育主要难点及发展趋势优化方案

主要难点及发展趋势优化方案

【摘要】:随着图像数据获取手段的快速发展,图像数据量呈爆炸式增长,当前图像识别的计算模型和方法在处理高维多模态海量数据时面临着重大挑战。图像目标识别所面临的许多难点都可以归结到图像处理与模式识别领域的一些基础性问题,这些问题目前还没有满意的解决方法,但对目标识别来说它们又是如此的重要。因此,相关领域的科研人员对它们开展了大量的研究工作,并取得了一定的前沿性成果。

数字图像具有信息量大、内容丰富、表现力强、便于存储和传输等优点,在社会生活的诸多方面发挥着重要作用。但是受到计算理论和方法的制约,现有技术难以满足人们日益增长的对图像识别的广度和深度的需求,数字图像应用的突出挑战问题如下。

首先,数字图像蕴含了丰富的语义,由于图像目标固有的复杂性,出现了“有信息,用不了”的情况。在图像处理过程中,通常可方便地从图像目标中提取各种底层描述,然而,底层描述与丰富的高层语义之间缺乏简单、明确的对应关系,提取多类别、多层次的语义信息仍然十分困难。

其次,由于图像的数据量极大,出现了“信息多,用不好”的情况。随着图像数据获取手段的快速发展,图像数据量呈爆炸式增长,当前图像识别的计算模型和方法在处理高维多模态海量数据时面临着重大挑战。

最后,获取的同一组数据可用于多种用途,出现了“需求多,顾不到”的情况。数字图像的应用需求日益多样化,各种应用对处于不同概念级上的语义需求各异,同一应用在不同上下文环境下对语义的要求也不尽相同。但是,由于缺乏对需求的感知——缺乏将高层需求转化为机器可接受的高层语义特征,缺乏从高层语义特征到底层特征间可逐级计算的多层次特征表示和计算模型,因此难以从图像数据中提取出有效的语义并组织起来满足多样化的应用需求。

图像目标识别所面临的许多难点都可以归结到图像处理与模式识别领域的一些基础性问题,这些问题目前还没有满意的解决方法,但对目标识别来说它们又是如此的重要。因此,相关领域的科研人员对它们开展了大量的研究工作,并取得了一定的前沿性成果。