首页 理论教育计算机PACS技术改革医学图像

计算机PACS技术改革医学图像

【摘要】:现在一般所称的多媒体技术,除了具有图形、图像、活动图像、声音等表达能力以外,还必须是交互式的。之所以要强调“交互式”,是因为录像与电影也是通过活动图像与声音来传递信息的,但通常不把它们称为多媒体。

4.6 PACS中的医学图像新技术

4.6.1 医学图像多媒体技术

医学图像多媒体通信传输是多媒体计算机和通信网络的有机结合,是一种涉及信息处理、微电子、计算机和网络等领域的综合技术。医学图像多媒体通信的实现将主要依赖多媒体的网络平台、通信终端平台、数据压缩技术、通信中电子设计自动化(EDA)技术等方面的技术。

1)多媒体的概念

媒体就是信息的载体。多媒体可简单地定义为:除了文字、数字以外,还使用其他多种媒体的人机信息交流手段,通常指声音、图形、图像、活动图像、动画等信息媒体。当然,它也可以包括其他可能的信息交流的感知方式。例如,触、嗅、重力感、平衡等感觉。

现在一般所称的多媒体技术,除了具有图形、图像、活动图像、声音等表达能力以外,还必须是交互式的。“交互式”是计算机技术里一个常用的概念,指通过人机对话的方式,由人不断输入指令,命令计算机按人所需要的方式工作,可以通过键盘、鼠标或触摸屏输入指令,也可以通过声音及其他的所有可能的方式(如操纵杆、数据手套等)输入指令。之所以要强调“交互式”,是因为录像与电影也是通过活动图像与声音来传递信息的,但通常不把它们称为多媒体。这是因为,当观看录像或电影时,只能被动地接受信息,既不能跳过一段你不愿看的内容,也不能“主动地”去影响节目里情节的发展,即不能与之“交互”。VCD也不是真正的多媒体。

一般而言,不同媒体的特性是不一样的。从人接受信息的渠道可以将媒体划分为听、视、触、其他等感觉(嗅觉、味觉等)类别。听觉类媒体可以细划分成音乐、人声与其他的声音;视觉类媒体可划分成符号类的(文字、数字)与非符号类的视觉图像。视觉图像又可分成普通图像和由计算机绘制的图形(图像动起来即为视频影像,图形动起来即是动画)。运动的图形、图像统称为活动图像或动态图像。声音与动态图像合成在一起就构成了混合的媒体。计算机中常用到的各种媒体以及它们之间的关系如图4.20所示。

文字(数字)是人与计算机进行信息交流的主要手段,称为符号化的媒体,这些文字反应在人脑中并不是它们的形状,而是它们作为符号所代表的语言含义。因此,从本质上说,文字及数字作为一种视觉媒体,与其他的更一般的、形象化的视觉媒体有质的区别。文字在计算机中用代码来表示。ASCII码是最常用的、单字节的西文文字及符号代码。中文字符的代码一般是双字节的,如GB码和BIG5码。

自然界有各种各样的声音,但从计算机运用的角度来说,声音大致可分为三大类,即人的语言、音乐与普通声音。声音有三要素:音调、音强与音色。音调是指声音的频率特性,音调高则频率高,声音尖锐,声调低则频率低,声音低沉。音强是指声音振动的幅度,也就是声音的响度。音色是用以评价声音质量的主观标准,是由混入基音中的泛音所决定的,这种评价是主观的。

图4.20 计算机常用媒体

2)医学图像多媒体平台

(1)医学图像多媒体的网络平台

实现高质量的多媒体通信网络平台主要取决于网络带宽及各层次上媒体的同步(如图像对声音的时延应小于40 ms)、端到端的时延(如声音时延应小于250 ms)、时延抖动以及组网和控制的方式。

①NISDN NISDN所提供的是电路交换型业务,用户接入速率为2B+D和30B+D。其优点是端到端时的延低和能保证一定带宽,缺点是组网不够灵活,多级级联受限。

②DDN DDN提供固定或半永久连接的电路交换业务,速率为n×64kbit/s(n= 1~31),具有类似NISDN的优缺点,租用费较高,仅适合政府和大企业集团的多媒体通信业务。

③PSTN PSTN虽然已能达到可视电话的质量要求,但带宽仍比较窄,要想达到较高质量的多媒体通信,还有待于声像压缩技术和调制解调技术的进一步发展,要构成多媒体会议型业务,还需考虑类似多点控制单元技术的支撑。

④分组交换网 分组交换网(X.25网)具有动态跟踪业务的需求来调整信息速率和交换机吞吐的能力,但其时延大、速度低,端到端时延不固定、抖动大,仅适用于非实时要求的数据业务,基本上不能支持多媒体的通信业务。

⑤帧中继 帧中继作为一种快速的分组交换网,速率可达512kbit/s,但其端到端时延不易得到保证,因而不太适合传输实时性要求高的多媒体通信业务。目前帧中继正在与ATM网融通,作为一种标准的适配业务接入ATM网,最大限度地保证端到端的服务质量,传送高质量的实时语音和图像。

⑥B-ISDN 以ATM为核心的B-ISDN适合于吞吐量大、突发性强的图像视频信息,具有适合各种业务质量要求的承载能力,是一种理想的多媒体通信平台。目前,IP-over ATM将成为网络和多媒体通信发展的主流技术,其特点是将ATM交换与IP路由技术集成在一起,形成多层超高速选路/交换技术,可将传输速度提高到千兆位和兆兆位范围,这让我们看到IP网上多媒体通信业务的发展的诱人前景。

⑦CATV网 CATV网的数字化和朝着双向交互式网络的演变,使其成为继公共电话网、计算机通信网后又一个覆盖面广泛的多媒体通信网络平台。

(2)医学图像多媒体的终端平台

目前基于PC机的多媒体通信终端平台有着很好的发展前景,主要表现在以下几方面:

①集成性 表现在硬件、多媒体和业务功能等的集成。各种声像处理和通信接口板块和PC机的即插即用技术的结合,使这些板块构成为PC机的组成部分,实现声像、文本、数据等多种媒体的集成传输、存储及分解显示再现;一机多用,集录像、传真机、可视电话、会议电视终端、协同工作终端和计算机于一体。

②交互性 表现为交互控制的实时性和良好的人机交互环境。硬件的集成、各处理块间通信通过总线进行,减少了通信开销,提高了交互控制的实时性;利用PC机丰富的编辑软件(包括可视化技术等),为用户提供了生动友好的交互界面和电子白板等协同工作的交互环境。

③重现性 借助于PC机的存储功能,使终端在实现实时通信的同时,还可实现许多非实时的业务功能,如电子邮件、语音信箱以及图文传真信箱等。

④可扩展性 基于PC机平台的多媒体终端的部分功能可通过软件来实现,如通信呼叫的初始化过程、运行中状态的检测、运行参数的动态变化,以及声像压缩算法等,使终端有很大灵活性和可扩展性,成为一个可编程的工作平台。

⑤可靠性 由于PC机硬件和软件本身具有的冗余纠错能力,很大程度上保证了多媒体通信终端性能的可靠性。

多媒体通信业务是近年来发展起来的一种新兴通信业务,正处于不断地开拓其应用领域的过程中。根据不同的应用环境和用户需求,将有不同的通信方式和内容以及人机交互界面,它是一种随应用环境和用户需求而变化很大的业务。它的工作平台应具有较高的灵活性和可扩充性,实际上,一些图像、语音压缩编解码芯片以及通信接口芯片,几乎不到一年就又有了新的改变,许多处理算法又不能完全通过软件来实现,故在多媒体通信中采用了EDA技术,实现硬件电路编程化将尤其显得重要。

4.6.2 医学图像的信息融合技术

1)信息融合

信息融合(Intelligence Fusion,IF)技术出现在20世纪70年代末,随着理论研究的深入和应用领域的扩大,这项技术已成功地应用于医学领域的许多方面。信息融合的目的是把多源信息在空间或时间上冗余或互补的数据,根据需要来进行处理,将数据协同应用,获得研究对象的一致性描述,以进一步发现多源信息有机组合所蕴含的新信息。信息融合系统将比组成它的各分系统具有更优越的性能。信息融合已成为20世纪90年代的研究热点之一。

不同的医学图像促进了有关脏器的相关但不相同的信息,如CT和MR以较高的空间分辨率提供了脏器的解剖结构信息,而PET和SPECT以较差的空间分辨率提供了脏器的新陈代谢功能信息。多种成像设备可以提供更为全面的信息,但这些信息也可能会相互矛盾,所以必须将功能与结构图像的信息有机地结合起来。一个完整的医学图像融合系统就应该是一种或多种医学成像、处理设备与融合软件的总和。

(1)按成像设备的组成分类

按照成像设备的组成,可将系统分为同类与异类多源融合系统。同类多源融合系统如SPECT,MR图像融合系统;异类多源融合系统如SPECT与MR图像融合系统、SPECT与CT图像融合系统等。

(2)按融合对象分类

按融合对象,有单样本时间、空间及模板等融合系统。

①单样本时间融合 对某个病人,将一段时间内对同一脏器所做的同种检查图像进行融合,有助于跟踪病理发展和研究该检查在疾病诊断上的异性。

②单样本空间融合 将某个病人在同一时间内对同一脏器所做的几种检查图像进行融合,以便综合利用这几种检查所提供的信息,对病情做出更确切的诊断。

③模板融合 可以从许多健康人的研究中建立一系列模板,将病人的图像与模板图像融合,有助于研究某种疾病和诊断标准。

(3)按处理方法分类

按处理方法来分,则融合法有数值融合化和智能融合法之别。

①数值融合法 将来源于不同成像设备的图像做空间归一化处理(确保不同图像中的像/体素表达同样大小的空间区域),获得一致性描述后直接应用。

②智能融合法 将来源于不同成像设备的图像做空间归一化处理后,根据研究的需要,选择不同图像中的所需信息进行综合。

(4)按系统拓扑结构分类

按系统的拓扑结构,有集中、分布、分层和混合等方式。

①集中式 将各种成像设备所得的图像都直接送到中央处理器来进行融合处理。这种结构既可实现时间融合,又可实现空间融合,但由于其数据量大,数据样式多,对传输、处理设备要求较高,解决策略复杂,故实现困难。

②分布式 每台成像设备都是一个自主的局域处理器,完成对采集信息的局域处理,可在本地完成时间融合,同时又可与其他的结点通信,完成最终诊断,这种结构要求成像设备的性能好,并且具有开放性。

③分层式 在集中和水平式之间引入中间结点,先进行同类成像设备的数据融合,再将结果送至全局处理器,进行异类成像设备的信息融合。

④混合式 在大型融合系统中,成像设备的配置关系十分复杂,无法将它划归哪种结构形式。在这种情况下,可按信息之间的内在联系将整个系统分解成若干个互连的小型系统,逐级进行融合,得出最终的诊断结果。

2)信息融合技术

一般用“协同效应”这个术语来描述信息融合在医学图像研究上的作用,实现医学图像的协同,数据转换、数据相关、图像数据理解是关键技术。

①图像数据转换是对来自相同或不同采集设备的图像进行格式转换、三维方位调整、尺度变换等,以确保多源图像的像/体素表达同样大小的实际空间区域,确保多源图像在空间描述上的一致性。它是图像融合的基础。

②图像融合首先要实现相关图像的对位。图像分辨率越高,图像细节越多,实现点到点的一一对应也就越困难。目前在进行两幅高分辨率图像(如CT图像和MR图像)的对位时一般借助于外标记,便于自动对位工具操作。

③图像数据库完成典型病例、图像数据的建档和管理及信息提取,它是融合的数据支持。

④数据理解在于综合处理应用各种成像设备所得信息,以获得新的有助于临床诊断的信息。

4.6.3 医学图像的体视化技术

自计算机诞生之日起,就有关于体视化的研究。将数据以图形方式来表示是早期体视化的基本思想,然而那时还没有系统体视化的理论和方法。随着计算机的处理能力日益增强,才为体视化的发展提供了必要的物质基础。

体视化是科学可视化的一个重要组成部分,它是在吸收图像处理、计算机、视觉和计算机图形学等学科有关知识的基础上发展起来的。图像处理主要研究从图像到图像的变换,其中图像滤波和变换方法被借用过来,用于滤除体数据中的噪声和校准成像过程所带来的畸变。体数据是对某种物理属性的空间采样,而不同的物质一般具有不同的物理属性,因此利用图像分割技术可以基于采样值把不同物质区分开。计算机视觉或图像理解的任务是对图像进行解释,即给予每个图像元素一个符号描述,其中分割或分类可用于区分体数据中不同种类的物质。体数据分类是体视化的一个关键步骤,分类的正确性和准确性直接关系到对体数据所含对象的分析和显示。

传统计算机图形学以面和边等基元来描述物体,不含有任何内部信息;而三维体视化则是以三维基元(体素)来描述整个物体,它包含物体内外的全部信息。现在体视化正在逐渐代替传统图形学更好地显示三维物体(不仅是物体表面,还有物体的内部)。

1)体视化的基本概念与框架

目前,关于体数据的表示、处理分析、操作、物体重建和显示的研究已经逐渐形成一门独立的学科——体视化。体视化的任务就是要揭示物体内部复杂的结构,使人们能够看到通常情况下看不到的物体内部结构。体视化与传统计算机图形学的主要差异就在于对象的表示模型不同,一个是有限个离散采样,另一个是连续的几何描述,由此导致对物体的处理、操作、变换、分析和显示方法的截然不同。

(1)体视化的基本概念

由于体视化正处在研究和发展阶段,所使用的术语还没有完全统一,而且同一术语的中文译名也不尽相同。本书在此对体数据和体素这两个概念,以及它们所涉及的相关知识做一些介绍。

①体数据(Volumedata/Vo1umetricdata) 体数据可以看成是在有限空间中对一种或者多种物理属性的一组离散采样,它可以表示成:f(x),x∈Rn,{x}是n维空间的采样点的集合,因此也有人把体数据看成为数据集。体数据可以按不同标准分成不同种类:

a.按采样空间的维数,可把体数据分为三维体数据和高维体数据。当空间维数为3(n=3)时,称f(x)为三维体数据;当n>3时,则称f(x)为高维体数据。

b.按采样值的个数,可把体数据分为标量体数据和向量体数据。当采样值是单值时,得到的是标量体数据;当采样值是多值时,得到的是向量体数据。X线—CT设备产生的是标量体数据,采样值反映物质对X线的吸收程度;磁共振装置产生的是向量体数据,每个采样点上有3个采样值,它们分别代表质子密度、弛豫时间T1值和T2值。

图4.21 体数据类型

(a)有结构体数据;(b)无结构体数据

c.体数据还可以按采样点之间的拓扑结构分成有结构体数据和无结构体数据。(www.chuimin.cn)

对于有结构的体数据,采样点之间在各维上存在确定而统一的邻接关系。对于三维有结构的体数据,它的任一个采样点都可以用它所在的行、列、层的序号(i,j,k)加以标识。因此每个采样点在3个轴向上有6个邻接采样点。逻辑坐标(i,j,k)不一定等于采样点的实际物理位置(x,y,z)。有结构的体数据不只是采样数据的集合,它还隐含着采样点之间的连接关系。图4.21(a)是按拓扑和几何结构分类而得到的8种体数据类型。对于有结构的体数据,按其采样点之间的几何位置关系可以进一步分为笛卡尔型、规则型、整齐型和曲线型4种类型。在这4种类型中,物理坐标与逻辑坐标之间的关系分别为:

笛卡尔型:(x,y,z)=(i,j,k)

规则型:(x,y,z)=(i×Δx,j×Δy,k×Δz)

整齐型:(x,y,z)=(x[i],y[j],z[k])

曲线型:(x,y,z)=(x[i,j,k],y[i,j,k],z[i,j,k])即从笛卡尔型到曲线型,体数据对采样点的几何结构要求越来越宽。

对于无结构的体数据,采样点之间则不存在邻接关系,不同的三角剖分算法将产生不同的邻接关系。对于无结构的体数据,按其采样点之间的几何关系可以进一步分为规则型、非规则型、混合型和弯曲型4种类型,如图4.21(b)所示。

如果采样空间以某种统一方式进行剖分,由此形成的采样点连接网格结构就是无结构规则的。而对同一组采样点采用多种剖分方式,得到的则是非规则网格。如果一个体数据的一部分是规则的,而另一部分是非规则的,那么它就是混合型的。以上这3种类型的网格都是直线网格,只有弯曲型体数据具有曲线网格。

有结构规则体数据可以用n维数组(外加表示各轴向网格点间距的n个参数Δx1,Δx2,…,Δxn)来表示,所以它也称为n维离散图像(简称n维图像)。

三维有结构规则标量体数据可以用三维数组表示成下面的形式:

其中 Δx,Δy,Δz——网格点在3个轴向上的间距;

d1,d2,d3——体数据的维数;

f[i,j,k]——三维体数据在(i,j,k)上的灰度或密度。②体素(Voxel) 是组成体数据的最基本单位。通常有两种体素定义:一种是把体素定义为中心点在采样点上的小长方体,这个小长方体内的值是不变的,都等于该采样点的采样值;另一种是以8个相邻的网格点[(i,j,k),(i+1,j,k),(i,j+1,k),(i,j,k+1),(i+1,j+1,k),(i+1,j,k+1),(i,j+1,k+1),(i+1,j+1,k+1)]为顶点的小长方体当作一个体素,这个小长方体内的值是变化的,体素内任一点的值可以用8个顶点上采样值的三线性插值计算出来,有时也把这种体素叫做体素细胞。因此,三维体数据可以看成是由许多个体素组成的。当固定某一维,就得到一幅二维图像,称之为断层图像或切片。

(2)体视化的框架

图4.22 体视化过程

图4.22是三维体视化的主要过程,体数据可以从一系列二维投影数据经过图像重建过程而生成,X线—CT等断层扫描设备就是完成图像重建任务,产生一系列断层图像。体数据的另一个来源是连续的计算或几何模型,它们需要经过体素化过程才能转化为体数据。与体素化相反的过程是物体三维重建,它从体数据中抽取出物体的表面。

体素化和物体重建是实现了离散的体数据表示与连续的几何表示之间相互转换的两个互逆过程,它们是将体视化和传统计算机图形学连接起来的纽带。

对体数据进行显示有两种方法:

①基于表面的显示方法。

②直接对体数据进行显示的方法。

后者又被称为基于体素的显示或直接体视方法。不论哪种方法,其最终目的都是生成一个显示图像。

图4.23描述了三维体视化总体框架。从图中可见,三维体视化的第一个步骤是图像获取。通过图像获取设备(X线—CT、磁共振或超声扫描)对真实物体进行扫描而得到一组二维断层图像,也可以是对计算模型的离散采样,以构成二维断层图像。

图4.23 三维体视化框架

由于断层图像一般含有噪声,需要进行滤波以提高信噪比。当这组二维断层图像之间的间距相对于图像内像素之间的间距很大时,或者断层图像之间的间距不均匀时,就需要在断层图像之间构造新的二维图像,这个过程叫做图像插值。经过图像插值,就得到了一个各向同性的三维体数据。为了进一步提高信噪比,有时还需要进行一次三维滤波。三维体数据也可以通过对几何模型进行体素化来获得。

体视化目标是人主动参与可视化过程,根据需要对体视化数据所蕴涵的不同对象进行选择,并施加诸如缩放、平移、旋转、删除、改变其物理属性(颜色、透明度、反射系数等)以及剖切等操作,使人能够更好地理解和掌握对象的结构。对体数据进行操作实质上是对其进行相应变换。

体数据的滤波、校准、插值、分类或分割构成了体数据的预处理过程,它为后续的体视化过程做了一些必要的数据整理和准备工作。实现体数据可视化一般有两条途径:

①进行物体三维重建,然后用传统计算机图形学的显示算法对重建出的物体表面进行显示。

②直接对体数据进行显示(直接体视化)。

体数据的表示指体数据在计算机中的表示方式,体数据表示方式不同,相应的体视化算法也会有些差别。

(3)体视化数据 这里介绍一些关于体视化数据的知识:

①体数据的表示 目前体数据的表示主要有3种方式,即:原始灰度图像表示,二值化图像表示或者二值化图像的简化表示,以及原始灰度图像加上属性的综合表示。

第一种方式是把原始体数据原封不动地保留下来,这种表示方式的优点是不丢失信息,缺点是对机器内存要求高,处理速度慢。二值体数据表示可以大幅度地减少存储量,它用八叉树结构或段存储结构来表示体数据,二值体数据表示方式的优点是减少了存储量,加快了处理速度,缺点是丢失了大量有用信息。

在对原始体数据进行处理的过程中,要产生一些中间数据,如属性、颜色、阻光度、法向量等。中间数据一次性被计算并保留下来将成倍地加大存储需求量,如每次处理都重新计算这些数据又浪费大量的时间。在内存较大的机器上才能同时保留原始体数据和一些计算出来的属性信息。目前常用小波方法表示体数据,即对体数据压缩及对压缩的体数据直接体视。

②体数据的分割 体数据分割的目的是有选择地对它们进行分析和显示。如对X线—CT体数据进行翻译,可以确定各个区域代表的是肌肉、骨骼,还是其他组织。

体数据分割方法有门限、边缘抽取和区域生长等方法。这些方法按输出结果的不同可分为两类:二值分割(Binary Segmentation)和模糊分割(Fuzzy Segmentation)。前者对每个体素做出一个肯定的二值判断,后者只给出每个体素属于某个物体的可能性或者某种物体占有率。在实际图像获取过程中,每个采样值可以看成是空间中一个小方体内物理属性的综合结果。小方体内包含多种物体成分(即部分占有),当出现部分占有情况时,二值分割就无法准确合理地区分物体,而模糊分割则能比较好地处理这种情况。

但在当前的实际应用中,体数据分割是一个没有彻底解决好的问题,现多借助于人的视觉能力,进行人机交互分割。

③面绘制 从三维体数据中重建物体表面,首先必须根据采样值的分布变化确定物体的边界,然后用适当的数学表示方法来描述物体表面。重建方法可以分为从轮廓重建物体表面(也称作切片级重建方法)和从体素重建物体表面(也称作体素级重建方法)两种方法。

a.从轮廓重建物体 在医学上,切片级重建是以断层图像作为处理的对象,首先在每个切片图像上抽取出物体的轮廓,然后用轮廓拼接构造通过这组轮廓的物体表面。通过1组平面轮廓的曲面有无穷多个。为了使重建问题有解,要引入新的约束,如体积最大、表面积最小、对应方向一致、跨度最小等。若当三维物体自身出现分叉状态,在断层图像上表现为相邻断层上的轮廓存在一对多关系,这时由于约束不足,轮廓对应的随意性将很大。

b.从体素重建物体 体素级重建方法是在物体表面通过的每一个体素内构造小面片(一般是三角片),物体表面就是由许许多多的小三角片组成的。全局的拓扑结构由局部拓扑处理所确定,所以体素级重建方法比切片级重建方法具有更高的精度和可靠性。

体绘制由于体数据的分割是一个非常难以解决的问题,无法保证后面重建结果的可靠性,所以后来研究了回避分割和重建问题的直接体视方法。直接体视以体为操作的基本单位,显示处理速度非常慢,不能满足实时交互的要求。

④体视化系统 体视化经过20多年的发展,从原理、方法到系统实现形成了一套比较完善的体系,在体视化软件的开发工作上,已推出一些商业化软件。在硬件上多采用多处理、大容量内存、快速的I/O系统,高带宽总线及快速/宽带磁盘技术。

由于数据分割是一个不确定问题,不可能存在一种全自动的分割方法把分割问题彻底解决好,人工干预是不可避免的,一般的观点是,分割必须和体数据显示紧密结合在一起,操作者一边进行分割一边观察显示结果,再根据显示决定如何调整分割。这种“分割与显示”过程不断重复进行,直到达到满意结果为止。目前的硬、软件系统都在向这方面努力。

另外,很多人为实现从不同影像设备获取的体数据之间的融合,实现多种数据模型的混合和相互转换,即实现物体的表面几何描述模型和体数据离散描述模型混合在一起进行处理、分析、操作和显示而努力。

未来的体视化不仅仅是“观看”体数据的工具,它要实现虚拟现实技术,创造逼真的虚拟环境,让操作者在这个虚拟环境中参与对体数据的操作和改造活动。操作者就像置身于真实世界中一样,该技术应用于医学可让医生在虚拟手术室对病人的模型实施各种手术方案,模拟手术过程,使医生在真正做手术之前就可以进行多次演练,以制订出最佳的手术方案,提高手术的安全性。

2)体数据处理

(1)体数据的变换与转换

体数据的变换根据傅里叶变换法的有关内容可以归结为如下几个步骤:

①对每个一维投影波形进行傅里叶变换,得到傅里叶平面上具有相同倾斜角的一条直线上的G(ρ,θ)。

②在傅里叶平面上,用插值完成由极坐标表示的G(ρ,θ)到直角坐标表示的F(u,v)的转换。

③对F(u,v)进行傅里叶逆变换,生成断层图像。傅里叶逆变换的公式如下:

影像设备一般只是对物体进行扫描并完成二维断层图像重建(近几年生产的X线—CT和磁共振设备已具有物体三维重建功能)。断层图像可以显示在屏幕上,也可以存储在磁带上备档(影像设备自身带的计算机一般是各个厂家专用的)。为了对影像设备生成的一组断层图像做进一步的处理分析,首先必须读出影像设备中的数据,并在另一台计算机上进行可视化系统的开发。一般有两种方式可以读取影像设备中的数据:一种是离线方式,即将存储于磁带上的数据读入计算机之中;另一种是在线方式,计算机与影像设备直接相连,数据格式转换既可由硬件来实现,也可由软件来实现。

影像设备的性能及使用者的操作水平都会影响到输出图像的质量,不可避免地给重建的断层图像带来噪声,因此滤波是十分必要的。在断层平面的两个轴线方向上的采样密度一般比垂直断层平面方向上的采样密度大几或十几倍,这就需要进行图像插值,在原来的断层图像之间构造一些插值图像。

体数据的转换通过影像设备获取体数据之后,第一个问题是数据格式的转换,即把X线—CT、磁共振或超声输出的数据转换成便于计算机接收、处理的形式。它包括必要的格式转换和数据压缩,影像设备输出的数据量一般是非常大的。一个病例的常规X线—CT检查要取40个512×512断层图像,占40 Mbit存储空间。如果不进行适当的压缩,势必造成存储空间和处理模块负荷过重。

这里的数据压缩与图像处理中的图像压缩是两个不同的概念。图像压缩是可以复原的(尽管有些压缩算法会损失一部分信息),数据压缩实际上是数据删减,删减方式主要有:

①保留感兴趣的区域,把其余部分剪裁掉。②降低体数据的空间分辨率。③降低体数据的灰度分辨率。(2)体数据滤波与三维重建

体数据滤波分为傅里叶平面上的滤波和实平面上的滤波。

①傅里叶平面上的滤波 傅里叶平面上的滤波随机噪声一般在频域上表现为高频成分,假如信号和噪声在频率域上是可分离的,就可以设计一个低通滤波器,把噪声从信号中分离出来。

设f(i,j)是一个受噪声污染的二维图像,其离散傅里叶变换为F(u,v)。令

G(u,v)=F(u,v)·H(u,v)

其中img119是理想圆形低通滤波器的传递函数,r为一常数,表示滤波半径。

这种滤波器将傅里叶平面上以原点为中心、r为半径的圆内部的频率成分完全保留,而将圆外的频率成分统统滤除,对G(u,v)进行傅里叶逆变换就得到滤波后的图像:

g(i,j)=F1{G(u,v)}

这种圆形低通滤波器容易产生模糊和环形波纹,造成图像退化。因为一些图像特征(如锐利的边缘)也表现为高频成分,它们也同噪声一道被滤掉了,从而造成了图像模糊。比较实用的是Butterworth滤波器,其滤波传递函数形式为:

这种滤波器对低频成分滤除得较少,对高频成分滤除得较多,在通过的频率和滤除的频率之间没有不连续性,并克服了圆形滤波器所产生的环形效应,图像的清晰度也比较好。

②实平面上的滤波 实平面上常用的滤波方法有3种,邻域平均法、中值滤波法和保持边缘滤波法。邻域平均法是对于图像中的每一个像素取一个以它为中心的区域,用该区域内各像素灰度的加权平均值取代该像素的灰度值;中值滤波法是在图像上滑动一个含有奇数个像素的窗口,对该窗口所覆盖像素的灰度按大小进行排序,处在灰度序列中间的那个灰度值称为中值,用它来代替窗口中心所对的那个像素的灰度;保持边缘滤波法是在滤波之前能够检测出边缘,对那些没有边缘的图像区域进行平滑。

③三维重建 三维重建是计算机视觉、模式识别及可视化技术等领域中的经典研究主题。通过各种传感器,计算机可以获取外部世界中物体的某种信息(采样数据),重建的任务就是要从获取的采样数据中恢复物体的三维结构,即物体的原形。重建从本质上说是一个逆问题。

不同的领域所用的传感器不同,所得到的数据种类也不同,重建的目标也不一样,因此造成重建方法的多样化。在立体礼堂中,通过摄像机可以获取周围环境的光强信号。在这里,重建的含义是要从不同角度拍摄的图像重构三维物体描述,而重建的关键在于解决好图像的匹配问题。而激光扫描测距仪获取的是景物的深度信息,从距离图像重建三维物体的重点在于确定三维点之间的拓扑关系,然后选择适当的数据描述工具(如多面体、三角片或者参数曲面)去拟合这组点。在医疗领域,通过各种医疗影像设备可以得到人体内部的一组断层图像,其灰度代表生物组织的某种物理属性。一般不同的器官和生物组织具有不同的物理属性,反映在图像中表现为不同的灰度。因此,要从三维图像中重建器官和组织的三维结构,首先要确定它们的边界,即要对原始图像进行分割,然后用三角片来拟合器官和各种生物组织的表现。

在医疗图像处理和分析中,重建所起的作用最为突出。近年来,随着医疗影像技术的日益成熟以及各种医疗影像设备在医院中的广泛使用,医生可以通过这些设备无损地获取人体内部组织的三维图像。从一组二维断层图像上理解病人身体内部器官的三维结构是非常困难的,即使经验丰富的医生也很难准确地描述器官的立体结构和确定病变体的方位。所以,三维重建是对病变体进行的定量分析(如计算体积、表面积和空间定位等),这是提高诊断准确率的重要保证。

从三维体数据中重建三维物体的方法很多,但从重建过程处理的基本元素的级别上来分,可以把这些方法分成两大类:体素级和切片级重建方法。体素级重建先要确定物体表现在每个体内的小面片,然后将这些小面片连接起来构成物体的表现。切片级重建则是从一组平面轮廓重构通过这些轮廓的曲面。当原始图像的分辨率很高时,体素级重建方法更可靠,也更有效;而当原始图像的分辨率很低时,体素级重建方法的重建精度也很低,这时切片级重建方法能够比较好地构造出光滑的表面。总体来说,体素级重建方法相对比较可靠,因为它只需要保证各个小面片之间的拓扑一致性,不需要考虑总体的拓扑关系,但重建的结果却产生大量的小面片,占用大量的存储空间。切片级重建方法可以实现大幅度的数据压缩,但轮廓对应存在着多义性,特别是在出现分叉情况时使得轮廓对应问题的不确定性更加严重。