欢迎访问发表云网!为您提供杂志订阅、期刊投稿咨询服务!

图像法论文大全11篇

时间:2023-03-22 17:38:05

图像法论文

图像法论文篇(1)

因此我认为高中物理教学过程中应该更多的采用图像法。高中教材里所附的这些实物和图像在教学过程中不可忽略,它可以起到意想不到的效果。这些图像有:力学中,力的图示、质点、匀速直线运动的位移图像,速度图像、振动图像、波形图;热学中,等容图像、等温图像;电学中,点电荷、电场线、磁场线、交变电流的图像;光学中的光路图等等。这些图像是通过应用物理的方法从实物、从实验中抽象出来的或是应用数学手段总结出来的。它能够形象的反映物理规律,表达物理知识。比枯燥的文字、公式更容易理解和掌握。

在讲授电场时,通过实验演示,很多同学都相信互不接触的电荷间具有力的作用。力是物体间的相互作用,因此电荷之间应该存在一种物质,这种看不见、摸不着的特殊物质是什么呢?从而引入了"电场"。有的同学还不理解,进而人为的引用一种客观上不存在的线来描述电场,即电场线。将无形的物质用有形的东西来表示,大部分同学明白了。可以看出在教学中采用图像法具有形象直观、易掌握等优点。当然有时也会遇到一些麻烦。

图像法论文篇(2)

    所谓的颠覆关系就存在于这一斗争最有趣和最复杂的种种形态中”[2](P187)。在这里,米歇尔强调了语言与图像之间漫长的斗争过程,认为两者之间辩证复杂的张力关系构成了文化的发展。如果说传统文化是语言实施着对图像的压制和控制,那么,进入当代的视觉文化时代,图像应该站在与语言构成对立面的基础上,消解语言中心主义的局面,通过制造图像和观看图像承担世界意义的建构。但是,图像的兴起以及形成的对语言的挑战,并不意味着图像取代语言成为知识体系和文化秩序的主宰,而是将图像在语言中心论的框架中解放出来,摆脱语言论的控制,在关注语言与图像之间的“互文”性阐发中重新挖掘和创造图像,让图像再度被发现,让图像彻底释放出自己的知识能量。

    图文之争与当代文学理论研究的新思路

    图文之争的介入给当代文学理论注入了新鲜血液。随着图像意识的增强,文学与传媒、文学与图像、文本形式、文学的存在方式、图像叙事与文本叙事等诸多问题越来越多地进入到文学理论研究的视野,成为人们关注的热点问题。如米歇尔在《图像理论?序》所说的那样:我们生活在一个视觉文化时代,所有的媒体都是混合媒体,所有的再现都是异质的,文学与视觉艺术之间的互动关系构成了再现,它们与权力、价值和人类的利益纠缠在一起,影响到文化模式的变化。一种阅读文化与一种观看文化之间的差异不仅是一个形式问题;它含蓄地指出社会性和主体性所采取的形式,一种文化所构成的各种个体和制度。在这里,我们可以发现:文学与图像的关系问题可以在媒体再现中找到交汇点。换句话说,图像与语言之间的关系并不是一种单纯的异质关系,两者之间的研究也不是一种简单的、毫无价值的平行对照,相反,两者之间内在的互动关系以及构成的外部关联使得不同艺术之间的关系研究成为可能。从这个意义上说,图像与语言的关系为文艺理论和美学研究提供了更广阔的空间,因为两者之间的关系在很大程度上突破了传统文艺理论观念。

    从历史上看,在语言学研究范式的框架中,文学理论研究的中心和旨归是文学语言本身,认为语言是一种线性的、稳定和逻辑的符号,先行地设定文化、文学发展变迁的规律。在这种观念中,语言占据主导优势,而图像只是语言之外与人的感性层面相关联的不可靠的形式,图像与语言根本无法联袂,亦无法在一种张力的结构中生发出更高意义上的思维模式。20世纪后期以来,随着视觉文化和读图时代的来临,单纯的语言学思维方法已经不能完整有效地对当今文学图像化和传媒化趋势作出有力的阐发,同时它也无法表征当前层出不穷的文学审美现象。

    因此,当前文艺理论研究必须摆脱传统文艺理论研究中的不合理方式,关切当代传媒视野中的文学现实问题,在正视语言学等研究方法的同时,侧重考虑在图像与文字之间寻找文艺理论研究的生长点。本雅明是建构此种研究范式的积极实践者和探索者,他在研究摄影与电影的过程中预言电影将成为未来语言的者,认为以文字和书籍为代表的传统印刷文化必将受到以图像为主的机械复制文化的冲击,这昭示着图文之争在现代文学艺术发展过程中将成为一个待解的问题。与本雅明不同,利奥塔从解构理论的角度对西方传统文艺理论中存在的理性与感性、理智与欲望、话语与图像、推论和感知等二元对立模式进行批判性考察,为感性、欲望、图像和想象力的存在寻找依据,解构西方传统的元叙事话语和思维模式,达到攻击现代性的目的。鲍德里亚比本雅明和利奥塔走得更远,他在由电脑所创造的虚拟图像世界中,反思和批判传统的文学生成和存在方式,认为虚拟图像比真实存在更完美真实。

    在此观念下,文学艺术与现实之间的关系应该重新设置和厘定,也就是说:图像与现实的脱节、虚拟与真实界限的消解,使得传统的“文学艺术模仿生活”的观念出现问题,这无疑对当代文艺理论研究产生重要影响。本雅明、鲍德里亚在文化和艺术层面上对图文关系的探索,深刻地表明文艺理论对图文关系的重视源于当代文化给作者和读者带来的新的创作和阅读感觉经验,它是对当下文学艺术发展的理论总结和建构。显然,西方文化领域对图文关系的研究已达到了一个很高的水平,其方法和思路不同于传统的美学与文艺理论研究,已进入到图像文化分析、社会历史分析、符号政治经济学分析的综合、交叉的层面,其研究主旨是在揭示图像与文学差异、互动和互通的特征,进而进入图文生产、消费与社会权力表达、文化模式变迁之间的复杂关系的探究上。

    当前国内文学理论研究领域,图文关系的研究也逐渐深入展开,这主要沿着两种思路进行:一是在文化研究的语境中,探讨图像与语言文字的关系,强调图像的强势原因、表现方式和审美效果等。这是当前文学遭遇图像时代问题的一种“宏大理论”式的阐发,这种研究并没有在图像与语言之间折叠、缠绕的复杂关系中解决文学变化的具体问题;二是沿着“文学是语言的艺术”的历史命题,在文学与传媒的关系日益紧张的今天,根据文学和视觉艺术两者的交叉渗透,从文学语言的角度来关注视觉艺术,同时强化从图像的角度来审视文学,试图在文学与图像之间建构一种互文性的文学理论。具体而言:从文学语言的角度研究视觉图像,就是理解图像如何借助物理时空的张力结构,来接近文学并通过语言立“象”达到充满想象力的审美至境。

    反之,从图像的角度来分析文学语言,就是理解图像如何赋予文学语言新的意义,探索图像在文学语言塑造过程中所具有的重要功能,比如研究表明两者之间的关系可以归纳为三种历史形态:以图言说、语图互仿和语图互文,以此揭示语图关系发展的规律。显然,以上所说两种研究的价值取向不同:前者侧重语言与图像的对立,以此勾画出当代文化模式的变迁,以及带来的审美方式的变化;后者则侧重语言与图像两种媒介所具有的思维方式交融凝聚到文学本身,回答文学在传播过程中因媒介不同而发生了怎样的变化。如果说前者侧重外部研究,那么后者则是从内部探讨文学的根本性问题。

    值得注意的是:在叙事学中,传统的文字叙事所固化的领域开始成为语图关系研究的重要目标,从而形成一种崭新的叙事文本研究,此研究围绕图像与文字两种不同的叙事特点,主要从叙事学的角度来考察图像与文字之间错综复杂的关系,突出图像对叙事文本的模仿和再现问题,旨在解构文字叙事在叙事传统中的绝对主流,摆脱与语词共存和竞争中图像的压抑性地位。通过图像与文字之间复杂关系的梳理,让两者在交互叙事中建构不同的价值维度,以此彰显不同的审美意义。诸如此类的研究对于我们今天重新理解文学有太多的启示,这昭示着当前文艺理论研究观念的重要转变,这些探索对于建构文学理论研究范式具有启发性和创新意义。

    图文之争与当前文学理论研究的几点反思

图像法论文篇(3)

中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2014)07(a)-0228-01

1 图像分割

作为一种图像技术,图像分割得到了人们广泛的研究与重视,并在实践中也得到应用。在图像应用中,图像分割技术可以在需要进行图像目标提取的工作中发挥重要的作用。如生物医学图像分析、遥感图像分析、文档图像处理、生产过程控制、在线产品检验以及工业自动化中都应用了图像分割技术。应用领域的不同也让图像分割技术具有着不同的名称,如目标追踪技术、目标识别技术、阀值化技术、目标轮廓技术等,这些技术的核心或者本身等同于图像分割技术。图像分割是将某个图像分为具有自身特色的几个区域,并对感兴趣区域提取的过程与技术。这里所提出的特色包括像素的纹理、颜色、灰度等,目标经过预先定义后可以指向单个区域,也可以指向多个区域。由于在研究图像和应用图像的过程中,往往只是对图像的某个部分感兴趣,所以为了对这些部分进行分析与辨识,有必要将他们提取和分离出来,并对他们进行利用,由此可见,图像分割是对图像进行处理以及分析的重要步骤。图像分割的方法多年来一直得到了人们的重视,基于多样化的分割算法基础上,将图像进行分割与分类的方法也非常多,比较通用的分类是根据图像中相邻像素在像素值方面表现出的两个性质:相似性与不连续性。虽然区域内部中的像素都具有相似性,但是不同区域边界上却具有着不连续性,因此,分割算法可以以此为依据分为基于边界的算法和基于区域的算法两种,另外,以分割过程中所使用的处理方法的差异,分割算法可以分为串行算法与并行算法。

2 模式识别理论基础上的图像分割

一般而言,模式识别需要由设计与实现两个过程来组成,设计指的是使用样本开展分类器设计,实现指的是使用设计完成的分类器来对待识别的样本开展分类决策。随着模式识别理论以及技术的发展,模式识别方法也得到了一定程度地创新,当前的模式识别方法主要包括统计模式识别方法;以句法规则结构化模式为依据的模式识别方法以及神经元网络模式识别方法。

图像分割所具有的难点在于分割依据的确定,即难以根据具有确定性的判定标准来对需要分割的图像各个部分开展判断以确定分割对象的位置,因此,基于知识的多特征多级判别的变化域分割概念被提出。在这一概念中,需要对特征进行分析,确定分割对象之间最明显的区分特征来作为分割依据,随后可以根据特征标准来使用经典的图像分割技术分割特征空间并得到可靠的位置结构。同时以分割精确度的差异为依据,开展多特征多级的分割,即在进行特征抽取后以具体需求为依据再次开展特征抽取或者开展多次的特征抽取,每一个提取过程中所使用的特征依据都需要达到减少分析区域的效果,并在此基础上对分割范围进行进一步的确定。具体而言,基于模式识别理论对分割问题作出考虑,分割对象可以根据图像本身的结构特性和统计特性分为分割类与非分割类。每一种事物都具有某些特征来与其他事物进行区分,所以在图像分割过程中也必然能够提取出一些和分割背景具有差异的特征来当做分割依据。在对定位对象进行分割的过程中,可以选择由这些特征所构成的特征空间来开展定位识别,所以本文认为,可以将图像分割的对象当做模式识别对象,把图像分割过程当做模式识别中识别特定模式类并以特征模式类特征为依据来进行分割的过程。

基于模式识别理论的图像分割主要分为四个步骤。

一是对分割对象本身所具有的所有特性做出分析,为分割需要提供依据。在图像分割过程中,选取这些特征的原则为更好、更容易的区分分割对象。在此方面又包括以下几点内容:可靠性,属于同类对象的特征应当相似。区别性,属于不同类别的识别对象所具有的特征值应当存在差异。独立性,在分割过程中所使用的特征应当不存在紧密关联。虽然十分相似的特征可以进行组合,但是不能当做相同的特征。对数量进行控制。特征个数的增加会增大模式识别系统在进行图像分割过程中的复杂程度,其中用于结构测试的样本数量会随着特征量的增加呈现出指数关系的增长。在模式识别理论基础上的图像分割工作中,一般需要开展大量的实验、计算与分析才能够充分了解分割对象所具有的特性,同时需要在具体的图像分割过程中寻找能够区别于复杂背景且稳定、有效的特征来当做图像分割的依据。

二是通过特征空间转换将图像转换成为确定特征基础上的特征空间。在此过程中变换域方法、神经网络方法以及模糊理论等方法都可以作为变换方法。这主要是由于图像分割过程中的复杂背景会产生很多的不确定性因素,并对特征的确定产生干扰,所以在开展图像分割之前,有必要采用数学方法和一些其他的学科理论来变换图像,其目的主要在于让特征这一作为图像分割的依据更加突出。

三是根据已经明确的特征范围和特征标准,采用合理的分割技术来分割特征空间,同时以分割对象的特征标准度范围和标准度量值为依据来匹配图像中的各个区域以确定需要进行分割的区域。另外在分割图像的过程中,最底层环节为图像处理技术,分割中的工作都需要建立在图像处理技术基础上。

四是当分割精度没有达到需求和要求时,有必要进一步开展特征选择,即对以上三个部分进行重复。

综上所述,模式识别理论对于提高图像分割效果而言发挥着重要作用。无论是模式识别理论还是图像分割作为一种具有先进性和现代化特点的技术都具有着良好的应用前景,但是在此过程中,需要认识到二者的发展以及应用价值的提升都需要二者本身做出不断的完善。单从模式识别理论在图像分割中的应用于完善方面来看,首先需要对单识别器的性能进行进一步的提高;其次有必要继续强化对多分类器集成方法的谈论与研究。这对于增加模式识别理论在图像分割方面的应用价值具有重要意义。

参考文献

[1] 靳富丽.模式识别理论及其应用[J].湖北广播电视大学学报,2007(12).

[2] 曾庆鹏,吴水秀,王明文.模式识别中的特征提取研究[J].微计算机信息,2008(1).

图像法论文篇(4)

中图分类号:TN929.11 文献标识码:A 文章编号:1007-9416(2015)11-0000-00

1引言

图像增强的目的是要改善图像的视觉效果,是一种基本的图像预处理手段,通过增强图像中的重要信息来改善图像的视觉效果,针对给定图像的应用场合,有目的地强调图像的局部或整体特性,将原来一些不清晰的图像变得清晰或强调一些感兴趣的特征,扩大了图像中不同物体特征之间的差别,抑制了一些不感兴趣的特征达到改善图像质量、丰富信息量,加强了图像判读和识别效果,满足图像在某些特殊分析中的需要。

图像增强可以有效改善原始图像的视觉效果同时可以对原始图像进行某种程度的滤噪。为计算机的后续处理提供了方便,其实质是有目的的抑制了图像中一些次要信息而加强了图像中某些重要信息。但是由于图像信息本身之间具有较强的相关性和图像存在的复杂性,在处理过程中在各个不同层次都有可能会出现不确定性问题,将粗粗集理论应用于图像的分析和理解,在有些场合比传统计算的方法(即使用一些精确、固定和不变的算法表达和解决问题的相关方法)具有更好的效果。近年来许多学者提出了用粗糙集理论用于研究不确定性问题,它不仅为智能信息处理提供了一种新的处理技术,同时也为信息科学和认知科学提供了一种新的科学逻辑和研究方法。近年来有些学者已将粗集理论用于图像处理相关方面的研究、分析。粗集理论作为一种新的计算方法(新计算方法的指导思想就是利用现有规则所允许的不确定性和部分真实性,以得到便于处理、鲁棒性和成本都较低的一种解决方案)与遗传算法、神经网络等方法一样,是极具发展潜力的智能信息处理技术。本文首先把图像看成是一个知识系统,根据粗集方法,基于其不可分辨关系,分割成不同的区域,提出了一种基于粗糙集理论的图像增强方法,获得了良好的增强处理效果。

2基于粗集理论的图像增强方法

利用粗集理论中不可分辨关系和近似空间等相关概念,首先把待处理图像定义为一个近似空间,则该近似空间存在一个等价关系,同时在待处理图像I中定义一个粗近似集为。

待处理图像的可移动窗为(),中心像素灰度值为,可以将该处理窗分成4个一维子窗口,分别为水平、垂直、和水平分别成45度和135度的四个子窗口如图1所示。

图1子窗口示意图

我们可以分别定义待处理图像的每个可移动窗中子窗口上的等价关系为:

(3)

其中是中心像素的灰度值,是第个子窗口,是待处理图像可移动子窗中的一个预定的等价误差类。则用表示子窗口内一定不存在灰度突变,用表示子窗口内可能存在灰度突变。于是可以定义在每一子窗口中满足这一等价关系的像元数目为,同时定义近似精度在每一个子窗口内:

(4)

其中集合的元素数目用表示。

我们同时再用来定义待处理图像的可移动子窗口的均值:

(5)

这样对原始图像通过粗集处理后可以得到一个新的线性加权图像(即增强后的图像为:

(6)

其中是图像的第个像素的灰度值,图像可移动窗中第k个子窗口的均值用表示,可移动窗中第k个子窗口的均值近似精度用表示,参数用来控制原始图像和粗集处理后的图像之间的平衡,一般取值大于1。

3实验结果

通过利用上述粗集处理,根据灰度相似性利用粗集中不可分辨关系对待处理图像进行了划分,待处理图像的处理窗内水平、垂直、45度和135度的4个一维子窗口4个不同方向子窗口划分得到四个相应的粗集及其近似精度,然后通过近似精度加权求得子窗口的均值加权和,并以此均值加权和代替待处理窗的中心像元的灰度值,以达到增强图像、平滑噪声的效果。由于采用了四个不同方向上的一维子窗口,并通过四个子窗口的近似精度加权求和,使得灰度相似方向上的子窗口均值对增强结果贡献相对较大, 达到抑制了噪声的同时使得图像边缘也得到了保护和加强。

参考文献

[1]张朝全,周绍景.梁颖.基于粗集与FCM的快速图像分割改进方法[J].昆明冶金高等专科学校学报,2015,03:60-64.

图像法论文篇(5)

图文之争与当代文学理论研究的新思路

图像法论文篇(6)

关键词:人脸;指静脉;独立成分分析;主元分析;图像质量;D-S证据理论

中图分类号: TP391.413 文献标志码:A

Abstract: For the fusing recognition with face and finger-vein at decision level, a new quality score of image by combining three indexes was presented, and an improved fusion strategy based on D-S evident theory was adopted to fuse two biometric characteristics. At first, the quality score of image was computed by combining index of distinct, contrast and coefficient. Then an improved method based on image quality and D-S evident theory was adopted. This improved method reduced the impact of maximum of image quality score and made the weighted parameter with the actual situation more consistent. Compared with the result of D-S evident theory with no regard to image quality, the results reveal that the fusion method in this paper based on D-S evident theory taking account of image quality information improves the performance.

Key words: human face; finger-vein; Independent Component Analysis (ICA); Principal Component Analysis (PCA); image quality; D-S evident theory

0 引言

生物特征识别技术为身份识别和信息安全等领域提供了一条便捷、高效、安全的新途径。目前常见的生物特征识别技术有人脸、指纹、虹膜、指形、静脉、掌纹、步态以及签名等识别技术,其中指纹和人脸识别技术则是最成熟、应用最广泛的技术。

然而这些生物识别方式都有各自的缺点,尚无能取代所有其他生物特征识别的特征,尤其是一些生物特征可能被复制和伪造,影响其安全性。但若能采用融合理论,综合多个生物特征,从理论和实践上都表明能得到比单一生物特征更优的识别性能和通用性[1-3]。

图像质量对生物特征识别系统的识别性能影响很大,对信息完整、图像质量高的样本库所获得的识别率,可能因为图像质量下降而迅速降低。文献[4-10]都对基于图像质量的生物特征做了深入的研究,取得较大进展。其中,Nandakumar等以虹膜和指纹为融合对象,对每次需要匹配的单个待测样本和模板样本的图像质量做出评价,给出一种基于图像质量的似然率指标,对此进行融合得到了满意的识别结论[4]。文献[5]则给出一种新的基于贝叶斯网络的基于图像质量的多生物特征融合系统,将生物特征图像质量和匹配值看作同等地位的量,用贝叶斯网络融合识别。Richiardi等对基于图像质量的语音、人脸、指纹和签名的图像质量评价指标作了综述并分析了将图像质量信息应用到多生物特征融合识别的方法[8]。Fierrez-Aguilara等在文献中分别就指纹与签名、指纹与语音的基于图像质量的融合方法做了分析,主要思路是在每次计算匹配值时考虑图像质量指标,再用基于支持向量机的方法进行融合[10]。

本文结合人脸和手指静脉两种生物特征进行融合识别,以提高识别的精确性和系统的通用性。针对图像采集中易产生噪声干扰,受光照等因素影响而生成质量差的图像,尤其是手指静脉图像采集困难,实现了一种基于图像质量信息加权的D-S证据理论融合手指静脉和人脸特征量的多特征融合识别系统。

1 融合识别系统结构

选择指静脉和人脸进行融合识别出于如下的考虑:静脉识别技术因可实现活体检测,具有更好的精确度和稳定性;速度快、特征唯一,安全性好;且静脉识别以非接触的方式进行认证,也易于被人们接受,并减少因皮肤表面的皱纹及污垢的干扰。而人脸识别作为一种被动识别方式,易于被人接受,也是目前实用化程度较高的一种生物特征识别方法。选择人脸和指静脉进行多生物特征融合识别,可利用人脸识别中成熟的识别算法,并发挥的指静脉识别精度高、不易被伪造的优势,形成互补。

考虑图像质量因素的影响,一种新的基于图像质量的加权D-S证据理论融合系统的结构如图1所示。

由于尚无公开的多生物特征测试数据库,这里选择ORL人脸库[11]和指静脉库[12]组成多生物特征库,包含40个对象,每人10幅人脸和指静脉图像,人为组合组成测试数据库,如图2(a)~(d)所示是其中的4组样本,这种人为的指定并不影响对融合结果的实验效果。

2 生物特征抽取

2.1 基于独立成分分析的指静脉特征抽取

静脉图像匹配方法包括结构匹配、模板匹配等,然后根据实验数据得到的阈值进行判断。

目前的静脉识别方法多集中在模板匹配或细节特征点匹配[13-15]、Gabor滤波和编码[16]等,例如Wan等提出基于细节点特征提取的指纹静脉提取方法,通过匹配汇合点和分叉点的方法实现手指静脉识别[14]。但较少利用静脉图像的全局信息或整体纹理信息进行分析的。这里借鉴独立成分分析在人脸、掌纹等生物特征识别中的应用[17-18],采用基于独立成分分析的方法来抽取特征量,具体步骤如下。

1)归一化图像。

为了方便处理和简化计算,将大小为376×328的原始图像剪切成为150×150大小图像。将该矩阵的每个列向量提出来串接成为一个列向量。新的列向量表示一幅原始图像,所以待处理的n幅图像就组成n×2250的一个矩阵N。

2)对N做独立成分分析。

采用FastICA算法[19],对N做去均值后,FastICA首先对数据做主元分析(Principal Component Analysis, PCA),保留主要信息的基础上,压缩数据;然后进行独立成分提取,经过独立成分分析法抽取特征后所得指静脉基图像的部分示例如图3所示。

补充图3中每个子图的图名。

2.2 基于主元分析的人脸特征抽取主元分析法抽取人脸特征

人脸识别作为生物特征识别中研究最早也较成熟的方法之一,特征提取方法有基于代数的特征提取方法,如最基本的独立成分分析法、主元分析法和线性判别分析法等。Turk等首先提出基于主元分析的特征脸概念,并取得很好的识别效果[20]。其基本思路是将人脸图像数据用基于二阶统计矩的提取方法,映射到主元分量子空间。这里为了分析手指静脉图像和人脸进行融合对识别性能的影响,选用主元分析的方法提取人脸特征。

对ORL人脸库做基于主元分析法的特征提取,首先计算人脸库的人脸图像平均值,然后求取基于主元分析的特征脸,如图4所示为基于主元分析法特征抽取后的部分特征脸示例。

3 基于图像质量信息的人脸和手指静脉特征融合

生物特征的图像质量对识别性能有重要的影响,随着图像质量的下降,识别率将迅速降低,甚至会导致错误的识别结果。而人脸图像的采集容易受光照、采集角度的影响;手指静脉作为一种新兴的生物特征方法,其图像采集更易受可见光、被采集个体等因素的影响,较易产生清晰度差、对比度弱的图像。针对这个存在较差图像质量的情况,若能够在识别过程进行前,对样本的质量信息进行量化,并弱化质量差的信号的影响,将有可能提高系统的识别性能。下面先给出一种组合的图像质量评价方法。

3.1 图像质量评估

图像质量是图像的一个重要信息,对图像质量的评价量主要有主观评价和客观评价,主观评价由人们根据自己的视觉感受,根据视觉效果做出评判,受主观因素影响较大;客观评价以图像内容的数学表示,通过定义定量的数学质量指标,进而判断图像信息[21-23]。客观评价标准分无参考和有参考两大类。有参考的图像质量评价量根据待测图像和标准图像之间的差异性来判断,差异性越大,说明图像质量与标准图像相差越大,质量越差,常用的指标有峰值信噪比和均方误差等。但应用过程中,标准图像的较难选择或找不到合适的量。图像质量评价的主要问题是评价指标的通用性差,对某些图像,有些指标甚至背离了人类视觉感受。

常用的图像质量评价可根据结构信息相似量、图像中包含信息量多少、图像对比度、清晰度和图像边缘信息等角度进行分析。以下是几种主要客观图像质量评价度量指标。

1)无参考图像质量指标。

无参考图像质量指标有图像的均值、图像的方差、图像的熵、拉普拉斯和值等。图像的熵的定义为:

H=-∑L-1i=0p(i) ln p(i)(1)

其中p(i)是灰度i的分布概率。该指标表示图像包含平均信息量多少的度量。熵值越大说明图像包含信息量越多。

2)有参考图像质量指标。

有参考图像质量指标有均方根误差、峰值信噪比、相关系数、结构相似度等。皮尔松相关系数定义为:

Qp=corrcoeff(IA,I)(2)

其中:I为待测图像,IA训练样本平均值,Qp为图像质量的量度值。

3)亮度对比值。

人们观察图像时,对局部区域的绝对亮度不敏感,对局部区域与相邻区域的相对亮度变化敏感,根据这一特点将图像划分成N×N的不重叠的子图像,第(m,n)个块的亮度对比度值定义为其亮度的标准差[21]:

Ic(m,n)=1N×N ∑n×N+Nj=n×N+1 ∑m×N+Ni=m×N+1(I(i, j)-I(m,n))2(3)

4)图像清晰度指标[22-23]。

清晰度方法是利用相邻像素点的差异来度量图像清晰度。利用高斯拉普拉斯算子:

LOG(x,y)是L0G,还是数学上的对数书写形式Log?即中间的是零,还是字符“o”?请明确。=-1πδ41-x2+y22δ2exp-x2+y22δ2(4)

其中:σ为高斯函数的标准方差,其值较小时,锐化图像;反之则平滑图像。常用大小为5×5的高斯拉普拉斯算子。

利用待测图像与高斯拉普拉斯算子卷积后的水平像素灰度均值来定义图像清晰度[22]:

Q0(y)=∑yI(x,y)*LOG这个“LoG”中,中间的字母是“o”,还是零?请明确。(x,y)(5)

Qq=1N∑yQ0(y)(6)

其中N为图像高度。若图像清晰,对应的Qq值大;反之若图像模糊,则每个像素附近的灰度值变化很小,对应的图像高频量小,Qq值也小。

5)组合的图像质量评价法方法。

本文根据图像质量评价指标的特点,综合图像清晰度Qq、亮度对比度Ic和相关系数Qp的质量评价指标,定义整体质量评价量为:

Qs=W1Qq+W2Ic+W2Qp(7)

图5是一组图像质量由好到差的样本,除了个体因素的差异外,主要是图像采集装置性能、光照条件等都不可能完全一致,导致了存在一定量的较差图像质量样本。其中图(a)、(b)图纹理清晰,对比度好,图(c)对比度强,图(d)、(e)质量较弱。

根据计算结果和主观评价赋予权值量W1,W2,W3分布为1,0.5,0.5。最后所得Qs如表1所示,所得结果和主观评价基本符合,能够反映图像清晰度和对比度,体现了人眼对图像质量的主观感受。

下面分析一种基于图像质量的加权D-S证据理论融合方法,来探讨考虑图像质量信息后对识别性能的影响。

3.2 基于图像质量加权的证据理论融合方法

由于待识别的对象个性差异及硬件因素,存在着图像噪声、图像质量差、所需生物特征信息缺损等不利因素,此外还有识别算法的内在缺陷,两个来自同一对象的生物特征可能得出不同的结果,这时常规的如加和、乘积、最大值法等融合策略的结果有可能比单生物特征识别还差。通过D-S证据理论对不确定信息的融合有望提高融合识别性能。

Vatsa等提出基于图像质量和Dezert-Smarandache理论的多个指纹特征融合识别方法[6]。首先对指纹图像的质量信息用基于冗余离散小波变换(Redundant Discrete Wavelet Transform, RDWT)方法求得度量值,然后对图像匹配值做基于图像质量评估度量值的增强,最后采用Dezert-Smarandache理论进行融合识别。

本文对Vatsa的对基于图像质量的图像匹配值增强方法作了改进,并对人脸和手指静脉图像进行基于图像质量D-S证据理论进行融合识别,具体方法如下。

先对图像采用式(7)方法计算图像质量的量化值:求出一组训练样本的平均值IA,然后计算每个待测样本的图像质量数Qs。

然后在D-S证据理论组合规则上,考虑图像质量因素的影响,将图像质量信息正则化,Vatsa采用Tanh方法,使得其范围在[0,1]。

在3.1节的图像质量评估分析中,本文采用组合的图像质量评估方法使其与主观评估相一致,但考虑到图像质量评估对不同光照、对比度和纹理等差别的反映情况不同,且通用性有限,其图像质量评估指标的最高值并不意味着该图像一定具有最强的可分性,本文对以上的图像质量信息正则化方法进行如下改进:

Qnorm=Qs-min(Qs)med(Qs)-min(Qs)(8)

该方法用中间值med(Qs)代替质量评估量化的最大值,减少图像质量最大值的影响,使正则化的结果更为恰当。

Vatsa采用的方法中对所有质量信息以阈值为0.5分作两种情况对特征匹配值进行基于图像质量的增强。根据本文采用的待融合生物特征,尤其是手指静脉图像,个别图像质量因光照和生物个体原因,难以根据该图像进行识别,根据这一情况,本文作如下改进,通过实验求得评估图像质量为差的阈值,该阈值以下的图像信息不参与融合识别。在图像质量分数值大于阈值时,可对特征匹配值进行基于图像质量的变换如式(9)所示:

Sqj=Qnormsj0.5, θ≤Qnorm≤0.5(1-Qnorm)sj0.5,0.5

下面采用D-S证据理论进行融合识别。Dempster于1967年提出D-S证据理论,之后Shafer用信任度函数和似然度函数扩展了该理论,成为处理不精确性的信息的数学方法,称做D-S证据理论[24-25]。该理论可看作对贝叶斯决策的推广,通过定义信任函数和似然函数把命题的不确定性问题转化成集合的不确定问题,解决因信息不完备或模糊性导致的不确定,只要求证据间相互独立。D-S证据理论已经成为不确定性决策的常用理论,可以用于决策分析或故障诊断等领域。

D-S证据理论作为表达和处理不确定性知识的数学工具,可有效处理单生物特征在识别系统中存在的冲突性和不确定性。利用人脸和手指静脉的基于D-S证据理论融合识别时,是由人脸和手指静脉两个识别子系统提供两个证据实现融合识别,其中首先需要确定每条证据的基本概率赋值函数。在此基础上,利用D-S证据理论的合成规则将相关证据生成一个新的证据,得到最后的可信度和判决结果。这里的证据信息来自两个识别子系统,保证了证据间相互独立。

定义U是完备的有限集合,用2U表示U所有子集和空集。

定义m(•)=2U[0,1],称做基本概率赋值,0表示完全不信任,1表示完全信任。对每个分类器有确认a和拒绝-a(-a=U-a)两个结果,计算相应的分类识别率作为基本概率赋值[6]。假设对一个输入模式类别为j(j∈c)被分配到包括拒绝类的k(k∈c+1)类,则分类器输出[24]为k的预测率Pk是输入模式正确分类的个数和被分类到k所有模式总数的比率。该方法表明对匹配值Sqj对第j个对象分类到k,所有对象被正确分类的可能性是Pkj,没有正确分类的可能性是1-Pkj,对第j个对象的基本概率赋值计算如式(10):

mj(k)=Pkj•sqj(10)

利用D-S证据组合规则,对多个证据的组合为:假定A,B用来计算焦元C新的信任函数,D-S证据组合规则:

m(C)=∑A∩B=Cm(A)m(B)1-∑A∩B=m(A)m(B)(11)

这里有两种生物特征对应两个分类器, j=1,2,在获得基本概率赋值后,利用基于证据理论的组合规则求:

mfinal=m1m2(12)

最后用阈值法进行判决。

判决结果=接受, mfinal≥t拒绝,其他 (13)

4 融合实验结果分析

本文选择ORL库和指纹静脉图像组合形成融合特征库。多生物特征库中每个对象每种特征的前5个样本进行训练,其余的样本进行测试。在进行同类测试和异类测试时候,计算欧几里得距离作为匹配值。采用基于图像质量因素的加权D-S证据理论融合,首先求取一组待融合的人脸和手指静脉图像的图像质量度量,根据第3章的方法将图像质量的信息增加到融合过程中。再采用D-S证据理论融合,对基本概率赋值进行组合,得到最后的融合结果。为评价和分析考虑图像质量信息的效果,与不考虑图像质量信息时的D-S证据理论融合作对比分析。将错误接受率(False Acceptance Rate, FAR)和错误拒绝率(False Rejection Rate, FRR)在同一坐标中表示的结果如图6所示,是对基于图像质量加权D-S证据理论融合和常规D-S证据理论融合的结果比较。

结果表明基于图像质量加权的D-S证据理论能降低识别结果的不确定性,提高识别性能,得到更好的识别效果。

已有较多研究工作[6-10]充分利用图像质量信息来提高识别系统的性能,这些文献中基于图像质量的融合识别不仅比单生物特征优越,也明显优于基本的Sum、加权和、最大或最小、乘积等融合策略,现将这些已有的考虑图像质量信息的融合方法加以比较,其中EER(Equal Error Rate)即等错误率,如表2所示。

5 结语

D-S证据理论定义信任函数和似然函数分析处理随机性或模糊性产生的不确定性,可避免先验概率和条件概率的求取。鉴于生物特征识别系统中图像质量对识别性能的重要影响,以及多生物特征(尤其是诸如手指静脉和人脸不相关的特征)融合识别可提升系统识别性能,本文结合融合理论利用多源信息的冗余性和互补性来克服信息的不精确性和不完整性,并考虑图像质量信息进行基于D-S证据理论的多特征融合识别分析。结果表明该方法可有效地处理不确定性和不精确性的信息,基于图像质量加权的D-S证据理论的多特征融合识别有效提高了系统的识别性能。

参考文献:

[1]

ROSS A, JAIN A K, QIAN J Z. Information fusion in biometries [J]. Pattern Recognition Letters, 2003, 24(13): 2115-2125.

[2]

HONG L, JAIN A, PANKANTI S. Can multibiometrics improve performance? [C]// Proceedings of 1999 IEEE Workshop on Automatic Identification Advanced Technologies. Piscataway: IEEE, 1999: 59-64.

[3]

JAIN A K, PANKANTI S, PRABHAKAR S, et al. Biometrics: A grand challenge [C]// Proceedings of the 17th International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2004: 935-942.

[4]

NANDAKUMAR K, CHEN Y, Jain A K, et al. Quality-based score level fusion in multibiometric systems [C]// Proceedings of the 18th International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2006, (4): 473-476.

[5]

MAURER D E, BAKER J P. Fusing multimodal biometrics with quality estimates via a Bayesian belief network [J]. Pattern Recognition, 2008, 41(3): 821-832.

[6]

VATSA M, SINGH R, NOORE A, et al. Quality-augmented fusion of level-2 and level-3 fingerprint information using DSM theory [J]. International Journal of Approximate Reasoning, 2009, 50(1): 51-61.

[7]

FIERREZ-AGUILAR J, CHEN Y, ORTEGA-GARCIA J, et al. Incorporating image quality in multi-algorithm fingerprint verification [C]// Proceedings of the International Conference on Biometrics. Berlin: Springer-Verlag, 2006: 213-220.

[8]

RICHIARDI J, KRYSZCZUK K, DRYGAJLO A. Quality measures in unimodal and multimodal biometric verification [C]// Proceedings of the 15th European Conference on Signal Processing. Poznan, Poland: EURASIP, 2007: 301-310.

[9]

SINGH R, VATSA M, NOORE A, et al. DS theory classifier fusion with update rule to minimize training time [J]. IEICE Electronics Express, 2006, 3(20): 429-435.

[10]

FIERREZ-AGUILAR J, ORTEGA-GARCIA J, GONZALEZ-RO-DRIGUEZ J, et al. Discriminative multimodal biometric authentication based on quality measures [J]. Pattern Recognition, 2005, 38 (5): 777-779.

[11]

AT&T Laboratories Cambridge. The ORL database of faces [EB/OL]. [2011-03-25]. .

[12]

余成波,秦华锋.手指静脉识别技术[M].北京:清华大学出版社,2009.

[13]

MIURA N, NAGASAKA A, MIYATAKE T. Feature extraction of finger-vein patterns based on repeated line tracking and its application to personal identification [J]. Machine Vision and Applications, 2004, 15(4): 194-203.

[14]

WAN LINGYU, LEEDHAM G, CHO D S-Y, et al. Minutiae feature analysis for infrared hand vein pattern biometrics [J]. Pattern Recognition, 2008, 41(3): 920-929.

[15]

WAN LINGYU, LEEDHAM G. A thermal hand vein pattern verification system [C]// Proceedings of the Third International Conference on Advances in Pattern Recognition and Image Analysis. Berlin: Springer-Verlag, 2005: 58-65.

[16]

YANG JINFENG, SHI YIHUA, YANG JINLI. Personal identification based on finger-vein features [J]. Computers in Human Behavior, 2011, 27(5): 1565-1570.

[17]

BARTLETT M S, MOVELLAN J R, SEJNOWSKI T J. Face recognition by independent component analysis [J]. IEEE Transactions on Neural Network, 2002, 13(6): 1450-1464.

[18]

DENIZ O, CASTRILLON M, HERNANDEZ M, et al. Face recognition using independent component analysis and support vector machines [J]. Pattern Recognition Letters, 2003, 24(13): 2153-2157.

[19]

HURRI J. FastICA [EB/OL]. [2011-04-19]. cis.hut.fi/projects/ica/fastica.

[20]

TURK M, PENTLAND A. Eigenfaces for recognition [J]. Journal of Cognitive Neuroscience, 1991, 3(1): 71-86.

[21]

李奇,冯华君,徐之海,等.数字图象清晰度评价函数研究[J].光子学报,2002,31(6):736-738.

[22]

王鸿南,钟文,汪静,等.图像清晰度评价方法研究[J].中国图象图形学报,2004,9(7):828-892.

[23]

WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment: From error visibility to structural similarity [J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.

[24]

PARIKH C R, PONT M J, JONES N B. Application of Dempster-Shafer theory in condition monitoring systems: A case study [J]. Pattern Recognition Letters, 2001, 22 (6/7): 777-785.

[25]

DEZERT J. Foundations for a new theory of a plausible and paradoxical reasoning [J]. Information and Security Journal, 2002, 12(1): 13-57.

图像法论文篇(7)

中图分类号:j0 文献标识码:a

2012年6月在南京举办了“图像与表演国际学术研讨会”。与会者就图像与表演之间的关系各自做了主题发言和探讨。这是一个基于艺术学理论的实践研究主题的学术会议,目的在于探讨不同艺术门类之间的关系,以及探讨不同门类艺术的共同规律,并以此寻求艺术的本质与艺术原理。当代各种媒体视屏的传播功能,使人们感到图与图像在传播中的“读图时代”是不可抗拒的。但是如何理解“读图时代”中“图”的概念和含义,是图还是图像,如何区别,一些学者试图把戏剧戏曲和影视中截取的“图”作为“图像”,并以此探讨“图像与表演”的课题。但问题也就随着学者们的探讨出现了。图与图像,我们究竟作何理解。它们仅是概念不同而内涵一样吗?显然,由于一些学者把图与图像混用,或看成没有区别的视觉文化,因而探讨结果依然是表演艺术范畴之内的问,题,并没有涉及到图像——造型艺术的问题。表演艺术与造型艺术之间的关系和规律没有得到有效的解决。因此,“图像与表演”或者说造型艺术(美术学),与表演艺术(戏剧戏曲影视学)的关系,需要依赖艺、术学理论的原理来思考图与图像的概念与内涵等问题,并以此解决好这两种艺术门类之间的学理关系。

一、图与图像

“读图时代”似乎成为我们这个时代的一个显著特征。实际上,“图”与“图像”是两个完全不同的概念,其内涵也不同。所谓读图时代的“图”并非都是图像,故此人们才感受到读图时代越来越简单与平面化。读图时代的“图”多是一种后文化时代的产物,其特征是简单、浮躁、肤浅、无深度、游戏性,最大限度的碎片化。“碎片化”是“图”的总体特征,我们也可以将“图”称为“图片”,但不可称为“图像”。图像,具有独立性、完整性、自足性和系统性的特征,它不是偶然的符号集合。图像的“孕育性”具有图像学和叙事学的意义,可阐释,可叙事,包含了某种意义(象征、隐喻等),是“图”与“像”的整合,具有独立意义的传播功能。中国传统文化中的治学方法是“左图右史”。即“置图于左,置书于右;索像于图,索理于书。”(郑樵《通志略·图谱略》)“图”指的是图形,“像”指的是图形中深藏的含义。《说文解字》云:“像,似也”。段玉裁注:“然韩非之前或只有象字,无像字。韩非以后小篆即作像。许断不以象释似,复以象释像矣。系辞日,爻也者,效此者也。象也者,像此者也。又日,象也者,像也。……盖象为古文,圣人以像释之。虽他本像亦作象。然郑康成、王辅嗣本非不可信也。凡形像、图像、想像字皆当从人,而学者多作象,象行而像废矣。”段注提到了“图像”,意在解释“像”的出处与来历,像与爻辞功能大体一致,故圣人以像释之。《易·系辞上》云:“仰以观于天文,俯以察于地理,是故知幽明之故。”《易·系辞下》又云:“仰则观象于天,俯则观法于地”。“观天文”实为观天象(像),与“索图于像”,说明了二者合二为一的“图像”,自有深妙的玄机。《易·系辞上》所指的“河出图,洛出书,圣人则之”的“图”,当为“图像”理解,很有玄机可阐释。当今“图像”与西说融合,基本上属于美术学(造型艺术)意义的范畴,有独立的自足的编码符号系统。即显示了母题、主题、意象、形象、结构以及相关联的系统,这与西方图像志与图像学有关分析和阐释的对象——图像的理论有关。因此,图像一系列的编码符号(图像逻辑)隐藏有深刻的含意,具有阐释学和叙事学的意义。不仅如此,作者(艺术家)赋予给图像的精神与情感是丰富的和完整的。当然,一些折射了历史、文化、民族、社会等价值的具有可阐释性、叙事性的摄影作品,也因此可作为图像来分析和

阐释。

图不具有上述所说的图像的编码符号与意义。图是时间过程中一瞬间截取的片段,是非独立性、非自足性和非系统性的时间碎片,不孕育整个时间过程,其精神和情感也是散碎的。因而,图不具有图像学的意义,也无叙述性。如一些出现在影视、戏剧戏曲或舞蹈表演中一个画面的截取图——剧照,不具有图像学的意义。也就是说,无法从图像志的辨析到图像学的阐释,没有叙事的性质。如同连环画中每一页都是图,不完整,没有独立性,不可阐释。概言之,图的碎片特性,缺乏图像逻辑的系统。正因为如此,连环画的图才配以文字,并且由众多的图构成一本可阐释的、可解读的具有完整性的连环画。连环画的每一页仅仅是孤立的图,而不是图像。影视、戏剧戏曲和舞蹈等中截取出来的图——剧照,仅仅是图而已,而不是图像。今日流行的动漫(学科上归属影视戏剧戏曲学)、网络上流传的照片,等等,皆为图,非图像。正是应为这些“图”充满了我们的视觉世界,我们才惊呼读“图”时代的来临。但仅仅是“图”的到来,而非真的“图像”的到来。因为我们的视觉文化大都是图,所以我们感到今天的“读图时代”越来越简单,越来越觉着肤浅。而真正的图像却受到图的冲击,使我们难以辨认,或根本没有认识到图像本身到底是什么。于是有的学者认为图像与表演无法辨分:图像就是表演,表演就是图像。这种认识是值得商榷的,主要问题在于把图与图像混同了。

图像包含了最基本的单位或元素——母题、主题、意象、结构以及与之相关联的符号等。人们通过对母题的分析与辨认,最后进行图像学对主题的阐释与研究,这是对图像的基本研究路径和研究手段。这就涉及到图像的符号以及编码问题。19世纪西方产生的图像学理论主要是对古希腊和中世纪宗教艺术的图像进行研究的一种方法,并由此使艺术史研究进入到人文主义的学科中。法国艺术学家埃米尔·所著的《图像学:12世纪到18世纪的宗教艺术》便可使我们了解图像学研究的对象,并由此也了解西方“图像”一词所指的含义了。图像学成为艺术史学家对图像隐藏的某种文化、思想、宗教或历史最完美的解释。阐释和研究的这些图像本身有这样几种特征:其母题或主题隐含或象征了某种意义,显现了它的历史性、社会性、政治性、宗教性和叙事性的特征。西方最早被认可为图像的不是别的,正是那些被今天称为宗教的和古典的“艺术”。它们是由“艺术家”依据某种意图而创作的。某个艺术(图像)体现了某个“艺术家”思考和表达的意图,或者表现了他者(教会或赞助者)的意图。“在12和13世纪意大利和法国艺术中我们可以找到许许多多类似的例子,即,艺术家直接和精心地从古典的母题中借用了母题,却把异教的题材改变成基督教题材。”母题、主题、意象等,都是经过艺术家或赞助者的意图来编译符号构成了图像不可缺少的元素并由此产生了意义,从这个层面上说,图像还具有符号学的意义。结构是图像隐含的内容之一,是符号系统的编码程序。如何构图画面,如何取舍母题或意象,并从各种构成关系中产生某种特定的主题,这就是创作者所要思考的结构要素。西方中世纪的宗教图像,是创作者与赞助人(教会组织)共同完成的艺术(图像)形态。当代学者研究与阐释它们,提出了图像学的研究方法,同时还提出了一个肖像学(圣像学)的概念,“肖像学是艺术史中研究与艺术形式相对的艺术题材或含义的一个分支。”正是因为这些中世纪的艺术(图像)具有象征意义、为现代人难以知晓的隐喻,以及它们隐藏的事件和某种可叙事的关联情节,才被研究者称为图像。在西方,图像显然包含了中世纪的宗教绘画与雕刻,通过运用图像学方法研究,揭示这些图像在中世纪宗教文化系统中的现象和宗教文化的形成与变迁,以及图像所暗示出来的宗教思想与其它观念。图像学研究不仅仅是针对宗教艺术图像的研究,也包含对古希腊艺术(图像)的研究,其实际目的还是因为中世纪宗教艺术中,借用了古典艺术的母题,但因某种主题的需要而使母题发生了变异。图像学正是要阐释这种变异而叙事新主题的含义。因此,图像学研究和阐释的是,西方各个时期图像所显示的文化形成和变迁,以及这些图像隐藏的文化、社会、宗教、思想与政治的意义。西方现代图像学转向对所有图像领域的研究与阐释,因为图像中最要的是它包含了思想与观念,显示了图像中某种历史与观念。

不难理解,图像就是我们今天说的造

艺术,是空间艺术的概念,非时间艺术的概念,是艺术家的独立创作的作品(图像)。艺术家在创作作品(图像)时,都有自己的思路、观念和企图,这就是我们说的一整套艺术构思和技术,也可以说是“编码系统”,故此自成独立的系统。一些摄影作品,由于摄影师有意识地选取某些重大的事件进行抓拍,使其作品本身具有了叙事性因素,随着时间的推移成为将来历史中的某个重要事件,再经过一些艺术化形式的处理,如构图剪裁、光线等暗房技术的处理,使摄影作品成为可阐释和可叙述的图像。还有一些摄影作品,经过摄影者后期制作处理,即后期编码,使其成为图像。当代一些广告摄影作品,之所以也可以称为图像,是因为这些广告被摄影师按照商家和市场(客户)的消费观念的需求,以及时代文化时尚包括审美属性等,即我们通常说的“设计意图”,进行了“观念”的处理,做了后期编码制作,使其突出商业与市场价值的效应并体现了设计师的设计理念,体现了“我消费,故我在”的当代消费文化时代的观念,具有独立的意义。当然广告这类图像比起我们前面描述的图像来讲,因为广告图像注重的是商业价值和商业效应,它缺少叙事学的意义,即使阐释也是单向的,隐含的人文思想较少。总之,广告设计经过“编码系统”的处理,较多的是体现了某个阶段的时尚设计观念或创意理念,自身也构成了独立的、可解读的和阐释的价值体系。

质言之,图像应该具有这样几个术语来指向它的全部意义:形式、形象、母题、主题、意象与象征(寓言)。

图或图片,无上述我们说的这些基本元素。之所以说“读图时代”是肤浅的、无深度的,甚至是游戏性的,就在于“读图时代”的图没有独立性,没有编码的符号系统,缺乏隐含的历史性独特含义,没有叙事的结构。这就是造成我们今天焦虑读“图”时代肤浅的根本原因。尤其是今日的各种媒体在传播过程中的视觉文化现象,基本上是贴“图”视觉现象。因此,才被认为当今是“读图时代”。也有西方后现代文化理论家认为媒体与语言发生的词与物的关系,使当代的视觉文化现象具有“图像转向”的意义。但是,“不管图像转向什么,应该清楚的是,它不是回归到天真的模仿、拷贝或再现的对应理论,也不是更新的图像‘在场’的形而上学,它反倒是对图像的一种后语言学、后符号学的重新发现,将其看作是视觉、机器、制度、语言、身体和比喻之间复杂的互动。它认识到观看(看、凝视、观察实践、监督以及视觉)可能是与各种阅读形式(破译、解码、阐释等)同样深刻的一个问题,视觉经验或‘视觉读写’不能完全用文本的模式来解释。”这里我们看到了,即使西方后现代文化理论阐释图像并使图像转向成为后现代文化阐释,图像依然脱离不了上述的“术语”。不是任何“图”都是可以作为“图像”来认识的。

二、表演艺术中的碎片影像

表演是时空艺术,它包含了造型元素,又必须需要时间完成叙事。它包括了早期传统的舞蹈、戏剧戏曲和后来工业社会的电影电视。这些是不同历史阶段的表演艺术形式和现象,虽有差异,但其艺术的本质和规律是不变的。时间艺术是需要在一段时间内展现其叙事的结果,它不暗示某种未完结的内容或含义。因此,“时间”就是表演艺术的主要叙事方式。然而作为空间艺术的那些图像,它们的叙事是在阐释者的阐释中完成的,故此阐释(破译、解码等)是空间艺术的主要叙事方式。表演艺术的“时空”也是它的存在的方式;作为造型艺术的图像的“空间”是它存在的方式。艺术分类学依据艺术的存在方式分类,把艺术分为时间艺术与空间艺术,表演一类的同时具有时间与空间性质,故为时空艺术。也正应为如此,表演某些性质又复杂一些。在一般人的心理上,读图看似比较简捷和容易,一眼望去尽收眼底。现代人们的生活方式越来越紧张,时间越来越“少”,人们沟通的方式依赖电脑等多媒体视屏技术,视觉文化便在各种媒体上呈现。“读图时代”正是这种社会生活现状中产生的。“读图时代”的中的“图”的概念是混杂的,事实上是包含了“图”与“图像”。但是,表演艺术中截取下来的图(剧照或还不如剧照的图),以及动漫作品中截取下来的图,只能是图,或称为影像碎片,不能作为图像。这种影像碎片的图,貌似成为了空间艺术,其实不然。原因就在于它不可阐释,不可叙事。它阐释的符号是乱码,叙事的主要方式——时间没有了。也不是空间的艺术,因为它是

从时间艺术中抽离出来的瞬间碎片的影像,没有经过编码系统的过程,不具有自足性的独立特征。

在南京举行的“图像与表演”主题的国际学术会议,主办方是中国艺术学理论(原艺术学)学科的发源地、全国唯一的“艺术学理论”重点学科的东南大学艺术学院,也是全国首家艺术学理论的博士点授予权单位和全国首家艺术学理论博士后流动站单位。其举办“图像与表演”会议的宗旨与目的不言而喻,就在于探讨造型艺术(图像)与表演艺术(影视戏剧戏曲)之间的某些关系。这是一个基于艺术学理论实践层面研究课题的国际学术会议。一些研究者把注意力放在了表演艺术中的图与表演本身的研究视野中。他们几乎都把图与图像混淆了,以至于有的学者认为,当今的图像与表演无法分清。造成这种误读的根本原因,就是没有打通最关键的三个门类艺术——美术学、音乐学与舞蹈学,缺乏研究和架构艺术学理论的学术能力,错把“图”当作“图像”了。因而,所研究的图像与表演之间的学理问题,实际上依然是表演艺术自身的问题。即用戏剧戏曲影视中截取下来的图片,探讨戏剧戏曲和电影自身的问题,与造型艺术的图像没有关联。甚至一些与会者,还把一些采用社会学方法收集的一手资料图片,作为图像来理解。这些一手资料的图片对于帮助和了解研究者考察某个民族的传统文化习俗,具有资料性的考证意义和价值。但仅是图片资料,非图像资料。

艺术学理论学科的重要创始人张道一先生,很早就对从事艺术学理论研究者提出了要求,他指出研究者必须将美术、音乐与舞蹈这三门打通,这是从事艺术学理论研究者所必须具备的基本要求和学术能力。张道一先生在“艺术三要素”中,始终反复强调了研究者要打通艺术的“三大块”:美术、音乐与舞蹈,掌握它们、了解它们共同规律和基本原理。不仅如此,张道一先生还强调要抓住艺术的“三要素”:思维、载体、技巧,才能抓住艺术的真谛,“可以说思维、载体、技巧是创作艺术的三条腿,三足鼎立不但站得稳而且走得远。”张道一先生的“艺术三要素”分别从艺术创作与艺术理论两个方面探讨了艺术“三大块”与“三要素”的关系问题。目的就是阐明艺术学理论研究的基本原理和基本理论必须建立在打通美术、音乐与舞蹈三门学科基础上,建立在艺术实践中对艺术的思维、载体和技术的掌握的基础上。一个从没有从事过造型艺术创作的艺术学理论研究者,对图与图像的理解自然难度很大。他无法理解“图像”为什么是独立的系统,为什么“图”就不是独立的系统。艺术离不开思维,这是最基本的。造型艺术的图像首先是需要艺术家的思维,他要在作品中表达自己的思想、观点、看法和态度,使作品具有某种意义。载体是艺术呈现的物质形式,没有物质这个载体,艺术永远不能够实现物质化,艺术品无法产生,艺术家的思想、观念、看法和态度等,都只能装在他的头脑中,表达不出来。选择什么物质作为承载艺术的载体,是艺术的本体问题,物质关系到艺术的语言、表达和技术等艺术的本体问题。但是,有了思维和载体,不等于就有了艺术作品。艺术家如何表现他的思想和观念等,还必须依赖于艺术的技巧。如果一个造型艺术家(画家、雕塑家),没有掌握一定的艺术技巧,再好的思想或想法也是无法表现出来的,或者创作不出来好的艺术品。艺术技巧的好坏不但影响到艺术家思想观念的表达,也影响到艺术作品的品质和艺术价值。这三者是相互叠加与印证作品(图像)的自足系统的,使艺术作品(图像)产生了独立的、完整的图像学与叙事学的意义,具有文化与艺术的价值和意义。  表演艺术中截取某个瞬间的图,仅仅是整个时空艺术中的一个“碎片影像”。对这样的碎片影像作完整的描述,只能将无数碎片影像叠加起来还原到时间的方式逻辑系统中才能做到。这样做实际上依然还原为表演艺术的形态,或者就是连环画的形态。把电影转换为“连环画”的这种形态,是上世纪70年代我国很流行的一种阅读方式,用碎片影像组成一组一组的画面,图片的下面配上一段文字说明,这就是“电影连环画”。我把这种阅读形式称为看“静态电影”。这就说明了“图”不是“图像”。我们不能把影视戏剧戏曲中截取的影像——图,这些乱码碎片,当作图像并试图进行阐释。企图对碎片影像这样的图作图像学的阐释和叙事学的文本诠释,其结果都是无法进行的。即便试图对这些影像图进行阐释与诠释,阐释或诠释者也是依据已知的表演

图像法论文篇(8)

    “语言学转向”强调的是世界是由语言建构的,语言符号之间的不断转换产生了世界的意义,换句话说:意义的产生不过是一种语言到另一种语言的转换过程,这种转换完成了语言对世界的编码。从这个意义上说,我们生活的世界不是一个经验和实体的世界,而是一个语言符号的世界,我们的知识和认识是由语言来塑造的,在语言的主宰下,语法、句法、语用、词汇、话语、语境、意义、文本、叙事、修辞等跟语言学相关知识被广泛运用到其它学科领域中,以至于语言学的模式和方法成为人文科学普遍的思维模式和方法,因此,“语言与存在”取代了传统的“思维与存在”的命题成为整个知识范式转换的重要表征,这也从根本上揭示了语言的本体含义,它远非工具,而被看作存在本身,正如维特根斯坦所宣称:全部哲学就是语言批判,想象一种语言就意味着想象一种生活方式。从历史实践上看,作为人类交往活动中最常见的两种媒介形式,图像与语言文字相比所处的地位不一样。在文字发明之前,图像是先民表达和记录的方式;当文字出现之后,文字以语法和修辞结构来表达具有丰富的联想性和多义性的意义,而图像被降低为识字的辅助手段。因此,在很大程度上,图像被认为是感性的、直观的、平面的、零碎的,人们重视语言的理性逻辑,强调语言与图像的异质性,而忽视图像与语言之间的辩证关系,以及图像的独立性和意义的建构性。米歇尔发起了对语言主导文化的解构性批判,他认为:“文化的历史部分就是图像符号与语言符号之间争取支配地位的漫长斗争的历程,任何一方都是为自身而要求一个可以接近‘自然’的特权。在某些时刻,这种斗争似乎进入了沿着开放边界展开的自然交流;而另一些时刻(恰如莱辛的《拉奥孔》)这些边界关闭了,彼此相安无事。所谓的颠覆关系就存在于这一斗争最有趣和最复杂的种种形态中”[2](P187)。在这里,米歇尔强调了语言与图像之间漫长的斗争过程,认为两者之间辩证复杂的张力关系构成了文化的发展。如果说传统文化是语言实施着对图像的压制和控制,那么,进入当代的视觉文化时代,图像应该站在与语言构成对立面的基础上,消解语言中心主义的局面,通过制造图像和观看图像承担世界意义的建构。但是,图像的兴起以及形成的对语言的挑战,并不意味着图像取代语言成为知识体系和文化秩序的主宰,而是将图像在语言中心论的框架中解放出来,摆脱语言论的控制,在关注语言与图像之间的“互文”性阐发中重新挖掘和创造图像,让图像再度被发现,让图像彻底释放出自己的知识能量。

    图文之争与当代文学理论研究的新思路

    图文之争的介入给当代文学理论注入了新鲜血液。随着图像意识的增强,文学与传媒、文学与图像、文本形式、文学的存在方式、图像叙事与文本叙事等诸多问题越来越多地进入到文学理论研究的视野,成为人们关注的热点问题。如米歇尔在《图像理论?序》所说的那样:我们生活在一个视觉文化时代,所有的媒体都是混合媒体,所有的再现都是异质的,文学与视觉艺术之间的互动关系构成了再现,它们与权力、价值和人类的利益纠缠在一起,影响到文化模式的变化。一种阅读文化与一种观看文化之间的差异不仅是一个形式问题;它含蓄地指出社会性和主体性所采取的形式,一种文化所构成的各种个体和制度。在这里,我们可以发现:文学与图像的关系问题可以在媒体再现中找到交汇点。换句话说,图像与语言之间的关系并不是一种单纯的异质关系,两者之间的研究也不是一种简单的、毫无价值的平行对照,相反,两者之间内在的互动关系以及构成的外部关联使得不同艺术之间的关系研究成为可能。从这个意义上说,图像与语言的关系为文艺理论和美学研究提供了更广阔的空间,因为两者之间的关系在很大程度上突破了传统文艺理论观念。从历史上看,在语言学研究范式的框架中,文学理论研究的中心和旨归是文学语言本身,认为语言是一种线性的、稳定和逻辑的符号,先行地设定文化、文学发展变迁的规律。在这种观念中,语言占据主导优势,而图像只是语言之外与人的感性层面相关联的不可靠的形式,图像与语言根本无法联袂,亦无法在一种张力的结构中生发出更高意义上的思维模式。20世纪后期以来,随着视觉文化和读图时代的来临,单纯的语言学思维方法已经不能完整有效地对当今文学图像化和传媒化趋势作出有力的阐发,同时它也无法表征当前层出不穷的文学审美现象。因此,当前文艺理论研究必须摆脱传统文艺理论研究中的不合理方式,关切当代传媒视野中的文学现实问题,在正视语言学等研究方法的同时,侧重考虑在图像与文字之间寻找文艺理论研究的生长点。本雅明是建构此种研究范式的积极实践者和探索者,他在研究摄影与电影的过程中预言电影将成为未来语言的者,认为以文字和书籍为代表的传统印刷文化必将受到以图像为主的机械复制文化的冲击,这昭示着图文之争在现代文学艺术发展过程中将成为一个待解的问题。与本雅明不同,利奥塔从解构理论的角度对西方传统文艺理论中存在的理性与感性、理智与欲望、话语与图像、推论和感知等二元对立模式进行批判性考察,为感性、欲望、图像和想象力的存在寻找依据,解构西方传统的元叙事话语和思维模式,达到攻击现代性的目的。鲍德里亚比本雅明和利奥塔走得更远,他在由电脑所创造的虚拟图像世界中,反思和批判传统的文学生成和存在方式,认为虚拟图像比真实存在更完美真实。在此观念下,文学艺术与现实之间的关系应该重新设置和厘定,也就是说:图像与现实的脱节、虚拟与真实界限的消解,使得传统的“文学艺术模仿生活”的观念出现问题,这无疑对当代文艺理论研究产生重要影响。本雅明、鲍德里亚在文化和艺术层面上对图文关系的探索,深刻地表明文艺理论对图文关系的重视源于当代文化给作者和读者带来的新的创作和阅读感觉经验,它是对当下文学艺术发展的理论总结和建构。显然,西方文化领域对图文关系的研究已达到了一个很高的水平,其方法和思路不同于传统的美学与文艺理论研究,已进入到图像文化分析、社会历史分析、符号政治经济学分析的综合、交叉的层面,其研究主旨是在揭示图像与文学差异、互动和互通的特征,进而进入图文生产、消费与社会权力表达、文化模式变迁之间的复杂关系的探究上。当前国内文学理论研究领域,图文关系的研究也逐渐深入展开,这主要沿着两种思路进行:一是在文化研究的语境中,探讨图像与语言文字的关系,强调图像的强势原因、表现方式和审美效果等。这是当前文学遭遇图像时代问题的一种“宏大理论”式的阐发,这种研究并没有在图像与语言之间折叠、缠绕的复杂关系中解决文学变化的具体问题;二是沿着“文学是语言的艺术”的历史命题,在文学与传媒的关系日益紧张的今天,根据文学和视觉艺术两者的交叉渗透,从文学语言的角度来关注视觉艺术,同时强化从图像的角度来审视文学,试图在文学与图像之间建构一种互文性的文学理论。具体而言:从文学语言的角度研究视觉图像,就是理解图像如何借助物理时空的张力结构,来接近文学并通过语言立“象”达到充满想象力的审美至境。反之,从图像的角度来分析文学语言,就是理解图像如何赋予文学语言新的意义,探索图像在文学语言塑造过程中所具有的重要功能,比如研究表明两者之间的关系可以归纳为三种历史形态:以图言说、语图互仿和语图互文[3],以此揭示语图关系发展的规律。显然,以上所说两种研究的价值取向不同:前者侧重语言与图像的对立,以此勾画出当代文化模式的变迁,以及带来的审美方式的变化;后者则侧重语言与图像两种媒介所具有的思维方式交融凝聚到文学本身,回答文学在传播过程中因媒介不同而发生了怎样的变化。如果说前者侧重外部研究,那么后者则是从内部探讨文学的根本性问题。值得注意的是:在叙事学中,传统的文字叙事所固化的领域开始成为语图关系研究的重要目标,从而形成一种崭新的叙事文本研究,此研究围绕图像与文字两种不同的叙事特点,主要从叙事学的角度来考察图像与文字之间错综复杂的关系,突出图像对叙事文本的模仿和再现问题,旨在解构文字叙事在叙事传统中的绝对主流,摆脱与语词共存和竞争中图像的压抑性地位[4]。通过图像与文字之间复杂关系的梳理,让两者在交互叙事中建构不同的价值维度,以此彰显不同的审美意义。诸如此类的研究对于我们今天重新理解文学有太多的启示,这昭示着当前文艺理论研究观念的重要转变,这些探索对于建构文学理论研究范式具有启发性和创新意义。

    图文之争与当前文学理论研究的几点反思

    20世纪80年代以来,国内文艺理论界关于本质主义与反本质主义一直存在论争,不同观点的研究者在本质建构和拆解的论争中宣扬自己的文学理论观念。图像与文学的关系问题作为文艺理论研究的现实问题,在为文艺理论营建新的研究思路的同时,跳出本质主义、历史主义和解构主义等思维模式,力求返回文学活动本身,沿着亚里士多德所设定的文学媒介理论的路线寻求“拯救文学现象”,这无疑将为我们重新反思文学理论研究提供了契机。首先,文艺理论研究应从文学现实出发,避免抽象化。何谓文学现实?在我看来,其实质就是被文学本质思维模式所遮蔽的文学发展过程中文学与其他文化形式交织、文学本身新变的现实问题。在本质主义与反本质主义理论观念指引下,文学理论研究大都围绕原典或抽象概念的演绎展开讨论,试图勾画出一幅以理念存有为深层基础的文学图景。这是一种本质先行的理论模式,此种模式直接规定文学之为文学的本质,达到一种理论自身的自洽性和完美性,最终,文学现象被置换成一个抽象化、一元化的世界,文学活动的朴素性和现实性逐渐消失。图像与文学的关系问题不同,它是当代传媒文化现实中文学发展出现的真问题,它带动文学活动各要素在传媒世界中发生了新变。比如依照新媒体观念,图像、语言和其他文本都混杂其中构成超文本文类,读者面对如此复杂而丰富的文本世界目不暇接,此种变化打乱了以往文学理论设定和裁量文学的标准。因此,文学理论必须真正面对这些问题,从学理层面加以阐发,进而把当代文学理论研究向前推进。其次,回归文学本身的问题也是一个值得反思的文学理论问题。传统的语言学研究范式注重文学的文学性研究,认为语言是文学的内在规定性和永恒性。这是它的功绩,也是它的偏颇。因为,它在把文学的文学性研究推上高峰的同时忽视了语言以外、或者与语言相关的知识场域(比如,文学与其他艺术语言之间的关系)。当前盛行的文化研究,打破了文学理论学科的界限,以超越文学社会学的姿态,把触角渗透到生活的各个方面,使得文学研究的边界变得模糊,文学本身的问题几乎成了一个被遗忘的话题。在这样的情形下,我们也深切地感受到文学基础理论知识体系的松散和脆弱。在两种研究方式面前,我以为,图像与文学的关系是文学理论重新思考文学自身问题反弹的重要表现,它介乎语言和文化之间,寻找理解和阐发文学的新维度,同时这也是对强调文学性研究的形式主义文论和强调文化权力的文化研究的一种反驳和超越。从这个意义上说,语图关系研究意味着在经典意义上的理论研究之外拓展出新的文艺理论研究思路。最后,应该提倡文学理论研究的多元主义理念。文学是复杂

图像法论文篇(9)

0 引言

雾天单幅图像的处理方法可以分为两类:图像增强和图像复原。图像增强方法通过增强图像的细节,改善图像的视觉效果来达到视觉上的去雾效果。这种方法计算相对简单,适应性广,但对于局部景深的变化细节处理有待改进。而图像的复原方法是建立雾天退化模型,通过补偿退化过程造成的失真进而获得无雾图像或者是最贴近的估计结果。目前,第二种方法发展较快,有Tan[1]提出的算法,此算法通过最大化提升雾天图像的局部对比度来达到去雾的目的。Fattal等人[2]则假设雾天图像局部区域的反射强度为常向量,利用独立成分分析估计场景的常向量反射强度。HE等人[3]提出一种暗原色先验去雾算法,这种方法利用雾气浓度的暗原色先验规律,估算出场景透射率,然后求出无雾图像。

目前针对雾天视频的去雾方法主要建立单幅图像去雾的基础上,也可分为基于图像增强和基于物理模型的视频去雾方法两类。前者对视频的每一帧进行直方图去雾化处理,后者则是对背景图像采用去雾算法进行处理,求取得到相关的参数后,再将物理模型与原始视频结合得到完整的去雾视频。

1 雾气理论

1.1 大气散射理论

大气散射模型由大气光成像模型和入射光衰减模型组成[4]。何恺明[3]给出了雾霾天气下单色大气散射模型的简化表达式为:

其中,A为大气光强为输入的有雾图像,为空间坐标x处的场景反照率,为大气的散射系数,是观测点到场景点的距离。去雾的本质就是通过求取以及A的值以从原有雾图像中得到去雾后的图像。

1.2 暗原色先验理论

在原始的雾气图像中,雾气的浓度会随着景物距离的变化而变化,因此透射率是一个变化的参数,而暗原色先验则提供了估算透射率的方法。暗颜色先验理论是对大量室外无雾图像的观察统计得到的:在排除了天空等大面积明亮区域后的无雾图像中,存在这样的一些像素点,它们在RGB3个颜色通道中至少一个通道的值很低,这就是暗原色的概念,数学模型为[3]:

其中为原始图像的颜色通道,为红绿蓝3个颜色通道,c为颜色通道的合集;为以x为中心的局部区域。通过观察统计得到,的值较低且趋近于0。如果J是无雾图像,则被称为J的暗通道。

2 基于大气散射理论的去雾算法

2.1 简化的大气散射理论

从大气散射模型出发,定义,,则散射模型表达式变换如下:

其中,表示介质在图像位置x处的传播函数或者透射率,为复原后的无雾图像。定义,则(3)式变换为:

其中,为大气耗散函数,它表示环境光对图像的附加部分。这里去雾问题就转化为计算大气透射率和大气光强的问题。

2.2 去雾算法流程

本文的去雾算法:第一步,假定是固定场景的有雾视频,因此可以通过帧差法获得视频的背景图像;再通过暗原色的值的变化来估计大气透过率,获得背景图像的大气透射率,由此即可通过运算求得。第二步,用暗原色先验方法的统计信息估算出大气光强值A,并将原始图像数据代入到(4)式中即可求得去雾后的复原图像。

2.3 大气透射率估计

在雾霾天气下获得的图像,由于大气光参与成像,会使得暗原色强度值发生变化,而大气透射率是与这个值直接相关的,因此可以通过暗原色值的变化来估计大气透射率[3]。这个粗略估计的大气透射率可以表示为:

其中是调节因子,使复原的图像更接近真实图像。

本文采用双边滤波的方法对原始图像进行处理,目的在于消除其中可能导致图像复原错误的细节信息。双边滤波采用加权平均获取图像的强度值[5],其定义为:

这里为粗略估计的大气透射率,为滤波优化后的大气透射率,表示像素的邻域,和分别是空间域和灰度域的权重,是归一化参数,而后三个权重参数可由以下公式求取:

越小则图像细节和边缘越清晰,则这里取8,取0.1。

2.4 大气光强估计

目前已经有很多方法解决这一问题。如对边缘检测处理后的图像采用灰度腐蚀的方式进行分块统计,找到候选的天空区域,但这种方法要求场景中必须存在天空区域。本文先对三个颜色分量进行灰度腐蚀,然后将处理后的图像中各像素点的亮度值按照递减的方式进行排序,从这些最小值中选取0.1%最亮的像素所在的位置,找到这些位置所对应的原始有雾图像区域,而这些区域中的像素最大值就是大气光强A的估算值。

3 分析与应用

3.1 去雾效果验证

实验采用了VS2008在Core(TM)i5,3.20GHz,3.47GB内存的PC机上对本文提出的去雾算法进行了分析验证,图1图2即为采用本算法后的图像去雾效果图。

3.2 计算速度

视频去雾处理的时间长短取决于视频帧图像的大小、视频算法的复杂度以及场景的复杂度。本文算法是对暗颜色先验去雾方法的改进。对于暗颜色先验去雾方法而言,算法需对每帧图像进行按雾气浓度的局部颜色修复,因而计算量较大。相比之下,双边滤波估算大气透射率的去雾方法,其复杂度与视频帧图像总像素数目线性相关,因而该方法的运算速度比较快。表1是这两种算法的运算速度对比。

3.3 视频图像去雾系统

利用本文的理论,构建了一套视频图像去雾系统。这套系统可以降低监控视频画面中雾霾的影响,改善视频图像质量,减少恶劣天气对CCD摄像机的监控画面的干扰,让视频监控系统看得更远、更清楚、更准确。目前,这套系统已经应用在了黄山风景区的视频监控系统之中,改善图像的成像质量,使得图像信息更加丰富,为黄山景区视频监控提供亮丽、清晰、准确的图像画面。

4 总结与展望

本文提出了基于大气散射理论的视频去雾算法。这种算法基于固定场景下使用双边滤波的方式改进了原有的暗原色先验估计大气透射率的方法。实验结果显示这种算法去雾效果较为清晰,对比度较原始图像有明显的提升,且处理速度相对较快。而对于不断发生变化的有雾场景,还需要提出一种更精确的背景建模和检测场景变化的方法,这个是下一步需要解决的问题。

参考文献:

[1]TAN R.Visibility in bad weather from a single image[c]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Washington,DC:IEEEComputer Society,2008:2347-2354.

图像法论文篇(10)

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)33-7562-04

1 概述

图像分割指把图像分成各具特性的区域并提出感兴趣的目标,它是图像处理到图像分析的关键步骤。图像的阈值分割是一种简单有效的方法,应用非常广泛。它通常是利用图像的灰度特征来选择一个或多个最佳灰度阈值,并将图像中的像素点按照阈值划分为若干个区域,从而提出感兴趣的目标。在该方法中,如何确定最佳阈值是进行图像分割至关重要的环节,为此图像阈值分割一直是数字图像处理领域的一项重要研究内容。长期以来,人们已提出了多种选取阈值的方法,如直方图阈值法,最大熵阈值法,Otsu阈值法等。

粗糙集是一种很新的理论[1],该理论的核心概念是对象的不可分辨性和集的近似性。近年来粗糙集理论在图像处理中已广泛的应用,如文献[2]运用粗糙集理论中的相似关系来解决图像中的聚类问题,可以有效的消除噪声。文献[3]对彩色图像信息的相关性和不精确性,用粗糙集近似概念对图像直方图颜色信息进行分类,提高了分割的效率。文献[4]用粗糙集近似特性对医学图像粗糙表示,确定图像的正域、负域和边界域的位置,可以精确提出有意义的区域。

本文是基于粗糙集理论的近似概念对灰度均匀的图像进行分类,找到最佳阈值对图像进行分割。由于图像灰度和空间的模糊性,图像的边界区域是不确定的,因此可以用粗糙集理论上近似和下近似概念来描述图像的目标,背景和边界区域。集的近似能力可以用粗糙熵来衡量,当粗糙熵最大时,图像边界区域不确定性趋于最小,这时所选择的阈值可以对图像的目标和背景进行正确的分类。实验表明这是一种有效的分割方法。

2 图像的粗糙分类

2.1 粗糙集理论

给定一个有限的非空集合[U]称为论域,[R]为一等价关系,则称知识库[K=(U,R)]为一个近似空间。若论域中存在子集[X?U],我们根据关系[R]定义的基本集合[Yi(i=1,2...n)]来描述集合[X],为了准确地说明某些 [Yi]在[X]中对象的隶属度情况, 这里考虑两个子集:

[R_(X)=?Y∈U/R:Y?X] (1)

[R(X)=?Y∈U/R:Y?X≠Φ] (2)

分别称它们为[X]的[R]下近似和[R]上近似。[R_(X)]是根据知识[R],[U]中所有一定能归入[X]的元素的集合,它是所有包含于[X]集合的[Yi]并。[R(X)]是根据知识[R],[U]中可归入[X]的元素的集合, 它是所有与[X]的交不为零的[Yi]并。[BNR(X)]是根据知识[R] 既不能归入[X]也不能归入[-X]的元素的集合,我们把[BNR(X)=R(X)-R_(X)]称为[X]的[R]边界域。集合(范畴)的不确定性是由于边界域的存在而引起,集合的边界域越大,其精确性越低。对于属性[R]的近似精度定义为:

[dR(X)=card(R_(X))/card(R(X))] (3)

其中[card()]表示该集合的元素数目。精度[dR(X)] 用来反映对于了解集合[X]的知识的完全程度,当[dR(X)=1]时,[X]的[R]边界域为空,集合X为R可定义的。当[0

[PR(X)=1-dR(X)] (4)

[X]的[R]粗糙度与精度恰恰相反,表示的是集合[X]的知识的不完全程度。

2.2 基于粗糙集理论的子图划分

对于一幅灰度级为[L]的[N×N]个像素组成的二维图像[U],设像素[X]为[U]中的一个对象,称知识库(知识系统)[K=U,R]为一个图像近似空间。图像中每一点像素的灰度值用[Pi]表示。把原图像分成[Gi]个互不重叠的小块,有一些分块包含的是目标像素,有一些分块包含的是背景像素,而有一些分块即包含背景,又包含目标像素。对于图像目标和背景灰度值在两个不同的灰度区间的图像,从灰度直方图可知两者相交的地方就是目标和背景的边界区域,因此把背景的灰度值区间定义在[0,1,2,3...T],目标灰度值区间定义在[T+1,T+2...L-1],找到合适的[T]值,确定边界区域的位置,目标和背景就可精确地分开。由粗糙集理论的上近似、下近似以及边界域的概念来定义图像中每一块所包含目标和背景像素的程度。

目标灰度的下近似表示: [OT=?Gi|Pi>T,Pi]是分块[Gi]中每个像素的灰度值[] (5)

目标灰度的上近似表示:[OT=?Gi|Pi>T,][Pi]是分块[Gi]中存在像素的灰度值[] (6)

背景灰度的下近似表示:[BT=?Gi|Pi≤T,][Pi]是分块[Gi]中每个像素灰度值[] (7)

背景灰度的上近似表示为:[BT=?Gi|Pi≤T,Pi]是分块[Gi]中存在像素灰度值[] (8)

目标的边界区域:

[QOT=OT-OT] (9)

背景的边界区域:

[QBT=BT-BT] (10)

用R粗糙度来定义目标和背景的不确定程度:

[ROT=1-|OT|/|OT|=(|OT|-|OT|)/|OT|] (11)

[RBT=1-|BT|/|BT|=(|BT|-|BT|)/|BT|] (12)

| |指集合包含的元素数目。因为边界即在目标区域又在背景区域中,粗糙度越小,说明目标和背景的边界区域越小,两者越接近重合。选择合适的阈值[T]满足粗糙度[ROT],[RBT]同时达到最小,此时目标和背景的边界域[QOT=QBT],两者完全重合,即为图像目标和背景相交的边界。

3 粗糙熵

3.1粗糙熵的引入

对目标和背景边界域的确定,阈值[T]的选择至关重要。直方图阈值法虽然是可取的方法,但并不精确。对于一幅灰度均匀的图像,如果其图像的直方图具有两峰一谷,但两峰值相差较大,有宽且平的谷底,直接用双峰之间的谷点作为门限值误差太大,容易将目标和背景点混淆。如下图(2),从一幅eight.tif灰度直方图中可以看到阈值[T]并不能确定,选择范围在130~210之间。

引入信息论中熵的概念,来精确的计算阈值[T]。把目标区域和背景区域看做成两个信源,由目标和背景区域的粗糙度,定义目标区域粗糙熵为 :

[REOT=-ROTlogROT] (13)

背景区域粗糙熵为:

[REBT=-RBTlogRBT] (14)

根据熵的概念和性质,两个独立信源联合熵等于它们各个熵之和,所以目标和背景区域粗糙熵为:

[RET=-(ROTlogROT+RBTlogRBT)] (15)

选择阈值[T]的准则是使它们的熵之和取最大,这就是所谓最大熵准则下的最佳门限[9]。因为随着粗糙度[ROT,RBT]的减少,粗糙熵值在不断的增大,当两者达到最小时,粗糙熵值达到最大,此时所选用的[T]值就是最佳阈值。所以粗糙熵的最大值可以定义为:

[T*=argmaxRET] (16)

求解出最终的[T*],此时所对应的[T]值就是最佳分割阈值,说明了目标和背景的粗糙度最小。但同时也应该知道图像分块的大小影响粗糙熵的最大值,所以决定图像的分割质量是由[T]值的选择和分块的大小共同决定的。

3.2 熵最大求解算法

因为图像背景和目标的灰度区间为[0,1,2,...T]和[T+1,T+2...L-1],从灰度直方图中可以选择[T]值的范围,每一个[T]值,就对应一个粗糙熵[RET],当粗糙熵值最大时,就确定了最佳阈值。对一幅灰度均匀的图像首先从灰度直方图选择阈值[T]的范围,然后把图像划分为互不重叠的小块,分块中最大灰度值为[max-Pi],最小灰度值为[min-Pi]。求解[T*]的算法为:

Step1 给目标和背景的上近似和下近似设置初值为零。即[OT=0,OT=0,BT=0,BT=0]。

Step2 从图像的灰度直方图选择阈值的范围为[T∈a,b] 。

Step3 把图像分成c个互不重叠的小块,确定每块的灰度最大值[max-Pi]和最小值[min-Pi]。

Step4 从[T]值选择范围中选择第一个值[a],

若[T

若[T

若[max-Pi≤T],则[BT=BT+1];

若[min-Pi≤T] , 则[BT=BT+1]。

Step5 用式(11),(12),(15)计算[T]值所对应的粗糙熵。Goto Step4,选择下一个[T]值,计算其对应的粗糙熵,一直到[b]值选择结局。

Step6通过每一个[T]值所计算出粗糙熵的值,比较大小,当粗糙熵最大时,所对应的[T]值为最佳阈值[T*]。

4 实验分析

通过最佳阈值[T*]的求取,从分块的图像中找到表示目标灰度的下近似所包含的分块,对原图像进行二值化分割,得到明显区分的目标和背景的二值图。二值图[g(x,y)]可由下式表示:

[g(x,y)=1若f(x,y)>T*0若f(x,y)≤T*] (17)

[f(x,y)]是原图分块中所有像素的灰度值。

在VC++6.0`环境下对两幅图像采用本文的方法,直方图阈值法和Otsu阈值法进行分割,比较分割的结果。对一幅灰度均匀的eight.tif图像(有[256×256]像素)进行分割的结果如图3:a 是原图,其灰度直方图具有明显的双峰一谷,因为图像包含的细节较少,可把图像划分为较大的[4×4]分块,减少计算时间。对比分割的结果会发现,直方图阈值法由于选择的阈值不准确,导致一部分目标像素点分割时被归入背景中。但本文的分割方法比Otsu分割的效果稍差一些,因为图像分块过大,像素包括的过多,在阈值[T]的求解中,为了使熵最大,导致了背景像素点的错误分类。

图4是对一幅灰度均匀flower图像的分割结果。因为图像包含的细节较多,故分块的大小为[2×2]。直方图阈值法分割的结果最差,许多像素被误分,但本文的方法和Otsu阈值法几乎取得相一致的分割结果,是因为图像分块较小,目标和背景像素都得到正确的分类。

4 结论

本文根据粗糙集理论对图像的目标和背景近似分类,通过计算粗糙熵的最大值,精确出图像的边界,进行阈值分割,实验获得较好的分割效果。但对一幅具有多层次,细节丰富的图像,分块过程将变得非常繁琐,阈值求解的计算量加大。因此如何优化图像的分块,采用新的求解阈值的方法,不断的改进创新将是下一步的研究的方向。

参考文献:

[1] Pawlak Z. Rough Sets, Theoretical Aspects of Reasoning about Data[M]. Dordrecht:Kluwer Academic Publishers,1991.

[2] Choubeg S K,Deogun Js,A comparion of feature selection algorithms in the context of rough classifiers[J]. IEEE,International Conference,1996,1122-1128,

[3] Akash Mohabey, A. K. Ray. Rough sets Theory based Segmentation of Color Image[J].IEEE,Internation Conference,2000,338-342.

[4] Shoji Hirano,Rough representation of a region of interest in medical image[J].International Journal of Approximate Reasoning,2005(40):23-34.

[5] 刘宏建, 刘允才. 一种基于粗集理论的图像分割方法[J].红外与毫米波学报,2004(6):456-464.

图像法论文篇(11)

本文介绍讨论了几种目前广泛应用的图像边缘检测、图像阈值分割的各种算法,并给出了对比分析;对遗传算法的基本概念和研究进展进行了综述;给出了标准遗传算法的原理、过程、实验结果及分析. 实验结果表明,本文提出的遗传分割算法优于传统分割算法。

第一章 绪论 1.1 图像分割综述

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这里所说的特性可以是灰度、颜色、纹理等,而目标可以对应单个区域,也可以对应多个区域。图像分割是数字图像处理中的一项关键技术,它使得其后的图像分析,识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。而且,在数字图像处理工程中,一方面,图像分割是目标表达的基础,对特征测量有重要的影响;另一方面,图像分割是自动目标识别的关键步骤,图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形式,分割中出现的误差会传播至高层次处理阶段,因此分割的精确程度是至关重要的。只有通过细致精细的图像分割,才能使得更高层的图像分析和理解成为可能。因此,图像分割是由图像处理进到图像分析的关键步骤,在图像工程中占据重要的位置。

1.2 图像分割的研究意义与发展现状

作为计算机视觉和图像处理中的难点和热点之一,图像分割的研究受到了研究工作者的高度重视,对图像分割进行了深入、广泛的研究。作为一种重要的图像技术,图像分割在不同领域中有时也用其它名称:如目标轮廓(object delineation)技术,阈值化(thresholding)技术,图像区分或求差(image discrimination)技术,目标检测(target detection)技术,目标识别(target recognition)技术,目标跟踪(target tracking)技术等,但这些技术本身或其核心实际上也就是图像分割技术。图像分割作为图像处理、分析的一项基本内容,其应用非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。在工业自动化、在线产品检验、生产程控、文件图像处理、遥感图像、保安监视、以及军事、体育、农业等行业和工程中,图像分割都有着广泛的应用。例如:在遥感图像中,合成孔径雷达图像中目标的分割、遥感云图中不同云系和背景分布的分割等;在医学应用中,脑部 MR 图像分割成灰质(GM)、白质(WM)、脑脊髓(CSF)等脑组织和其它脑组织区域(NB)等;在交通图像分析中,把车辆目标从背景中分割出来等;在面向对象的图像压缩和基于内容的图像检索中将图像分割成不同的对象区域等。在各种图像应用中,只要需对图像目标进行提取,测量等都离不开图像分割。

自 20 世纪 70 年代至今,已提出上千种各种类型的分割算法。如:门限法、匹配法、区域生长法、分裂-合并法、水线法、马尔可夫随机场模型法、多尺度法、小波分析法、数学形态学等。随着新理论、新技术的发展,一些新的图像分割方法也随之出现,但这些分割算法都是针对某一类型图像、某一具体的应用问题而提出的,并没有一种适合所有图像的通用分割算法。通用方法和策略仍面临着巨大的困难。另外,还没有制定出选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。

1.3 本论文所作的工作

据此,在本论文中只对常用的、并在实践中行之有效的边缘检测方法和阈值分割方法进行深入的了解,并对阈值分割方法中的灰度直方图双峰法和基于遗传算法的最大类间方差法进行详细的讨论,同时用Matlab对上述两种方法进行验证并给出结果。

1.4 本论文的论述内容

本文对图像分割的整个过程中的一些常用的,经实践检验行之有效的算法进行了讨论和 改进。全文共七章。第一章为绪论,主要介绍了现阶段图像分割技术的发展现状和研究意义。其他六章分别在以下几个方面介绍了本文所做的工作:

1.对本文所采用的试验测试工具Matlab 进行简介。

2.简介数字图像的基础问题。概述了数字图像的基本概念和特点,简介了各种图像格式的特点和应用,为全文的讨论作一铺垫。

3.详细讨论了图像分割中的基于阈值的图像分割方法,给出了直方双峰法的算法和验证结果,并简要介绍了普通最大类间方差法的算法过程。

4.对遗传算法理论进行简介。详细讨论了遗传算法的定义和标准遗传算法的流程和要素。为应用此方法对最大阈值进行迭代寻优打下基础。

6.应用遗传算法改进了最大类间方差法。给出了整个遗传操作的使用函数与具体进程,并对实例图片进行处理,得到处理结果并得到迭代最优阈值M。

本文研究了图像分割的相关理论和常用技术,并对遗传算法进行了介绍,对遗传算法应用于图像分割进行了验证.

第二章 Matlab简介 2.1 MATLAB的概况和产生背景 2.1.1 MATLAB的概况

MATLAB是矩阵实验室(Matrix Laboratory)之意。除具备卓越的数值计算能力外,它还提供了专业水平的符号计算,文字处理,可视化建模仿真和实时控制等功能。MATLAB的基本数据单位是矩阵,它的指令表达式与数学,工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多.

当前流行的MATLAB包括拥有数百个内部函数的主包和三十几种工具包(Toolbox).工具包又可以分为功能性工具包和学科工具包.功能工具包用来扩充MATLAB的符号计算,可视化建模仿真,文字处理及实时控制等功能.学科工具包是专业性比较强的工具包,控制工具包,信号处理工具包,通信工具包等都属于此类.开放性使MATLAB广受用户欢迎.除内部函数外,所有MATLAB主包文件和各种工具包都是可读可修改的文件,用户通过对源程序的修改或加入自己编写程序构造新的专用工具包.

2.1.2 MATLAB产生的历史背景

在70年代中期,Cleve Moler博士和其同事在美国国家科学基金的资助下开发了调用EISPACK和LINPACK的FORTRAN子程序库.EISPACK是特征值求解的FOETRAN程序库,LINPACK是解线性方程的程序库.在当时,这两个程序库代表矩阵运算的最高水平.到70年代后期,身为美国New Mexico大学计算机系系主任的Cleve Moler,在给学生讲授线性代数课程时,想教学生使用EISPACK和LINPACK程序库,但他发现学生用FORTRAN编写接口程序很费时间,于是他开始自己动手,利用业余时间为学生编写EISPACK和LINPACK的接口程序.Cleve Moler给这个接口程序取名为MATLAB,该名为矩阵(matrix)和实验室(labotatory)两个英文单词的前三个字母的组合.在以后的数年里,MATLAB在多所大学里作为教学辅助软件使用,并作为面向大众的免费软件广为流传。1983年春天,Cleve Moler到Standford大学讲学,MATLAB深深地吸引了工程师John Little.John Little敏锐地觉察到MATLAB在工程领域的广阔前景.同年,他和Cleve Moler,Steve Bangert一起,用C语言开发了第二代专业版.这一代的MATLAB语言同时具备了数值计算和数据图示化的功能.1984年,Cleve Moler和John Little成立了Math Works公司,正式把MATLAB推向市场,并继续进行MATLAB的研究和开发.

在当今30多个数学类科技应用软件中,就软件数学处理的原始内核而言,可分为两大类.一类是数值计算型软件,如MATLAB,Xmath,Gauss等,这类软件长于数值计算,对处理大批数据效率高;另一类是数学分析型软件,Mathematica,Maple等,这类软件以符号计算见长,能给出解析解和任意精确解,其缺点是处理大量数据时效率较低.MathWorks公司顺应多功能需求之潮流,在其卓越数值计算和图示能力的基础上,又率先在专业水平上开拓了其符号计算,文字处理,可视化建模和实时控制能力,开发了适合多学科,多部门要求的新一代科技应用软件MATLAB.经过多年的国际竞争,MATLAB以经占据了数值软件市场的主导地位.

在MATLAB进入市场前,国际上的许多软件包都是直接以FORTRANC语言等编程语言开发的。这种软件的缺点是使用面窄,接口简陋,程序结构不开放以及没有标准的基库,很难适应各学科的最新发展,因而很难推广。MATLAB的出现,为各国科学家开发学科软件提供了新的基础。在MATLAB问世不久的80年代中期,原先控制领域里的一些软件包纷纷被淘汰或在MATLAB上重建。

时至今日,经过MathWorks公司的不断完善,MATLAB已经发展成为适合多学科,多种工作平台的功能强大大大型软件。在国外,MATLAB已经经受了多年考验。在欧美等高校,MATLAB已经成为线性代数,自动控制理论,数理统计,数字信号处理,时间序列分析,动态系统仿真等高级课程的基本教学工具;成为攻读学位的大学生,硕士生,博士生必须掌握的基本技能。在设计研究单位和工业部门,MATLAB被广泛用于科学研究和解决各种具体问题。在国内,特别是工程界,MATLAB一定会盛行起来。可以说,无论你从事工程方面的哪个学科,都能在MATLAB里找到合适的功能。

2.2 MATLAB的语言特点

一种语言之所以能如此迅速地普及,显示出如此旺盛的生命力,是由于它有着不同于其他语言的特点,正如同FORTRAN和C等高级语言使人们摆脱了需要直接对计算机硬件资源进行操作一样,被称作为第四代计算机语言的MATLAB,利用其丰富的函数资源,使编程人员从繁琐的程序代码中解放出来。MATLAB最突出的特点就是简洁。MATLAB用更直观的,符合人们思维习惯的代码,代替了C和 FORTRAN语言的冗长代码。MATLAB给用户带来的是最直观,最简洁的程序开发环境。以下简单介绍一下MATLAB的主要特点。

1. 语言简洁紧凑,使用方便灵活,库函数极其丰富。MATLAB程序书写形式自由,利用起丰富的库函数避开繁杂的子程序编程任务,压缩了一切不必要的编程工作。由于库函数都由本领域的专家编写,用户不必担心函数的可靠性。可以说,用MATLAB进行科技开发是站在专家的肩膀上。 更为难能可贵的是,MATLAB甚至具有一定的智能水平,所以用户根本不用怀疑MATLAB的准确性。

2. 运算符丰富。由于MATLAB是用C语言编写的,MATLAB提供了和C语言几乎一样多的运算符,灵活使用MATLAB的运算符将使程序变得极为简短。

3. MATLAB既具有结构化的控制语句(如for循环,while循环,break语句和if语句),又有面向对象编程的特性。

4. 程序限制不严格,程序设计自由度大。例如,在MATLAB里,用户无需对矩阵预定义就可使用。

5. 程序的可移植性很好,基本上不做修改就可以在各种型号的计算机和操作系统上运行。

6. MATLAB的图形功能强大。在FORTRAN和C语言里,绘图都很不容易,但在MATLAB里,数据的可视化非常简单。MATLAB还具有较强的编辑图形界面的能力。

7. MATLAB的缺点是,它和其他高级程序相比,程序的执行速度较慢。由于MATLAB的程序不用编译等预处理,也不生成可执行文件,程序为解释执行,所以速度较慢。

8. 功能强大的工具箱是MATLAB的另一特色。MATLAB包含两个部分:核心部分和各种可选的工具箱。核心部分中有数百个核心内部函数。其工具箱又分为两类:功能性工具箱和学科性工具箱。功能性工具箱主要用来扩充其符号计算功能,图示建模仿真功能,文字处理功能以及与硬件实时交互功能。功能性工具箱用于多种学科。而学科性工具箱是专业性比较强的,如control,toolbox,signl proceessing toolbox,commumnication toolbox等。这些工具箱都是由该领域内学术水平很高的专家编写的,所以用户无需编写自己学科范围内的基础程序,而直接进行高,精,尖的研究。

9. 源程序的开放性。开放性也许是MATLAB最受人们欢迎的特点。除内部函数以外,所有MATLAB的核心文件和工具箱文件都是可读可改的源文件,用户可通过对源文件的修改以及加入自己的文件构成新的工具箱。

2.3 MATLAB 遗传算法工具箱简介

鉴于Matlab强大的扩展功能和影响力,各个领域的专家相继突出了许多基于Matlab的专用工具箱。本文所采用的遗传算法工具箱,就是由英国谢菲尔德(Sheffield)大学设计推出的。相对于其他版本的遗传算法工具箱,如:美国北卡莱罗纳州立大学推出的遗传算法优化工具箱GAOT(Genetic Algorithm Optimization Toolbox),以及MathWorks公司最新的一个专门设计的Matlab遗传算法和直接搜索工具箱(Genetic Algorithm and Direct Search Toolbox),本工具箱的出现最早,影响较大且功能较为完备。文中所采用的所有遗传操作函数大部分出自本工具箱。 第三章 数字图像基础简介

图像处理的首要一步,就是要了解图像的基本性质与特点。只有充分了解和掌握了所要处理得图像的特点和性质,才能在接下来的处理中根据图像的特点获取所需的信息,并对其进行相应的处理。

本章将介绍数字图像的基础知识,以及图像在计算机处理中的信息表达形式,并对几种常用的图像文件格式Bmp, Jpeg以及Png等做简要的介绍。

3.1 图像的基本概念及其特点

要对图像进行处理,必须清楚图像的概念。一般来说,二维或三维景物呈现在人眼中的样子就是图像。图像具有以下三个方面的特点:

①图像带有大量的信息,一幅图像顶得上千言万语;

②图像种类繁多,包括照片、绘图视频图像等;

③人类从外界获得的大部分信息来自视觉系统。

人们看到的任何自然界的图像都是连续的模拟图像。其形状和形态表现由图像各位置的颜色来决定。可以用f(x, y)表示一幅模拟图像,其中x, y表示空间坐标点的位置,f表示图像在点(x, y)的某种性质的数值,如亮度、颜色等,f、x、y可以是任意的实数。而把连续空间的图像在坐标空间(X, Y)和性质空间F都离散化,以便于计算机进行加工处理的离散化的图像则称为数字图像。数字图像用I (r, c)来表示,其中:r=row为行,c = col为列,表示空间离散点的坐标,I表示离散化的图像f。I, r, c都是整数。实际中仍习惯用f (x, y)表示数字图像。图像存储画面的形式为栅格结构:即将图像划分为均匀分布的栅格(像素),显式的记录每一像素的亮度和颜色;而将像素的坐标值规则地隐含起来,其位置排列规则,通常为矩形排列。

3.2 图像的格式

组成数字图像的基本单位称为像素(Pixel),把像素按不同的方式进行组织和存储,就得到不同的图像格式;把图像数据存为文件就得到图像文件。图像文件按其格式的不同一般具有不同的扩展名。常用的图像文件格式有位图文件、JPEG文件、GIF文件、PNG文件等。每一种格式都有它的特点和用途,在选择输出的图像文件格式时,应考虑图像的应用目的以及图像文件格式对图像数据类型的要求。下面我们介绍几种常用的图像文件格式及其特点。

3.2.1 BMP图像格式

这是一种DOS和Windows兼容计算机系统的标准图像格式。BMP格式支持索引色、灰度等色彩模式。图像存储为BMP格式时,每一个像素所占的位数可以是1位、4位、8位或32位,相对应的颜色数也从黑白一直到真彩色。对于使用Windows格式的4位和8位图像,可以指定采用RLE压缩。BMP图像文件含文件头、调色板数据和图像数据三个层次。其中文件头由定义文件标识、大小即图像数据偏移量的BITMAPF工LEHEADER以及指定BMP图像自身的若干参数的BITMAPINFOHEADER两部分组成。这种格式在PC机上应用非常普遍。

3.2.2 JPEG图像格式

JPEG是由联合照片专家组(JiontPhotographic Experts Group)开发的一种图像文件格式。它采用有损压缩方式去除冗余的图像和彩色数据,在获取极高的压缩率的同时也能展现十分丰富生动的图像。也就是说,可以用较少的磁盘空间得到较好的图像质。另外,JPEG还是一种比较灵活的格式,当将图像保存为JPEG格式时,允许用户用不同的压缩比例对文件进行压缩,就是可以指定图像的品质和压缩级别。

3.2.3 TIFF图像格式

TIFF文件主要由三部份组成,包括文件头、标识信息区和图像数据区。T工FF文件的图像数据区以行扫描的方式存取图像,存储图像前先将图像分割成若干部分,压缩后再存储。存储时,单色图像一个字节存储8个点,16色图像一个字节2个点,而256色图像就是一个字节存储一个点。TIFF图像格式是一种应用非常广泛的位图图像格式,几乎被所有绘画、图像编辑和页面排版应用程序所支持。TIFF格式常常用于在应用程序之间和计算机平台之间交换文件。

3.2.4 GIF图像格式

CIF是Graphics Interchange Format(图形交换格式)的缩写,是由ComputerServe公司推出的一种图像格式。该种图像格式的特点是压缩比高,可以极大地节省存储空间。最初的GIF只是简单的用来存储单幅静止图像,后来可以同时存储若干幅静止图像从而形成连续的动画;同时,GIF格式支持透明背景,可以较好地与网页背景融合在一起。因此,GIF常常用于保存作为网页数据进行传输的图像文件,成为网络和BBS上使用频率较高的一种图像文件格式。但是GIF最多只能处理256种色彩,不能用于存储真彩色的图像文件。

3.2.5 PNG图像格式

这种格式称为可移植网络图像文件格式(Portable Network Graphics),由Thomas Boutell, Tom Lan。等人提出并设计。其特点是:①支持48位真彩色图像、16位灰度图像和颜色索引数据图像;②主要面向网络图像传输和图像编辑,其提供的二维交叉存储机制使用户在图像网络传输过程中能更快的观察到接近真实的近似图像;③对用户完全透明且无专利限制,用户可以从Internet上随时下载与PNG文件格式配套的图像数据压缩算法源程序代码:④ 具有比GIF高5-20%的压缩效率;⑤ 具有可扩展性。

作为目前最不失真的图像格式, PNG格式图像吸取了GIF和JPEG二者的优点。它可以把文件压缩到极限以利于网络传输,但由于采用无损压缩方式来减少文件大小,PNG格式能保留所有与图像品质有关的信息。同时,PNG支持图像背景透明,显示速度快。

本文的所有图像的处理都是对由JPG格式图像通过图像格式转化得来的Bmp格式的索引色图像进行的,其具体转换程序参见附录[一]。

第四章 图像分割 4.1 图像分割算法的定义与分类

在图像的研究和应用中,人们往往只对一幅图像中的某些部分感兴趣,这些感兴趣的部分一般对应图像中特定的、具有特殊性质的区域(可以对应单个区域,也可以对应多个区域),称之为目标或前景;而其它部分称为图像的背景。为了辨识和分析目标,需要把目标从一幅图像中孤立出来,这就是图像分割要研究的问题。所谓图像分割,从广义上来讲,是根据图像的某些特征或特征集合(包括灰度、颜色、纹理等)的相似性准则对图像象素进行分组聚类,把图像平面划分成若干个具有某些一致性的不重叠区域。这使得同一区域中的象素特征是类似的,即具有一致性;而不同区域间象素的特征存在突变,即具有非一致性。从集合的角度出发,图像分割定义如下:

设整个图像空间为一集合R 。根据选定的一致性准则P ,R 被划分为互不重叠的非空子集(或子区域):{R1, R2,L, Rn},这些子集必须满足下述条件:

(1) R =

(2) 对于所有的i和j ,当i ≠ j, =空集

(3) P(Ri) = True ,对所有的i

(4) 所有i ≠ j;Ri ,Rj相邻,P(Ri U Rj) = False

(5) 对i =1,2,L,n, Ri是连通区域

其中:P(Ri)为作用于Ri 中所有象素的形似性逻辑谓词,i, j =1,2,L,…n。上述条件

(1)指出分割后的全部子区域的总和应包含图像中的所有元素,或者说分割应将图像中每个象素都分进一个子区域中。

(2)指出各个子区域相互不重叠。

(3)指出分割后得到的属于同一区域中的元素应该具有某种相同特性。

(4)指出对于分割后得到的属于相邻两个区域中的元素具有某种不同的特性。(5)要求同一个子区域内的元素应当是连通的。

其中分割准则P 适用于所有象素,由它来确定各区域元素的相同特性。上述数学条件说明了图像分割算法的一些特点,凡不符合以上特点的图像处理算法则不能称为图像分割算法。

目前,在己提出的多种类型的分割算法中,大致可以分为基于边缘检测的方法和基于区域的方法。而在实际应用中,这些方法主要又可划分为三种类型: 边缘检测型、阈值型和区域跟踪型。本文的讨论正是基于阈值型图像分割方法展开的。

4.2 基于阈值的分割 4.2.1方法定义与特点

基于阈值的分割方法是一种应用十分广泛的图像分割技术。所谓阈值分割方法的实质是利用图像的灰度直方图信息得到用于分割的阈值。它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的象素是同一个物体。它不仅可以极大的压缩数据量,而且也大大简化了图像信息的分析和处理步骤。因此,在很多情况下,是进行图像分析、特征提取与模式识别之前必要的图像预处理过程。它特别适用于目标和背景占据不同灰度级范围的图像。阈值分割方法的最大特点是计算简单,运算效率高,在重视运算效率的应用场合,它得到了广泛的应用。

4.2.2阈值的分割的描述

设(x,y)是二维数字图像的平面坐标,图像灰度级的取值范围是G= {0, 1, 2,…L-1 }(习惯上0代表最暗的像素点,L-1代表最亮的像素点),位于坐标点(x, y)上的像素点的灰度级表示为f (x, y)。设t∈G为分割阈值,B= {b0, b 1}代表一个二值灰度级,并且b0, b1∈B。于是图像函数f 1(x,y)在阈值t上的分割结果可以表示为:

阈值分割法实际就是按某个准则函数求最优阈值t的过程。域值一般可写成如下的形式:

T=T[x,y, f (x,Y),p (x,y)]

其中f (x, y)是在像素点(x, y)处的灰度值,p(x,y)是该点邻域的某种局部性质。4.3.3阈值分割方法的分类

通过上文的讨论,结合所给公式,可以将阈值分割方法分为以下3类:

1)

全局阈值:T=T[p(x,y)〕,即仅根据f(x,y)来选取阈值,阈值仅与各个图像像素的本身性质有关。

2)

局部阈值:T=T[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。

3)

动态阈值:T=T[x,y,f(x,y),p(x,y)],阈值与像素坐标,图像像素的本身性质和局部区域性质相关。

全局阈值对整幅图像仅设置一个分割阈值,通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像,并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果,但存在几个缺点:

1)

每幅子图像的尺寸不能太小,否则统计出的结果无意义。

2)

每幅图像的分割是任意的,如果有一幅子图像正好落在目标区域或背景区域,而根据统计结果对其进行分割,也许会产生更差的结果。