欢迎访问发表云网!为您提供杂志订阅、期刊投稿咨询服务!

多元文化主义的概念大全11篇

时间:2023-07-20 16:24:48

多元文化主义的概念

多元文化主义的概念篇(1)

[分类号]G250.73

知识检索的产生与发展一方面来源于用户对知识检索的需求;另一方面来源于信息检索理论与实践的发展与完善。知识检索模型和知识检索呈现方法是知识检索的重要研究方面,以本体作为知识组织的方法,能实现基于语义的知识检索。

1 知识检索技术的研究与发展

在讨论区中呈现了如下的关于知识检索的介绍:①知识检索的基本思想就是模拟扩展人类关于知识处理与利用的智能行为和认识思维方法;②知识检索通过挖掘其深层含义,充分精确地表达知识资源和用户需求,进而在各类异构的数据库、数据仓库、知识库中进行检索,返回最相关的结果的检索机制;③基于Ontology的知识检索可以阐述为:在领域专家帮助下建立领域Ontology,把收集来的数据按规定格式存储在关系数据库、知识库等的元数据库中;④查询转换器按照Ontology把查询请求转换成规定的格式,从元数据库中匹配出符合条件的数据集合,检索的结果经过定制处理后返回给用户;⑤知识检索的基本特征有:支持自然语言检索;支持语词、语义内容的处理,实现同义词扩展检索和关联检索;具有概念推理和学习功能;具有强大人机交互接口。

知识检索是一种全新的信息检索方式,是在现有的信息检索技术以及模型上发展而来的。搜索引擎是当前检索信息的主要方式,它们能在短时间内反馈给用户大量的信息,但反馈信息中的信息噪音过大,其中包含了太多的无用信息;目录分类的数据库规模较小,以致某些主题下收录的范围不够全面,检索到的信息数量有限。可以看出,传统的信息检索缺点在于没有从语义层次上对信息进行标引,不能够满足用户在语义和知识上的需求。而知识检索是综合运用信息管理科学、人工智能、认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理与多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取文本、图像、视频、声音等媒体类型的知识源,并能准确精选用户需要的结果。知识检索是将信息或知识按照一定的方式组织、存储,并根据用户的需求找出相关信息和知识的过程。在这个过程中,被检索的对象是知识资源、知识库。知识检索就是采用一种从语义上标引文章的技术,形成知识库,再从知识库中查询用户所需的信息。

知识检索和信息检索的不同,在于知识检索强调了语义,它从文章的语义、概念出发,能够揭示文章的内在含义,而不像信息检索只是基于字面的机械匹配。知识检索提高了查全率和查准率,减轻了用户的负担。表1从检索语言、检索模型、组织方式、搜索方式和检索效率方面进行了归纳。

与主题词表或分类表不同的是,本体是领域知识规范的抽象和描述,可以构造丰富的概念间的语义关系,能够准确描述概念含义以及概念之间的内在关联;形式化能力最强,同时具有高度的知识推理能力,能通过逻辑推理获取概念之间的蕴涵关系。因此,本体是一种知识组织体系。以本体作为知识组织的技术和方法,能实现基于语义的知识检索。知识检索是传统信息检索的发展,随着人工智能、系统信息管理等相关高新技术的运用,提供个性化、智能化的主动信息服务也将是知识检索的发展方向。当前,图书情报档案的知识检索系统更加注重文本挖掘的功能,如大规模实例描述的汉语分词排歧知识库,具有主题词典和内容相似性检索功能,自动分类、聚类和自动摘要功能,文本数字理解和新词学习功能等。

2 基于本体的知识检索模型

2.1 信息检索模型的发展

经典的信息检索模型包括布尔检索模型、向量空间模型和概率检索模型,目前大多数检索系统往往综合上述各种模型,以达到认为最佳的检索效果。这些检索模型的不足是:在文献的组织与描述上,采用词切分和单汉字或两者结合标引文献,将关键词作为描述文献的基本元素,文献之间是相互独立的;在检索操作上,是基于关键词的无结构查询,难以反映词语问各种语义联系,查询能力有限,误检率和漏检率很高;在模型约束方面,索引项之间独立性的要求不符合实际情况,计算查询和文档之间的相似度的方法也有局限;虽经不断完善,也难以从根本上适应网络巨量信息的检索。

由此,一些学者从不同角度提出了基于知识的检索模型,如分类检索模型、多维认知检索模型、分布式检索模型、概念检索模型等。特别是概念检索模型克服了以往检索模型中以词及其权值为中心建立相关性而忽略了语义关联的缺点,以概念词典为辅助,采用人工智能技术,增强搜索引擎概念分析理解能力,从概念层面上来处理用户的查询请求,从而实现特定领域的概念检索。上述检索模型由于没有知识组织体系的支撑,没有实现对检索对象的语义标注,也没有对其语义进行解析,因此被解释为基于知识的信息检索模型。

2.2 基于本体的知识检索

基于本体的知识检索模型在资源对象的组织、描述、表示、检索和模型约束等方面都具有自己的特征,主要表现为:

在检索对象的组织上,知识检索模型利用领域本体作为组织资源的基础。首先构建一个涵盖相关领域概念及概念间关联的领域本体库作为资源描述和知识表示的工具与模型,如各学科领域的主题词表、分类表,在此基础上确定领域知识本体的主要概念和概念间的各种关系,构筑领域本体的概念模型。

在检索对象的描述上,知识检索模型借助语义标引工具,按照领域本体的概念及关联,对资源对象进行概念分析、分类、标引、描述和处理,形成机器可以理解的带有语义信息的元数据。

本体概念的优化检索依赖于本体检索语言的功能。在支持本体检索的诸如RQL,DQL,0WL-QL,SquishQL,RDFQL,RDFPath和Versa等知识语言中,以RQL作为知识检索模型的检索语言可以满足知识检索的需要。

知识检索模型提供了特定领域可控的概念语义体系,并建立与概念体系相对应的具有层次结构的自然语言术语体系,能对自然语言提问和本体概念库的术语进行语义的理解、分析和匹配,依据本体概念问的语义关系,实现知识检索。

在模型约束上,知识检索模型的约束比较少,但要求概念和关系构成一个有向图,关系必须是有方向的;另外,要求每一个概念/实例都需要有一个唯一的标识。

2.3 Ont-KRM:基于本体的知识检索模型

基于上述约束和所建立的本体原型,笔者设计了的基于本体的知识检索模型Ont-KRM(Knowledge Retrieval

Model 0n Ontology)。Ont-KRM分为人机交互部分、知识源部分、检索匹配和本体库等部分,如图1所示:

人机交互部分主要是分析用户提交的检索请求,返回整理检索结果。检索请求的分析主要是依据本体知识,分析用户的真实检索意图,形成规范、准确的检索请求,提交给检索匹配模块。检索请求的分析主要分为以下步骤:①对检索请求进行预处理,提取需要检索关键字(词);②借助本体并在必要时通过和用户再次交互,判断检索请求中关键字(词)的领域、相关概念等等,确定用户的真实意图;③将用户的真实意图形成统一、规范的检索请求提交给检索匹配部分;④在对用户意图进行分析和交互的基础上补充和完善本体库中的相关知识;⑤对检索匹配部分返回的检索结果进行处理、合并后返回给用户。

知识源部分主要对知识源进行收集、并对收集的知识源根据本体库中的知识进行标注和分析,对从知识源中抽取的知识进行转换,对本体库中的相关部分进行补充和完善,建立对应的索引信息,放入索引库。

检索匹配部分主要是从人机交互部分收集统一的检索请求,并依据本体库中的相关知识对检索请求和索引库进行语义与语法层面的匹配,并将检索结果返回给人机交互部分。

本体库部分应该说是整个模型的核心部分,从对检索请求和检索结果的处理,到对检索请求和索引的匹配,再到对知识源的标注、索引的建立都基于本体库中的相关知识。同时,上述各个过程又可以对本体库中的知识进行补充和完善。当然,对本体库中知识的任何修改都要经过领域专家和系统的双重认定。

3 基于本体的知识检索呈现

3.1 知识组织体系及本体的语义标注

所谓知识组织体系,是对资源内容概念及其相互关系进行描述与组织的机制。目前图书情报界公认的知识组织体系是主题词表和分类表,但本体是领域知识规范的抽象和描述,可以构造丰富的概念间的语义关系,能够准确描述概念含义以及概念之间的内在关联。本体是一种知识组织体系,以本体作为知识组织的方法,才能实现基于语义的知识检索。因此,本文的知识检索模型和方法都建立在本体基础之上的。

目前信息机构中采用的元数据方案大多源自于对馆藏进行长期保存的目的,并不能够完全满足知识组织的要求。通过元数据的描述,可以充分揭示元数据的元素及元素揭示内容的语义含义,达到进行元数据互操作和对内容进行知识组织的目的,笔者重点研究以下问题:

标注元数据元素的语义。元数据互操作常见的困难是元素问同名异义和异名同义,RDF的思路是如果不同元数据中的元素指向同一个资源,那么这些元素具有同一语义。根据信息机构数字资源的特点,选用DC元数据作为元素语义的最终解释。也即如果说不同元数据中的元素都可以使用DC元数据中的同一个字段进行解释,那么这两个元素就认为在语义上相等。操作时将元数据与DC元数据元素之间的映射关系放在数据提供者方,当数据提供者在进行注册或者使用的元数据发生变化时,由其管理人员对映射进行定义。

标注元数据元素内容的语义。在解决了元数据元素的语义以后,采集回来的元数据应该用什么方法进行组织,与元数据元素内容的语义相关,因此还需要揭示元数据元素内容的语义。笔者通过RDF的描述方式来对元数据元素内容的语义进行揭示,框架中定义了一个关于元数据元素内容的ontology,并通过URI建立元素与ontology中的条目之间的关系,以此来标注元素的语义。

标注知识组织的内容。在对数据源的元数据进行描述时,数据源的管理人员可以根据元数据元素的功能对其进行区分,只提供标注内容的元素。这样,既减少了进行元数据描述的工作量,也为知识组织能够更有效的进行提供了方便。另外,对知识的组织还需要根据系统的实际需要有所选择,在进行元数据采集时,可以通过定义对DC元数据的哪些元素内容进行组织,然后再反向定位到与其相关的元数据元素来确定知识组织的内容。

3.2 知识检索呈现

知识检索呈现要解决的问题就是知识提供的形式和检索结果显示的形式。常见的知识呈现方式主要有概念图(concept map)、思维导图(mind map)、认知地图(cognitivemap)、语义网络(semantic network)、思维地图(thinking map)等。信息检索和知识检索呈现之间虽在呈现方式上存在着相互借鉴,但它们之间的区别还是很大。表2从呈现对象、呈现目的、呈现方式和交互类型等方面加以区别:

从呈现对象看,信息检索呈现的对象是信息,而知识检索呈现的对象是知识,包括知识本身和检索结果中的知识;从呈现目的看,信息检索呈现一是从大量信息中发现新的信息;二是将检索结果直观的呈现给用户以提高检索效率。而知识检索呈现则在于促进知识的传播和创新,方便用户更好的认识和获取知识;从呈现方式看,信息检索呈现的方式通常是图形、图像,而知识检索呈现的方式包括知识图表、视觉隐喻等;从交互类型看,信息检索呈现的交互是人机交互,而知识检索呈现的交互是人人交互。

资源的显示方式取决于资源的组织方式。信息组织线性的、无结构的方式,决定了信息的提供与获取是以关键词和分类目录及索引等途径来实现的,检索结果显示的是一组基于关键词层面上的没有语义的文献集合。而知识组织基于领域本体,是对概念关联的组织,所以知识检索显示的应是反映知识内容和概念关联的知识网络(或称知识地图)。简单地说,知识网络是对领域知识结构的展示,是对已获取的知识以及知识之间的关系的可视化描述。

3.3 基于本体的知识检索呈现技术

基于本体的知识检索呈现,是指通过一定的知识表示技术,将领域知识按照一定方式,清晰有序地在一个统一的界面上展示出来,以供检索者方便地查询与获取知识。基于领域本体的知识网络具有三个特征:①定位知识,给出任何一个概念,都可以显示该概念在知识体系中的位置;②揭示知识关联,知识网络不仅要确定概念的位置,还要揭示此概念和其他概念间的语义联系,描述知识网络中各种关联;③可视化展示,通过直观、形象的模式、模型、图形、图像等方式,展现知识地图。

下面以笔者开发的知识集成原型系统中的“知识检索系统”为例,来说明知识检索的呈现方式。

该系统是一个基于与鲁迅相关资源知识的领域本体原型的知识检索系统。这个领域本体原型的构建以分类/主题一体化词表为基础。由于分类和主题表达的对象都是主题概念,两者之间存在着隐含的概念对应关系。与鲁迅相关资源知识的领域本体概念网络的显示以及对知识的获取,是通过概念浏览和概念检索实现的。

页面布局。用户界面分为概念导航区和概念检索区两个部分,概念导航区是领域本体中各类概念的分类导航,点击具体的分类之后就可以在右侧的知

识导航区,显示概念的网络关系图。概念检索区在输入需要检索的概念,并进行进一步细化之后,就可以看到以相关的网络概念图和相关的概念实例。

概念浏览。概念浏览主要实现经济本体概念的分类导航和主题导航,可循着学科等级和概念间的语义关系进行浏览,起到知识导航作用。分类导航可对领域本体的分类知识树进行逐次浏览,选择一个分类概念,即可同时显示与该分类概念对应的主题概念关系,包括等同关系、等级关系和相关关系。反之亦然,可通过音序对领域本体的主题概念树进行层层浏览,选择一个主题概念,即可同时显示与之对应的学科类目(可以是一个类目或多个类目)。例如,在“分类导航”目录树中选择“阿Q正传”,主题概念浏览区便显示“阿Q正传”概念关系,点击概念关系就可以显示属于“阿Q正传”概念的文献实例,如图2所示:

多元文化主义的概念篇(2)

关键词:本体;P2P, 本体映射;知识视图

中图分类号:TP301 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-03

1 介绍

随着P2P(对等网络)技术的飞速发展,对网络节点的信息存储、传输和处理能力的要求迅速增长,对海量信息的搜索与利用成为当前P2P网络资源搜索技术的一个重要研究和应用领域。目前实用化的P2P资源搜索技术主要是基于关键字的匹配,其对资源信息的语义的揭示上有局限性。本体论[5]作为一种能够在语义和知识层次上描述资源信息系统概念模型的建模工具,自提出以来就引起国内外众多科研工作者的广泛关注。本文提出一种基于P2P网络局部本体概念聚类,构建网络全局知识视图的方法,全局知识视图为分散在网络中的节点提供了网络资源全局视图的结构化描述,为在P2P网络中进行基于局部本体的分布式资源匹配提供了有效途径。

2 相关技术

2.1 本体

本体[5] (ontology)是用于描述或表达某一领域知识的一组概念或术语,既可用于组织知识库较高层次的知识抽象,也可用来描述特定领域的知识。本体通过知识来表示元语,从而捕获某个领域的语义,使得机器能够(部分)理解该领域中概念间的关系,通过公理或规则,还可以捕获其他知识,如领域背景知识等。本文中将本体定义为 ,其中C表示概念集合;P表示属性集合;R表示关系集合;A表示公理集合。概念表示特定领域中的一组或一类实体或者事物,每个概念可以由属性分别描述其不同方面的特点;关系描述了概念与概念之间或者属性与属性之间的关系。关系主要可以分为两类:分类关系(taxonomic relationship)和关联关系(associative relationship)。分类关系表示概念与概念之间的父类,子类等上下位的层次关系;关联关系表示除了上下位层次关系以外的其它关系。属性是从不同方面,不同角度对概念的描述。公理用来表示概念或者实例的约束。

3 全局知识视图的构造

在P2P网络中,每个节点的资源由它自己的本体来描述语义,即局部本体。通过对底层局部本体的分析后建立一个共享的全局知识视图。局部本体的每一个概念和属性都将映射到全局视图对应的视图元素上。当增加新的资源时,只需要增加新的映射关系,而不需要对原有的映射和全局知识视图进行过多的更改。

全局知识视图从宏观上对P2P网络中的数据源的信息进行了统一的描述;相对于全局知识视图而言,微观上,局部本体除了定义概念、属性等基本部分之外,还可以定义局部数据源的位置,类型等信息,供下一步查询调用时使用。本文构建全局知识视图的步骤如下:

(1)分析P2P网络各局部资源本体中的概念间的相似关系;

(2)基于局部本体之间概念的相似关系生成知识视图元素;

(3)建立局部本体中概念、属性与全局知识视图元素的映射关系。

3.1 局部本体间的概念聚类

构建全局知识视图的一个重要内容是发现不同局部本体中存在的语义级的概念关联,通过语义的联系将不同本体内的概念映射到全局知识视图元素上,其中最基本的步骤是分析概念之间的相似关系,随后提取出概念间的共性的部分将其映射到全局知识视图中。假设在一个P2P网络中存在n个节点分别提供自身资源的局部本体描述: ,对应第i个局部本体的概念集 中所包含的概念数为 ,那么理想情况下,全局知识视图中对应于概念的视图元素的数量是 ;实际情况中,由于局部本体间的异构性造成具有等价或者相似的概念在全局视图中有多个知识视图与之对应,这种冗余造成知识视图的体积过于庞大,最差情况下,如果概念集中的每个概念都对应于一个全局视图元素,那么全局概念视图元素的数量将达到 ,假定相似度计算为基本运算,整个网络中本体的概念相似度计算的复杂度将达到 。因此,本文考虑将局部本体中的概念进行聚类,从而降低概念间关系分析的复杂性。

3.2 全局视图元素的构造

知识视图元素是对本体中实体的抽象,视图元素的构造过程正是对本体中实体的抽象过程,3.1节中描述的概念聚类算法是进行这一抽象过程的基础。

在本体中,概念间主要包括四类主要关系:等价关系(equivalentClass),继承关系(subClassof),关联关系(associateWith),不相交关系(disjointWith)。在构造视图时,视图元素之间的关系也应当体现概念间的这些主要关系,并且由于不相交关系的普遍性,在知识视图中不考虑元素的不相交关系,在构造视图元素之前,基于由概念聚类算法所得到的类簇,通过本体推理机(如RacerPro)和领域本体得到类簇内各概念之间的等价关系。对于相互等价的概念,在知识视图中用一个视图元素表示,因此,类簇 中的每个等价类对应于知识视图中的一个视图元素。基于此,将概念间等价关系简记作 ,概念 所属等价类记作 ,即若概念 满足 ,记作 ,对类簇 进行等价划分并且对应每个等价类创建相应的视图元素。

3.3 全局视图元素间关系构造

视图元素间的关系反映了本体中实体之间的关系,例如,概念间的等价关系使得概念由同一个视图元素表示,概念间的继承关系也应该在相应视图元素之间体现。简记概念 对应的视图元素为 ,构建全局视图元素间的关系规则如下:

(1)对于概念 ,若其满足 ,则 ,即概念 在视图中对应的视图元素相同:3.2节中,视图元素的构造已经保证了这一点,概念 若满足 ,则它们属于相同的等价类,因此可以保证 。

(2)对于概念 ,若其满足 即若概念 是概念 的子概念,则构建关系 ,其中 是对应于 的二元关系:该规则保证,若概念 是概念 的子概念,那么它们在知识视图中对应的视图元素也具有联系。

(3)对于概念 ,若它们的类层次体系中有公共的祖先概念,即若 使得 ,那么 有关联关系。

3.4 全局知识视图的维护

对于P2P节点资源的更新(包括添加,删除)如果引起了局部本体变化,全局知识视图要做相应的变化如下:

添加规则:如果被添加概念 , 使得 ,其中 是类簇 的等价类,那么知识视图不作变化,否则新增视图元素 ,根据 与其他概念的关系,调整 在视图中的位置。

删除规则:如果对于被删除概念 , 使得 ,其中 是类簇 的等价类,仅删除视图元素 及其联系,否则将等价类 一并删除。

4 分析及实验

4.1 概念聚类效果分析

如果直接在P2P网络局部本体的概念之间进行相似度计算,假定局部本体中概念总数是N,那么计算相似度的复杂性是 。本文采取先对概念进行聚类再进行相似度计算,假定每个类簇概念树相当,那么存在k个类簇的情况下,相似度计算的总次数是: 次,平均复杂度是: ,但是在实际情况中,局部本体中的概念所属于的领域本体数量并不多,通常只有少数几个,所以实际上并不能达到 的复杂度。但是对先对概念进行聚类可以有效的减少相似度的计算次数。

4.1.1 相似度计算次数比例随类簇数变化分析

图4.1.1中,横坐标为类簇数量 ,纵坐标为相似度计算次数比例 ,其中, 表示对概念进行聚类后所进行的相似度计算次数, 表示对概念进行聚类后所进行的相似度计算次数。假设,概念数为1000,初始类簇数量 少于20个,并且每个类簇中的概念数量服从随机分布,图5.1.1显示了随类簇数量变化,聚类前后实际计算次数的比例变化。随着类簇数量的增多,相似度计算次数有效得到减少,当 增加到一定程度之后,r减少的速度减缓。说明 增大到一定数量后继续在增大并不能有效使r减小,应当把 控制在合理范围内,在实际聚类过程中, 的大小取决于网络中的概念所涉及的领域本体数量的大小。

图4.1.1聚类后相似度计算次数比例随类簇数量变化图

4.1.2 相似度计算次数比例随类簇数量变化分析

图4.1.2中,横坐标为概念数量 ,纵坐标为相似度计算次数比例 ,其中, 表示对概念进行聚类后所进行的相似度计算次数, 表示对概念进行聚类后所进行的相似度计算次数,图线L1、L2、L3分别对应类簇数为4、8、12。途中显示,当类簇数一定时,相似度计算次数比例r随概念数量 没有明显变化,即相似度计算次数比例r与概念数量 ,无关。同时,相似度计算次数比例r随类簇数量 的增大而减少,和图4.1.1的结果相符。

4.1.3 视图构造效果分析

构造全局知识视图的作用是代替全局本体对网络中的资源语义进行描述,而构造全局知识视图的目标是:收集从不同节点得到的局部本体后,尽量减少对资源语义的重复描述。具体而言,是尽量减少局部本体之间的等价概念在全局知识视图中所对应的视图元素的冗余。因此,本实验分析文本所提出的全局知识视图构造算法减少视图元素冗余的效果。实验参数如表4.1所示:

表4.1 实验参数

由图4.1.3可知,当概念数增多时,视图元素和概念书的比例也相应的增多了。但是这种增多的趋势同时也随概念数的增多而相对变得平缓。并且视图元素和概念数的比例保持在一个比较低的比例,相当于1个视图元素对应3.3个概念。因此,本算法对减少视图元素的冗余是有效的。

5 总结与展望

本文提出了一种基于概念相似度聚类的P2P网络资源语义全局知识视图构造的方法。试图通过按照所属领域不同对概念进行划分,降低在全局知识视图元素构造过程中的概念相似度计算量。基于此的全局知识视图元素构造的规则和方法能够有效地用于全局知识视图的构造。并且实验证明,本视图构造算法有效的减少了视图中视图元素的冗余。

在本文的方法中,相似度的计算与概念聚类、视图元素的构造具有一定相对独立性。相似度计算方法也是当前研究的一个重要内容。相似度计算的准确性间接影响到了视图构造的效果,而相似度计算的速度直接影响到了视图构造的速度。因此,适合于P2P网络资源局部本体间的概念相似度计算方法也非常值得进一步的研究。

参考文献:

[1]Pantel, P.,& Lin, D. K. Discovering Word Senses from Text. Proceeding of ACM SIGKDD Conf. on Knowledge Discovery and Data Mining, Edmonton, Canada, 2002, 613-619.

[2]Do H H, Rahm E. COMA - A system for flexible combination of schema matching approaches[C]. Porceedings of Very Large Data Bases Conference. Roma, Italy. 2001:610-621.

[3]Maedche A, Staab S. Measuring Similarity between Ontologies [C]. Proceedings of the European Conference on Knowledge Acquisition and Management EKAW-2002. 2002:251-263.

多元文化主义的概念篇(3)

中图分类号:H059 文献标识码:A 文章编号:1000-2529(2011)06-0129-05

一、引言

纵观已有研究,学者们从不同的角度对中动构式(Mid-die Construction)进行过一些探讨:Fagan、Davidse&Heyvaert、徐盛桓、曹宏、何文忠等分析了英汉语中动结构的句法、语义特征及构句限制;Ackemat根据中动构式特点对其进行分类,并指出英语和荷兰语的中动结构与被动结构一样,具有施事论元的隐退和受事论元担任主语的特点;Lekakout研究了以英语和希腊语为代表的两类语言中的中动概念范畴的异同,认为英语中动范畴寄生于作格(parastic on ergative),而希腊语中动范畴寄生于被动概念(parastic on passives)。对于英语中动构式的生成,Stroik曾提出,中动构式靠句法推导而成,中动词具有完整的论元结构,通过论元的升、降格完成,至于其生成的认知发生机制如何,她并未进行深入的探讨。为了更全面地了解和认识中动构式,本文尝试从认知的视角,以概念整合理论为指导,探析英汉中动构式的范畴属性特征、句法语义特征及其认知发生机制。

二、理论基础

基于对概念隐喻理论(Conceptual Metaphor Theory)的进一步思考,Faucormier等提出心理空间理论(Men.tal Space Theory),继而将之发展成概念整合理论(Concep-tual integration Theory)。该理论认为,与隐喻一样,概念整合也是人类重要的认知工具。人们在交际时,不断地构建心理空间(Mental Space),同时对空间中的某些要素进行合成,以理解和生成语言,形成新的概念。概念合成通常涉及四个心理空间:两个输入空间(Input Space)、一个类属空间(Genetic Space)、一个合成空间(Blended Space)。输入空间提供概念合成的基本元素,人脑通过选择、匹配、想象以及抽象化和概念化等过程对这些元素进行认知加工,构建起类属空间和合成空间。类属空间是一个高度概括和抽象的空间,是输入空间的交汇点,反映各输入空间共有的角色、框架和图式。在合成空间里,有的元素源于输入空间,是输入空间元素的组合或完善,有的元素具有创新性,是联想和逻辑推理的结果,也是已知元素的扩展(elaboration)。

Goldberg认为构式是一个形式与意义的配对。Disselt进一步指出构式是一个特定形式与一个特定功能或意义的结合体,其中形式指音系、形态和句法特征,功能指语义、语用和语篇特征。构式这个形义配对体是语言在心智中的基本表征方式,体现了人类通过体验和认知加工对基本经验的概括和组织方式。构式之间具有多重承继连接(inheritance link)的关系。也就是说,有些构式承继了其他构式的部分结构和意义元素,具有其他构式的某些特征。我们认为构式间的承继连接正是其相应概念合成的一种表现。

大多数学者对英语中动构式这个概念有了基本的共识,而对汉语中动概念还存在争议。从跨语言的角度来看,中动构式是一个语义上的而非句法意义上的概念。然而,“语法和语义密不可分,语法规则和语义结构之间存在着对应关系”。不同的语言在句法上表现同一语义现象是人类对现实认知存在共性的结果。虽然汉语没有泾渭分明的语态区别,却确实存在与英语中动构式在句法、语义特征上一致的表达形式。根据构式的定义和英汉中动结构的特点,我们认为,英汉中动构式并非是寄生于其他结构,而是与其他构式具有同等句法地位的、独立的构式。它们具有完整的论元结构,是一定形式和意义的匹配,并与主动和被动构式之间具有句法和语义上的承继关系。在句法形式上表现为:NP+VP+AP;在语义上表现为:表状态意义,凸显主语的属性特征。

概念整合理论可用来揭示两个或两个以上概念的语义元素合成的在线心理认知机制,而构式作为语言在心智中的基本表征方式,它们之间的承继性连接正是其相应概念整合的结果。中动构式是中动概念的语言表征。中动概念与被动和主动概念有着十分密切的联系,或者说有一定的承继连接关系。我们认为概念整合理论对于词义构建的解释力,同样也适用于中动构式的生成。

三、英汉中动构式的基本特征

1.英汉中动构式的范畴属性特征

英汉中动构式都是一定形式和意义的结合体,是一个句法语义范畴,具有原型与非原型之分。原型中动句在句法结构上为:受事主语+及物动词谓语+状语。例如:

(1)这面料摸起来挺舒服的。

(2)这里的泉水喝起来真甜。

(3)你这孩子带起来真不省心。

(4)His novel sells well.

(5)This article reads like a translation.

(6)Government officials bribe easily in this country.

(1).(6)的主语“面料”、“泉水”和“officials”等是它们所在句的及物动词谓语动作的承受者,整个句子表达的是状态意义,凸显主语的属性特征。

非原型中动句在句子的部分结构或语义上背离了中动构式的典型形式或语义,是中动构式范畴的非原型成员。刘正光提出“中动构式涉及几个次类,它们之间构成一个连续体”:a.Ps+VP(Ps:patient subject).b.Is+VP(Is:instru-merit subject,including subject of means);c.Ls+VP(Ls:lo-cation subject);d.Ps/Is+V+DO(DO:direct object)。其中的“次类”指的就是中动构式的非原型成员或边缘成员。英汉非原型中动句对原型中动句的偏离主要表现为:非原型中动句的主语不是受事,而是被动参与者工具、处所或材料;谓语动词也发生偏离,不及物动词进入中动构式;状语部分也有变化,中动句也有带宾语的实例。在英语中,不及物性谓语动词的中动句其主语通常不是动作行为的受事,而是与受事相关的工具、手段或处所。例如:

(7)Narrow tyres manoeuvre more easny.(手段主语+不及物动词+状语)

(8)The knife cuts well.(工具主语+不及物动词+状语)

(9)This lodge sleeps five persons.(处所主语+不及物动词+宾语)

(10)Professional bakers have understood for years thatbetter flour bakes better bread.(材料主语+及物动词+宾语)

这一情况也适用于汉语中动句,例如:

(11)手机打起来方便。(工具主语+不及物动词+状语)

(12)江景房住着开阔。(处所主语+不及物动词+状语)

(13)这双鞋跑起来不跟脚。(手段+不及物动词+状语)

(14)好料和好面。(材料+及物动词+宾语)

(7).(14)中的主语“knife”、“lodge”、“手机”、“江景房”等不是谓语动词语义指向的受事,而是被动参与者手段、工具、材料或处所,动词“sleep”、“住”和“跑”等是典型的不及物动词,这些句子都是中动构式的非原型成员。中动构式的原型成员和非原型成员所具有的中动范畴属性由高到低,形成一个连续统。

关于非受事被动参与者进入中动构式的问题,我们可以从参与者角色与论元角色的关系及人类的转喻思维中寻求答案。动词框架语义的一部分包括参与者角色的界定,它和与构式相联的论元角色相区别。一般情况下,“施事”或“受事”更容易被突显,成为注意的焦点,而其他参与者如处所、材料和工具等受到的关注度相对较低。然而,在转喻思维的作用下,同一认知域的某一实体可以指代另一实体,成为认知上凸显的部分。例如:在非原型中动句“手机打起来方便”中,主语“手机”不是谓语动词“打”的受事,而是“打(电话)”的工具或手段,在“手段”代“结果”的转喻思维作用下成为认知识解中的图形(figure),处于被突显状态,临时具有原型中动句主语成分的语义,因此与受事者角色融合(fusion),成为中动句主语论元角色的实例,被表达为直接语法功能成分,即这里的主语。处所和材料获得认知凸显地位的情况也是转喻思维的结果。以上分析表明,无论是原型还是非原型中动句,都是中动范畴的家族成员,是形式(N1岍AP)和意义(状态意义,凸显主语的属性特征)的配对,都与主动和被动范畴有着十分密切的关系,承继了主动和被动概念的某些意义元素。

2.英汉中动构式的句法语义特征

(1)英汉中动构式的句法语义冲突

对于中动构式的句法语义特征,Fagan认为,中动构式句并不是用于报告行为事件,而是陈述某物体具有某一特定的属性。何文忠指出中动句通常表示一种可能性,表述的是虚拟事件。中动结构作为一个构式,其构式义是说话人对话题的主观评价,说明主语的一般特征,具有“类指”的属性。在综合考察了中动构式的句法语义特征后,我们认为,中动构式承继了主动和被动构式的一些信息,在句法上表现为主动形式,在语义上与被动句一脉相承,是人类思维对被动概念和主动概念整合的结果。下面我们还是以(1).(6)句为例,进一步探析英汉中动旬的句法语义特征:

从常识和逻辑来看,以上句子的动词和主语之间在语义上构成被动关系,即,“面料被摸”、“泉水被喝”、“孩子被带”、“novel is sold”、“article is read”、“officials is bribed”。表达的是状态意义,句法上应为被动语态;从语言事实来看,四个句子在语义上是对“面料软”、“泉水甜”、“孩子不省心”、“小说好卖”、“文章像译文”、“官员容易贿赂”之类的事物属性特征的说明和描述,句法上表现为主动语态。显然,这些中动句的句法语义在逻辑和语言事实上表现不一致,存在着冲突。

(2)英汉中动构式的句法语义融合

中动句表达的是状态意义,凸显的是主语的属性特征,而这些正是被动和主动概念的重要元素。由此,我们有理由认为,中动构式的生成在于主动和被动概念的整合。根据范畴的模糊性特征,中动构式与主动和被动构式之间存在重合部分,承继了被动和主动概念的部分范畴属性。从这个角度探讨中动句在逻辑和语言事实上的冲突,可以很好地揭示其句法语义冲突的解除,直至融合的过程。还是以(1)-(6)为例:

首先,虽然以上句子表达的是状态意义,但是它们要突显的却是“摸、喝、带、卖起来怎么样”的信息,而这些信息的语言表达便是对事物特征和属性的描述,可以说这些句子在语义上是表状态意义和属性特征的融合。

其次,被动构式的状态意义成分本身也与属性特征意义密不可分。汉语中像“眼镜摔破了”、“衣服染红了”等这类句子数不胜数。Langacker认为英语的过去分词-ed表示一种动作发生后的结果,具有消除动作时间过程的功能。连淑能提出英语的被动式由系表结构演变而来,可以表示动作(动句),也可表示状态(静句)。在英语中有很多过去分词可以直接用作形容词,表属性特征。例如:

(15)The glass is broken.

(16)Bill is narrow-minded.

(17)He is quite experienced.m teaching beginners.

(18)She found the house renovated.

从某种程度上讲,状态意义和属性特征密切相关,且具有相似性,正是语言使用中的这种理解促使了主动和被动概念整合的发生。

我们再回到(1).(6)句的分析。前面提到从常识和逻辑来看,它们在句法上应为被动形式,正是被动构式的状态意义和表属性特征融合的本质,让表被动意义的范畴有可能接受非被动形式,包括以上的中动形式,突显主语的属性特征。出于兼表状态意义和属性特征的需要,通过二者基于相似性的跨空间的映射而完成主动和被动概念的整合,中动句式成为了表达的理想选择。

四、中动构式的认知发生机制

主动概念表达动作行为、过程或事物的属性特征,凸显的是施事或与施事相关的参与者。被动概念表达的是状态意义,凸显的是受事或与受事相关的参与者。根据概念整合的运行规律,我们试用图示来揭示中动构式的生成过程,以更清楚地了解中动构式的在线心理认知机制:

图1中输入空间1和输入空间2分别为被动概念和主动概念。空间1中的状态意义、被动形式和被动参与者凸显是被动概念的部分元素或结构,实线连接黑点表示被动概念和主动概念的元素构成直观映射关系,没有映射的黑点代表此次认知过程中退隐的其他元素或结构。

出于兼表状态意义和属性特征的需要,人类认知对被动概念和主动概念中的元素进行整合、重组,其中状态意义和属性特征因其相似性发生跨空间的映射,并和其他元素一起,经过高度概括、图式和抽象化,状态和属性特征作为认知焦点,投射到类属空间(这种抽象的、联想性的映射在下面图解时用虚线表示)。输入空间的概念意义元素投射到类属空间,反映两输入空间投射的、待加工的抽象的概念。如图2所示:

一旦语言所提供的线索与现存的结构、认知原则和背景框架结合起来,就会发生意义建构,其结果的丰富程度大大超过语言所明晰表达出来的信息。图3中合成空间是对输入空间元素的选择、整合、扩充和创新,也是类属空间的具体化。主、被动概念范畴中的“状态意义”、“属性特征”、“主动形式”和“被动参与者凸显”等元素映射、合成,并增加新颖的元素,如状态意义和主动形式的匹配,属性特征和被动参与者凸显的匹配等,形成层创结构(Emergent Strue-ture),进而生成新的概念,即以主动形式表达状态意义和凸显被动参与者属性特征的中动概念。层创结构的形成既是来自输入空间元素的扩展,也是人类联想和逻辑推理等创新思维的结果。层创结构中的意义元素是新概念的重要组成部分。根据表达“属性特征”的需要,认知选择了“主动形式”,根据表达“状态意义”的需要,认知选择了“被动参与者凸显”。在句法、语义结构上表征为:NP+VP+AP,被动参与者受事或与受事相关的手段、工具和处所担任主语,从而生成中动构式。中动句式的主动表达形式说明了它的属性特征意义是第一位的。曹宏认为中动句的句式意义为:在‘NP’‘VP’的时候,‘NP’通常‘AP’,也表明中动构式的属性特征意义成分更多一些。一方面,中动构式与主动和被动构式构成承继关系,另一方面,又具有不同于被动和主动构式的性质与特征,带来了语言表达的具体、丰富和细腻。

多元文化主义的概念篇(4)

我们既可以用一个概念引申并联系一课的知识点,也可以用一个概念把一单元的知识构建起来。例如《政治生活》中的第二单元《为人民服务的政府》,核心概念是政府,也可称为主体性概念,图示如下:

在政府相关知识点的教学中,可联系国家、公民、中国共产党、人民政协等主体性概念进行比较,帮助学生系统地把握这些容易混淆的内容。

一课或者一单元的知识跨度不是很大,用一个概念可以把知识的内在联系表达出来。但是一本教材的知识跨度大、内容多,所以针对一本教材而言,就需要用到多个概念。先对每个概念的子知识准确理解,再比较和研究这些子知识之间的联系。例如,《生活与哲学》,除了第一单元介绍了哲学的基本知识以外,另外3个单元就详细介绍马克思主义哲学的基本理论。在教学中, 马克思主义哲学的知识归类比较清晰,主要包括两大部分内容,辩证唯物主义(辩证唯物论、认识论、唯物辩证法)以及历史唯物主义(历史观、人生观、价值观),图示如下:

多元文化主义的概念篇(5)

1.引言

随着互联网与信息技术的发展,信息化的越来越深入到工作与生活的各个层面,随之而来的是信息量的急剧膨胀。由于信息处理技术的发展,如何从海量的信息中高效快速、准确地检索到所需信息已经成为计算机领域研究的一个热点问题。信息检索就是从信息集合中找到用户所需信息的过程。在实践中,传统的基于关键词的检索方法主要通过把表征用户查询请求的关键词与表征信息内容的索引词进行严格机械匹配进行的。由于一义多词和一词多义现象的存在,缺乏语义理解能力,致使表示查询请求的关键词和用户的真实需求之间,关键词和索引词之间会存在多重表达差异,从而导致查询结果检准率低、误检率高。为此,本文将研究研究面向本体的智能信息检索技术,并以此为基础构建一个系统模型,通过建立本体库与元数据库来准确映射信息资源,实现了对查询条件进行了语义层面的处理,从而提高检索效率。

2.信息检索与本体

2.1 信息检索

信息检索Information Retrieval)这个术语产生于Calvin Mooers1948年在MIT的硕士论文。信息检索是指将信息按照一定的方式组织和存储起来,并针对用户的需求找出所需信息的过程,又称为“信息存储与检索”[1]。从广义上讲,信息检索包括存储过程和检索过程,对用户来说,往往仅指查找所需信息的检索过程。 信息的存储主要为对一定专业范围内的信息进行选择, 并在此基础上进行信息特征描述、加工并使其有序化,即建立数据库。检索是借助一定的设备与工具,采用―系列方法与策略从数据库中查找出所需信息。在现代信息技术环境下,信息检索从本质上讲,是指人们希望从一切信息系统中迅速、准确地查找到自己感兴趣的有用信息,而不论它的出现形式或媒体介质[2]。

伴随着Internet的广泛应用,网络上的资源呈现出海量、无序的特点,给传统基于关键词匹配的信息检索带来了局限性:对所需检索的目标不能准确描述;无法量化检索目标与候选者间的符合程度。为此,本文提出的基于本体的语义信息检索,利用本体描述语义检索模型中的语义信息,对信息资源进行准确的语义标注,实现语义层面的检索,从而有效提高查全率和查准率。

2.2 本体

2.2.1 本体基本概念

本体(Ontology)是指对世界上事物的基本描述其概念起源于哲学领域 它在哲学中的定义为对世界上客观存在物的系统地描述,即存在论,是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质,后来随着计算机科学技术的发展,本体的概念被引入计算机工程。从本体的哲学内涵出发,结合计算机工程领域的特点,斯坦福大学知识系统实验室(KSL)的Gruber于1993年在概念化(conceptualization)这一重要的定义基础上提出了第一个广泛被接受的定义:本体是一个明确定义的概念化规范[3]。Gruber把本体解释成共享概念化的明确的形式化规范。共享体现了本体获取领域知识,能够被多个人和系统共同接受:概念化是一个的结构,D是领域、R是D上的集合和相应关系,是现实世界的抽象模型;形式化是指本体能够被机器理解和学习;明确则是要清晰地定义概念和概念之间的关系。1998年,Guarino修订了Gruber的定义,引入了统称为概念关系的内涵关系,将本体定义为“本体论是一个逻辑理论,用来说明一个正规词汇表的逻辑含义[4]。2001年,Zuniga折中了两种定义,提出信息系统本体论应该是“特定的形式化语言产生的清晰公理理论[5]。关于本体,在信息系统理论界还有很多代表性的定义,但总体来说,本体都是用于表示信息系统中隐含或不明确的信息,以便使知识的共享和复用成为可能。

2.2.2 本体的构建

构建本体时,根据各自问题域和具体工程的不同 形成了不同的构建方法。这些方法有TOVE法、METHODOLOGY方法、骨架法、KACTUS工程法、SENSUS法、IDEF5方法和七步法[6]。其中最具参考价值的方法是骨架法。构建本体的核心在于严格确定领域内的术语、属性、关系和规则等,确立术语间的语义网络,建立术语库和关系库,并用规范化、形式化的语言进行描述和存储,使计算机能够识别和处理[7]。其主要步骤是 确定构建本体的目的和范围;构建本体(分为本体获取、本体编码和本体重用本体评估);使用本体语言对本体进行描述。

目前用于构建本体的工具很多,比较常见的有Ontolingua、Ontosaurus、WebOnto、protege、OntoEdit等。其中Ontolingua和WebOnto均只支持在线编辑 而且必须是注册用户才可以使用Ontosaurus是一个可以对用Loom编写的知识库和本体进行浏览的Web浏览器,其文库中只有少量可以使用的本体,对初学用户不易使用;protege则是一个可以免费下载的、具有图形化用户界面的、可在本地运行的本体构建工具;OntoEdit也是一个在本地运行的免费程序 但必须注册后由网管人员给用户提供用户名和密码。在这5种工具中protege有它明显的优势,因而现在的本体构建大多都是使用protege来实现的[8]。

2.2.3 本体的描述语言

OWL(Web Ontology Language)是W3组织推荐的本体描述语言,基于XML、RDF和RDF Schema建立。OWL相对XML、RDF和RDF Schema拥有更多的机制来表达语义,从而超越了XML、RDF和RDF Schema。OWL是最新的Web本体语言标准。2002年7月,W3C组织公布了网络本体描述语言(Web

Ontology Language,OWL)的工作草案1.0版,2003年8月该工作草案发展成 W3C的候选建议,在2004年的2月10号,OWL成为W3C正式推荐的标准。

OWL 已经发展成公认的未来的Web本体语言标准。OWL增加了更多的词汇用于描述更多的语义特征:如类之间的关系;基数;相等关系;更丰富的属性类型;属性特征和枚举类。OWL提供了比XML、RDF和RDF模式更强大的功能,在它们的基础上增加了自己的带有形式语义的词汇[9]。

3.语义检索系统模型模型

3.1 基于本体的语义检索系统设计

本体系统模型主要分为三个模块:用户查询模块、本体管理模块、元数据管理模块,其系统结构如图1。

本系统模型的建立步骤的基本步骤可归纳如下:

(1)利用本体编辑器工具建立相关领域的本体。

(2)对收集的信息资源进行本体元数据标注:各种信息资源如PDF、Web网页等,根据已建立的领域本体实体进行元数据标注。使用RDF或OWL语言对信息资源进行语义层面表示和描述,然后将其按照一定的格式存储在元数据库中。

(3)根据用户检索界面提交的概念,在理解用户需求的基础上,语义检索引擎借助解析推理工具对用户请求进行概念分析和语义相关性推理,然后检索并对已进行本体元数据标注的信息资源库进行检索,最后将检索结果通过反馈给用户检索界面输出。

(4)设计用户检索界面:对用户的检索输入并进行概念提取,并将分析结果传递输出给语义检索引擎;在本体的帮助下匹配出符合条件的数据集合,把检索结果经过定制处理后返回给用户。

3.2 本体库的构建

一个本体可由概念、分类层次、关系、函数、公理和实例六种元素组成。本体中的概念是广义上的概念,除了可以是一般意义上的概念以外,也可以是任务、功能、行为、策略推理过程等等[10]本体中的这些概念通常构成一个分类层次本体中的关系表示概念之间的关联,这种关联表现了除分类层次关系之外的概念之间的所有联系 本体中的函数是一种特殊的关系 公理在许多领域中,表示函数之间或关联之间也存在着关联或约束 实例是指属于基本概念类的基本元素,即某概念类所指的具体实体,特定领域的所有实例。根据本体的形式化描述,构建领域本体库的步骤如图2所示。

本体的建立可以通过调用本体本体编辑器工具建立相关领域的本体,创建相应的本体类和属性。应用本体可看作领域本体在数据源上的映射,是将数据源中的异构数据转换成由OWL来描述的本体实例得到的,具体实现时,可以首先创建一个OWL文档,然后每取得一个元数据信息,就将其作为一个子结点插入到 OWL 文档中,并且插入元数据的属性信息。然后,通过本体解析工具,把应用本体存入到数据库中(比如MySQL)。另外,还可以将OWL描述的本体转化成RDF三元组,并存入RDF三元组库中。一个复杂的由OWL定义的类或属性可以表示成一个或多个相应的RDF三元组。

3.3 语义匹配与语义推理

构建了查询本体后,为了进行有效的语义推理,可以根据领域本体和应用本体所定义出的语义关系,并根据相关的存放在知识库中的语义规则集进行相似度匹配推理计算本体相似度的方法有很多,基本上都是以分别属于不同本体(查询本体和应用本体)的实体之间配对比较

来实现,常用的方法如下:

(1)根据聚类原理及空间向量夹角的余弦公式进行本体之间概念、属性等相似计算。

(2)从图论和树的角度来比较两个本体的异同,如WordNet[11]就是基于概念图的本体表示方法。

(3)根据数据库领域模式匹配的理论,基于字符串匹配或字符串之间的编辑距离来比较两个本体的异同。

(4)依据谓词逻辑及机器学习的理论进行本体的相似度匹配,如使用一阶谓词逻辑的描述逻辑进行匹配。

(5)根据语法和语义进行比较,如借助于类似于WordNet的词典进行同义词的判定,根据领域、需求及粒度的划分定义好本体之后,需要用本体相似度的匹配理论进行本体之间相似度的计算,主要考虑本体之间概念 属性及关系的相似度时,可以使用本体推理机辅助计算。语义推理模块接受上一步中标注的检索词,结合推理规则,利用推理机进行语义推理,查询本体库,同时利用推理引擎进行语义推理,得到检索词之间的语义关系,最终产生标准的查询语句用于进一步的信息查询。目前常用的推理机有Jena、Racer和Jess[12]。

3.4 元数据库

建立元数据,就是通过对各种非结构化得信息资源进行语义描述,使信息资源在语义理解上避免歧义、多义,使其具有规范性和可操作性。国际上应用广泛的元数据标准是都柏林元数据核心(Dublin Core Metadata)[13],而国内元数据标准有《DA/T46-2009 文书类电子文件元数据方案》。

建立元数据库的基本过程就是使用本体元数据标注,根据一定的规则和程序,对文档内容进行分析,然后给每篇文档赋予一定数量的内容标示,作为存储与检索的依据。为了便于检索,可以使用RDF或OWL语言对信息资源进行语义层面表示和描述,然后将其按一定的格式存储在元数据库(关系数据库、知识库等)中,从而建立了元数据库。

在本系统中,引入元数据机制,在概念层的下层形成元数据层。这样,概念层可以直接引入元数据模式作为特定概念类的属性集,也可以在某概念集中引入某个描述性元数据模式及其定义作为概念类。通过这种元数据引入机制,可以将特定应用的语义元数据集成到语义层次模型中。以设备资源为例,其设备资源信息包括名称、类型、所属企业、规格等元数据信息,可以根据设备类型将这些元数据分配到其所对应的概念节点下,作为此概念节点的一个资源实例。如果这个概念同时还与企业信息存在关联,那么也可以将其中相关的元数据作为其概念的数据实例。这样,元数据库中信息可以作为本体类的一个实例映射到上层的本体库中,从而使非结构化信息资源可以利用本体的语义方面的特性实现在语义层面的查询。

本文针对传统的基于关键字的信息检索中缺乏知识表示和语义处理能力的缺陷,提出了一个基于本体的语义检索系统模型。本体在智能信息检索系统中提供了必须的元语,该元语能够生成有效的查询与资源表述,使用语义标签对非结构化的信息进行描述,生成元数据,并且利用元数据库对为元数据进行统一存储管理,使检索系统可以使用语义层面的检索,并且利用语义推理机制,为终端用户的检索返回更有效的结果。总之,基于本体的语义Web信息检索技术可以使Web信息检索能更加个性化、人性化、智能化、多样化,在将来一定会得到进一步的应用和发展。

参考文献:

[1]李梅,王庆林.中文全文检索技术的研究及实现[J].情报学报,2003,22(1).10-17.

[2]孙建军,等.信息检索技术[M].北京:科学出版社,2004.

[3]TRGruber A transation approaeh to portable ontology speeifieations,Stanford University,TeehReP:Logic-92-1,1993.

[4]邓志鸿,唐世渭,张铭,杨冬青,陈捷.Ontology研究综述[J].北京大学学报,2002(9).730.

[5]李善平,等.本体论研究综述[J].计算机研究与发展,2004(7).

[6]杜文华.本体构建方法比较研究[J].情报方法,2005(10).24.

[7]Mariano Fernandez Lopez. Overview of methodologies for building Ontologies[C]. In Proceedings of the IJCAI-99 Workshop on Ontologies and Problem Solving Methods, 1999.

[8]杜文华,董慧本.本体建设工具比较研究[J].情报杂志,2005(02):5-7.

[9]OWL Web Ontology Language Overview.省略/TR/owl-features/.

[10]石静,肖航宇,熊前兴.基于SWRL规则与本体相似度的语义检索模型研究[J].计算机应用与软件,2010(7):236-273.

多元文化主义的概念篇(6)

1.引言

Jackendoff(1990)的词汇概念结构理论与Goldberg(1995)的构式语法是上个世纪九十年代认知语言学的重要理论体系,都运用了论元结构来说明语言中的一些特殊现象,动词和句式之间的关系是他们讨论和研究的中心。Jackendoff并没有明确提出“动词中心”的说法,但从他对句子的论元结构的描述不难看出,他的概念结构并没有摆脱生成语法的影子,句子的生成依然是论元插入动词的概念结构,再转化为句法结构的结果。与Jackendoff不同的是,Goldberg以构式(construction)的论元结构为研究中心,认为动词不能决定句子的生成,构式的意义才是构式生成的关键。

虽然他们研究的内容不同,一个是动词概念,一个是构式概念,但是这两者之间的关系是非常紧密的,在一定程度上,动词可以选择它能够出现的构式,同样构式也可以选择满足它的动词。而且,表明句子中动词和名词关系的论元结构在概念结构理论和构式语法中的运用都颇有新意。因此,本文想通过比较Jackendoff和Goldberg的理论方法和哲学基础,讨论这两个分别代表概念语义学和构式研究的理论之间的关系。

2.理论方法

Jackendoff用形式化的语言描述内在概念的空间关系,在生成语法学派中对语义的研究做出了很大的贡献。他的概念结构相当于语义结构,与句法和音系结构并行。Jackendoff摈弃了由表层结构映射到音系和语义结构的句法中心说,认为这三个层次是自主的结构,都具有同等的创造性,不存在从一个层次到另一个层次的派生,它们之间是对应关系而非派生关系,由对应规则(correspondence rules)联系起来。

构式是形式-意义的对应,不依赖动词,基本的句型都是构式的实例。每个构式的存在,都有与之相应的特定的意义,也就是说,构式本身就有构式意义,与句中的动词无关。构式语法没有严格划分词库与句法之间的界限,按照构式的定义,词也是形式-意义相对应的构式。与生成学派一样,构式语法试图解释为什么语法允许我们使用无数正确的表达法的同时,又让我们放弃无数其他的表达,它反对存在深层结构或语义结构的说法,认为没有从深层结构到表层结构的转换,语法是单层次的。构式是语法、语义和语用的一体,是非模块性的。(董燕萍 梁君英,2002)

概念结构是由概念成份组成的,它们属于不同的本体范畴,诸如Thing,Event,State,Action,Plate,Path,Property及Amount等。每个句法成分(除了无内容的it和there)都对应一个概念成分。但是,并不是每个概念成分在句中都有一个对应的句法成分。这可以解释同一个动词在不同的句子有不同数量的论元。(1)中的break是同一个词,具有相同的概念结构,只是在映射到句法结构时,有些概念成分没有被体现出来,概念结构中的施事者论元没有出现在(1a)。

(1)a.The window broke.

b.Bill broke the window.

(2)a.Harry climbed (up) the mountain.

b.Harry climbed down the mountain.

c.The snake climbed (up) the tree. 可以用来解释同一个动词出现在不同句子现象的还有Jackendoff(1990)提出的优势规则(preference rules),词项含有一个或多个概念条件,满足不同的条件就会有不同的表达,例如,climb有两个独立的概念条件,(1)向上走;(2)用劲抓住。(2a) 满足第一个条件,但不符合第二个,(2b)破坏了第一个条件,但满足了第二个条件,(2c)因为蛇不能抓,破坏了第二个条件,但符合第一个条件,都是可以接受的;(2d)则同时破坏了两个条件,不被接受。动词后面选择怎样的补语一直是在词项的子语类属性框架(subcategorization frame)中注明的,但是在实际的应用中,补语的类别、数量是很灵活的,如果把所有的信息都堆砌在框架中,必然是要增加习得者的负担的,有鉴于此,Jackendoff制定了一些像优势规则这样的词汇规则来解释语言的生成,这些规则在子语类属性框架之外,可以减轻词项的负重。

Goldberg并不赞成词汇规则说,她给出了一些不及物动词后面带宾语的例子。

(3)a.He sneezed the napkin off the table.

b.She baked him a cake.

c.Dan talked himself blue in the face.

Goldberg认为,如果坚持词汇规则说,为了解释三个句子的正确性,我们就必须说明三个动词在句中有特殊的含义,有三个论元,其意义分别如下:

(4)a.X CAUSES Y to MOVE Z by sneezing

b.X INTENDS to CAUSE Y to HAVE Z

c.X CAUSES Y to BECOME Z by talking(例3-例5取自Goldberg,1995)

这样就有增添另一个独立词项的趋势,而这正有违建立词库的初衷,即减轻习得者词汇习得的数量。Goldberg(1995)认为构式语法的一大优势就是关注动词与句式之间的关系,而词汇规则说把这个关系隐藏在规则本身。对于上列句式,她认为可以由各自的句式特征来解释。例如,双宾构式的定义就与三个论元(agent,patient,recipient)有关联,由构式提供句子中的论元,而不是由动词许可,这样就无需为句中的三个动词重新定义。

他们最大的分歧在于对动词意义的不同态度。在概念结构理论中,动词的概念结构是描述详尽地,可以用来预测句式的信息;而在构式语法里,构式的意义成为主导,可能和动词意义一致,也可能互补,甚而截然相反,动词意义可以表示构式意义的增添、动态作用力、前提条件,或与构式同时进行的行为或动作。构式语法否认动词意义在句式中起到的重要作用,而是认为整个构式的意义决定了论元的数量及在句法中的位置。 "

不难看出,Jackendoff(1990)和Goldberg(1995)的研究好像是沿着两条平行线进行的,前者运用词汇概念结构和词汇规则解释语言的生成,后者则是利用构式的概念解释语言的合理性;一个致力于词汇概念论元结构的描写,另一个以整个构式的论元结构为主导。概念结构理论体现的是语言从内在概念表征到句法的由下而上的产生过程,在构式理论中,我们看到的是句法、语义和语用处于同等重要地位的理念。它们是认知语言学领域两种不同的研究方法。但是,因为他们都以论元结构为切入点,论元结构揭示的是述语及其相关的名词短语之间的关系,他们选择的语料几乎相同,都是动词论元结构会产生变异的句式,如双宾结构、动结式、way-结构等。所以尽管他们采取不同的研究方式,我们还是能看出他们研究理念中的相似之处,这将在下文进行讨论。

3.论元结构

Jackendoff(1990)和Goldberg(1995)都沿用了论元结构的概念,并且赋予了新意。尤其是Jackendoff(1990)对论旨角色(thematic roles)的处理与众不同,论元在概念结构中的位置决定了它的语义特征,有标记标注以示区别,避免了一个论元可以对应多个论旨角色而一个论旨角色又可以分配给多个论元的问题的困扰,简化了论元结构。在Jackendoff的理论体系中,论元结构是概念结构的一部分,是语义表征,而非句法表征。在构式理论中,论元结构不再是词项特征,而是一个构式的句法-语义的匹配,它描述的是与这个构式相关的论元,可能与动词的论元一致,但也可能多于或少于动词论元的数量,因此,构式的论元结构成为研究的中心,不同的构式有不同的论元结构,这直接决定了句中论元的数量。Goldberg也避免使用传统的论旨角色,而是根据构式的不同将它们简化为“_er”和“_ee”来表示行为的主体和客体。

对论元结构的研究使他们对动词后面出现的不同的补足成分很感兴趣,(5)是Goldberg的例子,同样的动词kick在(5)中有着不同数量及特性的补语,使得它似乎具有了不同的含义。

(5)a.Pat kicked the wall.

b.Pat kicked Bob black and blue.

c.Pat kicked the football into the stadium.

d.Pat kicked at the football.

e.Pat kicked his foot against the chair.

f.Pat kicked Bob the football.

g.The horse kicks.

h.Pat kicked his way out of the operating room.

(Goldberg,1995:11)

kick是有施事和受事两个论元的及物动词,(5a)是kick的典型句子,但在(5b)(5c)(5e)(5f)(5h)中,kick是有三个论元的及物动词,充当第三个论元的有形容词短语、名词短语和介宾短语,而(5g)的kick只有一个论元。在不同的句式中,kick体现出不同的论元结构。构式既然是形式-意义相对应的,每个构式就有自己的含义,不依赖动词的意义,构式形式的变化将导致意义的改变,即使动词是一样的。所以,在Goldberg(1995)看来,(5)的每个句子都是一个独特的构式,有不同的论元结构,可以赋予句子不同的论元,数量上可能会与动词的论元不一样,这正符合她的动词不能预测句子意义的观念。

Jackendoff(1990)的概念结构是怎样解释这一现象的呢?他是赞成精简词库的,他认为词项信息只包含其句法类别和概念结构,子语类化的特征及对应于每一个概念成分的句法位置由普遍原则决定。这个原则就是对应规则,或称为联系规则(linking rules)。一个词出现在什么句法结构中,这结构如何对应概念结构,都与这个词的词项信息无关,而是由词项之外的规则来操作。

(6)是kick的概念结构,其中包含了kick的所有信息,表示施事致使客体沿着路径运动的过程。按照联系规则,kick的概念论元结构中的施事(Agent)出现在主语位置后,客体(Theme)占据宾语位置,形成了(5a)。客体作为可选择的论元,在(5g)中没有出现,(5d)中取而代之的是一个目标论元(Goal),(5c)(5e)则是在客体论元占据宾语位置后,再由目标论元充当介宾结构形成的。至于什么论元先占据哪个句法位置,由它们在论旨层阶(thematic hierarchy)中的先后顺序决定。

(6)kickCAUSE ([]i ,[GO([]j,[Path])])]

(5h)是所谓的way结构,动词后面的名词短语及介词短语显然都不是kick的直接宾语,(5b)是很多文献致力于研究的动结式(resultative constructions),形容词短语black and blue表述了动词kick进行的动作的结果。在kick的词项中很难体现出这两种补语的特征,所以Jackendoff 没有在词项中添加规则,而是在对应规则中添加了附加语规则(adjunct rules),他认为(5h)中动词后面的NP+PP,以及(5b)中的NP+AP都不是动词的直接宾语,而是附加语,附加成分使得概念结构中的主动词“降格”为表示伴随、方式或结果的从属部分,如(7)所示,kick是Bob变得black and blue的方式,也是Pat走出屋子的伴随动作。

(7)a.Pat made Bob black and blue by kicking him.

b.Pat went out of the operating room kicking. 他们都试图解释没有得到动词许可的名词出现在动词宾语的位置,一个采取附加语描述,一个利用构式来分配宾语,但是异曲同工。这是因为动词作为句子的一个不可或缺的组成部分,它的意义与句子的意义是互相补充、互相牵制的,无论是概念结构理论还是构式理论,动词的意义对句子都是一样的,这反映出尽管两个理论所采用的方法迥异,它们的目标却是一致的,作为认知语言学的两项研究,它们探索的是人类的认知过程,Jackendoff和Goldberg的两种研究方法体现了语言的认知性。

4.哲学基础

Jackendoff(1990;1997)认为,人的语言能力是内在的、天赋的。他的概念结构是对世界的反应,概念体系是存在与大脑中,是普遍的,与人的身体经验无关。他追随Chomsky的语言内在说,认为人类的概念体系亦分为内在概念(internal concepts)和外在概念(external concepts)。他区分真实世界(real world)和映射世界(projected world),认为真实世界和映射世界存在明显的差异,我们只能意识到我们的思维无意识组织起来的映射世界。 "

生成句法学派感兴趣的一个问题就是语言的创造性,在人类有限的大脑中,人们可以理解并创造出他们从未听过的无限的句子。Jackendoff认为,这些无限的句法结构必须以有限的语言元素(primitives)及有限的组合原则(principles of combination)的形式存在于大脑中。人们说出或理解句子的过程,就是创造或运用大脑中的信息结构的过程。

与概念结构理论鲜明的哲学基础相比,构式理论没有让我们看到明显的哲学理念,但是从Goldberg(1995)的理论阐述还是能看出端倪。Jackendoff在概念结构中确定词的含义,他采用语义分解(semantic decomposition)的方式简化词汇的概念,那么在构式语法中词义是如何确定的呢?Goldberg(1995)在第二章首先介绍了Fillmore的框架语义学,框架是指任何一个由相关概念组成的概念体系,对其中任何一个概念的理解都必须以对整个体系的理解为前提,要了解一个词的意义,就要了解框架内所有的信息。Goldberg(1995)指出动词和名词一样有框架意义,动词应该以有丰富的世界和文化知识的语义框架为背景来定义。在她看来,赋予动词丰富的框架语义知识,对于正确使用副词和附加语、明确构式中的指称、合理地解释和翻译构式,以及“阻碍”习得过程中出现的泛化(overgeneralization)都是必要的。她承认要精炼地描述词汇的框架知识是很困难的,更别说形式化的表征了,但她同样不赞成语义分解动词意义,相反,她将语义分解放在构式上,因为语义与句法之间的对应是通过构式,而不是通过词项进行的,动词的词项不含句法信息,而是属于构式的一部分,这样就不难解释在某些特殊构式中动词后面有不同特性和数量的补语。另外,不仅动词的定义与框架相关,构式的意义也是在一定的框架内确定的。因此,同动词一样,构式在语义框架内除了其基本含义外,也可能具有多种相关联的意义。以双宾构式为例,它的基本含义是物品从来源到目标的转移。但不同类别的动词构成的双宾结构会改变这种含义,如(8a)就不一定有物的移交,(8b)只表示行为者有能力使物的转移发生,但未必这样做。

(8)a.Bill promised his son a car. (8)以具有基本意的构式为原型,其他与之相关联的构式因为家族相似性,与原型构成了一个语义框架。 王寅(2002)指出,“Lakoff和Johnson将认知科学分为两大派:第一代认知科学和第二代认知科学。……Chomsky将笛卡尔哲学和形式主义哲学加以综合,形成了一种混合哲学,构成了他的语言学基础,与第一代认知科学的观点一致。”他(王寅,2002)认为,体验哲学的出现是两代的分水岭。如果说构式语法反映了代表第二代认知科学的体验哲学观,那么,概念结构理论应该是两代之间过渡的产物,因为它既具有生成语法学派所强调的心智和生成的特性,又兼具认知语言学的体验性。

5.结论

本文比较了概念结构理论和构式理论的研究方法和哲学基础,通过比较我们可以看出,它们研究的内容相近,即论元结构,所不同的是分别以动词和构式为中心,而且它们的哲学基础虽然也有很大的差异,但是都强调人对世界的体验,只是前者突出了空间体验。反映人类认知过程的共同目的以及对论元结构的共同兴趣,已经让Jackendoff和Goldberg开始联手讨论语言问题,这也是值得很多研究同一课题的学者关注的。

参考文献:

[1] Goldberg,A.Constructions:A Construction Grammar Approach to Argument Structure[M].Chicago,IL:University of Chicago Press,1995.

[2] Goldberg,Adele,and Ray Jackendoff.The English Resultative as a Family of Constructions[J].Language 80,2004:532-568.

[3] Jackendoff,R.Semantic Structures[M].Cambridge,MA:MIT Press,1990.

[4] Jackendoff,R.Twistin' the Night Away[J].Language 73,1997:534-559.

多元文化主义的概念篇(7)

一、框架语义学理论

框架语义学(Frame Semantics) 归属于认知语言学(Cognitive Linguistics)。框架这个概念在不同学科中的定义不同。本文依据的是框架语义学的框架概念。美国语言学家Fillmore将“框架”的概念引入到语言学研究中(Fillmore 1982),认为“框架”是概念系统,是人类经验、思维的结构背景,想要理解系统中的任何一个概念,都要首先理解它所在的整体结构。在建构概念框架的过程中,人们将语言知识分门别类地归入到各个认知域和框架中。

二、对二语习得词汇影响

(一)框架中的概念元素和意象元素

框架语义学中,框架元素是重要部分。一个框架至少包含一个概念框架元素( Croft & Cruse 2004:15) 。

(二)框架与视角

视角(perspective)指的是说话人看待问题界定概念的角度。同一个情景选择不同视角会产生不同的词汇表达。如(1)Tom bought a book from Jack for 5 dollars.(2)Jack sold a book to Tom for 5 dollars.前者是买方视角,后者是卖方视角。将视角引入框架, 对分析和比较近义词语的运用具有积极意义。在语义框架的背景下,近义词在一定程度上反映的是认知视角的不同。如“abolish”和“cancel”,前者的视角定位于正式的语体框架,对象包括制度、规章或习俗,后者框架视角较随意,多指取消合同、比赛等。通过视角维度的分析,可以帮助学生深入理解一些通过单纯的讲解记忆难以区分清楚的易混近义词,促进词汇的恰当使用。

(三)框架与原型

原型概念在理解人类范畴化的方面很重要, 范畴、语境和背景这些概念都是通过原型来理解的。心理学家E. Rosch( 1975)首先她还对鸟、水果、交通工具、蔬菜等十个范畴进行了实验研究, 提出原型理论。同一范畴的成员之间的地位并不相同, 典型成员有特殊地位, 被视为该范畴的正式成员。在词汇教学中, 可以以原型词作为参照,对非原型词进行分类, 并逐步将它们纳入框架, 从而达到系统而又有条理的教学。

三、词汇的具体差异

(一)跨文化差异

Fillmore认为框架不是客观世界真实存在的实体而依赖于文化框架。weekend在西方文化中用于休息, 但在印加文化中却用于赶集。[ WEEK] 框架中的WORKDAY 和WEEKEND 两个概念框架元素在西方文化、印加文化存在差异。英语的 horse和汉语的马概念元素相同, 但意象框架元素不同。[ HORSE] 框架有STRONG 的意象元素,所以英语说 as strong as a horse, 而[ 马] 框架的意象元素是快速, 汉语说快马。

(二)个体差异

人的经验不同导致不同的语义框架。如“holiday”对于教师和学生来说语义框架是周末、寒暑假等相关节日,而对于一般工人来的语义框架中可能只包括周末。对少数不休星期六、日而休星期一、二的人来说, 一般人的weekend实际上是他们的workday, 一般人的workday有一部分是他们的weekend。框架及其概念元素的个体差异实际上消解于语言社区的制约。因为没有这种制约, 语言社区各成员之间的交际就难以实现。

四、词汇学习方法

什么教学法才是最好的外语教学法?对这个问题的研究和争论从来没有停止过。本文介绍的基于框架语义学的二语词汇教学法,不同于传统的词汇教学法。框架语义学下的词汇学习,主张学习者准确理解词义,采用不同的解决途径来应对词汇学习过程中的不同阶段。在第一阶段用学习者头脑中已有的一语框架进行词义解释; 在第二阶段通过揭示二语框架来进行词义解释, 以帮助学习者建立二语框架。同义词现象与认知经济原则相违背。违背一个原则必定有另一个原则在起作用。我们认为, 这另一个原则就是认知图式化多样性。

五、结语

框架语义学提供了学习词汇语义的一种特别方式。通过对词汇语义框架的有意识关注,能够促进学生对特定词汇概念的深入理解,并帮助学生通过语义框架有效扩展相关词汇,特别是多义词和近义词的理解。语言、文化差异、同一框架内视角不同也会导致词汇意义上的不同。框架语义学也是一种编撰双语字典和语料库的组织构造方法。但传统的词汇教学法也有其优势,不能完全抛弃。二语教学中,如何合理的利用框架语用学指导教学和学习,有待进一步探索。

参考文献:

[1] Croft W,Cruse DA.Cognitive Linguistics[M].Cambridge:CambridgeUniversity Press,2004.

[2] 范娜.框架语义理论与大学英语词汇教学[J].江西电力职业技术学院学报,2007,19(4):52-53.

多元文化主义的概念篇(8)

对地理对象的概念性描述一般都是基于自然语言文字的,与描述者的知识、经验和背景有很大的关系,导致在概念描述时存在着很大的歧义性。如“高层建筑”在维基百科中被描述为:“具有较多层数高度较高的建筑”,其中“较多”和“较高”两个术语带有很强的主观性,其判别阈值取决于领域背景:中国《民用建筑设计通则》将10层及以上的住宅建筑和高度超过24m是公共建筑称为高层建筑;而《日本建筑大辞典》将5层~6层至14层~15层的建筑定为高层建筑。

1.2语义表达的方法

对地理概念的语义描述就是表达从一个地理概念空间到另一个地理概念空间的映射关系。地理概念空间之间的映射关系的研究也是当前认识语言学领域对语义理论研究的一个热点[21]。地理概念空间的转换或对应主要有比喻法、代数法、概念集成/绑定法和属性枚举法,其中属性枚举法是最容易理解的方法,即将概念的属性一一列举出来。每个概念都与一定的属性或性质关联,这些定义的属性足已确定对象的相关外延[22]。属性枚举法就是基于这点,用地理概念拥有的属性来描述概念。如“高层建筑”可以用“占地面积”,“建筑面积”、“层数”、“高度”等描述其特征。即如何找到概念(“高层建筑”)的本质属性(本体性质)是枚举法的关键。

1.3形式本体和概念化

为减少对地理国情描述的歧义和澄清自然文字描述的语义,需要对地理国情所表达的对象的本质进行分析,明确地理对象的本体语义。为达此目标,形式本体的方法为地理国情的概念化提供了有力理论基础。形式本体指用系统的、形式的和公理的方法对事物存在的形式和方式进行的逻辑开发的方式。本体被描述为用于描述形式词汇意图含义的逻辑理论,即对世界特殊概念化的本体承诺。根据概念化理论,概念化被定义为三元组:C=<D,W,>,其中为定义在域空间(D,W)上的概念关系的集合,域空间(D,W)是一种世界结构,D为域,W为D的最大状态集。概念关系ρ定义为从W到D上所有外延关系的映射(或函数):ρ:W2D。给定一个语言L和它的词汇V,对概念化C=<D,W,>的本体承诺O为:O=(C,)。其中为映射:VD∪将D中的元素赋给V中的常量,中的元素赋给V中的谓词符号。

2地理国情本体构建方法

根据创建本体的5个基本准则(清晰性、一致性、可扩展性、最小编码偏差及最小本体承诺),本文基于本体开发工程理论和已有的本体创建方法,结合天津市地理国情监测内容的特征,提出了一种构建天津市地理国情本体的方法。主要包括5个步骤,如图1所示。(1)明确本体的范围和目的:本文所要构建的地理国情本体库包含概念的范围为天津市地理国情中所有的地理概念;本体建立的目的是为天津市地理国情概念建立一套语义描述体系,从而为地理国情信息的共享和语义互操作服务。(2)列举概念:尽可能列举出领域内的所有概念,对每个概念在不同领域中的定义进行资料分析和总结,得到每个概念的定义并集。(3)概念化:采用属性枚举法对每个概念进行语义表达,形成知识框架。(4)形式化表达:用形式化语言将先前得到的天津市地理国情概念模型进行外在表达,本文采用OWLDL语言进行本体的表达和建库。(5)评价验证:根据相应的评价标准对所建立的本体进行验证。本文所述的方法是一个迭代的过程,所创建的地理国情本体在特定阶段是一个相对完善的本体,随着客观世界的变化和地理国情内涵的丰富,还需要反复的评价与修改。

2.1天津市地理国情本体构建的范围和目的天津市地理国情监测项目从城市建设、生态环境、地表变化、土地利用和地质变化5个方面就城镇化进程等45个专题展开了监测工作。本文所构建的本体库的所涉及的地理概念范围与之相对应,详情如表1所示。

2.2天津市地理国情的概念化

天津市地理国情的概念化是指以天津市地理国情所涉及的地理概念为研究对象,分析其所要服务的知识领域,根据相关标准建立概念的语义描述集,确定每个概念语义的描述集和属性集,从中提取出本体属性集,从而实现地理信息的概念化,具体过程如图2所示。

2.3天津市地理国情形式化表达

本体描述语言从自然语言到描述逻辑形式多种多样,语言的形式化和规则性越高就越利于机器理解。对于地理国情本体,支持推理的能力是很重要的,它可以检测概念间是否互相矛盾,以保证本体的质量。网络本体语言OWL(WebOntologyLanguage)是由W3C(国际万维网联盟)的共享本体的标记语言,用来描述万维网文档和应用中的类和类之间的关系,并可以通过形式化语义实现逻辑推理。综合考虑地理国情本体所需要的表达力和推理能力后,本文使用OWLDL作为地理国情本体的描述语言。它主要针对概念、性质、个体之间关系的描述,以保证强大的语义表达能力。由OWL描述的一个本体主要包括三种组成元素:类(class),实例(individual)和属性(property)。类代表一些实例的集合,OWL还支持对简单类进行并、交、补运算等集合操作得到的复杂类;实例作为类的成员出现,是领域中实际感兴趣的对象;属性是实例之间的二元关系。在OWL中有两种属性:对象属性和数据属性。

2.4地理国情本体属性库的构建

选择合适的建库工具是快速、成功地构建本体的关键。好的本体编辑软件应该具备本体录入、一致性检查、可视化、查询、推理等功能。protégé软件是目前使用最广泛的本体编辑器之一,它提供了图形化和交互式的本体设计环境,其OWLPlug-in支持OWL描述语言,满足地理国情本体属性库的构建需求。在OWL语言语法中,一个本体属性由类(A)、实例(B)、属性(C)三部分组成,并采用三元组(ACB)描述三者的关系。使用protégé软件构建地理国情本体属性库的过程也就是对地理国情本体属性的每个组成部分进行构建的过程:类的构建:建立基本本体属性(如“对象”、“成因”、“时间性”、“物质性”、“空间性”、“量度”等)的所有子类及实例,如图3所示。“天然”,而“天然”的实例有“冰川作用”、“风蚀作用”等),如图4所示。属性的构建:对于“功能”、“目的”之类的动词,在protégé中采用属性进行表达,如图5所示。

多元文化主义的概念篇(9)

中图分类号:TP391.3 文献标识码:A 文章编号:1671-2064(2017)05-0015-01

企业管理信息化建设过程中,必然要求从原有的统一规则规范向统一数据源转变。为推动企业信息化建设,加强经营管理,解决数据源不一致、数据定义不准确、传递不及时等问题,实现信息资源充分共享、信息资源利用效率最大化,必须从全局角度出发,研究分析不同层级单位、不同业务领域、不同种类信息系统建设中所涉及到的业务基础数据,构建统一的底层数据源,而其标准化程度直接影响着信息化水平,而底层数据源中最基础的莫过于数据元,下面将围绕数据元、元数据等概念粗略地讲一下自己的认识。

1 数据元

数据元表1所示;大多数期刊和标准中对他的定义是:通过定义、标识、表示以及允S值等一系列属性描述的数据单元,在特定的语义环境中被认为是不可再分的最小数据单元,即data element。这里介绍两个概念,一个是“数据元”,另一个是“数据元概念”。

2 元数据

元数据表2所示。大多数期刊和标准中对他的定义是:关于数据的数据,即data about data或metadata(meta作为前缀表示“变化”、“变换”或“元标签”之意),用以描述、解释、识别、评价甚至追踪数据。

因此,(1)元数据一般是可结构化的,这样才能用以描述或解释某对象或数据;(2)元数据是一组可结构化的数据元或数据元概念的集合。

3 主数据

如果元数据中某几个数据元或数据元概念可能基础性较强,通用性高,两个或两个以上管理系统共享且相对静态,那么这几个数据元或数据元概念就是主数据,换句话说:主数据是元数据的一个子集。

4 数据元标准内容

多元文化主义的概念篇(10)

二、题元理论

正因为并非所有的语言都可以把“施事/受事”等语义概念语法化,或者把“主语/宾语”等句法概念语义化,这样才有必要建立“题元”这样的一种概念。所以研究题元的人首先都有一种共识:一方面“题元”不可能是纯语法的成分性概念,而是在句法概念中加进语义内容。

引入题元的目的主要在于要说明那些靠原有的某种句法概念,如主语、宾语之类,所不能说明的事实。举例说,下面(1)结构形式不同,但动名语义关系差不太多,下面(2)结构形式差不多,但动名语义关系却很不相同。这时只有想办法把结构形式和语义关系两种分析结合起来才可能正确解释它们的异同:

(1) A. John bought flowers from Bill约翰向比尔买花 B. Bill sold flowers to John比尔把花卖给约翰

(2)A.他家跑了一只羊B.他家宰了一只羊C.他家卖了一只羊

三、题元角色

题元角色及其前身(语义)格60年代起进入理论语言学文献,并长期起着重要的作用。但它在定义、划界、数量设置乃至归属等方面存在一些相当严重的困难,因而又成为最富争议的概念之一。美国语言界也出现了两种截然不同的方法来克服这一问题。一种是把词项视为结构体,即:词汇—概念结构,并根据这些结构上的不同位置把题元角色派生出来。第二种是把题元角色视为某种丛集概念,并通过其特征的不同组合来派生传统的角色。《题元原型角色与论元选择》一文是第二种方法的代表作,下面笔者将对该篇进行评价。

第一,题元角色在语言中的数量和构成一直难以确定,即使是最常用的角色,如客事和施事在定义和外延上都有分歧,做进一步切分的人也不少,切分得粗细往往难以反映现象的区别,而切分得细概括力就会低。

第二,题元角色的特性应该根据什么事实基础来归纳,现在也缺乏统一的标准。但是Dowty认为其中的很多现象其实与题元角色无关,而属于句法、语用或其他语义现象。

第三,Dowty同时指出,目前人们鉴别题元角色的角度各有不同,有时以事件为根据,得出的角色能够独立于语法功能而保持稳定的语义作用。但有时又以视角为依据设立角色,得到的结果往往与事件相脱节,而且缺乏稳定性。例如“The lamp is over the table”(灯在桌子上)和“The table is under the lamp”(桌子在灯下)两句描绘的事件是相同的,但是Talmy(1985)把前句中的“lamp”定为图形,“table”定为背景,后句中的两个NP的角色则完全相反。

针对以上问题的出现,Dowty提出了以下的看法。首先,他认为传统的题元角色在切分、划界和定义方面的困难表明它们不是离散的范畴,而是个边界模糊的丛集概念。

多元文化主义的概念篇(11)

一、前言

在题元的理解中,一些学者从“词汇—概念结构”观出发,将题元视作动词的词汇蕴涵或词汇预设。jackendoff(1990)即认为题元角色是由词汇概念结构赋予某个结构位置的。按照cook(1989)的见解,概念特征是由各种细微的语义概念所构成的延续性语义混沌体,题元则是对其进行梳理与切割的结果,这同dowty(1991)将构拟题元角色的原型蕴涵当作界野模糊的连续体有相通之处。

二、题元理论

正因为并非所有的语言都可以把“施事/受事”等语义概念语法化,或者把“主语/宾语”等句法概念语义化,这样才有必要建立“题元”这样的一种概念。所以研究题元的人首先都有一种共识:一方面“题元”不可能是纯语法的成分性概念,而是在句法概念中加进语义内容。

引入题元的目的主要在于要说明那些靠原有的某种句法概念,如主语、宾语之类,所不能说明的事实。举例说,下面(1)结构形式不同,但动名语义关系差不太多,下面(2)结构形式差不多,但动名语义关系却很不相同。这时只有想办法把结构形式和语义关系两种分析结合起来才可能正确解释它们的异同:

(1) a. john bought flowers from bill约翰向比尔买花 b. bill sold flowers to john比尔把花卖给约翰

(2)a.他家跑了一只羊b.他家宰了一只羊c.他家卖了一只羊

三、题元角色

题元角色及其前身(语义)格60年代起进入理论语言学文献,并长期起着重要的作用。但它在定义、划界、数量设置乃至归属等方面存在一些相当严重的困难,因而又成为最富争议的概念之一。美国语言界也出现了两种截然不同的方法来克服这一问题。一种是把词项视为结构体,即:词汇—概念结构,并根据这些结构上的不同位置把题元角色派生出来。第二种是把题元角色视为某种丛集概念,并通过其特征的不同组合来派生传统的角色。《题元原型角色与论元选择》一文是第二种方法的代表作,下面笔者将对该篇进行评价。

第一,题元角色在语言中的数量和构成一直难以确定,即使是最常用的角色,如客事和施事在定义和外延上都有分歧,做进一步切分的人也不少,切分得粗细往往难以反映现象的区别,而切分得细概括力就会低。

第二,题元角色的特性应该根据什么事实基础来归纳,现在也缺乏统一的标准。但是dowty认为其中的很多现象其实与题元角色无关,而属于句法、语用或其他语义现象。

第三,dowty同时指出,目前人们鉴别题元角色的角度各有不同,有时以事件为根据,得出的角色能够独立于语法功能而保持稳定的语义作用。但有时又以视角为依据设立角色,得到的结果往往与事件相脱节,而且缺乏稳定性。例如“the lamp is over the table”(灯在桌子上)和“the table is under the lamp”(桌子在灯下)两句描绘的事件是相同的,但是talmy(1985)把前句中的“lamp”定为图形,“table”定为背景,后句中的两个np的角色则完全相反。

针对以上问题的出现,dowty提出了以下的看法。首先,他认为传统的题元角色在切分、划界和定义方面的困难表明它们不是离散的范畴,而是个边界模糊的丛集概念。

其次,在归纳题元角色的特性方面,dowty认为需要收缩阵地,选择许多范围中的一个观察,这样事实基础上的选择才不致流于任意性。他本人选择的是论元选择的角度。

四、浅析dowty有关题元理论的阐释

笔者认为,dowty对现有题元理论研究的批评是有道理的。实践初步证明,在定义、切分、划界和数

量设置方面的问题不解决,题元角色的研究就很难有新的实质性进展,甚至可能陷入早年对语义特征研究同样的困境。dowty正视了这一现象并试图解决,应该是值得推崇的。

dowty的理论是否可行还需取决于词项内部有无结构这一关键问题。他把题元角色定义为动词对论元的蕴涵,只与句义有关,又是个丛集概念,这样就基本排除了词项内部有结构的可能。但是,词汇语义学多年来的研究成果似乎支持相反的结论。比如:(1)词组的构成是有限制的。(2)动词隐含论元的语义往往可以根据动词判断出来。jackendoff提出,因为英语动词“enter”(进入)的词目有事件、路径、地点和事物这些结构性语义函数,所以它不仅指“经过了某个路径”还有“走入某个地方”的意思,而且其第二论元“into something”即使没有明说,这个意思也总是存在的。

再者,笔者认为,把题元角色视为丛集概念的方法在克服了传统研究某些不足的同时,也带来了一些新的问题。例如,原型蕴涵的组合有无限制?这个问题dowty并没有论述。然而,自然语言中可以找得到的某些组合,如原型施事特性自立性和原型受事特性静态性的结合却和他的体系格格不入,因为原型蕴涵是个边界模糊的连续体;相反,语言所不容的某些组合,如“感受义与自由义二者相互排斥”,dowty的体系中又缺乏排除的机制。

五、结语

总之,笔者认为,dowty有关题元原型角色和论元选择的理论避免了传统研究中的一些缺陷,又带来了新的问题,解释了不少现象,也付出了一定的代价。它值得我们借鉴,也需要我们在借鉴中做一番深思熟虑的工作。题元理论及题元角色理论是开放的课题,期望更多有识之士提出更多更好的见解不断丰富该理论的内涵。

参考文献:

[1]dowty d. thematic proto--roles and argument selection, language no. 3, new york, 1991. grimshaw, j. (1990) argument structure. cambridge, mass.: mit press.

[2]talmy, l. force dynamics in language and thought. in papers from the 21st regional meeting, chicago linguistic society, chicago: university of chicago,1985.