欢迎访问发表云网!为您提供杂志订阅、期刊投稿咨询服务!

计算机语言的概念大全11篇

时间:2023-08-03 16:18:58

计算机语言的概念

计算机语言的概念篇(1)

随着认知语言学的发展,隐喻逐渐进入认知科学的研究范畴。Lakoff等正式提出“概念隐喻”(conceptualmetaphor):人类以一个概念去理解、建构另一个概念,于是也以一个概念的词语去谈论、表达另一个概念。Fowler从隐喻对语言词语的影响角度出发指出:词一旦脱离它原来所属的范畴,而用于新的语境,隐喻便出现了。在这一意义上,几乎所有的词当不表示一种具体的意义时,就可以表现出隐喻性,因为它们的原义都可以追溯到某种具体的意义。

自然科学研究是人类的认知活动和思维过程。具有认知功能和语义功能的隐喻,在自然科学研究中成为认知工具和思维手段。当语言文字记录自然科学研究时,隐喻便发挥着生成语言词汇的功能。概念隐喻的功能机制是喻源域与目标域间的映射,即用喻源域的一个概念去表述目标域中的一个概念。在相似性的基础上用人们熟悉、了解的现象和事情来表现本来不熟悉的现象和行为,这就是隐喻的本质。认知语言学家认为,隐喻不仅是一种语言表达方式或修辞现象,而且是人类认识客观世界的逻辑思维活动,也是人类命名客观事物的重要方法。

二、自然科学新词的隐喻性

(一)生活概念隐喻自然科学新词

自然科学研究主体常常借用日常生活概念去表达科学概念,此种概念类比手段有利于化深奥的科学概念为浅显、化抽象的科学现象为形象。生物学中的相关专业术语有airway(气管)、conception(怀孕)、colony(菌群);电学专业的powersource(电源)、line(线路)、electroncloud(电子云)、electronicsmog(电子雾)、rabbitears(V形电视天线)、track(磁道);海洋学中的jetstreams(西风急流)借喻了je(t喷气机)的“迅疾”之意;交通运输领域的turnou(t岔道)显然借喻了out的基本含义“出去”。book意为“书”,科学家将其应用到计算机领域喻指“阅读器”,如e-book译作“电子阅读器”;channel在日常生活中是指“水渠、渠道”,计算机领域借用channel喻指“把I/O设备和辅助存储器联入计算机系统中的设备”;interpreter日常原意是“口译者”,在计算机范围的意义是“解释程序”,即该程序能够读出源语句并译成机器语言,并能过执行这些机器指令;download在计算机领域是指“下载”,其意义实际上取自日常生活中的load(装载)。类似词汇还有menu(菜单)、toolbar(工具栏)、mouse(鼠标)、spiders(网页爬虫)、termina(l终端机)、thinclien(t瘦客)、cookies(信息记录程序)、networkbridge(网桥)、snailmai(l传统邮件)、packets(数据包)、surfing(网上冲浪)等。许多自然科学新词生成于日常生活的物质经验,其间的援引关系正是以“概念隐喻”思维为纽带的。

(二)科学概念隐喻自然科学新词

计算机语言的概念篇(2)

当前,计算机和互联网飞速发展,广泛应用于各行各业,渐渐与人们的日常生活紧密地联系在一起。它们不仅改变了我们的生活,也创造和更新了大量的新鲜事物,计算机的相关概念和术语位列其中。科学技术领域新事物的发展促进了语言的快速发展,新事物的发展和隐喻思维方式是新词语产生的催化剂(赵艳芳,2001:113)。计算机词汇作为新创造、新发明,基本上是通过隐喻为人类所认知和理解的。隐喻不单是一种语言现象,而且是人类感知和概念客观世界诸种事物的一种重要认知活动(王文斌,2007)。隐喻通过将已有的、具体的概念进行心理加工,将认知领域中本无关联的两个或多个事情进行联系,借助表示具体物体的词来表示抽象的思维概念,为人们更进一步掌握和应用计算机及互联网提供了捷径。

一、计算机词汇概况

严格意义上,计算机词汇属于科技词汇的范畴,具备专业性强,概念抽象的特征。对于缺乏专业背景的普通人来说,科技词汇的认知和理解难度相对较大。认识事物首先是从感知信息开始的,感觉到的事物要经过加工、组织才能被理解和记忆(赵艳芳,2001:96)。与抽象难懂的科技词汇相比,计算机词汇的特点却是形式简单、通俗易懂。由于计算机科学及互联网技术的飞速发展性及普遍应用性,简洁明了的术语概念对于缺乏计算机专业背景的普通人更易接受,计算机词汇与日常生活词汇便通过隐喻的手段紧密联系起来。日常使用的词汇构成方式不是单一的,计算机词汇同样如此,例如,便携式计算机给人们提供了很多便利,只要把计算机放在膝盖上,不论何种场景,都可以使用,人们就把这种计算机称为“laptop”;“menu”通常指在餐馆或饭店点菜用的菜单,人们发现计算机显示器上数据信息的排列与菜单相似,就用menu指排列的数据选择项;“mouse”不仅仅指一种动物,也可以指与计算机相联接的、用于光标移动的设备。计算机词汇通过合成和引申等构成方法,帮助普通人群认识相关新事物、理解相关新概念。

二、概念隐喻理论

Lakoff & Johnson(1980)在《我们赖以生存的隐喻》(Metaphors We Live by)一书中指出语言与隐喻认知结构有密切的联系,提出了概念隐喻理论。他们认为,概念和行为的构建是隐喻性的,因此语言的构建也是隐喻性的。之后,Lakoff & Turner(1989)对隐喻中两个事物间的映射作了解释,即两个概念域之间的对应集。Ungerer & Schmid(1996)又从认知的角度将单个的隐喻理解为某一始源域模型的结构映射到一个目标域模型的结构。 Fauconnier(1997)进一步指出,隐喻中两个域间的映射,是人类认知能力中意义形成、转换和加工的重点。隐喻是能够对经验加以诠释的工具。束定芳(2000)指出,在人类认识事物时,由于思维能力的限制,或者由于语言中缺乏现成的语句或表达方式,而不得不用另一事物来谈论某一事物,其结果就是隐喻。隐喻的实质是借助一类事物理解和体验另一类事物。在日常生活中,人们往往参照熟悉的、有形的、具体的概念来认识、思维、经历和表达无形的、难以定义的概念,形成了一个不同概念之间相互关联的认知方式。在隐喻的基础上,人们可以通过始源域与目标域之间的映射关系达到认识未知事物的目的。隐喻不仅仅是种语言现象,更是一种人类的认知现象。它是人类将其某一领域的经验用来说明或理解另一类领域的经验的一种认知活动。在人类其他的文化和艺术活动过程中,我们到处都能看到隐喻的存在。(束定芳,2003:28)

新的隐喻之所以可以被人们所理解,是因为人类具有共同的经验、想象力和理解力,具有相似的隐喻概念(赵艳芳,2001:113)。相似性的联想是隐喻认知方式赖以生存的前提。以相似性为基础的隐喻是利用事物之间的人们已感受到的相似性;而创造相似性的隐喻则将原来并不以为其间存在着相似性的两个事物并置在一起,构成隐喻,从而使人们获得对其中某一事物新的观察角度或新的认识。可见,相似性是隐喻赖以成立的基本要素(束定芳,2003:172)。正因为万事万物是普遍联系的,任何事物之间总存在这样或那样相似的特点,人们才可能在始源域与目标域间搭起认识的桥梁,才可能在两物间寻求一个或多个共同点,达到认识的目的。人类在认识事物的时候,由于思维能力的限制,或者由于语言中缺乏现成的语句或表达方式,而不得不用另一事物来谈论某一事物,其结果就是隐喻(束定芳,2000)。隐喻是人类借用对事物某一领域的认知来诠释或解读另一领域的认知,可见相似性是隐喻的基础,是隐喻赖以生存的生命基石。(王文斌,2007:229)

三、计算机英语词汇的概念隐喻认知构建

计算机领域出现了许多新概念,无法在人类普通词汇中找到相应表达,所以就通过人脑中的意象图式寻找类似的词汇来谈论新事物。在新词语或旧词新意的创造过程中,形象化的类比、想象、联想等多种隐喻思维方式起着很大的作用。由于计算机和互联网发源于西方,本文将计算机英语词汇作为文本,研究计算机和互联网词汇与日常生活所使用的英语间的隐喻映射关系,进而理解计算机英语词汇的认知构建过程。

(一)计算机是人(THE COMPUTER IS A HUMAN BEING)

人体是由各器官共同协调工作的一个整体,各个器官的职责不同,都由大脑进行控制。计算机是一个由不同的部件构成的系统,每一个部件都有自己的作用,缺一不可,都由CPU(中央处理器)指令,进行操作。因此两者之间存在相似性,把人的特征投射到计算机词汇方面有利于我们对计算机的认识和理解。computer翻译成“电脑”就是典型的隐喻。人脑能够通过其他感官进行阅读并保留记忆,电脑也能读取数据信息以及存储数据,这样就完成了由始源域“人脑”到目标域“电脑”的映射。如“card reader”(读卡器),“command”(命令),“instruction”(指令),“edit”(编辑),“run”(运行),“record”(记录), “virus”(病毒),“bug”(漏洞)皆属于这类隐喻的词汇。

(1)My computer reads and stores data quite quickly.(我的电脑读取和存储数据都很快。)

(2)The memory is very large.(内存很大。)

(二)计算机是办公室(THE COMPUTER IS AN OFFICE)

计算机最初广泛应用在办公室,使用最频繁的是一般办公软件。人们首先就有计算机是用在办公室这类场所中的相关联想。那么,将办公室与计算机作为始源域和目标域进行映射后,“办公桌”(desktop),“文件夹”(folder),“文件”(document),“垃圾桶”(recycle bin),“打印机”(printer)这些计算机词汇就非常容易理解。计算机使用者可以对文件进行“set up”(建立)、“edit”(编辑)、“save”(存储)、“sort”(分类)、“retrieve”(恢复)和“print”(打印),就像是在真实的办公室里进行一样。

(3)The file takes up too much storage spaces.(文件占了很大的存储空间。)

(三)计算机是建筑(THE COMPUTER IS A BUILDING)

建筑和计算机之间的隐喻映射可以从“sign in/log in”(进入),“sign out/log out”(退出)看出。用户可以在计算机界面上打开不同的“window”(窗口),可以更换屏幕的“wallpaper”(墙纸),同时在不同的网络“platform”(平台)进行学习、交友、娱乐。“workstation”(工作站),“port”(端口),“library”(图书馆)等也是有关建筑物被映射到计算机领域的隐喻。

(4)You can log in the library without password.(不用密码也可以登陆图书馆。)

(四)计算机是工厂(THE COMPUTER IS A FACTORY)

在这个概念隐喻中,工厂的生产与计算机的运作构成了映射。计算机同样具有生产设施如“CPU”(中央处理器),“processor”(处理器),“device”(设备),“household”(仓库),“modulate”(模板)等。同时,“operating system”(操作系统)可以进行资源 “distribute”(分配)和“manage”(管理)。另外,为了保证预期的“quality”(质量),还应对产品进行 “debug”(调试),最后产品才能“package”(打包)出厂。

(5)Most of the devices connected to the computer communicate with CPU in order to carry out a task.(大多数连接到计算机上的设备通过与中央处理器通信完成作业。)

(五)计算机是容器(THE COMPUTER IS A CONTAINER)

计算机就像一个容器,可以“input”(输入)文字, “output”(输出)文本,它甚至还有“entrance”(入口),可以“log in”(进入)或“log out”(退出)该容器,“save”(存入)或“retrieve”(调出)你所要的资料。同时,它还拥有一定的“capacity”(容量),如果内存太满,就会出现数据“fill out”(溢出)。这时,就要“delete”(清空)回收站或“free”(释放)一些磁盘“space”(空间)。

(6)Low disk space.(磁盘空间不足)。

(7)Delete some unused files to free some disk space.(删除一些没用的文件,释放一些磁盘空间。)

随着计算机科学技术的迅猛发展,互联网日益贴近普通人的生活,成为最大、最重要的计算机网络。许多网络词汇也在概念隐喻理论的框架下应运而生。这些词汇简洁形象、易于理解,为使用者提供了很多便利。

(六)互联网是高速公路网(THE INTERNET IS A NET OF HIGHWAYS)

高速公路网是对互联网较为贴切的隐喻描述。遍布全国各地的高速公路互相联系、彼此交织,构成了四通八达的交通网络。在高速公路上,各种车辆高速行驶,畅通无阻。遇到收费站要交费,遇到事故可能会致使交通堵塞。高速公路网映射到“Internet”(互联网),有运行“path”(路径),“shortcut”(捷径),“access permission to information”(信息准入许可),“web speed”(网速)和“download speed”(下载速度)。如果迷路,还可以寻求“guide”(向导)和“map”(地图)的帮助。

(七)互联网是战争(THE INTERNET IS A WAR)

战争和互联网间的映射是后来出现的。随着互联网的不断渗透,计算机用户有时会受到“hacker”(黑客)的“attack”(袭击),“virus”(病毒)的“threaten”(威胁)。为了“defend”(保护)个人计算机的“security”(安全),用户可以设置自己计算机的“password”(口令)或者“code”(密码),确保个人信息的“safety”(安全性)。

(8)The website has been attacked by hacker.(网站让黑客袭击了。)

(9)My file was destroyed.(我的文件被毁了。)

(八)互联网是本书(THE INTERNET IS A BOOK)

很多要素构成了始源域书和目标域互联网的隐喻映射。如当人们在浏览或阅读“web page”(网页)时,可以调节屏幕“brightness”(亮度),“contrast”(对比度),“font”(字体)等,也可以通过“category”(目录)进行“retrieval”(检索),或者“page up”(前进翻页),“page down”(后进翻页)。

四、结语

隐喻无处不在,与日常生活联系十分紧密。在原始社会中,人类创造并使用的第一批词汇多是表示具体事物的,后来人们又用它们命名其他相似的具体事物,当人类从具体概念中逐渐获得了抽象思维能力的时候,往往借助于表示具体事物的词语表达抽象的概念(赵艳芳,2001)。计算机作为人类的新创造、新发明,就是通过这样的方式被人类认知理解进而广泛运用。隐喻普遍存在于计算机英语词汇中,因此对计算机英语词汇的认知构建十分重要。借由概念隐喻的映射,我们可以对现有的计算机英语词汇进行理解,也能为理解将来产生的计算机英语词汇提供有效的认知途径。

参考文献:

[1]Fauconnier, G. Mappings in Thought and Language [M]. Cambridge: Cambridge University Press, 1997.

[2]Lakoff, G & M. Johnson. Metaphor We Live by [M]. Chicago: University of Chicago press, 1980.

[3]Lakoff, G & M. Turner. More Than Cool Reason: A Field Guide to Poetic Metaphor[M].Chicago: Chicago University Press, 1989.

[4]Ungerer, F. & H. J. Schmid.An Introduction to Cognitive Linguistics[M].London: Addison Wesley Longman Ltd, 1996.

[5]范立云.计算机英语隐喻的认知价值[J].四川大学学报,2004.

[6]李阳、刘著妍.计算机隐喻词汇的功能与翻译[J].海外英语,2012,(10).

[7]林丽芳.论计算机英语的隐喻性[J].厦门大学学报(哲学社会科学版),2001,(1).

[8]刘淑容.计算机词汇隐喻的认知研究[D].湖南师范大学,2008.

[9]束定芳.隐喻学研究[M].上海:上海外语教育出版社,2000.

[10]束定芳.隐喻学研究[M].上海:上海外语教育出版社,2003.

[11]王文斌.隐喻的认知构建与解读[M].上海:上海外语教育出版社,2007.

[12]许满云.计算机英语词汇隐喻的认知研究[J].湖北广播电视大学学报,2012,(4).

计算机语言的概念篇(3)

随着计算机现代智能的高速发展,计算机已经完全融入我们的生活,甚至占据了重要领域,从国家核心科技到每个人生活的小细节,都离不开计算机的覆盖和使用。我们简单的在键盘上操作几个键,打出一系列符号命令,就能使计算机按照人类的要求,高速运行和进展,从而达到人力所不能达到的速度和正确率。

我们从小学习数学,数学是什么呢?数学是利用符号语言研究数量、结构、变化以及空间模型等概念的一门学科。数学,作为人类思维的表达形式,反映了人们积极进取的意志、缜密周详的逻辑推理及对完美境界的追求。数学更多的是一种抽象的概念,是一门重要的工具学科。人类利用抽象的概念及一些固定的定律形成理论,而脱离实际应用的概念并不是人类发展学习的初衷,而是利用它们来指导实际,化抽象为实体。而计算机就由此演化。1946年2月15日界上的第一台计算机诞生在宾西法尼亚大学,主要运用于高倍数的数学运算。时至今日,计算机直接能识别的语言仍然是1、0二进制代码。

1 计算机中所需要的数学理论

计算机学科最初是来源于数学学科本文由收集整理和电子学学科,计算机硬件制造的基础是电子科学和技术,计算机系统设计、算法设计的基础是数学,所以数学和电子学知识是计算机学科重要的基础知识。计算机学科在基本的定义、公理、定理和证明技巧等很多方面都要依赖数学知识和数学方法。计算机数学基础是计算机应用技术专业必修并且首先要学习的一门课程。它大概可分类为:

1.1 高等数学 高等数学主要包含函数与极限、导数与微分、微分中值定理与导数的应用、不定积分、定积分及应用、空间解析几何与向量代数、多元函数微分法及其应用、重积分、曲线积分与曲面积分、无穷级数、微分方程等。各种微积分的运算正是计算机运算的基础。

1.2 线性代数 线性代数主要包含行列式、矩阵、线性方程组、向量空间与线性变换、特征值与特征向量、二次型等。在计算机广泛应用的今天,计算机图形学、计算机辅助设计、密码学、虚拟现实等技术无不以线性代数为其理论和算法基础的一部分。

1.3 概率论与数理统计 概率统计与数理统计包含随机事件与概率、随机变量的分布和数学特征、随机向量、抽样分布、统计估计、假设检验、回归分析等。概率论与数理统计是研究随机现象客观规律并付诸应用的数学学科,通过学习概率论与数理统计,使我们掌握概率论与数理统计的基本概念和基本理论,初步学会处理随机现象的基本思想和方法,培养解决实际问题的能力。这些都是计算机编程过程中不可或缺的基础理论知识和技能。

2 计算机编程中数学理论的应用

计算机的主要专业知识包括计算机组成原理、操作系统、计算机网络、高级语言程序设计、数据结构、编译原理、数据库原理、软件工程等。计算机程序设计主要包括如:c语言、c++、java、编译语言、汇编语言等编程语言的基本概念、顺序结构程序设计、分支结构程序设计、循环结构设计、函数、指针、数组、结构、联合以及枚举类型、编译预处理、位运算、文件等内容,掌握利用各种编程语言进行程序设计的基本方法,以及编程技巧。算法是编程的核心,算法的运用离不开数学,数学运算正是编程的基础。

计算机科学是对计算机体系,软件和应用进行探索性、理论性研究的技术科学。由于计算机与数学有其特殊的关系,故计算机科学一直在不断地从数学的概念、方法和理论中吸取营养;反过来,计算机科学的发展也为数学研究提供新的问题、领域、方法和工具。近年来不少人讨论过数学与计算机科学的关系问题,都强调其间的密切联系。同时,人们也都承认,计算机科学仍有其自己的特性,它并非数学的一个分支,而有自身的独立性。正确说法应该是:由于计算机及程序的特殊性,计算机科学是与数学有特殊关系的一门新兴的技术科学。这种特殊关系使得计算机科学与数学之间有一公共的交界领域,它范围相当广,内容相当丰富,很富有生命力。这一领域既是理论计算机科学的一部分,也是应用数学的一部分。

2.1 计算理论是关于计算和计算机械的数学理论。主要内容包括:

①算法:解题过程的精确描述。②算法学:系统的研究算法的设计,分析与验证的学科。③计算复杂性理论:用数学方法研究各类问题的计算复杂性学科。④可计算性理论:研究计算的一般性质的数学理论。⑤自动机理论:以研究离散数字系统的功能和结构以及两者之关系为主要内容的数学理论。⑥形式语言理论:用数学方法研究自然语言和人工语言的语法理论。

2.2 计算几何学是研究几何外形信息的计算机表示,分析和综合的新兴边缘学科,它是计算机辅助几何设计的数学基础。主要内容如:贝塞尔曲线和曲面、b样条曲线和曲面、孔斯曲面。

2.3 并行计算问题是 “同时执行”多个计算问题。他的延伸学科有:并行编译程序、并行程序设计语言、并行处理系统、并行数据库、并行算法。

2.4 形式化方法是建立在严格数学基础上的软件开发方法。软件开发的全过程中,从需求分析,规约,设计,编程,系统集成,测试,文档生成,直至维护各个阶段,凡是采用严格的数学语言,具有精确的数学语义的方法,都称为形式化方法。

计算机语言的概念篇(4)

1 引言

随着internet的日益发展和普及,本体在信息采集、信息检索及本体集成等方面的应用越来越广泛。2002年12月18日berners-lee在国际xml2000的会议提出semantic web(语义网)的构想[1]。在semantic web中,语义相似度算法是实现基于本体的检索、采集等的关键问题。因此语义相似度算法的好坏成为信息检索效率高低的重点,于是改良语义相似度算法是一个迫切的问题。

关于语义的相关性,国内外专家已经做了大量的工作:resnik根据两个词的公共祖先节点的最大信息量来衡量两个词的语义相似度。agirre等在利用wordnet计算词语的语义相似度时,除了结点间的路径长度外,还考虑到概念层次树的深度、概念层次树的区域密度。鲁松研究了如何利用词语的相关性来计算词语的相似度。li sujian等提出了一种词语语义相似度的计算方法,计算过程综合利用了《知网》和《同义词词林》。朱礼军等引入了计算语言学中的语义距离思想来计算领域本体中概念间的相似度。

本文总结前人的经验,并将概念的数据类型考虑其中,这样概念的语义相似度就更加精确。

2 本体与领域本体

本体(ontology)作为一种能在语义和知识层次上描述信息的概念模型,自被提出以来就引起了国外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用,如知识工程、数字图书馆、软件复用、信息检索和web上异构信息的处理、语义web等。

2.1 本体的概念

目前对本体的定义有很多,专家们认为由studer等人在1998年提出的“本体是共享概念模型的明确的形式化规范说明。[3]”最为精确。它包含4层含义:概念化(conceptualization)、明确(explicit)、形式化(formal)和共享(share)。

(1)概念化:指通过抽象得出客观世界中一些现象(phenomenon)的概念模型。

(2)明确:指所使用的概念及使用这些概念的约束都有明确的定义。

(3)形式化:指本体是计算机可读的(即能被计算机处理)。

(4)共享:本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。

2.2 本体的分类

guarino[5]在1997年对本体依照领域依赖程度,分为顶级(top-level)、领域(domain)、任务(task)和应用(application) ontologies共4类。其中:

(1)顶级ontologies描述的是最普通的概念及概念之间的关系,与具体的应用无关,其他种类的ontologies都是该类ontologies的特例。

(2)领域ontologies描述的是特定领域中的概念及概念之间的关系。

(3)任务ontologies描述的是特定任务或行为中的概念及概念之间的关系。

(4)应用ontologies描述的是依赖于特定领域和任务概念及概念之间的关系。

本文主要就是基于领域ontology来设计与研究语义相似度计算方法。

3 语义相似度计算

语义相似度是判断几个概念之间的语义的相似程度。在信息检索中,它反映的是用户查询关键词的意义上的符合程度。

3.1 语义相似度计算原则

语义相似度的计算原则是为了本体内部概念间相似度计算更加准确而提出的[2],其内容如下:

(1)量化原则:相似度是一个数值,取值范围应该在[0,1]之间[3],如果两个概念完全相同,那么他们的相似度为1,完全不同,相似度为0。

(2)简单性原则:计算相似度的同时应该考虑计算复杂度[4],复杂度应该尽量降低。

(3)充分利用本体的特性。

(4)可调节性:可调节性是指相似度的计算结果可通过某些参数来调节,词语相似度是一个主观性比较强的概念,可调节性可以满足不同的需求,适应不同的情况[2]。

(5)类型性:在计算概念相似度的时候,也应该将概念的数据类型考虑其中,这样能提高概念相似度的精度。

(6)对称性:sim(c1,c2)= sim(c2,c1),对称性有利于概念相似度之间的对比与换算。

3.2 相似度计算方法

本文建立了一个简单的医疗系统的本体,如图1所示。class:表示的是类,subclassof:表示的是本体中最主要的关系,即概念之间子类的关系,也就是继承关系。例如:c0是c1,c2的父类,而c1与c2则是c0的子类。

利于owl语言构建此本体的代码片段,如下:

xmlns:rdf="/1999/02/22-rdf-syntax-ns#"

xmlns:xsd="/2001/xmlschema#"

xmlns:rdfs="/2000/01/rdf-schema#"

xmlns:owl="/2002/07/owl#"

xmlns="/ontology1243997987.owl#"

xml:base="/ontology1243997987.owl">

……

……

(1)语义距离:是两个概念在本体树中的最短距离,记作distant(a,b)。①语义距离越大,其语义相似度越低。反之越大。②两个概念的父节点是同一个,那么distance=1/n(n表示与该节点有共同父节点的子节点的个数)③同一概念的语义距离为0。例如:图1中所示的distance(c5,c5)=0,distance(c7,c8)=0.5。

(2)datatype(数据类型属性)的相似度:是两个概念的数据类型的比较得出来的一个参数值,记作simdt(a,b)。如果两个概念的数据类型相同,则simdt(a,b)=1。如果不同,则simdt(a,b)=0。

(3)objectproperty(对象类型属性)的相似度[5]:是类与类之间的关系,记做simobject(a,b)。和分别表示概念和的对象类型属性的个数。 的对象类型属性所对应的概念为,的对象类型属性所对应的概念为,则概念的对象属性的语义相似度为:

(4)本体概念的深度:是概念在本体树中的层数,记作depth(a)。

(5)调节因子:是为了满足系统的特定需要而设定的特定参数。由于词语相似度是一个主观性比较强的概念,所以必须使用调节因数来具体情况具体分析。它通过对本体树的广度与深度的控制来调节特定的语义的相似度。本文用k来表示调节因数。

综合得出语义相似度算法的公式:

式中sim(c1,c2)表示概念c1、c2的语义相似度,distance(c1,c2)表示概念c1、c2的语义距离,simdt(c1,c2)表示概念c1、c2的数据类型的相似度,simobject(c1,c2)表示概念c1、c2的对象类型的相似度,k表示调节因子,depth(c1)表示c1的的深度(即本体树中的层数),分别是数据类型属性和对象类型属性在属性相似度中的权值,,且。

3.3实验结果

根据本文得出的语义相似度算法,即上述公式计算出表1所示的本体树的语义相似度。

3.4 基于本体语义相似度的应用

begin;

input:查询表达式 q={w1,w 2,……,wn} and 语义相似度的临界值k;

result = null,i=0;

while(q[i]的语义相似度>=k){

result[i]=q[i]+相关概念集;

i++;

}

return result;

end;

4 结束语

人与机器之间的有语义的交流近年来成为了人们研究的焦点与瓶颈。本体由于其共享性和明确性以人与机器的语义交流的基础进入了人们的视野。本文通过建立本体树,利用其层次之间的关系来设计概念的语义相似度算法。同时将概念的数据类型与对象类型也考虑其中,这大大提高了概念的语义相似度算法的精度。但是由于本文只考虑了基于单个本体的相似度算法,不能满足多个领域本体间概念的相似度算法。在以后的研究中,会将此算法扩展到多个领域来设计,以便大幅度提高概念的语义相似度的精度,进而优化基于本体的信息检索及信息采集。

参考文献

[1]berners-lee t,hendler j,lassila o.the semantic web[j].scientific american, 2001,284(5):34-43.

[2],陶兰.一个改进的本体语义相似度计算及其应用[j].计算机工程与设计,2007,28(1):226-228.

[3] 刘建,李素建.基于《知网》的词汇语义似度计算[j].中文计算机语言学, 2002,7(2):59-76.

计算机语言的概念篇(5)

(一)计算机是虚拟网络

计算机网络完全是模拟真实的空间而建的,在这个空间里人们可以交朋友、浏览信息、学习、工作、娱乐休闲等等。当然,生活空间的一些词语与互联网中一些空间是相似的,即原始域同目标域之间是一种结构映射的关系。比如:你想看书,可以有“书架”,设置“文件夹”、“书签”;互联网有“封皮”(screen);有“纸张”,纸张有“亮度”(brightness),“对比度”(contrast);有“字体”(font);有“目录”(category),有“检索”(retrieval);有“首页”(home)也有“尾页”(end);有“前进翻页”(pageup),“后进翻页”(pagedown)和“暂停”(pause)。由此可以看出,计算机网络中的新词都是隐喻的,“电子书”的概念是由真实书本的概念所构成的。电子书有目录、有检索、有文字、有封面等等。从此意义上讲,网络是书这个隐喻概念决定了人们对电子书的认识和理解。

(二)计算机是人脑

计算机作为一种功能强大的工具,被设计用来处理人们全部的商务事务和所有的个人需要。因此,计算机又被称为电脑或人脑。顾名思义,电脑体现了人脑的功能以及人脑处理事务时的运行模式,而关于电脑在不久的将来终将取代人类的预言也屡见不鲜。电脑设备和运行过程也是从人脑隐喻而来的。人脑就是一个系统,在这个系统里,记忆力(memory)是人脑的核心,没有学习就没有理解,理解是记忆的基础。人类通过眼睛耳朵等感觉器官接受信息,也就是说感觉器官是人类摄取信息的途径。同样,计算机也有和人脑相似的记忆系统,那就是存储器(memory),计算机的内存是通过键盘、鼠标接受指令和信息的,没有键盘就没有计算机的工作平台。正因为memory一词被人们所理解,原始域人脑的各个特征才能成功地映射到目标域计算机系统。

综上可知,人是以人脑为中心的,在人脑的指挥下进行所有的工作,比如看、听、学等。计算机和人是一样的,它是以cpu为大脑,并且在它的指挥下也能和人类一样进行一系列的动作。人脑的认知特征与计算机的主要特性基本相同,用一种概念结构来架构另一种概念结构。通过对比,我们发现二者都有存储信息和读取信息的功能,正因如此,才能通过记忆的概念来理解存储器功能。

计算机语言的概念篇(6)

词语的语义相似度计算有3种方法:基于知识体系的方法、基于语料库的方法、基于网络的方法。基于知识体系的方法,大多以WordNet作为基础。WordNet是语义字典,它根据词条的意义将词语分组,每一个具有相同意义的字条组称为一个synset(同义词集合)。WordNet为每一个synset提供了简短,概要的定义,并记录不同synset之间的语义关系。它用概念之间的语义关系形成符合常识和语法的语义关系图。基于信息量的方法主要是通过词语上下文的信息,用统计的方法求解。基于网络的方法,主要是利用搜索引擎的搜索结果进行计算。 

二、语义相似度概念 

信息论中任何两个词语的相似度取决于它们的共性(Commonality)和个性(Differences)。公式如下: 

其中,分子表示描述A,B共性所需要的信息量;分母表示完整地描述A,B所需要的信息量。 

刘群、李素建认为语义相似度就是两个词语在不同的上下文中可以互相替换使用而不改变文本的句法语义结构的程度。两个词语,如果在不同的上下文中可以互相替换且不改变文本的句法语义结构的可能性越大,二者的相似度就越高,否则相似度就越低。对于两个词语W1,W2如果记其相似度为Sim(W1,W2),其词语距离为Dis(W1,Wz),根据刘群、李素建的公式: 

其中a是一个可变参数,含义是当相似度为0.5时的词语距离值。 

相似度被定义为一个0到1之间的实数,当两个词语完全一样时,相似度为1;是完全不同的概念时,它们的相似度接近于0。 

三、语义相似度的计算方法 

常用计算方法有基于知识体系的计算,基于大规模语料库的计算,基于网络的计算。 

(一)根据分类体系计算词语语义距离的方法 

这种方法也称为基于树的语义相似度计算方法,大体分为两种:一是基于距离的语义相似性测度;二是基于信息内容的语义相似性测度。主要是利用语义词典,我们可以把概念看做节点,关系看作边,这样WordNet的结构就可以看作是图结构。 

(1)基于树状层次计算语义相似度的基本思想 

这是以边为距离来计算语义相似度。如果树状语义网中所有的边即树的分支是等长的,那么边的数目可以作为距离的测度。假定要确定词语W1.W2之间的语义相似度,可以在该语义网中首先找到包含待比较词的那些子概念(或义原)。在此情况下,两者之间的语义相似性可以用连二者之间的最短路径来表示。例如,在图1(取自Wordnet本体中的一小部分)中,kid和boy之间的最短路径是}kid一juvenile一persor一male-girl,最小路径长度为4。而educator和boy之间的最小路径长度为5。因此,girl比teacher在语义上更接近于boy。该测度算法在基于Wordnet的语义网中获得了较好的计算结果。 

图1 

(2)基于《知网》hownet的语义相似度计算 

知网(英文名称为HowNet)是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。其中描述了16种关系,如上下位关系、部件-整体关系、属性-宿主关系等。《知网》中有两个主要的概念:“概念(义项)”与“义原”。“概念”是对词汇语义的一种描述。每一个词可以表达为几个概念。“概念”是用一种“知识表示语言”来描述的,这种“知识表示语言”所用的“词汇”叫做“义原”。“义原”是用于描述一个“概念”的最小意义单位,用多个义原对概念进行描述。目前有1500多个义原,但可以组合数量庞大的词汇。用义原计算可以有效提高效率,并且义原的相似度也可以根据其在义原树中的位置得出。因此它并非树状结构,而是一种网状结构;同时借助义原和符号对概念进行描述。对于两个汉语词语a和b:,如果A有n个义项(概念):sll,Slz}...,Sln,B有m个义项(概念):Szl,Szz,...}Sz}n,则词语A和B的相似度是各个义项相似度的最大值,义项又由义原表示,这样就将词语相似度转化为两个词语义原之间的相似度。并且由于义原在知网中所处的层次不同,它们在整体相似性中所占的比重也不一样,对词语相似性的影响程度也有所有不同。 

(二)利用大规模的语料库进行统计 

语料库语言学(Corpus Linguistics)是计算语言学的分支学科。它研究机器可读的自然语言文本的采集、存储、检索、统计、语法标注、句法语义分析,以及具有上述功能的语料库在语言定量分析、词典编纂、作品风格分析、自然语言理解和机器翻译等领域中的应用([HCN90])。语料库语言学研究的基础是机器可读的大容量语料库和一种易于实现的统计处理模型,两者是相辅相成、缺一不可的。从本质上讲,语料库语言学的研究采用的是一种基于统计的经验主义处理方法,它与传统的基于规则的理性主义处理方法是不同的。 

基于语料库的词语相似度研究大都采用了上下文语境的统计描述方法,即认同这样一个论断:词语的上下文可以为词语定义提供足够信息。词语向量空间模型是目前基于统计的词语相似度计算策略使用比较广泛的一种,算法复杂度也能够实现的模型。该模型事先选择一组特征词,然后计算这一组特征词与每一个词的相关性(一般用这组词在实际的大规模语料中以该词在上下文中出现的频率来度量),于是对于每一个词都可以得到一个相关性的特征词向量,然后利用这些向量之间的相似度作为这两个词的相似度。 

(三)基于信息量的计算方法 

一种是根据语义词典树的信息,根据树状结构中两个节点所含的信息量大小(子结点数与树中的所有结点数的比)来计算语义相似度。另一种是把Internet作为一个大型的语料库,以搜索引擎返的结果数作为计算的依据。公式如下: 

其中,NGD介于0与1之间,表示相似度.f(x),f(y)分别表示含概念x,y的网页数,f(x,y)表示同时含有概念的网页数,N表示搜索引擎引用的网页总数。以词语horse与rider为例,搜索词语"horse”返回46700000(记为f(x))条结果,搜索词语“rider"返回结果数为12200000记为.f'(y)),搜索同时含“horse,rider'的网页数是2630000(记为f(x,y)),共引用的网页数是 

N=8058044651,代人上述公式(7)求得: 

计算机语言的概念篇(7)

1 概论

1.1 自然语言理解的含义

广义“语言”是指任意有结构的符号系统。在这之中,自然语言和形式语言是常用的最关键的两种语言。然而狭义“语言”是说人类在社会生活中发展出来的用来互相交际的声音符号系统,是“自然语言”。

“自然语言理解”又名为人机对话,说的是让计算机根据这种语言所传递的指令做出相对应的回应的体系。

1.2 自然语言理解技术的含义

(1)自然语言是非常繁琐的符号系统。

(2)自然语言所有层次都具有非常高的不稳定性。

(3)自然语言是时时刻刻都在改变的,它在人们的日常生活中变化,在不同语言的使用者之的相互影响和发展。

(4)自然语言是人们交流思想的工具。

2 自动理解系统涉及到的问题

(1)人类拥有独立的语言能力,可以做出词与词之间的区分,为了使计算机能够达到类似的效果,需要将有可能用到的词语搜集到计算机系统中并构建相应的词语库。

(2)人们是通过识别出题目语句中的各个成分来对应用题题目进行理解的。计算机必须具有对句子中重要成分进行划分并标注,才能拥有像人类一样的能力。

(3)本文的最终目的是为了理解应用题,分析句子成分之后如何提炼成分之间的数量关系,即如何将题目中涉及的知识提取表述出来。

综上所述,为获得能达到以上三点要求的一个系统,应解决如下问题:

① 句子成分的自动分析

句子成分的自动分析意味着识别出句子中的各个单词。这包括了确定句子中的各个成分,以及判断不同成分的必要性,并如何实现其中的具体过程。

② 题目所含信息的提取与表示

题目所含信息的提取与表示则意味着要在分析句子成分后提取有效的信息,并将这些信息以计算机能够理解的方法进行表达。

3 句子不同成分的分析

3.1 语义块

语义块在句子中起着最小语义构成单位的作用,常用词或短语来表达。语义块的具体分类如下所示:

(1)主语义块:主语义块是句义中最重要的成分之一,可以将他们的组成部分分成核心部分和说明部分。

(2)辅语义块:相比于主语义块显得无足轻重。

在概念网络理论中,特征语义块的上装代表前说明成分,特征语义块的下装代表后说明部分。特征语义块的构成可表示如下:

E=上装+Ek+下装 公式1

其中,Ek是E块的核心部分。

3.2 句类

句类定义了句子的语义类别,具体分类如下所示:

(1)基本句类:基本句类只表达作用效应链的一个环节。

(2)混合句类则表达作用效应链的任意多个环节。

E语义块可以构成效应句、作用句、转移句、过程句、状态句和关系句。每一个基本句类有其下属类别,下属类别之下还可以再分子类。

3.3 概念层次网络理论的句类分析技术

概念层次网络理论的句类分析技术是专门为了对语句进行句子语义成分分析的一类技术,是识别句子中各语义块的一种方法。

概念层次网络理论的句类分析通过以下步骤来完成:

(1)对语义块进行感知。

(2)作出语义假设。

(3)旬类检验。通过对句类的合理性进行分析,确定出句子的句类。

(4)分析语义块的构成。在旬类检验通过之后,分析各个语义块的内部结构。

本文主要是利用HNC的句类分析技术,对句子中的各个语义块进行识别,识别之后按照一定规则提取出各个语义块之间的数量关系。

4 系统的设计

为了将以句类知识提取思想诉诸实践,实现前面所设计的算法,对这一思想的可行性以及实用性进行检验,本文设计并实现了一个自动理解系统。系统的总体模型如下:

依据本文中设计的系统总体模型框图,设计出的应用题自动理解系统的具体流程为:

(1)先处理各个分句;再处理各个分句中的各个分词,以词的序列来代替各个分句。

(2)通过字词结合规则预处理阶段,标注一些特殊的语义块。

(3)识别语义块,具体途径则参照概念层次网络理论的句类知识和语义块知识。

(4)结合特定规则提炼出各个子句蕴含的知识;最后扫描问题,寻找出需要求的未知量。

5 结束语

5.1 本文总结

本文通过研究自动理解应用题系统的设计原理与设计思路,分析了自动理解时需要注意的问。本的主要工作如下:

(1)针对高中生应用题的具体特点,在概念层次网络主要理论基础上,概括总结了常用的3种句子成分的划分模块。

(2)给出了高中生应用题自动理解系统的总体设计模型和基本设计流程。

5.2 进一步研究

本文在概念层次网络理论的基础上设计出了高中生应用题自动理解,在未来的科研工作中,本文准备再做以下几个方面的深入研究:

(1)加强系统功能:本系统初步实现了应用题自动理解,因此在下一步中可以考虑继续实现已被理解题目的相关解答,即添加应用题自动解题模块。

(2)深入使用概念层次网络理论:为了处理各变量之间关系更加复杂的应用题,可以在自动理解系统中应用更多概念之间的关联性,以提高系统在高复杂度下的执行效率。

参考文献

[1] 晋耀红.HNC(概念层次网络)语言理解技术及其应用[M].北京:科学出版社,2006.

[2] 苗传江.HNC(概念层次网络)理论导论[M].北京:清华大学出版社,2005.

计算机语言的概念篇(8)

中图分类号:G642.0?摇 文献标志码:B 文章编号:1674-9324(2013)19-0204-02

1 引言

程序设计课程是工科大学生的计算机基础教育必修课,而C语言作为一种常见的高级语言被广泛采用。另外,C语言程序设计课程也是计算机科学与技术专业的学科基础课程,是数据结构、操作系统等课程的先修课程。通过该课程的学习,可以使学生了解高级语言程序设计的基本思想,掌握相应的程序设计语法与一定的算法,为后续课程打下良好基础[1]。

然而,C语言涉及的概念较多,其语法规则广且较分散,各知识点间有穿插,常常使初学者很难理清头绪。传统教学方法按照相关知识点顺序介绍,常常使学生在学习的中前期“只见树木不见森林”,陷入到语法规则中。这样,部分学生在趣味性较多的算法介绍到来之前容易丧失信心甚至放弃学习。

针对这种情况,本文提出了多角度模块化教学方式,通过对教学内容进行整体化归纳提炼,使得学生在教学的早期阶段能够对课程有感性的整体认识。另外,通过不同视角的知识点模块化,让学生从多个角度理解相关概念及它们的区别与联系,从而达到更好地掌握课程知识的目的。

本文剩余部分的结构为:第2节详细介绍了多角度模块化教学方法的实施细节,第3节介绍该教学改革的试点情况,第4节对全文进行了总结。

2 多角度模块化教学方法

C语言课程知识点较多,包括:数据类型,运算符与表达式,顺序程序,循环程序,数组,函数,编译预处理,指针,结构体与共用体,文件,等。这些知识点中又包含相当多的语法规则,显得零零碎碎,初学的学生很难把握[2]。本章从三个不同的视角介绍模块化教学方式以解决这些问题。

2.1概念模块化

通过将众多的概念知识归纳提炼并模块化授课,可以有利于学生从总体上把握概念,也便于进一步自学更多的知识点。以数据类型为例,授课时并不是逐一讲解,而是首先以模块化方式展现这一部分的主要知识点,图1给出了这部分概念模块化的一个示意图。

授课时根据模块图讲解概念间的区别和联系,鼓励学生克服对这一部分的学习感到枯燥的情绪,然后再逐步讲解这些概念内容,讲解中注重相关比较,使得学生进一步加深印象。

由于从不同角度归纳总结存在不同的模块化,因此同时展现多个角度的知识概念模块对深刻理解问题是非常重要的,以C语言中的作用域与存储类别为例,通过时间和空间的不同角度可以加深学生对这部分重要概念的掌握。图2给出了从作用域角度和存在时间角度归纳的变量存储类别。这些模块化归纳对学生深入理解和掌握函数及软件复用的相关概念和思想是非常必要的。

2.2常见算法模块化

学生在课程教学的中后期开始逐步理解和阅读相关程序,但自己写程序却非常困难,常常对自己理解的简单的程序也难以独立写出,这是因为缺少常见算法的模式积累。如同英语作文写作需要积累一定的句式一样,程序设计初学者也需要积累一定的常见算法模块。可以从多个角度积累相关算法模块,如从实际问题的角度、从程序套路的角度归纳提炼并进行模块化。

以实际问题的角度为例,比较重要的算法有:求素数、求公倍数公约数等等,这些算法的重要性其实不在应用本身,而是一种编程思想的锻炼。对这些问题模块化,有助于训练学生快速独立编写程序,树立学习信心。

从程序套路的角度,对初学者而言,熟练掌握累加、阶乘、求最值等的模块化套路是非常重要的。以累加为例:诸如:-+…± 此类的程序均可模块化为如下代码:

sum=0;sign=1;for(i=0;i

其中为泛化的累加项,sum记录累加和,sign记录正负号变化,i是循环变量,N是循环次数。通过将这些套路模块化也有助于学生理解计算机与人各自的优缺点,理解自然语言转化为高级语言直至机器语言的一般过程,激发学生程序设计的兴趣和灵感。

2.3 实验模块化

实验对程序语言的学习至关重要,只有通过实验反复训练才可能真正掌握纷繁复杂的C语言语法规则,领悟程序设计的思想[3]。如何利用好有限的实验时间是非常值得探索的问题。将实验按内容或方式模块化可以方便程序验证,提高学习效率。

通常,实验根据课程进度分阶段完成不同的内容,前后联系并不大,如果能合理规划,将内容模块化,随着课程的推进,后面的实验内容利用前面的模块,可以极大地提高实验效率并培养学生软件复用的思想。

对初学程序设计的同学而言,对于布置的实验,常常对结果比较重视,而忽略了调试能力的锻炼。鉴于这种状况,对实验方式开展专项练习,对实验的代码编写、运行、调试、测试、维护等阶段开展专项模块化训练,可以锻炼学生对程序的排错能力,提高所编写代码的质量,并逐步体会到软件工程的相关思想。

3 班级试点结果

教学方法改革在多个计算机专业和非计算机专业班级均进行试点,所试点的计算机专业班级有多名同学参加程序设计竞赛获奖;所试点的非计算机专业班级在学校组织的同类型班级统考中多次名列前茅,在40多个同类型班级中一次排名第七,一次排名第四,一次排名第一,取得了较好的效果。

4 总结

C语言是一门重要的计算机基础教育课程,其教学方法的改革和创新是一项系统工程,涉及到教材选用、理论知识点的讲授以及实验的设计和创新。通过多视角多模块化教学方法的探索,可以有效地克服学生在学习中容易陷入繁杂知识点从而缺少整体观念的问题,提高学生的学习兴趣。总之,针对C语言程序特点,探索相应的教学方法创新有助于提高教学质量,为培养应用型、创新型、复合型人才做出贡献。

参考文献:

[1]何钦铭,颜晖,苏小红,等.“程序设计基础”课程教学实施方案[J].中国大学教学,2010,(5):62-65

计算机语言的概念篇(9)

自然语言理解研究是当前最热门的研究课题之一。目前国内对汉语理解的研究虽然比较多,但相对成熟的却比较少。这主要是由于汉语语句经过词法分析、语法分析以后还存在很多歧义。汉语与印欧语不同,关于成分间的搭配,其句法制约因素少一些,相应地,语义制约因素更复杂一些。因而语法分析以后进行详细地语义分析,计算机就可以更准确地理解汉语了。而又由于自然语言本身的模糊性和非精确性,以及计算机语言知识的贫乏,使得对语言的语义分析理解很困难。鉴于目前自然语言理解的需求,同时为了有效解决这个问题,本文将自然语言理解的范围限制到某个领域内进行研究。本文重点介绍汉语中名词短语的语义分析过程。

1 基于领域的自然语言理解特点

基于领域的自然语言理解把自然语言进行领域划分,在较小的范围内进行语言处理有其自身的优势:

(1) 缩小自然语言理解的研究范围有利于系统研究与实现。计算机要达到能够象人类一样游刃有余地理解自然语言,不仅需要将全部的自然语言知识输入进去,而且还需要将足够的经验输入进去,这将是一个相当大的挑战。将自然语言限制在领域内理解,其涉及的方面比较窄,词汇量比较少,语义比较确定,故分词、词法分析就变得相当简单,语义推理相也对比较简单,歧义处理的复杂性也会降低。这样系统开发就容易实现。

(2) 人们在分析处理复杂事物时,最常用的办法是把复杂事物进行分解,由局部到全部逐步处理。对自然语言理解这一庞大的工程来说,把自然语言按不同领域进行划分,不仅符合人类的思维习惯,而且降低了语言处理的难度。

2 名词短语的语义分析

计算机对名词短语的理解主要是对其组成成分间关系的识别。而在名词短语的组成成分中,名词与名词之间关系的最为复杂,可以形成定心结构、联合结构等等。同时,名词间关系的理解又是短语语义结构分析的重点,因此下面讨论一下名词间的关系。

第一种关系为一般特殊关系,这种关系不仅揭示了事物之间特有规律的联系,而且还可以简化概念的描述。采用面向对象中继承的方法,可以使下层概念自动具有上层概念的可继承的属性,因而也就可以集中考虑下层概念的特有属性。第二种关系是整体部分关系,又称组装关系,用于描述概念与其他概念之间的组成关系。通过他可以看出某个概念是以另外一些概念为其组成部分的。客观世界中,整体和部分关系广泛存在于事物之间,如:物理上的整体事物和他的一个部分,如汽车与发动机;团体(组织)与成员,如班级与学生;空间上的包容关系,如教室与桌椅;抽象事物的整体与部分,如法律与法律条文;具体事物和他的某个抽象方面,如人员与人员的身份。第三种为实例关系。概念间的实例关系也叫类概念的实例化,他是连接类概念和对象概念的桥梁和纽带,他主要是把类概念的属性值适当取值而得到的。例如,对于概念“三角形”当其属性“边”取值为“AB、BC、AC”,顶点取值为“A、B、C”时,就得到概念“三角形”的实例化概念“三角形ABC”。

3 名词短语语义分析的实现

3.1 语义分析总流程

名词短语理解的总流程图如图1所示。

3.2 句中名词语义识别的实现

简单句中名词识别是分析名词短语的基础,名词所描述的概念内涵、外延等语义直接影响名词短语的划分及识别。

本系统对名词语义分析实质上是概念的实例化过程,实例化就是对概念的属性值进行填充。我们用动态名词及名词属性模板记录实例概念及其属性。因此,这里只需通过语义规则来填充动态名词模板和名词属性模板就可完成概念的实例化,实现对具体概念的理解。

3.3 名词短语划分的实现

名词短语的界定一直是理解名词短语的难点。我们认为组成句子的基底结构是动核结构,任何一个动核结构都是由动核和动元(动核所联系的强制性语义成分)组成,而充当动核和动元的正是动词和名词,所以可认为名词与动词的理解是句子识别的核心。此外,结合汉语名词短语的语法结构特征,即大多数的名词短语都是以名词结尾,我们提出先对简单句中的名词短语做模糊划分,将句子分为作动元的名词块与作动核的动词块两部分。而对名词短语的进一步准确界定,仍需更多的语义知识才能处理。 转贴于

名词短语识别的详细流程如图3所示。

3.4 名词短语识别的实现

名词短语的识别模块是整个名词短语理解的核心,他不仅实现名词短语各组成成分及其语义关系的识别,而且通过语义分析的方法,可进一步界定名词短语。

名词短语识别模块的流程如图4所示。

4 结 语

把自然语言理解限定在领域范围内,显著降低了语言理解的难度,有助于自然语言理解系统的开发。本文将自然语言中的名词短语限制在特定的领域,大大降低了语义分析处理的难度,也提高了其实现的可能性。将自然语言理解的语义分析应用于中学几何网络智能辅导的专家系统的接口,对其中的名词短语进行理解,经过初步调试,取得一定的成果,结果比较令人满意。不过,由于自然语言理解是一个十分庞大的系统工程,对名词短语的语义分析处理涉及面很广,以及时间、条件和作者个人认识的限制,我们的工作还需要进一步深入,我们的系统还需要进一步的完善和改进。

参考文献

[1]姚天顺.自然语言理解——一种让机器懂得人类语言的研究[M].北京:清华大学出版社,2002.

[2]石纯一.人工智能原理[M].北京:清华大学出版社,1993.

[3]黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版社,1998.

[4]赖朝安,孙延明,齐德昱,等.基于自然语言理解的专家系统研究[J].计算机工程,2003,29(1):20-22.

计算机语言的概念篇(10)

计算机语言教与学的困惑的根源在于教师过于强调语法的教学,程序设计的应用性目的不强,注重抽象、逻辑性思维,忽略了形象思维,使学生感到程序是一个虚无缥缈的世界,看不见,摸不着,想不到,用不了。久而久之,对计算机语言产生了厌恶逃避之心,教与学走入了一个“死胡同”。

走出计算机语言教学困境的方法是要求教师通过教学使学生深刻体会到马克思主义世界观和方法论的科学真理性和力量;将教会学生科学的思维作为自己的崇高目标,为思维而教,教会思维;充分发挥左脑与右脑的抽象思维与形象思维能力,让语言与算法由抽象的虚拟世界变成一个实实在在的东西,让学生在一个“现实世界”里领悟语言与算法,使学生从传统的思维中走出来,创新思维及创新能力得到极大的发展。

本文结合c语言的教学,从哲学理念与科学思维两方面作一些计算机语言教学法方面的研究与实践。

一、树立哲学理念,用辩证唯物主义指导教学,培养创新精神

大家都知道中药,为了治疗某一个疾病,不同的医生开出的药方可能是不同的,药方里多味药共同起作用,有的疗效好,有的不太好,而有的医生神秘地加上某味药后,就有了药到病除的神效。在中药的配方里头蕴含着普遍联系的理念:药与药的联系,药与病的联系。

同样,知识与知识之间,知识与应用之间也有着内在的关联。在程序设计教学过程中,教师应设计一些具有现实应用价值的任务,它能让学生把与任务有关的知识点紧密联系在一起而形成一张网,在这张网中,既有旧知识,也隐藏着新知识,旧知识某方面的功能得到应用并得以巩固,新知识因为需要而学习,整个网也体现了知识的综合应用。知识的价值在应用中得到了充分体现。

教师要在学生熟悉的事物和陌生的事物之间运用类比,找到它们的相似与不相似之处,如生物的进化是生物自身的否定之否定,反映了生物现在与历史之间的、生物与生物之间的联系,在计算机语言中同样有着进化现象,如类型-数组-结构体-类的发展就如同单细胞生物向多细胞生物的进化,无机物向有机物的进化。高阶知识的雏形是基础知识,也是基础知识的合理组合,明了知识之间的血缘关系,学生更加重视基础知识的学习,而对高阶知识的理解就显得容易得多了。

在程序设计中,要培养学生的http://“求异”精神,实现辩证的肯定与否定。教师的讲解不是权威,不是唯一正确答案,鼓励学生进行小修小改,甚至另辟蹊径,找出一个更为睿智的思路,学生的任何思考都应辩证地肯定。学生在另觅思路的过程中,有的想法正确,有的想法错误,其实正确与错误不是绝对的,正确的程序可能在时间或空间上或许有一些问题,而错误的程序只要稍作修改(如语句顺序的改变)就是正确的,有时错误本身是正确的,只是因为它出现的时机或地方不对而已,正确与错误只有一步之遥。学生走过的不可能是一条“直路”,让他们在这条“曲折”的思路上做一回苦行僧,在这条创新的道路上完成一次洗礼,实现自我新的发展。

二、协调左右脑思维,提高科学思维素质,培养创新能力

美国的罗杰.斯佩里教授通过实验证实了左右脑分工理论。大脑分为左半球和右半球,一般左脑具有言语、概念、分析、计算、逻辑推理,将复杂事物细化等功能;右脑具有音乐、绘画、空间几何、想象、创造、综合等功能,右脑最重要的贡献是能进行创造性思维,研究表明右脑具有的巨大潜能并没有被充分利用。

现今的计算机语言教学大多都是以左脑为中心的教学,右脑基本处于睡眠状态,而学生的左脑也在抽象与逻辑思维中昏昏欲睡。

充分利用右脑惊人的形象思维能力,调动右脑思维的积极性是科学思维的关键。

计算机的数字世界是现实世界的一面镜子,现实世界里有什么,数字世界里就有什么,只是表现形式可能不同而已。计算机语言的概念、理论、方法在现实世界里都能找到它的“生活原型”。以概念教学为例,概念的重要性在于它是一种语义规定,弄不清楚就会出现“个个字都认识,句句话都听不懂”的现象,概念教学要加强形象思维。 c语言的指针概念是学生的一大难点,对于c系统中这一灵魂性的知识点,“地址”是它的原型,“地址”是一个“范围”概念,它不仅包含开始信息,也包含结束信息,还包含此范围内数据的特征三方面的信息。形象地理解了指针的概念后,对指针的重要性、指针的运算,通过指针获取数据的运算就有了一个“实实在在”的理解。这样的例子举不胜举,如容器与变量,时分秒的变化与循环,族谱与树结构等等。

李政道教授倡导科学与艺术的结合,他邀请画家们“画科学”。爱因斯坦描述他的思维过程是先用形象思维,再将形象思维转换成语言。计算机程序设计既是一门技术,也是一门艺术,在进行程序设计的过程中利用左右脑分工理论,重视右脑功能,并将左右脑“并联”起来协调工作。左脑将复杂的过程进行功能分解,右脑负责过程的形象化,将过程想象成一幅幅形象生动的画面,最后,由左脑负责将画面描述的算法抽象成一个个的语句,最后形成完整的程序。

右脑的思维具有无序性、不拘泥于局部的分析,而是统观全局,以大胆猜测跳跃式地前进,达到直觉的结论。在程序设计中有一个很有意思的现象,学生很快地想出了方法,但要求他们用计算机语言描述步骤时,他们却犯了难!步骤难以描述了,甚至在看似简单的顺序结构上也出现了困难,没有了头绪,此时可利用左脑的分析与细化功能对右脑绘制的主要画面做一些重组,变无序为逻辑上的有序,对右脑的思维进行“慢镜头”式的细化,细化到每一个“镜头”都能用一个语句加以描述为止。

人的右脑就像一台照相机,将输入大脑的信息以直观的图像加以思考并记忆,“图像记忆”这种右脑特有的机能,是右脑高速海量记忆的奥秘所在。在学习过程中,不妨“模糊性”学习,对接触到的东西先混个眼熟,混个耳熟,有意识地训练右脑的形象记忆与情感记忆,使记忆更生动、长久不忘。

人的创新能力与右脑思维密切相关,在左脑的配合下,右脑充分发挥想象力,在一闪念间产生顿悟,将一些看似不相干的知识与知识,知识与应用联系起来,并能进行综合应用。程序设计中不断“求异”的精神,是对右脑思维潜能的充分发挥,使我们的学生成为洋溢着创新欲望、充满活力的人。

计算机语言的概念篇(11)

大家都知道中药,为了治疗某一个疾病,不同的医生开出的药方可能是不同的,药方里多味药共同起作用,有的疗效好,有的不太好,而有的医生神秘地加上某味药后,就有了药到病除的神效。在中药的配方里头蕴含着普遍联系的理念:药与药的联系,药与病的联系。同样,知识与知识之间,知识与应用之间也有着内在的关联。在程序设计教学过程中,教师应设计一些具有现实应用价值的任务,它能让学生把与任务有关的知识点紧密联系在一起而形成一张网,在这张网中,既有旧知识,也隐藏着新知识,旧知识某方面的功能得到应用并得以巩固,新知识因为需要而学习,整个网也体现了知识的综合应用。知识的价值在应用中得到了充分体现。教师要在学生熟悉的事物和陌生的事物之间运用类比,找到它们的相似与不相似之处,如生物的进化是生物自身的否定之否定,反映了生物现在与历史之间的、生物与生物之间的联系,在计算机语言中同样有着进化现象,如类型-数组-结构体-类的发展就如同单细胞生物向多细胞生物的进化,无机物向有机物的进化。高阶知识的雏形是基础知识,也是基础知识的合理组合,明了知识之间的血缘关系,学生更加重视基础知识的学习,而对高阶知识的理解就显得容易得多了。在程序设计中,要培养学生的“求异”精神,实现辩证的肯定与否定。教师的讲解不是权威,不是唯一正确答案,鼓励学生进行小修小改,甚至另辟蹊径,找出一个更为睿智的思路,学生的任何思考都应辩证地肯定。学生在另觅思路的过程中,有的想法正确,有的想法错误,其实正确与错误不是绝对的,正确的程序可能在时间或空间上或许有一些问题,而错误的程序只要稍作修改(如语句顺序的改变)就是正确的,有时错误本身是正确的,只是因为它出现的时机或地方不对而已,正确与错误只有一步之遥。学生走过的不可能是一条“直路”,让他们在这条“曲折”的思路上做一回苦行僧,在这条创新的道路上完成一次洗礼,实现自我新的发展。

二、协调左右脑思维,提高科学思维素质,培养创新能力

美国的罗杰.斯佩里教授通过实验证实了左右脑分工理论。大脑分为左半球和右半球,一般左脑具有言语、概念、分析、计算、逻辑推理,将复杂事物细化等功能;右脑具有音乐、绘画、空间几何、想象、创造、综合等功能,右脑最重要的贡献是能进行创造性思维,研究表明右脑具有的巨大潜能并没有被充分利用。现今的计算机语言教学大多都是以左脑为中心的教学,右脑基本处于睡眠状态,而学生的左脑也在抽象与逻辑思维中昏昏欲睡。充分利用右脑惊人的形象思维能力,调动右脑思维的积极性是科学思维的关键。计算机的数字世界是现实世界的一面镜子,现实世界里有什么,数字世界里就有什么,只是表现形式可能不同而已。计算机语言的概念、理论、方法在现实世界里都能找到它的“生活原型”。以概念教学为例,概念的重要性在于它是一种语义规定,弄不清楚就会出现“个个字都认识,句句话都听不懂”的现象,概念教学要加强形象思维。C语言的指针概念是学生的一大难点,对于C系统中这一灵魂性的知识点,“地址”是它的原型,“地址”是一个“范围”概念,它不仅包含开始信息,也包含结束信息,还包含此范围内数据的特征三方面的信息。形象地理解了指针的概念后,对指针的重要性、指针的运算,通过指针获取数据的运算就有了一个“实实在在”的理解。这样的例子举不胜举,如容器与变量,时分秒的变化与循环,族谱与树结构等等。