理想的知识表达系统或全球知识地图
对思想知识表达系统:全球知识地图
塔拉斯菲拉托夫
摘要
一个最重要的问题,阻碍进一步的发展领域的知识表示和人工智能是一个问题的语义对齐或知识映射。 elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. 的进展,在其解决方案将大大有利于任务的信息检索,本体一致,相关性计算,文字的理解等在论文中的概念,多层面的全球知识地图 , 通过无人监管的阐述提取相依大型文件语料库 , 建议。 此外,人类直接的问题-知识表达系统界面处理和自适应解码器概念的提出,目的是与先前描述统一的映射模型。 结合这两种方法的建议作为基础,发展新一代的知识表达系统。
关键词: 知识表示,知识测绘,人机交互,本体对齐,本体上,相关性计算,信息检索,文件相似
1 。 导言
在社会中,知识领域的代表性更加显着,比去年年[ 25 ] 。 人们总是试图研究和分类知识的知识。 我们可以找到参考苏格拉底早在公元前五世纪[ 33 ]的蓬勃发展的逻辑和认识论[ 28 ] 在中世纪时代。 因为这个问题被认为是重要的过去,这是很难过高地估计其含义时期的资料。
现代技术赋予人类的过度洪水的数据难以整顿和进程。 一个人成为专家在特定的领域将耗时数年的学习,并要求信息的比赛随后跟上最新的专业发展趋势。
这是一个普遍的看法之间的知识工程师和数据挖掘的专家提供的资料公开获取足够提取真实的事实,实际上任何方面的我们的生活,甚至预测未来。 唯一的问题是要解决智能化进程从众多的信息来源。 [ 35 ] 。
这一因素需求的新一代知识表达系统,以帮助人类整顿,获取和利用其集体知识。
在当前的文件,我们建议的想法发展的新时代知识表达系统( KRS ) 。
我们认为,最近取得的成就在某些领域和科学将很快导致了巨大的突破,人类的知识范围的代表性和人机交互。 这将打开新的视野,大大提高工作效率的人在许多应用中。 惟一需要做的是使这些成就在一起。
理想KRS应提供使用者方便地进入人类的所有知识。 因此,其内容是:
- 一个人谁想要获得一些作品的知识,他/她有兴趣,
- 数据存储和
- 中介系统提供接口,一个人获得知识。
所遇到的障碍出现在这里所造成的限制,人的能力和目前的技术水平。
2 。 数据存储
2.1国家的艺术
知识表达系统需要的数据存储,除非它能够撷取必要的文件从外部来源实时。 我们可以赢得大纲两个办法的一个理想的KRS如今:结构手动全球知识管理,如本体库和系统,涉及自动索引和检索的最全面和方便收集原始文件(万维网) ,如搜索引擎。 这个问题的第一种办法是在它的手册性质-的任何企图,创造和保持全球人类知识基础,将导致折衷的细节,现状和可用性。 ], UFO (Unified Framework Ontology) 尽管有多个成功的上层本体的项目,如细胞周期[ 23 ] ,词[ 12 ] ,的DNS ,相扑等,正在进行的理论研讨,只要研究的目的是制定一个标准化的统一的全球本体名单下索(标准上层本体) [ 27 ] ,不明飞行物(统一框架本体) 等
第二种方法是,由于历史上流行的WWW是最大的,全面的和最新的语料库提供的数据自动处理的东西。 然而与此相反,以第一种办法的问题,自动信息检索发挥了重要作用。 案文的问题的理解和自然语言处理是一个最具挑战性的AI和尽管如此仍然没有有效的解决办法。 The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. 邻近的划分问题和相关的计算,即所谓的'网络集群'的问题[ 1 ] 。 第二种办法(自动索引) ,因此具有重大的缺乏在检索的准确性。
目前正在努力改进,使上述办法,以便克服这些问题。 例如,随着统一的基础本体项目(索, BULO )有一些试图发展本体对齐和本体映射技术,以使存在的本体论与相互之间以及与其他类型的知识基础[ 5 , 17 ] 。 人们常常提出的缺点,减少人工管理的情况下本体的手段自动化信息检索(搜索引擎技术) 。 另一方,改善超标准正在制定,以便能够以手动指定的信息以帮助搜索引擎了解常识意义上的万维网文件和它们之间的连结[ 24 ] 。 有必要认识到,这些混合式解决方案的缺点进行相应的技术与优势。
一个缺点团结这些办法,使他们融入社会不可能的:没有标准的测绘和建立关系的文件和概念在不同的系统。 这个问题将得到解决的情况下的系统之一,具有固定的数学解释等级如本体克服了现有方法(万维网) 。 然而,这似乎不太可能由于上述原因。 独立中介机构的标准是一个潜在的解决这个问题。 有多种举措,方向和相互联系起来的测绘知识基础的不同类型,其中有一个领域的本体映射。 这些举措有一个共同的缺点:没有一个单一的标准的绘图和建立关系的文件。 后来,其中没有一个是有可能成为一个普遍公认的标准,除非有更为持久的解决办法是发展。
2.2的概念,全球知识地图( GKM )
我们认为,这是有可能拟订一项单一的标准知识映射建立一个合乎逻辑的空间,其目的是预测的现实世界知识的概念。 这种模型(让我们称之为全球知识地图)应反映水平相似的文件和概念映射到它。
主要目的的模型是:
- 对齐和跨映射文件和概念(万维网,本体,电子图书馆,目录等)
- 通过浏览信息检索
- 精密自动计算相关常识
GKM因此需要一个数学/逻辑模型的知识存储与特定的条件:被优化的任务知识表示即与人力。 为实现这一条件的模型必须反映在其维度或其结构中的结构,人类的知识。
因此要求是:
- 维和绘图。
的主要因素为维度的含义是(或专题) 。
- 每个概念的人类知识可以映射到一个点的具体坐标系统中的空间。
- 每份文件或文字,可以映射到的若干要点(文件分为memes -有意义件)或1分。
- 相关的计算方法。
- 这是可能的数学计算两个概念之间的相关性的计算之间的距离相应的投影点空间。
- 因此,可以计算'相似'之间的文件和概念之间的距离计算的映射。
- 同质性的空间。
- 空间是统一的(同质)和连续
- 坐标反映的含义和点之间的距离差异,反映了这样的含义,如果C点位于A和B之间那么它意味着概念C是有关这两个A和B同样。
- 这是可能的'社区'的空间寻找知识来源映射到周边地区。
建立一个数学模型,这种空间的发展,使全球知识地图。 这是不值得尝试阐述这种模式( GKM )在一本手册的方式,由于上述原因的信息增长和不断变化,人类认识世界。 我们认为,这是有可能的提取相依和规则从现有的文本和corpuses使用这些作为处理器为我们的测绘的目的。
的基石我们的假设是,人们普遍有可能地图各种人类知识科目上单一的空间和距离的维度,后者反映了水平的相似性给予科目。 这种假设是基于约翰逊林登史特劳斯引理指出一套的N分高维欧几里德空间可以映射到一个n维欧几里德空间
( 2.1 )
这样的距离任何两个地点之间的变化,只有一个因素( 1
) [ 7 ] 。 向量空间模型中常用的信息检索和文本分类代表文件高维向量[ 31 ] 。 这些载体含有一定程度(根据数据功能选择)的信息是不够的主题进行分类的原始文件。
该Tychonoff定理[ 26 ]国点,代表性能的一类对象的,应位于靠近对方的财产,而不是点空间代表的物体的性质的其他课程。 of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. 在我们的任务,这意味着原来的向量空间的N文本可投射固定n维空间,并使用适当的算法,数据压缩/降维由于定理紧[ 22 ]的映射下将实现之间的距离点代表的相关性,相应的文件。
影响因素精度的测绘:
- 代表性的度量功能和规模的特征空间
- 规模,分散性和质量的文件语料库
提供了理论是适用于当前的状况,还有待发现其中技术将用来拟定映射。 我们建议把重点放在自动手段,由于许多复杂手工专家为基础测绘不适。
2.3自动GKM一代通过非监督提取物(假设)
为了有用GKM应包含映射大量的实际字(万维网)文件,并在其结构代表了人类共同的认识世界。 这是不值得考虑因此,任何手动的方式创建和填充GKM文件映射。 数据挖掘原则应该用来提取相依代表知识存在的文件的主体可供计算机处理和过滤掉不必要的数据。
有许多企图为无人看管的提取相依在文本然而它仍是一个令人怀疑是否有任何技术问题,能够提供一个可持续的知识提取通过分析大量文件收集 [ 10 , 11 , 21 , 30 ] 。
让我们分裂的因素,一般影响到文件的内容分为三类:
- 作者个人因素(情感和动机,创造文字,身体和道德国在思考和写作)
- 语言(规则等使用的语言写的文件)
- 知识库(某些部分的人类知识传递作者通过直接或隐含的文件)
让我们假定这是可能的过程中所有可用的文本文件中提取人类的作者和所有的依赖规则。 在这种情况下,影响因子1将会很小。 影响因子2是没有多大意义原因如下:
一) 文件多种语言可能被编入索引,因此,减少相互的影响
二) 语言本身反映了人类的知识[ 18 ] ;因此在一定程度上因子2是一个subfactor 3 ,甚至提取及其混合物代表了令人满意的成就
这是理论上是可行然后提取相应的信息主要是对人类知识暴露通过现有文件。 此信息转化为映射空间将假设为我们提供了可持续GKM 。
2.4实现(实验)
在太空建立每个文件应被映射到单一的协调。 在'浏览'的空间或距离比较应揭露这种状况的文件或其集群反映其相关性,这是不可能的某些特定主题名称中的空间坐标。
我们的实验中使用第2和第3维自组织特征映射高官与当地收集的文件显示,预测之间的距离的文件没有稳定的一系列发射。 这在我们看来是证明一个事实,即维度的地图是不够的,符合约翰逊林登史特劳斯引理上述。
遗憾的是,无法进行实验,以适当的维度。 例如,根据约翰逊林登史特劳斯引理,以地图20000文件允许10 %的错误,将需要58个方面。 这就需要计算的上述现代计算机的能力。
最重要的事情在这里提到的是,尽管引理给出了最高维度映射空间允许的条件下实现单投影,这是没有必要的最低限度的有效价值。 引理给出了一套价值的N点,即在最坏的情况是不可能出现的做法。 该检测方法的维度应该用来计算一个有效维度的数据,因此,确定正确的若干层面的测绘尤其是数据集。 目前已知的技术,这其中来自背景表面重建。 最近的一次是工作的S. 程,勇和Z.吴[ 4 ]在尺寸检测方法,通过主成分分析法[ 8 ]提出。 因此,内在维度数据可能被提取。 由于这是在实践中的价值低于最大维度必要的预测 相同数量的文件,在最坏的情况下理论上的情况下,这给了重大减少计算时间。 或者为同一目的,我们可以考虑的方法基于迭代评价。 目的是降维在我们的情况是要建立一个有效的测绘的常识相似之处信息来源是通过欧几里德表示投影点之间的距离。 采取任何降维技术的基础上随机选择的输入数据集(如主成分分析,自筹备地图,鉴别重建或三角)的情况下,当输出维数小于适当,预测将是不稳定和每个重映射会有所不同和预测之间的距离将不会保存。 我们还可以假设,当有效维度多方面的投入用于绘图的距离将保持某种程度的自由取决于降维方法。 因此,一种替代解决方案是一个随机选择降维技术结合增量维平行评价映射。 32]. 例如,技术的日益高官中所描述 [ 19 , 32 ] 。 旨在减少计算时间,节点的数量是增加了新的动态节点被均匀地分布在旧的和他们的权重向量正在建立的手段邻国原始重量载体。 同样的技术应用到维度(四)将提供一个机会来评价每一个D一步一步来。 评价标准将是稳定之间的距离预测。 为此目的,两个或两个以上的自组织图可以并行运行的两两之间的距离比较某些预测的每一次迭代。 在这里我们了解迭代阶段维度时增加了土壤有机质和网络是稳定的,因此新的参数。
总结上述,我们提出以下建议模型实验评价的更好的办法建立的全球知识地图从收集文本文件。
该datase电话:向量空间模型,用于(每个文件代表作为载体的功能,尺寸和功能的队伍中相应的坐标尺寸) 。
特征选择功能 :最有效地加以界定。
矢量大小 :建立实证。
数据处理和存储。
阿降维技术应该用于映射。 有两种方法:
一)预先计算的内在维度和评价不同的降维方法,称为维度的映射;
二) '增量维度评价办法,正在与几个映射并行运行-只有方法随机选择的输入数据可以使用。
输入 :文件的特征向量。
产出 : GKM坐标。
评价 :
1 )常识评价之间的对应关系的初步文件和欧几里德距离 其映射预测。
2 ) 稳定之间的距离这些成对的预测中,通过不同的发射情况下随机选择技术的使用。
3 。 接口
3.1 理想的知识表示界面
接口部分知识表达系统是非常重要的理想时,系统进行了讨论。 这两项任务的接受用户和传播知识回到他们是同样重要的任务是数据结构和存储。 在本文件讨论了如何实现知识表达系统的新一代,因此这一问题的互动是综述,以确定是否有可能提供一个理想的接口的手段,现代技术。
接口用于支持互动的用户与现代人类的知识表示和信息检索系统,主要的'索引'型,即用户必须确切地知道他们正在寻找他们还必须指定它语言。 一个常见的例子,这种接口是一个搜索引擎。 正如我们上文所述,搜索引擎和语料库的WWW文件是最完整和最新的知识表示系统可如今,这是由于其受欢迎程度。 同时据了解, '索引'接口是不自然的使用对人类,但它是唯一的选择是 ' 浏览'的方法正在建立很差[ 16 ] 。 原因是这个问题的知识地图和路线不允许自动分类和代表性的文件根据自己的学科。 然而,问题的统一的知识映射空间得到解决,新的可能性出现的建设有所改善,更自然的界面的浏览'类型。
3.2高维和可视化
在提到,由此产生的全球测绘空间很可能是n维其中n是高是要解决这个问题的视觉表现。 这是可能的人类想象的三维空间,因此,最佳的方式钕“三维代表性的评审。 降维技术或多个代表的办法可能是通过接口使用。
重要的是,借助统一的知识映射空间的错误是在最小的计算关联文件,而且,检索有关文件甚至从其他系统成为一个无足轻重的任务。 为最终用户,这意味着一旦该系统已设专题他/她感兴趣的,它决不会导致用户不相关的文件。
3.3信息请求链
当任务的主题地图和位置,相关的计算和知识空间浏览得到解决的最重要的任务仍然是解决问题的初步请求。 在国家最先进的信息检索系统下面的过程通常被参与信息时要求:
人权部分: 1 )想象- “ 2 )形成的语言建设- ” 3 )手动键盘输入(语音输入) - “ 机器的这一部分: 4 )语言解码- ” 5 )匹配和地点- “ 6 )可视化相匹配的文件
链很长,很明显,数据丢失和腐败是重要的,由于双重语言的编码和解码。 首先,用户已制定的认知图像短期语言句。 其次,系统解码一句,以便了解问题的用户的利益。 所描述的链初步请求原因不满的用户现代搜索引擎由于无法系统'了解'的请求时造成巨大损失的最终用户。 这些程度的检索错误和所造成的不便接口的限制是重大的,将大大的影响降到最低更精确的检索和位置的文件介绍了统一的测绘。
因此,有必要考虑,至少在理论上的可能性,创造一个理想的短链人类“ - ”知识表达系统的相互作用与单位造成数据丢失被淘汰:
人权部分: 1 )想象- “ [请求通过 穿过 直接人脑GKM坐标转换器] - “ 2 )匹配和地点- ” 3 )可视化相匹配的文件
我们的最新成果概况领域中的脑机接口(计算机接口)用于这一目的。
3.4脑机接口
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. 计算机接口的研究已经持续了超过30年,该地区仍然很年轻,并迅速发展。 最多最近时刻米 大部分重大进展在该地区已进入假肢控制即驾车职能脑[ 3 ]的解释和处理视觉信号。 这些成就已经核实在多个实验,涉及动物和人体实验对象。 研究人员报告说成功融合的机械或电子设备时,动物或人类学会控制装置的帮助下,他们的大脑;其他报告成功转让和解码的视觉信号[ 15 , 20 ] 。
脑机接口研究密切相关的领域的功能神经影像学,在各种技术已经开发,有效地记录国家的人的大脑,通过一定的物理特性。 最有成效的角度的BCI是近年来影像学技术称为功能磁共振成像 ) ( 成像 ) [ 6 , 13 ] 。 这种技术可以记录动态的血流量在不同的脑区,并随着时间的推移,以高精确度。 这因此可以建立连接模式激活大脑的不同领域和某些活动和认知过程的人力。 重要的是,这项技术,与许多替代品,是无创性和不涉及注射。 必须指出的fMRI然而,如今的硬件仍然是非常昂贵和笨重。
重要的是,实验表明,大脑适应新的条件。 例如,当汽车冲动被用来控制机械手或计算机鼠标光标,大脑能够逐渐分化并学会控制机械臂分开假肢。 列别杰夫提到的影响脑的可塑性,这可能允许把人工装置纳入机构的代表性。 [ 20 ]
最近的出版物领域中的神经进一步仍在讨论的机会,检测认知国[ 15 ] 。 这规定了集中我们的注意力集中在应用的可能性,在人类的BCI - KRS互动。
据了解,国家不同的认知与现实世界中的某些物体符合某些模式的脑区激活。 解读这些模式可以理解的叠加面向刺激一个人正在参加(他们的注意力引导) ,或在可视对象的情况,以确定该类别的物体成像的人(即脸,建筑,家具) ,甚至物体'颜色和方向。 [ 15 ]这些进程是复杂的,远远没有理解此刻。 应进一步研究揭示低阶和高阶大脑信号相关的某些认知功能;如何空间特征的模式随时间变化和在不同的影响;在何种程度上是有可能的推断激活模式的不同科目;等人们认为然而,准确地了解'计算'表现在人脑的关键是不能建设的有关BCIs 。 [ 20 ]的共同数据挖掘技术可用于提取有用的信息从各种影像传感器和建立连接国家与某些认知。
虽然有重要的问题会严重影响设备的成功的BCI领域的知识表示。 两个小问题泛化跨越时间和问题的不同情况相同的精神状态。 据了解,脑区激活模式相同的精神状态在一段时间内可能有所不同。 不同的相同的精神状态可能会修改图片,以及根据内容的变化和其他因素。 [ 15 ]这就需要灵活的空间重采样和分类算法,作为建议的海恩斯和里斯。 我们相信这些问题会得到解决后,发展的有效技术。
更令人怀疑的问题是,外推法的问题,以新的认知国。 海恩斯和里斯注意到,一些可能的感知或认知国家是无限的,而一些培训类必定是有限的。 [ 15 ]这是关键因此,解码器,可以接受培训,以推广经验,从小型训练集完全新的类别。 有可能的手段推断如果大脑激活模式实际上是安排在一些系统参数的空间。 这有待发现,但是,它被认为是有可能至少在某些类型的精神内容[ 15 ] 。 如果在空间抽象形状分类的神经模式确实存在它将使我们能够理论的可能性绘制人类大脑认知能力的国家进入全球知识地图描述本文件前面。 只要做到这一点,上述“问题的初步请求”将得到解决, “理想的人 ” - “ KRS ”链将有可能建立。
3.5 Learnable解码器
现在它是已知的感谢最新成就的脑功能成像,这是可以区分的激活时不同脑区的人是不同的主题的思考,我们可以推测,有可能创造一个learnable解码器,以图人开始认知国家知识地图上的知识表达系统。 因此一个理想的途径人机交互可能允许设立了巨大的速度和精度的沟通系统。 将减少数据丢失的原因消除语言上的互动阶段。 的速度和效力,因此将增加互动。 这两个因素将使人们的不同行业,以增加他们的工作成效显着。 从[ 6 , 15 ]我们知道,有一些规律性的位置脑的冲动和学科的知识是人类共同所有,我们可以调用这些功能人为。 然而众所周知,大多数这些联系应该是个人主义。 因此,必须单独的解码器自适应。
同样明显的是效率的解码器将取决于个人和他们的培训,它和学习能力。 我们可以推定这从实验用人工接口被用来取代失去肢体。 人类和动物能够集中精神以特殊的方式将一个人工操纵,甚至学习的实际控制肢体和人工分别[ 20 ] 。
鉴于上述,我们认为,人工神经网络-基于机制是最好的解决办法的一个解码器的问题。
解码器的学习过程
1 ) 这一点与随机坐标中的多维空间的GKM已被选中。
2 ) 多份文件中有其对应的周边地区(欧几里德度量正在使用)的选择和显示一个人的经营者。
3 ) 经营者集中他/她的心认知出席特定主题和相关物体的记忆。
4 ) 在神经影像数据正在收集的功能磁共振成像硬件的特定的一段时间。
5 ) 数据处理,通过空间重采样和降噪算法以翔实的模式特征提取当前迭代的培训。
6 ) 编写数据报的投入的神经网络。 该GKM选定坐标点是牵强的产出因此训练的神经网络关联特定脑激活模式与GKM坐标。
图3.1的过程,培训的解码器
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































最近的评论