유심 기술을 향해 표현 시스템 : 글로벌 기술지도

Taras Filatov

초록

하나는 지식 표현과 인공 지능이나 지식 매핑의 의미 론적 정렬에 문제가의 영역에서 추가 개발을 억제하는 가장 중요한 문제. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. 자사 솔루션의 진행을 크게 정보 검색, 존재론 정렬, 관련성 계산, 신문에서 글로벌 다차원 지식지도의 개념, 의존성의 추출을 통해 대용량 문서를 집성 실험실에서 텍스트를 이해 정교 등의 작업을위한 제안입니다 도움이 될 것입니다 . 또한, 직접적인 인간의 문제 - 지식 표현 시스템 인터페이스 및 적응력 디코더의 개념은 이전에 설명한 통일 매핑 모델과 상호 작용의 목적에 대한 제안을 독자층으로한다. 이 두 가지 접근 방법을 기초로 지식 표현 시스템의 새로운 세대의 발전을 위해 제안하는 조합.

키워드 : 지식 표현, 지식 매핑, 인간 컴퓨터 상호 작용, 존재론 정렬, 상위 존재론, 관련성 계산, 정보 검색, 문서 유사성

1. 소개

사회에서, 지식 표현의 필드를 더 지난해에 비해 상당한되었다 [25]. 만든 사람들이 항상 공부하고 지식에 대한 지식을 분류 시도. 소크라테스는 기원전 5 세기에 우리는 [33대로 논리와 인식론의 번성] 일찍 [28에서 참조를 찾을 수있습니다] 중세. 이후 문제가 과거에 중요한 것으로 간주됐다, 그것은 정보의 시대에 그 의미를 과대 평가하기 어렵다.

현대 기술에 과도한 데이터의 홍수와 systematise하고 어려운 과정 인류 하리니. 사람을 위해 그것을 학습의 년이 걸린다와 후속 정보를 요구하는 최신의 전문적인 동향과 함께 레이스를 유지하기 위해 특정 분야에서 전문가가되고있다.

그것은 지식이 엔지니어와 데이터 마이닝의 전문가가 그 정보를 개방형 액세스에 해당하는 가운데 인기있는 믿음은 우리가 삶의 거의 모든 측면에 대해 진실을 사실을 추출하고 미래를 예측에도 충분하다. 해결할 수있는 유일한 문제는 지능적으로 다양한 소스에서 정보를 처리하는 것입니다. [35].

이 요인은 인류 systematise, 액세스 및는 집단적 지식을 돕기 위해 지식 표현 시스템의 새로운 세대의 요구합니다.

현재 논문에서 우리는 새로운 시대 지식 표현 시스템 (KRS)의 개발에 대한 아이디어를 제안합니다.

우리는 특정 지역과 과학 분야의 최근 성과는 곧 엄청난 획기적인 인간의 지식 표현과 인간 - 컴퓨터 상호 작용의 범위에서 이어질 것입니다. 이것은 많은 응용 프로그램에 새로운 지평을 열 것입니다 크게 인간 작업의 효율성을 증가시킬 수있습니다. 요구를 할 수있는 유일한 것은 함께 이러한 업적을 가지고있다.

KRS 이상 인류의 모든 지식에 대한 편리한 액세스를 가진 사용자를 제공해야합니다. 는 요소가있다 :

  • 인간은 그 / 그녀가에 관심이 지식의 일부 조각이 액세스하기를 원한
  • 데이터 스토리지 및
  • the 중개 시스템은 인간에 대한 액세스를 지식에 대한 인터페이스를 제공합니다.

여기에서 발생하는 인간의 능력과 현재의 기술 수준이 장애물의 한계로 인해 발생합니다.

2. 데이터 스토리지

예술 2.1 주

하지 않으면 외부 소스에서 실시간으로 필요한 서류를 검색할 수있는 시스템의 데이터 스토리지 기술 표현이 필요합니다. 우리는 요즘의 이상적인 KRS 우승을위한 두 가지 접근 방법의 개요 수 : 수동 ontologies 글로벌 지식 관리 구조 및 시스템 등 자동화된 검색 엔진의 색인을 생성하고, 완전하고 접근할 가장 원시 문서 컬렉션 (월드 와이드 웹)의 검색과 관련된 같은 창고. 첫 번째 접근 방법의 문제는 수동으로 자연에있다 - 어떤 시도를 작성하고 세계 인간의 지식 기반 세부, 현실과 가용성 사이의 타협의 결과를 유지하고있습니다. ], UFO (Unified Framework Ontology) 그럼에도 불구하고 거기에 CYC [23], WordNet [12] 등 여러 성공적인 상단 - 존재론 프로젝트를 DNS, 스모 등 오랜 연구 Suo의 이름 (표준 어퍼 Ontology 아래 글로벌 표준의 통일을 목표로 지속적인 존재론 정교한 이론적 논의 ) [27], UFO가 (통합 프레임 워크 Ontology)

두번째 접근법은 역사적으로 인한에서 WWW - 데이터의 자동 처리를 위해 요즘 영장 - 날짜에 해당하는, 그리고 포괄적인 최대되고 만연되었다. 그러나 반면에 가장 먼저 접근하는 자동화된 정보 검색의 문제는 여기에 중요한 역할을한다. 텍스트를 이해하고 자연 언어 처리의 문제는 하나 대부분의 인공 지능에의 도전에도 불구하고 여전히 효율적인 솔루션없이 남아있다. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. 인접 구분 및 관련성 계산, 너무 - 불리는 '웹 클러스터링'문제 [1의 문제점을하고있습니다. 두 번째 접근법 (자동 색인 생성) 주요있다 따라서 검색의 정확성에 없다.

거기에 이러한 문제를 극복하기 위해서는 상기 방법을 개선을 지속적으로 노력합니다. 함께하기 위해서는 서로 다른 종류의 지식 기반을 가진 존재 ontologies [5, 17 예를 들어, 프로젝트와 함께 통일 기지 존재론 (Suo, BULO)에는 특정 시도 존재론 정렬과 존재론 매핑 기법을 개발하고있습니다. 그것은 자주의 뜻에 의해 자동으로 정보 검색 (검색 엔진 기술) ontologies의 경우에는 수동으로 행정부의 결점을 감소 것을 제안합니다. 검색 엔진을 지원하기 위해서는 수동으로 정보를 지정할 수가 WWW 문서와 그들 사이에 하이퍼 링크의 상식적 의미는 [24 이해할 수 있도록하기 위해 다른 측면에서 향상된 하이퍼 표준 개발되고있다]. 그것은 이러한 장점과 함께 하이브리드 솔루션은 해당 기술의 단점을 들어 이해가 필요합니다.

하나의 결점이 접근들의 단결과 통합을 불가능하게 : 거기 매핑 및 다른 시스템에있는 문서와 개념 사이의 관계를 수립의 기준입니다. 이 문제가 해결될 수학적 interpretable 계층과 시스템의 경우와 같은 하나의 ontologies 해결될 것이라고 기존의 접근 방식 (가 WWW)를 극복했다. 그러나 상기 이유로 인해이 어려울 것으로 보인다. 독립 중개자 표준이 문제에 대한 잠재적인 솔루션입니다. 거기에 다른 종류의 지식 기반의 상호 매핑을 연결하는 방향에서 여러 사업을하고있는 가운데 거기 존재론 매핑의 영역입니다. 이 이니셔티브를 하나의 일반적인 흉작이 : 매핑 및 문서 간의 관계를 수립의 단일 표준입니다. 그후, 그들 중 누구도 표준이 될 가능성이 높다는 널리 인정하지 않는 한, 더 지속 가능한 솔루션을 개발했다.

글로벌 기술지도 (GKM)의 2.2 개념

우리는 그것을 현실 세계의 지식 개념의 프로젝션의 목적과 논리적인 공간을 구축하여 지식을 매핑에 대한 단일 표준 정교한 가능하다고 생각한다. 이러한 모델은 (우리에게 그것과 글로벌 기술지도 전화) 문서 및 개념의 유사성의 수준에 매핑된하게 반영해야한다.

모델의 주요 목적은 무엇인가 :

  • 정렬 및 크로스 - 문서 및 개념의 (가 WWW, ontologies 매핑, 전자 - 라이브러리, 디렉토리 등)
  • 검색을 통해 정보 검색
  • 상식적 관련순의 정밀 자동 계산

따라서 특정 조건 GKM 지식 창고의 수학적 / 논리적 모델이 필요합니다 : 인간과 지식 표현, 즉 상호 작용의 작업을 위해 최적화된되고있다. 이 조건의 이행을 위해 모델의 차원에 반영해야 또는 그 구조는 인간의 지식의 구조에있다.

이 요구 사항에 따라서 :

  • 차원 및 매핑.

the 차원에 대한 가장 큰 요인은 의미 (또는 주제입니다.)

  1. 인간의 지식의 각 개념 시점에 특정와 매핑된 될 수있는 시스템 공간에서 좌표.
  2. 각 문서 또는 텍스트 포인트 (문서 memes으로 나누어져있습니다 - 의미있는 작품의 숫자에) 또는 한 지점 매핑된 수있습니다.
  • 관련성을 계산합니다.
  1. 그것은 수학적으로 두 개념 사이의 공간에 해당 프로젝션 점 사이의 거리를 계산하여 관련성 계산이 가능합니다.
  2. 그러므로 '자신의 매핑 사이의 거리를 계산하여 문서 및 개념 간의 유사성'계산이 가능합니다.
  • 동질성의 공간.
  1. 공간 () 동질과 지속적인 유니폼입니다
  2. 의미와 좌표 점 사이의 거리를 반영하는 C 지점 A와 B 사이에 위치해있는 경우는 다음의 개념 C는 A와 B에 동등하게 관련있다는 것을 의미하므로 의미의 차이를 반영한다.
  3. 그것은 '공간의 지식 소스가 인근 지역에 매핑된 찾는을 검색이 가능합니다.

이러한 공간의 수학적 모델을 만들고 글로벌 기술지도의 개발을 가능하게합니다. 그것은 (GKM)은 수동 방법으로 정보를 인간의 성장과 세계의 이해에 지속적인 변화의 이유로 인해 상기에서이 같은 모델을 정교하고 가치가 있지 않습니다. 우리는 텍스트의 해당 corpuses에서 의존성 및 규칙을 추출이 가능하며, 우리의 매핑 프로세서와 같은 목적을 위해 쓸 수 있다고 믿는다.

우리 가정의 모퉁이 돌 그것은 일반적으로 후자의 차원 시간 거리에 하나의 공간과 다양한 인간의 지식지도 과목을 과목 사이의 유사성의 수준을 반영하는 가능성이다. 이 가설에 근거 존슨 - Lindenstrauss 보조 정리 높은 차원의 공간에있는 N Euclidian 점 세트가 N 차원의 공간에 매핑된 Euclidian 수 풀렸다

(2.1)

같은 요인에 의해서만 변경 임의의 두 점 사이의 거리 (1 ) [7]. 벡터 공간 모델 일반적으로 정보 검색 및 분류에 사용되는 텍스트 높은 차원 벡터 [31로 문서를 나타냅니다]. 통계 기능을 선택에) 정보의 분류는 원본 문서의 주제에 따라 이러한 벡터 포함될 정도로 일정 수준 (.

이 Tychonoff의 정리 [26] 개주는 점, 한 클래스의 객체의 속성을 대표하는 각각의 속성을 공간에 다른 사람에게 더 가까이 위치해 있어야 포인트는 다른 클래스의 개체의 속성을 나타내는보다. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. 우리의 작업이있을 수있습니다 전망에 고정 N - 차원의 공간과 데이터 압축을위한 적절한 알고리즘 / 차원 감소 compactness의 정리로 인해 [22] 달성될 것이 매핑을 사용하여 n 문자의 원래 의미는 어디 거리 사이 벡터 공간 포인트는 해당 문서의 관련성을 나타냅니다.

는 매핑의 정밀도에 영향을 미칠 요소 :

  • 통계 기능의 배치와 기능이 공간의 크기를
  • 크기, dispersity과 품질의 문서를 집성

이 이론은 현재의 조건에서 제공 매핑 기법을 정교하게하는 데 사용되어야한다 찾을 수있다 적용됩니다. 우리가 자동 의미 많은 전문가가 만드는 - 기반에 의한 합병증으로 수동 초점을 제안하는 매핑을 적용할 수있습니다.

실험실 추출 (가설)을 통해 자동 GKM 세대 2월 3일

순서에서는 될 유용한 GKM (가 WWW) 문서와 그 구조에 세계의 일반적인 인간의 이해를 대표하는 단어의 진정한 의미 번호의 매핑을 포함해야합니다. 따라서 GKM의 가치 창조의 방법을 고려하지 않습니다 어떤 매뉴얼 및 문서 매핑을 함께 작성했다. 컴퓨터는 데이터 마이닝을 원칙으로 의존성 서류 처리와 불필요한 데이터를 걸러 내기 위해 사용할 수있는 기존의 지식을 나타내는 코퍼스에서 추출하는 데 사용해야합니다.

거기에 의존성이 실험실 텍스트 추출에 대한 여러 시도가있다는 여전히 의문 질문 기법 여부 대형 문서 컬렉션의 분석을 통해 지속 가능한 지식을 추출을 제공하는 능력이있다 [10, 11, 21, 30 일]입니다.

에는 일반적으로 세 가지 범주로 문서의 내용에 영향을 미치는 요인을 나누어 보자 :

  1. 저자는 개인적인 요인 (감정과 동기 중에 텍스트, 신체적, 정신적 상태를 만드는 방법을 생각하면서 글을 쓸)
  2. 문서를 작성하는사용하는 언어의 언어 (규칙 등)
  3. 인간의 지식을 저자의 기술 (특정 부분을 직접적으로 또는 암시적으로 문서를 통해) 전송

그것은 인간 저자의 사용할 수있는 모든 텍스트 문서를 처리하고 모든 종속성 규칙을 추출할 수있다 라는건 보자. 이 경우 요소 1의 영향을 최소화할 것입니다. 요인 2의 영향을별로 중요성으로 인해 다음 중 하나입니다 :

가) 여러 언어로 된 문서, 따라서 색인 서로 영향을 줄일 수있을

b) 항 언어 자체가 인간의 지식 [18]는 요인 2월 3일의 subfactor하고 심지어 자신의 혼합물을 추출하는 특정 범위; 너무 만족스러운 성과를 나타내는 반영

그것은 이론적으로 다음 정보는 대부분 인간의 지식에 해당하는 문서를 통해 노출에 해당하는 추출이 가능합니다. 이 정보로 매핑 공간으로 가정해 GKM 지속적인 변화와 함께 제공하게됩니다.

2월 4일 구현 (실험)

좌표 공간에서 각 문서에 내장된 하나에 매핑되어야합니다. '브라우징 공간이나 거리를 비교 문서의 상황이나 자신의 클러스터를 공개해야하고 그것을 특정하기 위해 특정 주제에 이름을 할당할 수있습니다들의 타당성을 반영하는 공간에 좌표.

문서의 수집과 함께 지역 차원 Kohonen SOM 2 및 3을 사용하여 우리의 실험은 그 문서의 예측 사이의 거리를 발사의 공개 시리즈 내내 안정되지 않습니다. 이것이 우리의 의견이 사실은지도의 차원은 존슨을 준수 - Lindenstrauss 보조 정리 상기의 증거가 부족하다.

불행히도 그것은 적절한 차원와 함께 실험을 수행하는 것은 불가능합니다. 예를 들어, 존슨에 따르면 - Lindenstrauss 보조 정리, 20000 문서 그것을 58 차원이 필요합니다 10 %의 오류 있도록지도합니다. 이 요구는 현대 컴퓨터 '이상 용량 계산.

중요한 것은 여기에 언급, 보조 정리 매핑하면서 공간을 하나의 프로젝션의 상태를 이루도록 허용의 최대 차원 수있다, 그것에 필요한 최소한의 효과적인 값이 아닙니다. 보조 정리 즉 최악의 경우에 나타날 가능성은 높지 않다는 연습 n 포인트의 설정에 대한 값을 제공합니다. 차원 탐지하기위한 방법과 데이터의 효과적인 차원을 계산하는 특정 데이터의 매핑을위한 차원의 정확한 수를 확인 설정을 사용해야합니다. 재건축의 배경에는 표면에서이 와서 기술 알려져있다. 하나는 최근의 미국에 의한 작품이다 쳉, 그 왕과 위대한 Z 우 [4] 어디에 교장 차원을 감지하는 방법을 통해 구성 요소를 분석 [8]을 제시합니다. 따라서, 데이터의 본질적인 차원의 압축을 풀 수있습니다. 연습에서이 값을 최대한의 차원으로 투영의 필요보다 낮은 것입니다 최악 - 사건 이론에있는 문서의 경우 같은 번호로, 이것은 상당한 계산 시간을 줄일 수있습니다. 우리는 방법을 고려할 수 있도록 반복적인 평가를 바탕으로 동일한 목적을 대신했다. 우리의 경우는 차원 절감의 목적은 어디에있는 효과적인 매핑 정보 소스 간의 유사성 상식적 프로젝션 지점 간의 거리를 통해 표현되고있다 Euclidian 확립하는 것입니다. 어떤 차원 감소 기법을 무작위로 선택에 입력 데이터 교장 (등과 같은 구성 요소를 분석, 자기 조직지도 상으로는 재건축이나 Sammon), 케이스보다 적을 때 적절한 출력 차원에서, 불안정 예상되며 각 계산과 설정을 기반으로 촬영 매핑 및 보존되지 않습니다 예측 사이의 거리가 서로 다른 것입니다. 그 때 우리는 또한 입력의 효과적인 차원 매니폴드 매핑에 대한, 자유의 거리가 어느 정도 유지됩니다 차원 감소와 방법에 따라 사용이있다는 생각이있습니다. 따라서 임의의 선택 대안 솔루션 차원 감소 기법 매핑의 증분 평행 차원의 평가와 결합입니다. 32]. 예를 들어, 고려, 성장 SOMs [19, 32에 설명되어의 기술]. 계산 시간을 단축시키기위한 목적으로, 노드의 개수를 동적으로 새 노드되는 획일적들은 원래 역기 아령 벡터 이웃한 벡터의 뜻으로 설정되는 늙은 병사들 사이 배포가 증가합니다. 동일한 기술 차원 (D)를 적용하여 각 단계에서 개발 단계를 평가할 수있는 기회를 줄 것이다. 평가 기준을 예측 사이의 거리의 안정화 될 것이다. 두 개 이상의 자기 조직지도 Pairwise 특정 계획안 간의 거리와 병렬로 실행할 수있습니다 이러한 목적을 위해 각 반복에 비교하고있다. 여기에서 우리는 무대를 이해 편력자 증가했다 때 SOM의 차원과 네트워크를 안정적으로 새 매개 변수와 함께했다.

우리는 텍스트 문서의 컬렉션에서 글로벌 기술지도 구축을위한 더 나은 접근 방식의 실험 평가를위한 다음의 모델을 제안 상기 요약.

이 datase 마 : 벡터 공간 모델 (각 문서의 크기와 같은 기능을 '계급으로 대응하는 차원에서 기능과 벡터로 표현 좌표)를 사용할 수있습니다.

기능을 선택 기능 : 가장 효과적인 정의되어야합니다.

벡터 크기 : 경험 설립된다.

데이터 처리 및 저장.

매핑을위한 한 차원 감소 기법을 사용해야합니다. 두 가지 접근 방법입니다 :

가) 일 Pre - 본질적인 차원의 계산 및 매핑의 알려진 차원과 다른 차원의 감축 방법을 평가할;

b) 항 '몇 매핑과 증분 차원 평가 방식'을 병렬로 실행되는 - 입력 데이터를 무작위로 선정 방법만을 사용할 수있습니다.

입력 : 문서 '기능 벡터.

출력 : GKM 좌표.

평가 :

초기 문서와 자신의 매핑 Euclidian 계획안의 거리를 사이에 서신의 1) 상식적 평가.

다른 발사를 통해 예측이 Pairwise 사이 거리의 2)의 경우 무작위로 선택 안정화 기술에 사용됩니다.

3. 인터페이스

1월 3일 이상적인 지식을 표현 인터페이스

지식 표현 시스템의 인터페이스 부분을 때 이상적인 시스템을 논의하는 것이 중요합니다. 사용자로부터 요청을받은 두 작업과 동등한 중요성을 다시 그들에게 지식을 전송 및 스토리지의 데이터를 구조화하는 작업을하고있다. 현재 논문에서 우리는 새로운 세대의 기술 표현 시스템과 상호 작용의 문제를 향해있는 방법에 따라서 여부를 확인하기 위해서는 현대 기술의 인터페이스를 제공할 수있다는 뜻으로 유심 구축 overviewed있다 논의할 예정이다.

그런 유형의 색인 생성 '을'을 중심으로 현대적인 지식 표현과 정보 검색 시스템과 인간의 상호 작용을 지원하는 데 사용하는 사용자의 인터페이스, 즉, 사용자는 그들이 정확하게 무엇을 찾고 있고, 그들은 또한 그것을 지정해야 언어를 알고 있어야합니다. 이러한 인터페이스의 일반적인 예제는 검색 엔진입니다. 위에서 언급한 바와 같이, 검색 엔진 및 www 문서의 코퍼스 가장하고 완료되면 - - 최신 지식 표현 시스템에 해당하는 요즘, 그들의 인기의 원인이되고있다. 동시에 그것은 '색인 생성'인터페이스를 사용하는 인간에 대한 자연 아니라 가장 잘 알려져 있지만 그 '으로 검색'접근을 아주 조악하게 설립되고있는 유일한 대안 [16]입니다. 그 지식을 매핑하고는 자신의 과목에 따라 자동 분류 및 문서의 표현을 허용하지 않는 정렬의 문제가에 대한 이유입니다. 그러나, 통합 지식 매핑 공간의 문제를 함께 해결하고, 새로운 가능성 '의 개선, 더 자연스러운 인터페이스의 건설에 대한 유형을 탐색'이 나타납니다.

2월 3일 높은 차원과 시각화

그 결과 글로벌 매핑 공간 n - 차원 여기서 n은 그것을 시각적 표현의 문제를 해결하는 데 필요한 높은 될 가능성이 크다 언급 가졌어요. 에 대한 인간의 3D 공간을 상상하기가 따라서 미국 노스다코타의 최적의 방법 -> 3D 이미지 표현을 평가할 수있다 가능하다. 인터페이스를 통해 접근하는 차원 감소 기법이나 여러 표현을 사용할 수있습니다.

정말 중요한 것은 오류 문서 간의 관련성의 계산을하는 동안, 그리고 최소화, 또 다른 시스템에서 관련 문서의 검색도 사소한 작업이되고 통일된 지식 매핑 공간의 도움으로. 일단 시스템이 그 / 그녀는 사용자, 리드하지 않습니다에서 문서에 관심이없는 주제에 위치해있다는 뜻 최종 사용자가 들어있습니다.

정보 요청 3월 3일 체인

과목의 작업을 할 때 매핑 및 위치, 관련성 계산과 지식을 해결하기 위해 공간을 탐색하는 작업이 남아있는 가장 중요한 해결하는 초기 요청의 문제입니다. -의 상태에서는 - 다음 프로세스는 일반적으로 - 미술 정보 검색 시스템이되고있다 와 관련된 정보를 제공해야 할 때 :

인간 부분 : 1) 상상력 -> 2) 언어 구조물의 형성 -> 3) 수동으로 키보드 입력 (음성 입력) -> 기계 부분 : 4) 언어적 디코딩 -> 5) 검색 및 위치 -> 6) 문서와 일치하는 시각화

긴 사슬이며 분명한 것은 그 데이터 손실 및 손상되고 언어 인코딩 및 디코딩을 이중으로 인해 상당한. 첫째, 사용자의 짧은 문장으로 언어인지 이미지를 공식화했다. 둘째, 시스템에 사용자의 관심의 대상이 이해하기 위해서는 문장을 해독하려고하고있다. 초기 요청의 설명 체인 현대 검색 엔진 시스템의 무능 '을 최종 사용자의 요청에 엄청난 손실을 이해하는 시간에 따른 사용자의 불만이 발생합니다. 이러한 검색 오류와 한계로 인한 불편 인터페이스의 학위와 의의가 크게 더 정확한 검색과 문서 통일 매핑하여 도입의 위치의 영향을 최소화합니다.

따라서 이론적으로 고려해 적어도 단위 데이터 손실의 원인이되고있는 이상적인 짧은 - 체인 인간 <-> 기술 대표 창조의 가능성을 제거하는 시스템의 상호 작용이 필요합니다 :

인간 부분 : 1) 상상력 -> [요청이 전달되는 를 통해 바로 인간의 두뇌 - GKM)와 일치하는 변환기] -> 2 좌표와 위치 -> 3) 문서와 일치하는 시각화

우리는이 목적을 위해 브레인 컴퓨터 인터페이스 (BCI)의 영역에서 최신의 성과에 대한 개요.

브레인 - 4월 3일 컴퓨터 인터페이스

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. BCI에 대한 연구에 30 년 이상과 아직 어리하고 신속하게 개발하고 지역 진행되고있다. 최대 순간 미터는 최근이 지역에 상당한 진보 의치 ost 파일 제어, 즉 두뇌의 기능을 자동차로 만들어왔다 [ 3]과 해석과 영상 신호 처리를 수행합니다. 이러한 업적을 여러 실험 동물과 인간의 과목을 포함하는 동안 검증되고있다. 연구진은 동물이나 인간들은 그들의 할 때 두뇌의 도움으로 그 장치를 통제하는 법을 배워야 기계 또는 전자 장치의 성공적인 통합 보고서; 다른 성공적인 전송과 영상 신호의 디코딩 [15, 20 리포트].

브레인 - 컴퓨터 공부를 밀접하게 기능적 neuroimaging, 어디 특정 물리적 특성을 통해 다양한 기술을 효과적으로 사람의 두뇌의 상태를 기록하기 위해 개발되었습니다 관련된 영역의 인터페이스를 제공합니다. 대부분 BCI의 관점에서 최근 neuroimaging 생산 기법을 기능성 자기 공명 영상이라고합니다 ) (fMRI) [6, 13]. 이 기술은 시간이 지남에 다른 뇌 영역에 혈액 흐름의 역학을 기록하며 높은 정밀도 수있습니다. 이것은 결과적으로 다양한 뇌 영역과 특정 활동과 인간의인지 과정의 활성화 패턴 사이의 연결을 설정할 수있습니다. 그것은이 기술은 많은 대안과 달리, 비 - 중요한 것은 침략적 주사를 포함하지 않습니다. 그러나 요즘은 fMRI 하드웨어 여전히 매우 비싸고 컴브리아의주의가 필요합니다.

그 실험을 보여 의미가있다는 새로운 상황에 적응 뇌. 예를 들어, 자동차 정비공 충동 조작하거나 컴퓨터 마우스 커서를 제어 할 수 있었다 점차 차별화하는 두뇌와 별도로 의치를 통제하는 법을 배워야 조작에서 사용되었다. Lebedev은 잠재적으로 신체 표현에 인공 장치를 통합할 수있는 뇌의 가소성 ','의 효과를 언급하고있다. [20]

추가 여전히인지 주에서 [15 감지 neuroimaging 논의할 수있는 기회의 분야에서 최근 출판물]. 이 규정하고 우리의 관심의 상호 작용에 인간 - KRS BCI의 애플 리케이션의 가능성에 초점을 맞추고있다.

그것은 다른 국가에서는 특정 실제 세계 객체와 두뇌의인지 영역을 활성화의 특정 패턴에 해당하는 것으로 알려져있다. 이러한 패턴을 디코딩 한 사람은 현재 (여기서 그들의 관심이) 또는 비주얼 객체와 함께 사건에 감독하는 사람이 이미징있다 (즉, 얼굴, 건물, 가구)과 심지어는 개체 개체의 클래스를 식별할 수있는 겹쳐 참석 지향적인 자극을 이해하실 수있습니다 '컬러와 방향. [15] 이러한 프로세스와 멀리 떨어져있는 순간에 복잡한 이해되고있다. 더 많은 연구가 얼마나 낮은 - 질서와 높은 - 순서 뇌의인지 기능에 관련된 특정 신호를 공개한다; 얼마나 시간이 지남에 패턴 변화의 공간적 특성과 다양한 영향을 받고 있으며 다양한 과목의 활성화 패턴을 추정해 볼 수있다는 정도; 등등 그러나 '의 정확한 지식을 계산'을 인간의 두뇌에서 수행성이 있다고 믿고있습니다 BCIs의 건설에 대한 결정되지 않습니다. [20] 일반적인 데이터 마이닝 기법을 다양한 neuroimaging 센서로부터 유용한 정보를 추출하여 특정인지 상태와 연결을 확립 적용될 수있습니다.

지식에는 진지하게 표현의 영역에서 BCI의 어플 라이언 스의 성공에 영향을 미칠 수 있지만 중요한 문제가있습니다. 사소한 문제를 두 시간에 걸쳐 일반화와 같은 정신 상태의 다른 인스턴스의 문제입니다. 그것은 같은 정신 상태의 뇌 영역을 활성화 패턴을 시간이 지남에 따라 다를 수도있습니다 알려져있다. 같은 정신 상태의 다른 인스턴스뿐만 아니라, 콘텐츠 유사 및 기타 요인에 따라 수정된 이미지를 줄 수있습니다. [15]이 유연한 공간 resampling 및 분류 알고리즘을 필요로 헤인즈와리스에 의해 제안된 사용됩니다. 우리는 이러한 문제를 효과적으로 기술의 발전에 따라 해결될 것이라고 믿습니다.

더 질문이 소설인지 모호한 상태로 추정의 문제입니다. 헤인즈와리스 가능한 지각이나인지 주들의 숫자는 무한하다 메모 반해 훈련 범주의 수를 반드시 제한됩니다. [15] 따라서 디코더 경험에서 얻은 작은 훈련을 완전히 새로운 카테고리를 설정할 수 일반화하는 훈련이 중요합니다. 그것은 추정의 뇌 활성 패턴이 실제로 보면 어떤 체계에 의해 매개 변수 공간에 배치하는 것이 가능해 질 것입니다. 이 발견되고 있지만, 그것이 정신적인 콘텐츠 [15의 일부 유형의 가능성이 있는것으로 보여집니다 적어도] 남아있다. 신경 패턴의 분류를위한 경우에는 추상적인 모양의 공간을 참으로 우리 인간의 두뇌의인지 상태의 글로벌 기술지도에 매핑의 가능성에 일찍 있도록 이론이 종이에 설명된 것이 존재합니다. 이 이루어집니다 제공, 초기 요청의 상기 "문제"및 "이상적 인간 <-> KRS"체인을 설정할 수있을 것입니다 해결될 것입니다.

5월 3일 learnable 디코더

지금은 그것이 다른 뇌 뇌 영상 분야의 활성화를 구별할 수있습니다의 최신 업적에 대한 감사를 시작하면 사람은 우리가 그것을 인간의인지지도로 learnable 디코더를 만들 수있습니다 다양한 주제에 대해 생각 탁상 알려져있다 지식 표현 시스템의 지식지도에주의. 그러므로 인간 - 컴퓨터 상호 작용의 이상적인 방법은 엄청난 속도와 의사 소통의 시스템과 함께 정밀 설립 될 수 있도록 할 수도있습니다. 거기에 데이터 손실이 적은 언어적 상호 작용의 무대의 철폐로 인한 것입니다. 속도와 상호 작용의 효과적으로 증가할 것이다. 이러한 두 가지 요인을 다양한 직업의 사람들이 업무의 효율성을 크게 늘릴 수있을 것입니다. [6에서 15] 우리가 뇌를 자극의 위치를 특정 regularities과 모든 인간에 대한 일반적인 지식의 과목 알고; anthropogenic 우리는 이러한 기능을 호출할 수있습니다. 그러나 그것이 링크의 대다수가 있어서는 개인주의로 알려져있다. 따라서 디코더를 개별적으로 적응해야합니다.

또한 디코더의 효율성과 학습 능력을 가진 개인과 그들의 훈련에 따라 달라집니다 분명하다. 우리는 인터페이스를 가진 인공 팔다리를 교체하는 데 사용되는 실험에서 손실이 탁상 수있습니다. 인간과 동물이 정신적으로 특별한 방법은 인위적인 조작과 별도로 실제 분수령과 인공 한 제어하는 [20 배울 이동을 집중시킬 수 있었다.

우리는 인공 신경 네트워크 - 기반 메커니즘 디코더 믿을 상기 감안하면 문제의 최선의 해결책이다.

디코더의 학습 과정을

1) 다차원 공간에 무작위로 선택되어 GKM의 좌표와 가리 킵니다.

2) 여러 문서 인근 지역에 매핑하는 데 (미터법 Euclidian)가 사용되고 선택됩니다와 인간의 연산자로 표시됩니다.

3) 연산자는 그 / 그녀의 마음을 cognitively 주어진 주제와 관련된 개체를 메모리에 참석을 집중하고있습니다.

4) fMRI는 하드웨어에 의해 시간이 neuroimaging 데이터의 특정 기간 동안의 수집되고있다.

5) 이 데이터는 공간적 resampling 및 잡음 감소 알고리즘 패턴 유익한 교육의 현재 반복을 통해 특성화를 추출하는 목적으로 처리됩니다.

6) 준비된 데이터가 신경 네트워크의 입력에 가져온있다. 이 GKM 선택된 지점의 출력 GKM와 연관 따라서 특정 뇌 활성 패턴 신경 네트워크 훈련을 가져온 좌표 좌표.

Human brain to Knowledge Representation System bridge interface

지식 표현 시스템 다리 인터페이스로 인간의 두뇌

그림 3.1 디코더의 훈련의 과정

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This