Rumo idealista Conhecimento Representação Sistema: Global Knowledge Mapa

Taras Filatov

Abstract

Um dos mais importantes problemas que inibem novos desenvolvimentos nas áreas de Conhecimento Representação e Inteligência Artificial é um problema de alinhamento semântico ou conhecimento mapeamento. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Os progressos na sua solução será muito benéfico para as tarefas de recuperação da informação, o alinhamento ontologia, relevância cálculo, texto etc No entendimento do papel do conceito de conhecimento global multidimensional mapa, elaborado através da extração de dependências desacompanhados de documentos grandes corpus, é proposto . Além disso, o problema dos directos humanos - Conhecimento Representação Sistema interface é tratada e um conceito de descodificação adaptativos propostos para efeitos de interação com o modelo descrito anteriormente unificado mapeamento. Em combinação destas duas abordagens são sugeridas como base para um desenvolvimento de uma nova geração de conhecimentos sistemas de representação.

Palavras-chave: representação conhecimento, conhecimento de mapeamento, interação humano computador, ontologia alinhamento, superior ontologia, relevância cálculo, Information Retrieval, documento similaridade

1. Introdução

Na sociedade, o domínio do conhecimento representação tornou-se mais significativa nos últimos anos [25]. As pessoas sempre feitas tentativas para estudar e classificar o conhecimento sobre o conhecimento. Podemos encontrar referências de Sócrates, o mais cedo no século V aC [33] para o florescimento de lógica e epistemologia [28] na meia idade. Uma vez que o problema foi considerada importante no passado, é difícil sobreestimar o seu significado durante a era da informação.

As tecnologias modernas têm alimentado a humanidade com inundações excessivo de dados, que são difíceis de sistematizar e processo. Para uma pessoa para se tornar um especialista em determinada área, isso leva anos de aprendizagem e exige uma posterior informacional corrida para manter-se com as últimas tendências profissionais.

É uma crença popular entre conhecimento e mineração de dados engenheiros especialistas que as informações disponíveis em acesso aberto é o suficiente para extrair certos fatos sobre praticamente qualquer aspecto da nossa vida e até mesmo prever futuro. O único problema a resolver é a inteligência do processo a partir de múltiplas fontes de informação. [35].

Esta nova geração de fatores procura conhecimentos representação sistemas para ajudar a humanidade sistematizar, acessar e utilizar o seu conhecimento coletivo.

No atual trabalho, propor idéias para o desenvolvimento de uma nova era Conhecimento Representação System (KRS).

Acreditamos que as recentes conquistas em certas áreas e das ciências em breve levar a um enorme avanço no campo do conhecimento humano representação e interação humano-computador. Isto irá abrir novos horizontes e aumentar a eficácia do trabalho humano em muitas aplicações. A única coisa que precisa ser feito é levar estes resultados em conjunto.

Ideal KRS deve fornecer um usuário com um acesso conveniente a todos os conhecimentos da humanidade. Seus elementos, portanto, são:

  • um homem que quiser acessar algum pedaço de conhecimento que ele / ela está interessada em,
  • um armazenamento de dados, e
  • o intermediário sistema para fornecer uma interface para acesso ao conhecimento humano.

Os obstáculos que surgem aqui são causadas por limitações das capacidades humanas e atual nível tecnológico.

2. Armazenamento de dados

2/1 Estado da arte

Conhecimento sistema de representação exige que os dados de armazenamento a menos que seja capaz de obter os documentos necessários a partir de fontes externas, em tempo real. Podemos descrever duas abordagens para ganhar um ideal KRS de hoje: estruturado manualmente gerido conhecimento global de armazenamento, tais como ontologias e sistemas automatizados que envolvam indexação e recuperação de matérias-primas mais completa e acessível documentos coleta (World Wide Web), tais como motores de busca. O problema da primeira abordagem, que está em seu manual natureza - qualquer tentativa de criar e manter a base do conhecimento humano global resultará em compromisso entre o detalhe, atualidade e usabilidade. ], UFO (Unified Framework Ontology) Não obstante, existem vários êxito superior ontologia projectos como Cyc [23], WordNet [12], DNS, etc SUMO e em curso discussões teóricas, enquanto a investigação orientada para elaborar um padrão mundial unificado ontologia sob os nomes de Suo (Standard Upper Ontology ) [27], UFO (Unified Framework Ontology) etc

A segunda abordagem se tornou historicamente prevalente devido a WWW ser a maior, abrangente e up-to-date corpus de dados disponíveis para processamento automatizado atualmente. No entanto, em contraste com a primeira abordagem, os problemas de recuperação automatizada informação desempenham um papel importante aqui. Os problemas e compreensão de texto processamento da linguagem natural são uma das mais desafiadoras em TI e, no entanto, ainda permanecem sem solução eficiente. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Adjacentes são os problemas de classificação e relevância cálculo, a chamada "web clustering 'problema [1]. A segunda abordagem (indexação automática), portanto, tem um grande falta de precisão na recuperação.

Há esforços em curso sobre trazer melhorias para a referida abordagens a fim de superar estes problemas. Por exemplo, juntamente com a base unificada ontologia projectos (Suo, BULO), existem algumas tentativas para desenvolver ontologia ontologia alinhamento e técnicas de mapeamento, a fim de levar inexistente ontologias em conjunto entre si e com outros tipos de conhecimento bases [5, 17]. Muitas vezes, é proposto para diminuir as deficiências da administração manual em caso de ontologias, através da recuperação automatizada informação (motor de busca tecnologias). Do outro lado, a melhoria hipertexto normas estão a ser desenvolvidas, a fim de tornar possível especificar manualmente informações para ajudar os motores de busca compreender o significado da commonsense WWW documentos e ligações entre elas [24]. É necessário entender que essas soluções híbridas transportar as deficiências das correspondentes técnicas, juntamente com vantagens.

Uma lacuna une estas abordagens e torna impossível a sua integração: não há padrão de mapeamento e estabelecimento de relações entre documentos e conceitos em diferentes sistemas. O problema seria resolvido no caso de um dos sistemas com fixada matematicamente interpretáveis hierarquia, como ontologias supera a abordagem actual (WWW). Contudo, isto parece improvável devido às razões acima mencionadas. Independente padrão intermediário é uma potencial solução para este problema. Existem várias iniciativas no sentido de estabelecer relações recíprocas e mapeamento das bases de conhecimentos diferentes tipos, entre os quais existe uma área de ontologia mapeamento. As iniciativas têm um comum lacuna: não há padrão único de mapeamento e estabelecimento de relações entre documentos. Posteriormente, nenhum deles é provável que se torne um padrão amplamente reconhecido, a menos que uma solução mais sustentável é desenvolvido.

2.2 O conceito de um Mapa Global Knowledge (GKM)

Nós acreditamos que é possível elaborar uma norma única para o conhecimento através da construção de um mapeamento lógico espaço com o objetivo de projeção do mundo real conhecimento conceitos. Esse modelo (chamemos-lhe Global Knowledge Mapa) deve reflectir nível de similaridade de documentos e conceitos mapeados para ele.

Principal objectivo do modelo é:

  • Alinhamento e cruzada mapeamento de documentos e conceitos (WWW, ontologias, e-bibliotecas, diretórios, etc)
  • Recuperação da informação através de navegação
  • Especificação cálculo automatizado de relevância commonsense

GKM, portanto, requer uma matemática / modelo lógico do conhecimento específico de armazenamento com uma condição: ser ótimo para a tarefa de representação ou seja, a interacção com o conhecimento humano. Para o cumprimento desta condição do modelo deve reflectir na sua dimensionalidade ou na sua estrutura a estrutura do conhecimento humano.

Os requisitos são, portanto:

  • Dimensionalidade e mapeamento.

O principal fator para a dimensionalidade é o significado (ou um tópico).

  1. Cada conceito do conhecimento humano podem ser mapeados para um ponto com um determinado sistema de coordenadas no espaço.
  2. Cada documento de texto ou podem ser mapeados para um determinado número de pontos (documento está dividido em memes - significativo de peças) ou um ponto.
  • Pertinência cálculo.
  1. É possível calcular matematicamente a pertinência entre os dois conceitos, calculando a distância entre os respectivos pontos projeção no espaço.
  2. Por isso, é possível calcular a "semelhança" entre documentos e conceitos, calculando a distância entre os seus mapeamentos.
  • Homogeneidade do espaço.
  1. O espaço é uniforme (homogêneo) e contínua
  2. Coordenadas refletem o significado e as distâncias entre os pontos reflectem a diferença de significado, para que, se o ponto C se situa entre A e B, então isso significa conceito C está relacionada a ambos A e B da mesma forma.
  3. É possível "navegar" no espaço do conhecimento encontrar fontes mapeados para a zonas vizinhas.

Construir um modelo matemático de tal espaço permite o desenvolvimento da Global Knowledge Mapa. Não é interessante tentar elaborar um tal modelo (GKM) em uma forma manual devido às razões acima mencionadas informações de crescimento e mudança contínua na compreensão humana do mundo. Nós acreditamos que é possível extrair dependências e regras disponíveis a partir de corpuses de textos e como utilizar estes processadores para os nossos fins de mapeamento.

A pedra angular das nossas hipóteses é que geralmente é possível mapear vários temas do conhecimento humano no espaço único e as distâncias dentro da dimensionalidade dos últimos reflectem um nível de semelhança entre determinados assuntos. Esta hipótese é baseada em Johnson-Lindenstrauss Lemma declarando que um conjunto de n pontos em alta Euclidiana espaço tridimensional podem ser mapeados para um espaço N dimensional Euclidiana

(2,1)

tal que a distância entre dois pontos quaisquer alterações em apenas um fator (1 [7]). A Vector Space Model comumente utilizados em Information Retrieval e Texto Categorization representa documentos tão alto dimensional vetores [31]. Esses vetores contêm determinado nível (dependendo da função escolhida uma métrica) de informações que é suficiente para classificar o assunto do documento original.

O Tychonoff teorema [26] determina que os pontos que representam as propriedades de objetos de uma classe, deve estar situado mais perto de si no espaço que a propriedade dos pontos que representam as propriedades de objetos de outras classes. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. Em nossa tarefa, isto significa o original espaço vetorial de n textos podem ser projetados para fixo N-dimensional espaço adequado e usando um algoritmo de compressão de dados / dimensionalidade redução devido ao teorema de compacidade [22], o mapeamento será alcançado quando as distâncias entre pontos representam a relevância dos documentos correspondentes.

Fatores que afetam a precisão do mapeamento:

  • representatividade da métrica função do tamanho e da característica espacial
  • tamanho, dispersibilidade e qualidade dos documentos corpus

Desde que a teoria é aplicável nas condições actuais é que continua a ser encontrado técnicas devem ser utilizadas para elaborar o mapeamento. Propomos a centrar-se em meios automáticos, devido a muitas complicações tornando manual peritos com base em mapeamento inaplicável.

2,3 Automática GKM geração através desacompanhados extracção (hipótese)

Para ser útil GKM deverá conter mapeamentos de número significativo de palavras reais (WWW) e documentos na sua estrutura comum humanos representam o entendimento do mundo. Não é interessante, pois, de considerar qualquer manual de criação de formas GKM e preenchendo-o com documento mapeamentos. A extracção de dados princípios devem ser utilizados para extrair dependências representando o conhecimento existente a partir do corpo de documentos disponíveis para o tratamento informático e filtrar os dados desnecessários.

Houve numerosas tentativas de extracção de dependências desacompanhados em textos no entanto, ainda é uma questão duvidosa se qualquer técnica é capaz de proporcionar um conhecimento extração sustentável através da análise de documentos grandes recolha [10, 11, 21, 30].

Vamos dividir os fatores que geralmente afetam o conteúdo dos documentos em três categorias:

  1. Autores factores pessoais (sentimentos e motivações para criar o texto, física e moral estados durante a pensar e escrever)
  2. Língua (as regras da língua, etc usada para escrever o documento)
  3. Conhecimento (algumas partes do conhecimento humano autor transmite directamente ou implicitamente através do documento)

Vamos supor que seja possível processar todos os documentos de texto disponível autores humanos e extrair todas as dependências regras. Neste caso, a influência do fator 1 será mínimo. A influência do fator 2 não é de grande importância, devido ao seguinte:

a) documentos em vários idiomas podem ser indexados, reciprocamente, por conseguinte, reduzir a influência

b) a própria linguagem reflete conhecimento humano [18], assim, em certa medida o fator 2 é um subfactor de 3 e até mesmo a extração de sua mistura representa uma conquista satisfatória

É teoricamente possível, em seguida, para extrair informações principalmente correspondentes ao conhecimento humano através expostos os documentos disponíveis. Esta informação transformada para o mapeamento espacial irá hipoteticamente nos fornecer GKM sustentável.

2/4 Execução (experimento)

No espaço construído cada documento deve ser mapeado para coordenar único. O 'browser' do espaço ou distâncias comparação deve revelar essa situação de documentos ou seus agrupamentos refletir a sua relevância e que é possível atribuir nomes a certas tópico específico coordenadas no espaço.

Nossas experiências de utilização de 2 e 3 dimensional Kohonen SOM local com uma coleção de documentos revelam que as distâncias entre as projeções dos documentos não são estáveis em toda a série de lançamentos. Isto na nossa opinião, é a prova de que a dimensionalidade do mapa é insuficiente o que está de acordo com Johnson-Lindenstrauss Lemma acima mencionadas.

Infelizmente, é impossível realizar a experiência com um bom dimensionalidade. Por exemplo, de acordo com Johnson-Lindenstrauss Lemma, para mapear 20.000 documentos permitindo 10% de erro que vai exigir 58 dimensões. Isto exige cálculos modernos computadores que estão acima da capacidade.

A coisa importante a referir aqui é que, ao mesmo tempo que dá um máximo Lemma dimensionalidade do espaço que permite o mapeamento de cumprir a condição de única projeção, não é necessário o mínimo valor efectivo. Lemma dá um valor para um conjunto de n pontos ou seja, para o pior caso que não é provável que apareça na prática. Os métodos de detecção dimensionalidade deverá ser utilizada para calcular uma efectiva dimensionalidade dos dados e, portanto, determinar o número correto de dimensões para o mapeamento de particular conjunto de dados. Existem técnicas para conhecer esta que provêm do fundo da superfície reconstrução. Uma das mais recentes é o trabalho por S. Cheng, Y. e Z. Wang Wu [4], onde através do método de detecção dimensão Principal Component Analysis [8] é apresentado. Assim, a dimensionalidade intrínseca dos dados pode ser extraído. Como, na prática, este valor é inferior ao máximo dimensões necessárias para a projecção de o mesmo número de documentos em um caso teórico-pior caso, isto dá uma significativa redução no cálculo tempo. Como alternativa para o mesmo efeito, podemos considerar os métodos iterativos baseados em avaliações. O objectivo da dimensionalidade redução no nosso caso é o de estabelecer um mapeamento eficaz quando o commonsense semelhança entre fontes de informação é expressa através de distância Euclidiana entre projeção pontos. Tendo qualquer dimensionalidade redução técnica baseada na selecção aleatória a partir do conjunto de dados de entrada (tais como a Principal Component Analysis, Self Organising Maps, Sammon reconstrução ou triangulação), em caso de saída dimensionalidade é menos adequado do que, as projeções será instável e com cada novo cálculo o mapeamento será diferente e as distâncias entre as projeções não irá preservar. Nós também podemos supor que, quando o efetivo dimensionalidade das entradas múltiplas é utilizada para o mapeamento, as distâncias serão de preservar um certo grau de liberdade, dependendo dimensionalidade redução método utilizado. Uma solução alternativa é, portanto, uma selecção aleatória dimensionalidade técnica combinada com a redução gradual dimensionalidade paralelo avaliação do mapeamento. 32]. Considere, por exemplo, a técnica de cultivo SOMs descrito em [19, 32]. Destinados a reduzir o cálculo tempo, o número de nodos é aumentado dinamicamente com novos nodos sendo distribuídos uniformemente entre os antigos e os seus pesos vetores a ser estabelecidas para o meio dos vizinhos original pesos vetores. Mesma técnica aplicada a dimensionalidade (D) daria uma oportunidade para avaliar cada D passo a passo. Critérios de avaliação seria estabilização das distâncias entre as projeções. Para esse efeito dois ou mais auto-organizar mapas podem ser executados em paralelo com pairwise distâncias entre certas projeções sendo comparado a cada iteração. Sob iteração aqui entendemos a fase em que a dimensionalidade do MOS foi aumentada e conseqüentemente a rede foi estabilizada com novos parâmetros.

Resumindo o acima referido, propomos o seguinte modelo experimental para a avaliação da melhor abordagem para a criação da Global Knowledge Mapa da coleção de documentos texto.

O datase t: vetor espacial modelo a ser usado (cada documento representado como vetor com características como dimensões e características »classifica como em coordenadas correspondentes dimensões).

Feature selecção função: mais eficaz a ser definido.

Vector size: a ser estabelecido empiricamente.

Processamento de dados e armazenamento.

A dimensionalidade redução técnica deve ser utilizada para o mapeamento. Existem duas abordagens possíveis:

a) pré-calcular as dimensões intrínsecas e avaliar diferentes dimensões com uma redução métodos conhecidos dimensionalidade do mapeamento;

b) "incremental dimensionalidade avaliação abordagem" com poucos mapeamentos sendo executados em paralelo, - apenas com métodos de seleção aleatória de entrada de dados podem ser utilizados.

Entradas: documentos' característica vetores.

Saídas: GKM coordenadas.

Avaliação:

1) Commonsense avaliação inicial de correspondência entre documentos e distâncias Euclidiana mapeamento das suas projecções.

2) Estabilização de pairwise estas projecções através de diferentes distâncias entre os lançamentos em caso selecção aleatória técnica é utilizada.

3. Interface

3,1 Ideal conhecimento representação interface

A interface parte do sistema de representação Conhecimento é importante quando o sistema ideal é discutida. Ambas as tarefas de recebimento de solicitações de usuários e transmitir conhecimentos que lhes costas são de igual importância com as tarefas de estruturação de dados e armazenamento. No papel atual, discutimos os caminhos para Conhecimento Representação Sistemas de uma nova geração e, portanto, a questão da interação é supervisionada, a fim de estabelecer se é possível fornecer um idealista interface por meio de uma tecnologia moderna.

As interfaces que são utilizadas para apoiar a interação do usuário com um humano moderno conhecimento representação e sistemas de recuperação da informação são principalmente de "indexação" tipo, ou seja, os utilizadores têm de saber exactamente o que eles estão procurando e eles também têm de especificá-lo lingüisticamente. Um exemplo comum dessa interface é um mecanismo de pesquisa. Como já mencionado acima, o motor de pesquisa e corpo de documentos WWW é o mais completo e atualizado com os conhecimentos representação sistema disponível atualmente, sendo esta a razão da sua popularidade. Ao mesmo tempo, sabe-se que a "indexação" interface não é natural para utilização em seres humanos, mas é a única alternativa como "navegando" abordagens estão a ser criados muito mal [16]. A razão para isso é o problema de mapeamento do conhecimento e alinhamento que não permite a classificação automática de documentos e de representação, de acordo com os seus assuntos. No entanto, com o problema do conhecimento unificado mapeamento espaço a ser resolvido, aparecem novas possibilidades para a construção de melhorias, interfaces mais naturais do 'browser' tipo.

3/2 Alta Dimensionalidade e visualização

Após ter mencionado que o resultado do mapeamento espacial mundial é susceptível de ser n-dimensional onde n é alta, é necessário resolver o problema da representação visual. É possível para o homem a imaginar 3D espaço, portanto, a melhor forma de ND-> representação 3D estão a ser avaliados. Dimensionalidade redução técnicas ou representação múltipla abordagem via interface pode ser usada.

É importante que, com a ajuda da cartografia espacial unificado conhecimento do erro é minimizado durante o cálculo de relevância entre os documentos, e, além disso, a recuperação de documentos relevantes até mesmo de outros sistemas torna-se uma tarefa trivial. Para o usuário final, isto significa, uma vez que o sistema tenha localizado o tópico que ele / ela está interessada em, ele nunca vai levar usuário a documentos irrelevantes.

3.3 Informação pedido cadeia

Quando as tarefas de temas de mapeamento e localização, cálculo e relevância conhecimentos espaço navega são resolvidos, a tarefa mais importante é que continua a ser a de resolver o problema de um pedido inicial. No estado-da-arte informação sistemas de recuperação os seguintes processos são geralmente sendo envolvidos quando são solicitadas informações:

Humanos parte: 1) Imaginação -> 2) formação de construções lingüísticas -> 3) manual teclado (voz entrada) -> Machine parte: 4) descodificação linguística -> 5) congruência e da localização -> 6) visualização dos documentos correspondentes

A cadeia é longa e é óbvio que a perda de dados e corrupção está a ser significativa devido à dupla linguística codificação e descodificação. Em primeiro lugar, o utilizador tem de formular o cognitivo imagens em curto período linguística. Em segundo lugar, o sistema tem de descodificar a frase, a fim de compreender o assunto de interesse do usuário. O pedido inicial da cadeia descrita causas insatisfação dos usuários dos modernos motores de busca devido à incapacidade do sistema para "compreender" a solicitação, resultando em enorme perda de tempo do usuário final. O grau de recuperação destes erros e os problemas causados pela limitação interface é muito significativo e irá minimizar os efeitos de recuperação e localização mais precisa dos documentos introduzidos pelo mapeamento unificada.

Por isso, é necessário considerar, pelo menos teoricamente, a possibilidade de criação de um ideal de cadeia curta humanos <-> Conhecimento Representação Sistema interação com unidades causando perda de dados são eliminados:

Humanos parte: 1) Imaginação -> [pedido são passadas através de cérebro humano directo-GKM coordenadas conversor] -> 2) congruência e da localização -> 3) visualização dos documentos correspondentes

Nós Resumo as últimas realizações na área da Brain Computer Interfaces (BCI) para esta finalidade.

3/4 Brain-Computer Interfaces

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. A investigação sobre BCI está em curso há mais de 30 anos e na área ainda é muito jovem e desenvolve rapidamente. Até um momento m ost recentes avanços significativos na área têm sido realizados em perna artificial controle ou seja automobilismo funções do cérebro [ 3], bem como a interpretação e processamento de sinais visuais. Estes resultados foram verificados durante vários experimentos envolvendo animais e seres humanos. Investigadores relatório integração bem sucedida dos dispositivos mecânicos ou electrónicos, quando os animais ou seres humanos aprendem a controlar o aparelho com a ajuda de seu cérebro, outras relatório transferência bem sucedida e descodificação dos sinais visuais [15, 20].

Interfaces cérebro-computador estudos estão intimamente relacionados com a área de neuroimagem funcional, onde várias tecnologias foram desenvolvidas para gravar eficazmente os estados do cérebro da pessoa através de determinadas características físicas. Mais produtivos do ponto de vista da neuroimagem BCI é uma recente técnica chamada ressonância magnética funcional ) (FMRI) [6, 13]. Esta técnica permite registrar a dinâmica do fluxo sangüíneo em diferentes áreas cerebrais ao longo do tempo e com uma elevada precisão. Este conseqüentemente permite estabelecer conexões entre diferentes padrões de ativação de áreas cerebrais e de certas actividades e processos cognitivos do homem. É importante que essa técnica, ao contrário de muitas alternativas, é não-invasivo e não envolve injeções. É necessário notar, contudo, que o fMRI hardware hoje ainda é muito caro e pesado.

É significativo que as experiências mostram que o cérebro se adapta a novas condições. Por exemplo, quando impulsos automobilismo foram utilizados para controlar um manipulador mecânico ou um computador cursor do mouse, o cérebro é capaz de diferenciar gradualmente e aprender a controlar separadamente manipulador de perna artificial. Lebedev menciona o efeito da "plasticidade cerebral", que potencialmente permite incorporar dispositivos artificiais em representação do corpo. [20]

Recentes publicações no campo da neuroimagem ainda discutir a possibilidade de detectar os estados cognitivos [15]. Este prevê a focalização da nossa atenção sobre a possibilidade de aplicação do BCI na interação humano-KRS.

Sabe-se que os diferentes estados cognitivos relacionados com determinados objetos do mundo real correspondem a determinados padrões de ativação cerebral áreas. Descodificação esses padrões permite compreender que sobreposta orientada estímulos uma pessoa está actualmente frequentam (onde sua atenção é dirigida) ou em caso de objetos visuais para identificar qual a classe de objectos a pessoa é imagem (ou seja, rostos, edifícios, mobiliário) e até mesmo os objetos 'cor e orientação. [15] Estes processos são complexos e muito longe de ser entendido no momento. Outros estudos revelam o modo como são de baixa ordem e alta correlação com a ordem cérebro sinais certos funções cognitivas, como as características espaciais dos padrões mudam com o tempo e sob várias influências, em que medida é possível extrapolar os padrões de ativação de diversas disciplinas; etc Acredita-se, porém, que o conhecimento exacto de "cálculos" realizado no cérebro humano não é crucial para a construção de relevante BCIS. [20] dados comum mineira técnicas podem ser aplicadas para extrair informações úteis a partir de diversos sensores neuroimagem e estabelecer ligações com certos estados cognitivos.

Há ainda questões importantes que podem afectar seriamente o sucesso do aparelho do BCI na área do conhecimento representação. Dois pequenos problemas são generalização em todo tempo e com o problema das diferentes instâncias do mesmo estado mental. Sabe-se que padrões de ativação de áreas cerebrais ao mesmo estados mentais podem variar ao longo do tempo. Diferentes instâncias do mesmo estado mental pode dar modificadas imagens e também, dependendo de fatores contextuais e outras variações. [15] Isto exige flexibilidade espacial reamostragem e classificação algoritmos a serem utilizados como sugerido por Haynes e Rees. Acreditamos que esses problemas serão resolvidos no desenvolvimento de técnicas eficazes.

Mais duvidosa questão é o problema da extrapolação para novos estados cognitivos. Haynes e Rees nota que o número de possíveis estados perceptuais ou cognitivas é infinito, enquanto que o número de categorias de formação é necessariamente limitada. [15] É fundamental, portanto, que a descodificação poderia ser treinado para generalizar experiências obtidas a partir de pequenas formação completamente definido para novas categorias. Seria possível, por meio de extrapolação dos padrões de ativação cerebral se estão realmente dispostas em alguns sistemática paramétricos espaço. Isto continua a ser encontrado, no entanto, acredita-se que é possível, pelo menos para alguns tipos de conteúdo mental [15]. Em caso resumo forma espaço para a classificação de padrões neurais na verdade existe isso permitirá teorizar sobre as possibilidades de mapeamento do cérebro humano cognitivo estados para Global Knowledge Mapa descrito anteriormente neste documento. Desde que este seja alcançado, o referido "problema do pedido inicial" será resolvido e "ideal humano <-> KRS" cadeia será possível estabelecer.

3,5 Learnable Descodificador

Como já é conhecido graças às últimas realizações de imagem cerebral, que é possível distinguir a ativação de diferentes áreas cerebrais, quando a pessoa está a pensar sobre os diferentes assuntos que podem presumir que é possível criar um descodificador para learnable mapa cognitivo humano iniciado estados em um mapa de conhecimento Conhecimento sistema de representação. Por conseguinte, uma forma ideal de interacção homem-computador poderá ser estabelecida permitindo uma enorme velocidade e precisão com um sistema de comunicação. Haverá menos perda de dados devido a eliminação da fase de interacção linguística. A rapidez ea eficácia da interacção aumentará consequentemente. Estes dois factores que irão permitir que pessoas de diversas profissões para aumentar a eficácia do seu trabalho de forma significativa. De [6, 15], sabemos que existem certas regularidades da localização cerebral dos impulsos e as disciplinas do conhecimento que são comuns a todos os seres humanos, que podemos chamar estas características antropogénicas. No entanto, sabe-se que a maioria destas ligações devem ser individualista. Assim, o decodificador deve ser individualmente adaptável.

É também óbvio que a eficiência do decodificador dependerá de pessoas e com isso a sua formação ea sua capacidade de aprender. Podemos presumir isto a partir das experiências com interfaces artificiais a serem usados para substituir membros perdidos. Os humanos e os animais foram capazes de se concentrar mentalmente, de modo especial, para mover um manipulador artificial e até mesmo aprender a controlar a parte real e artificial um separadamente [20].

Considerando o acima mencionado, acreditamos que uma rede neural artificial - com base mecanismo é a melhor solução de um descodificador problema.

Decodificador do processo de aprendizagem

1) O ponto com coordenadas aleatórias no espaço multidimensional da GKM for selecionado.

2) Vários documentos, que tenham a sua mapeamentos na área vizinha (Euclidiana métrica está sendo utilizado) são selecionados e exibidos para um operador humano.

3) Operador concentra a sua mente para cogniti assistir a determinado tema e em objetos relacionados à memória.

4) A neuroimagem dados estão sendo coletados por RMf hardware durante um período específico de tempo.

5) Os dados são processados através de uma reamostragem espacial e redução de ruído algoritmo visava extrair padrões informativos caracterizando a atual iteração de treinamento.

6) Preparado dados são coletados para as entradas da rede neural. O GKM coordenadas de um ponto seleccionado são buscados para as saídas, por conseguinte, da formação da rede neural para associar específicos padrões de ativação cerebral com GKM coordenadas.

Human brain to Knowledge Representation System bridge interface

Cérebro humano para Conhecimento Representação Sistema ponte interface

Figura 3.1 O processo de formação do descodificador

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This