Hacia la representación del conocimiento del sistema idealista: Mapa Global Knowledge

Taras Filatov

Resumen

Uno de los problemas más importantes que impiden la evolución en los ámbitos de la representación del conocimiento y la inteligencia artificial es un problema de semántica o de los conocimientos de cartografía alineación. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Los progresos en su solución será muy beneficioso para las tareas de recuperación de información, la ontología de alineación, la pertinencia de cálculo, comprensión de texto etc En el documento el concepto multidimensional de mapa global del conocimiento, elaborado a través de la extracción sin control de las dependencias de los grandes corpus de documentos, se propone . Además, el problema de la directa Humanos - Sistema de interfaz de la representación del conocimiento se dirige y un concepto de adaptación decodificador propuesto a los efectos de la interacción con los descritos anteriormente cartografía modelo unificado. En combinación, estos dos enfoques se sugieren como base para un desarrollo de una nueva generación de sistemas de representación del conocimiento.

Palabras clave: representación del conocimiento, mapeo de conocimientos, interacción humano computadora, alineación de la ontología, la ontología superior, la pertinencia de cálculo, de recuperación de información, documento similitud

1. Introducción

En la sociedad, el ámbito de la representación del conocimiento se hizo más importante en los últimos años [25]. La gente siempre se trata de estudiar y clasificar el conocimiento sobre el conocimiento. Podemos encontrar referencias desde tan temprano como Sócrates en el siglo V antes de Cristo [33] para el florecimiento de la lógica y la epistemología [28] en la Edad Media. Dado que el problema se consideró que era importante en el pasado, es difícil sobreestimar su significado en la era de la información.

Las tecnologías modernas han dotado los hombres con exceso de las inundaciones de los datos que son difíciles de sistematizar y procesar. Para una persona para convertirse en un especialista en un área determinada se necesitan años de aprendizaje y requiere de una raza de información para mantenerse al día con las últimas tendencias profesional.

Es una creencia popular entre los conocimientos de ingenieros especialistas en minería de datos y que la información disponible en acceso abierto es suficiente para extraer la verdad sobre los hechos prácticamente cualquier aspecto de nuestra vida e incluso predecir el futuro. El único problema a resolver es el proceso de forma inteligente la información de múltiples fuentes. [35].

Esta nueva generación de factores de demanda de sistemas de representación del conocimiento para ayudar a sistematizar la humanidad, el acceso y uso de sus conocimientos colectivos.

En el actual trabajo se propone ideas para el desarrollo de una nueva era de conocimiento del sistema de representación (KRS).

Creemos que los recientes logros en ciertas áreas y de las ciencias pronto conducir a un enorme avance en el ámbito de la representación del conocimiento y la interacción hombre-computadora. Esto abrirá nuevos horizontes y aumentar la eficacia del trabajo humano en muchas aplicaciones. Lo único que hay que hacer es llevar estos logros juntos.

KRS ideal debería proporcionar un usuario con un fácil acceso a todos los conocimientos de la humanidad. Sus elementos, por lo tanto, son los siguientes:

  • un ser humano que quiere tener acceso a alguna pieza de los conocimientos que él / ella está interesado,
  • de almacenamiento de datos, y
  • el sistema de intermediación para proporcionar una interfaz para el acceso a los conocimientos humanos.

Los obstáculos que se plantean aquí son causados por las limitaciones de las capacidades humanas y el actual nivel tecnológico.

2. Almacenamiento de datos

2.1 Estado del arte

Sistema de representación del conocimiento requiere el almacenamiento de datos a menos que sea capaz de recuperar los documentos necesarios de fuentes externas en tiempo real. Podemos describir dos enfoques para ganar un ideal KRS de hoy: estructura global del conocimiento gestionado manualmente almacenes como ontologías y sistemas automatizados de indexación de la participación y la recuperación plena de la mayoría de las materias primas y colección de documentos accesibles (World Wide Web), como los motores de búsqueda. El problema de la primera aproximación está en su manual de la naturaleza - todo intento de crear y mantener la base de conocimiento humano mundial se traducirá en un compromiso entre el detalle, actualidad y utilidad. ], UFO (Unified Framework Ontology) A pesar de que hay múltiples éxito superior proyectos como ontología Cyc [23], WordNet [12], DNS, etc SUMO y discusiones teóricas en curso, siempre y cuando las investigaciones encaminadas a elaborar un estándar mundial unificada ontología bajo los nombres de SUO (Norma Superior Ontología ) [27], OVNI (Marco Unificado de Ontología) etc

El segundo enfoque se convirtió históricamente prevalece debido a la WWW de ser el más grande, completa y actualizada corpus de los datos disponibles actualmente para el tratamiento automático. Sin embargo en contraste con la primera aproximación, los problemas de recuperación de información automatizado de desempeñar un papel importante aquí. Los problemas de comprensión de texto y de procesamiento del lenguaje natural es uno de los más difíciles en la AI y aún siguen sin solución eficiente. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Adyacentes son los problemas de clasificación y la pertinencia de cálculo, la llamada web agrupación "problema [1]. El segundo enfoque (indexación automática), por lo tanto tiene una gran falta de precisión en la recuperación.

Se están realizando esfuerzos en la aproximación de las mejoras a los mencionados enfoques para superar estos problemas. Por ejemplo, junto con proyectos de base uniforme ontología (SUO, Bulo) hay ciertos intentos de desarrollo de la ontología y la ontología adaptación técnicas de mapeo con el fin de ontologías existentes, junto con los demás y con otros tipos de bases de conocimiento [5, 17]. A menudo se propone reducir las deficiencias de administración manual de ontologías en el caso de los medios de recuperación de información automatizado (motor de búsqueda de tecnologías). Desde el otro lado, la mejora de hipertexto se están desarrollando normas para hacer posible especificar manualmente la información para ayudar a los motores de búsqueda de comprender el sentido común de la Web los documentos y los enlaces entre ellos [24]. Es necesario comprender que estas soluciones híbridas llevar las deficiencias de las técnicas correspondientes, junto con ventajas.

Una deficiencia une a estos planteamientos y hace imposible su integración: no hay ninguna norma de la cartografía y el establecimiento de relaciones entre los documentos y los conceptos en los distintos sistemas. El problema se resolvería en caso de que uno de los sistemas fijos con jerarquía matemáticamente interpretables como ontologías supera el enfoque actual (WWW). Sin embargo, esto parece poco probable debido a razones antes mencionadas. Intermediario independiente estándar es una posible solución a este problema. Existen múltiples iniciativas en materia de dirección de la vinculación recíproca y la cartografía de las bases de conocimientos de diferentes tipos entre los cuales hay un área de cartografía de la ontología. Las iniciativas tienen una deficiencia común: no hay una norma única de la cartografía y el establecimiento de relaciones entre documentos. Posteriormente, ninguno de ellos es probable que se convierta en una norma ampliamente reconocida a menos que una solución más sostenible se desarrolla.

2.2 El concepto de un Mapa Global Knowledge (GKM)

Creemos que es posible elaborar una norma única para el conocimiento de cartografía mediante la construcción de una lógica espacial con el propósito de la proyección de los conceptos del mundo real conocimientos. Modelo de ese tipo (vamos a llamarlo Mapa Global Knowledge) debe reflejar el nivel de similitud de los documentos y mapas conceptos sobre ella.

Principal objetivo del modelo es:

  • Transversal y la alineación de mapas de los documentos y los conceptos (WWW, ontologías, bibliotecas electrónicas, directorios, etc)
  • De recuperación de información a través de la navegación
  • Precisa el cálculo automático de común interés

GKM, por lo tanto, requiere de un matemático / modelo lógico de los conocimientos específicos de almacenamiento con una condición: ser óptima para la tarea de representación del conocimiento es decir, la interacción con humanos. Para el cumplimiento de esta condición, el modelo debe reflejar en su dimensionalidad en su estructura o la estructura del conocimiento humano.

Por lo tanto, los requisitos son los siguientes:

  • Dimensionalidad y la cartografía.

El principal factor para la dimensión es el sentido (o un tema).

  1. Cada concepto de conocimiento humano puede ser asignada a un punto con un sistema de coordenadas en el espacio.
  2. Cada documento o texto puede ser asignada a un número de puntos (el documento se divide en los memes - significativo de piezas) o un punto.
  • Pertinencia de cálculo.
  1. Es posible calcular matemáticamente la pertinencia entre dos conceptos mediante el cálculo de la distancia entre sus correspondientes puntos de proyección en el espacio.
  2. Por lo tanto, es posible calcular "similitud" entre los documentos y los conceptos de cálculo de la distancia entre sus asignaciones.
  • Homogeneidad del espacio.
  1. El espacio es uniforme (homogénea) y continua
  2. Coordenadas de reflejar el sentido y las distancias entre los puntos reflejan la diferencia en el significado de manera que si el punto C se encuentra entre A y B, entonces significa concepto C se relaciona con A y B, ambos por igual.
  3. Es posible "navegar" el espacio para encontrar las fuentes de conocimiento asociadas a las áreas vecinas.

La construcción de un modelo matemático de estos espacios permite el desarrollo de la Global Knowledge Mapa. No es que vale la pena tratar de elaborar un modelo (GKM) en forma manual, debido a razones antes citadas de la información y el crecimiento continuo cambio en la comprensión humana del mundo. Creemos que es posible extraer de las dependencias y las normas disponibles corpus de textos y el uso de estos procesadores para nuestros fines de mapeo.

La piedra angular de nuestra hipótesis es que generalmente es posible asignar diferentes temas sobre el conocimiento humano solo espacio y las distancias dentro de la dimensionalidad de este último reflejan un nivel de similitud entre determinados temas. Esta hipótesis se basa en Johnson-Lindenstrauss Lemma afirmando que un conjunto de n puntos de alta dimensión euclidiana en el espacio puede ser asignada a un espacio de n dimensiones euclidiana

(2,1)

tal forma que la distancia entre dos puntos cualesquiera cambios sólo por un factor (1 ) [7]. El modelo de espacios vectoriales de uso común en la recuperación de información y de categorización de texto representa los documentos como vectores de alta dimensiones [31]. Estos vectores contienen cierto nivel (en función de un indicador de función elegida), de que la información es suficiente para clasificar el objeto del documento original.

El teorema de la Tychonoff [26] establece que los puntos, lo que representa las propiedades de los objetos de una clase, debería estar situada más cerca los unos a los otros bienes en el espacio que los puntos que representan las propiedades de los objetos de otras clases. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. En nuestra tarea, esto significa que el original de espacio vectorial de n textos pueden ser proyectadas sobre la N-fijo y el espacio tridimensional utilizando un algoritmo de compresión de datos / dimensionalidad de reducción debido a la compactación del teorema [22], la cartografía se logrará cuando las distancias entre puntos representan la pertinencia de los documentos correspondientes.

Factores que afectan a la precisión de la cartografía:

  • representatividad de las métricas de la función y el tamaño de la característica de espacio
  • tamaño, dispersity y la calidad de los documentos corpus

Siempre que la teoría es aplicable en las actuales condiciones sigue siendo que se encuentran las técnicas que se utilizarán para elaborar la cartografía. Proponemos que se centrará en medios automáticos debido a las complicaciones que muchos manuales de expertos basados en la cartografía inaplicable.

2,3 GKM generación automática sin supervisión, a través de la extracción (hipótesis)

Con el fin de ser útil GKM debería contener asignaciones de número de palabra real (WWW) en los documentos y su estructura común de la humanidad representan la comprensión del mundo. Es por lo tanto no vale la pena considerar cualquier manual de formas de creación de GKM y llenándolo con el documento asignaciones. La minería de datos deberían ser utilizados para extraer las dependencias que representan el conocimiento del corpus existente de documentos disponibles para el tratamiento por ordenador y filtrar los datos innecesarios.

Ha habido numerosos intentos para la extracción sin control de dependencias en los textos, sin embargo, es todavía una dudosa cuestión de si cualquier técnica es capaz de proporcionar una extracción sostenible de los conocimientos mediante el análisis de un gran colección de documentos [10, 11, 21, 30].

Vamos a dividir los factores que suelen afectar el contenido de los documentos en tres categorías:

  1. Autores factores personales (los sentimientos y las motivaciones para crear el texto, física y moral de los estados durante el pensamiento y la escritura)
  2. Idioma (las normas, etc de la lengua utilizada para escribir el documento)
  3. Conocimiento (algunas partes del conocimiento humano autor transmite directamente o implícitamente a través del documento)

Vamos a suponer que es posible procesar todos los documentos de texto de los autores y extraer todas las normas de la dependencia. En este caso la influencia del factor 1 será mínimo. La influencia del factor 2 no es de mucha importancia debido a las siguientes:

a) documentos en múltiples idiomas pueden ser indexados, por lo tanto la reducción de la influencia recíproca

b) el propio idioma refleja el conocimiento humano [18], por lo tanto, en cierta medida, el factor 2 es un subfactor de 3 y hasta la extracción de su mezcla representa un logro satisfactorio

En teoría, es posible entonces extraer información correspondiente a la mayoría de los conocimientos humanos expuestos a través de los documentos disponibles. Esto transformó a la información de mapeo espacio hipotéticamente nos proporcionan GKM sostenible.

2.4 Aplicación (experimento)

En el espacio construido cada documento debe ser asignada a un solo coordinar. La "navegación" del espacio o distancia comparación revela que la situación de los documentos o sus agrupaciones reflejar su importancia y que es posible asignar nombres a determinados temas específicos de las coordenadas en el espacio.

Nuestras experiencias de la utilización de 2 y 3 dimensiones Kohonen SOM con una colección de documentos locales revelan que las distancias entre las proyecciones de los documentos no son estables en toda la serie de lanzamientos. Esto, en nuestra opinión, es la evidencia del hecho de que la dimensionalidad del mapa no es suficiente que se ajuste a Johnson-Lindenstrauss Lemma mencionados anteriormente.

Lamentablemente es imposible llevar a cabo el experimento con una dimensionalidad. Por ejemplo, según Johnson-Lindenstrauss Lemma, 20000 mapa de los documentos que permitan el 10% de error se requiere 58 dimensiones. Esto requiere que los cálculos están por encima de las computadoras modernas capacidad.

Lo importante a mencionar es que, si bien da un máximo Lemma dimensionalidad de la cartografía del espacio que permite cumplir con la condición de única proyección, no es necesario el mínimo de valor efectivo. Lemma da un valor para un conjunto de n puntos, es decir, para el peor de los casos que no es probable que aparezca en la práctica. Los métodos de detección de dimensionalidad se debe utilizar para calcular una eficaz dimensionalidad de los datos y, por tanto, determinar el número exacto de las dimensiones de la cartografía de todo conjunto de datos. Se conocen las técnicas para que este fondo provienen de la superficie de la reconstrucción. Una de la más reciente es la obra de S. Cheng, Y. Wang y Z. Wu [4] donde dimensión método de detección a través de Análisis de Componentes Principales [8] se presenta. Por lo tanto, la dimensión intrínseca de los datos pueden ser extraídos. Como este valor en la práctica es inferior a la máxima dimensión necesaria para la proyección de el mismo número de documentos en el peor de los casos, un caso teórico, se obtiene una importante reducción de tiempo en el cálculo. Como alternativa para el mismo fin, podemos considerar los métodos iterativo basado en las evaluaciones. El objetivo de reducción de dimensionalidad en nuestro caso es establecer una eficaz cuando la cartografía común similitud entre las fuentes de información se expresa a través de la distancia euclidiana entre los puntos de proyección. Reducción de dimensionalidad de tomar cualquier técnica basada en una selección al azar de los datos de entrada establecidas (por ejemplo, Análisis de Componentes Principales, la organización de autónomos Mapas, Sammon reconstrucción o triangulación), en caso de que la producción es inferior a la dimensión adecuada, las proyecciones será inestable y con cada nuevo cálculo la asignación será diferente y las distancias entre las proyecciones no conservar. También podemos suponer que cuando el efectivo de la dimensionalidad del colector de entrada se utiliza para la elaboración de mapas, las distancias con voluntad de preservar un cierto grado de libertad en función de reducción de dimensionalidad método utilizado. Una solución alternativa, por lo tanto, es una selección aleatoria de reducción de dimensionalidad técnica combinada con dimensionalidad incremento paralelo de evaluación de la cartografía. 32]. Consideremos, por ejemplo, la técnica de cultivo de soms descrito en [19, 32]. Destinadas a reducir el tiempo de cálculo, el número de nodos se incrementa dinámicamente con nuevos nodos que se distribuyen de manera uniforme entre los antiguos y de sus vectores de pesos que se establece en los medios de los vecinos originales pesos vectores. Misma técnica se aplica a dimensionalidad (D) daría la oportunidad de evaluar cada D paso a paso. Criterios de evaluación sería la estabilización de las distancias entre las proyecciones. Para este propósito dos o más la libre organización de los mapas pueden ser ejecutados en paralelo con las distancias entre algunos pares que se comparan las proyecciones en cada iteración. En virtud de iteración aquí entendemos la etapa en la dimensionalidad de la SOM se aumentó la red y, por consiguiente, se estabilizó con nuevos parámetros.

Resumiendo la citada proponemos el siguiente modelo para la evaluación experimental de la mejor enfoque para el establecimiento de la Global Knowledge Mapa de la colección de documentos de texto.

El datase t: modelo de espacios vectoriales para ser utilizados (cada uno de los documentos representados como vector con características como las dimensiones y características de filas como en las coordenadas correspondientes dimensiones).

Función de selección de función: más eficaz que se definan.

Tamaño del vector: ser establecido empíricamente.

Tratamiento y almacenamiento de datos.

Una técnica de reducción de dimensionalidad se debe utilizar para la asignación. Hay dos enfoques posibles:

a) antes de calcular la dimensión intrínseca y evaluar diferentes métodos de reducción de dimensionalidad con una conocida dimensionalidad de la cartografía;

b) «enfoque incremental dimensionalidad evaluación" con pocas asignaciones que se ejecute en paralelo - sólo con métodos de selección aleatoria de los datos de entrada puede ser utilizado.

Entradas: documentos característica vectores.

Resultados: GKM coordenadas.

Evaluación:

1) la evaluación común de la correspondencia entre los documentos iniciales y distancias euclidiana cartografía de sus proyecciones.

2) La estabilización de estas distancias entre pares a través de diferentes proyecciones de lanza en el caso de una selección al azar es la técnica utilizada.

3. Interfaz

3,1 Interfaz ideal de representación del conocimiento

La interfaz de la representación del conocimiento del sistema es importante el sistema ideal cuando se discute. Ambas tareas de recepción de solicitudes de los usuarios y la transmisión de conocimientos a ellos son de igual importancia con las tareas de estructuración de datos y almacenamiento. En el presente documento se discuten las formas de conocimiento hacia los sistemas de representación de una nueva generación y, por tanto, la cuestión de la interacción es Pasó revista a fin de establecer si es posible proporcionar una interfaz de idealistas por medio de una tecnología moderna.

Las interfaces que se utilizan para apoyar la interacción de un usuario humano moderno con la representación del conocimiento y sistemas de recuperación de información son principalmente de "indexación", es decir, los usuarios tienen que saber exactamente lo que están buscando y que también tienen que especificar que lingüísticamente. Un ejemplo de este tipo de interfaz es un motor de búsqueda. Como hemos mencionado anteriormente, motor de búsqueda y el corpus de documentos WWW es la más completa y actualizada del sistema de representación de los conocimientos disponibles hoy en día, siendo ésta la razón de su popularidad. Al mismo tiempo se sabe que la 'indexación' de interfaz no es natural para los seres humanos a utilizar, pero es la única alternativa como "navegación" se están estableciendo criterios muy mal [16]. La razón de que es el problema de mapeo de conocimientos y la adaptación que no permite la clasificación automática de documentos y la representación en función de sus temas. Sin embargo, el problema de espacio unificado de mapeo de conocimientos que se resuelve, aparecen nuevas posibilidades para la construcción de mejores, más naturales las interfaces de navegación de tipo.

3,2 y visualización de alta dimensionalidad

Después de haber mencionado que el resultado global de la cartografía del espacio es probable que sea n-dimensional, donde n es alta, es necesario resolver el problema de la representación visual. Es posible para los seres humanos para imaginar el espacio 3D, por lo tanto, la mejor manera de nD-> representación 3D se evaluarán. Técnicas de reducción de dimensionalidad múltiple representación o enfoque a través de la interfaz puede ser utilizado.

Es importante que con la ayuda de la unidad de mapeo de conocimientos espaciales se minimiza el error en el cálculo de otros documentos pertinentes, y, además, la recuperación de los documentos pertinentes, incluso de otros sistemas se convierte en una tarea trivial. Para el usuario final esto significa que una vez que el sistema se ha situado el tema que él / ella está interesado, que nunca llevará a los usuarios documentos irrelevantes.

3.3 Solicitud de información en cadena

Cuando las tareas de los temas de cartografía y localización, la pertinencia de cálculo y los conocimientos de navegación espacial se resuelven la tarea más importante que queda es resolver el problema de una solicitud inicial. En el estado de la técnica de recuperación de información en los sistemas de los siguientes procesos son por lo general se involucrados cuando se solicita información:

Parte humana: 1) La imaginación -> 2) la formación de construcciones lingüísticas -> 3) manual de entrada de teclado (voz) -> elemento de la máquina: 4) la decodificación lingüística -> 5) se pongan en venta y la ubicación -> 6) visualización de los documentos se pongan en venta

La cadena es larga y es evidente que la pérdida de datos y la corrupción está siendo importante debido a la doble codificación y descodificación lingüística. En primer lugar, el usuario tiene que formular las imágenes en breve cognitivo lingüística frase. En segundo lugar, el sistema tiene que descifrar la frase con el fin de comprender el tema de interés del usuario. Describe la cadena de la solicitud inicial causas de insatisfacción de los usuarios de los modernos motores de búsqueda debido a la incapacidad del sistema para "comprender" la petición resulta en gran pérdida de tiempo del usuario final. El grado de recuperación de estos errores y los inconvenientes causados por la limitación de interfaz es muy importante y minimizar el efecto de la recuperación más precisa y la ubicación de los documentos presentado por la unidad de mapeo.

Por lo tanto, es necesario tener en cuenta, al menos en teoría, la posibilidad de la creación de un ideal de cadena corta humanos <-> Sistema de Representación de la interacción del conocimiento con las unidades que causan la pérdida de datos está eliminando:

Parte humana: 1) La imaginación -> [solicitud se pasa por cerebro humano directo GKM-convertidor de coordenadas] -> 2) se pongan en venta y la ubicación -> 3) la visualización de los documentos se pongan en venta

Nos reseña los últimos logros en el área de Interfaces Cerebro Computadora (BCI) para este propósito.

3.4 Interfaces Cerebro-Computadora

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. La investigación sobre BCI ha estado sucediendo por más de 30 años y el área es todavía muy joven y se desarrolla rápidamente. Hasta un momento m mayoría de los últimos avances significativos en la zona se han convertido en prótesis de control de motor es decir, las funciones del cerebro [ 3], y la interpretación y el procesamiento de señales visuales. Estos logros se han verificado durante varios experimentos con animales y seres humanos. Informe de los investigadores el éxito de la integración de dispositivos mecánicos o electrónicos, cuando los animales o los seres humanos aprenden a controlar el dispositivo con la ayuda de su cerebro, y otros informe éxito de la transmisión y descodificación de señales visuales [15, 20].

Las interfaces cerebro-ordenador estudios están estrechamente relacionados con el ámbito de la neuroimagen funcional, en donde diferentes tecnologías se han desarrollado de manera efectiva a los estados de grabar su cerebro por medio de ciertas características físicas. Más productivos desde el punto de vista de BCI es una reciente técnica de neuroimagen llamada imágenes de resonancia magnética funcional ) (FMRI) [6, 13]. Esta técnica permite registrar la dinámica del flujo de sangre en diferentes áreas del cerebro con el paso del tiempo y con una alta precisión. Por consiguiente, permite establecer conexiones entre los patrones de la activación de diversas áreas del cerebro y de determinadas actividades y procesos cognitivos de la persona humana. Es importante que esta técnica, a diferencia de muchas alternativas, no es invasiva y no implica inyecciones. Es necesario señalar, sin embargo, que la fMRI de hardware hoy en día es todavía muy costosa y pesada.

Es significativo que los experimentos muestran que el cerebro se adapta a las nuevas condiciones. Por ejemplo, cuando los impulsos de motor se utiliza para controlar un manipulador mecánico o un ratón de ordenador, el cerebro fue capaz de diferenciar y aprender gradualmente a controlar manipulador por separado de las extremidades artificiales. Lebedev menciona el efecto de la «plasticidad cerebral», que potencialmente permite incorporar dispositivos artificiales en el cuerpo de representación. [20]

Publicaciones recientes en el campo de la neuroimagen discutir más aún la oportunidad de detectar los estados cognitivos [15]. Este establece el enfoque de nuestra atención sobre la posibilidad de aplicación del ICB en la interacción humano-KRS.

Se sabe que los diferentes estados cognitivos relacionados con ciertos objetos del mundo real se corresponden con determinados patrones de activación de áreas cerebrales. Decodificación de estos patrones permite entender que se superponen estímulos orientados a una persona que actualmente asisten a (donde a su atención se dirige) o en caso de objetos visuales para determinar qué clase de objetos de la persona es imagen (es decir, rostros, edificios, muebles) e incluso los objetos 'el color y la orientación. [15] Estos procesos son complejos y están lejos de ser entendido por el momento. Otros estudios ponen de manifiesto la forma de bajo y alto orden para señales cerebrales correlacionan con determinadas funciones cognitivas, la forma en que el las características espaciales de los patrones cambian con el tiempo y bajo diversas influencias, hasta qué punto es posible extrapolar los patrones de activación de los diversos temas; etc Se cree, sin embargo, que el conocimiento preciso de "cálculos" realizados en cerebro humano no es crucial para la construcción de las BCIS. [20] las técnicas de minería de datos comunes se puede aplicar para extraer información útil de varios sensores de neuroimagen y establecer conexiones con ciertos estados cognitivos.

Aunque hay cuestiones importantes que pueden afectar seriamente el éxito del aparato de BCI en el ámbito de la representación del conocimiento. Dos problemas menores son la generalización a través del tiempo y el problema de las diferentes instancias de un mismo estado mental. Se sabe que los patrones de activación de áreas cerebrales de la misma los estados mentales pueden diferir en el tiempo. Diferentes instancias de un mismo estado mental puede dar imágenes y modificados, en función de las variaciones contextuales y otros factores. [15] Esto requiere flexibilidad espacial remuestreo y algoritmos de clasificación que se utilizará como se sugiere por Haynes y Rees. Creemos que estos problemas se resolverán en el desarrollo de técnicas eficaces.

Más dudoso es el problema de la extrapolación a nuevos estados cognitivos. Haynes y Rees, tenga en cuenta que el número de posibles estados de percepción cognitiva o es infinito, mientras que el número de categorías de formación es necesariamente limitado. [15] Es crucial, por tanto, que decodificador puede ser entrenado para generalizar la experiencia obtenida de los pequeños completamente ajustado a la formación de nuevas categorías. Sería posible por medio de extrapolación si los patrones de activación cerebral son realmente dispuestos en algunos sistemática espacio paramétrico. Esto sigue siendo que se encuentran, sin embargo, se cree que es posible al menos para algunos tipos de contenido mental [15]. En el caso de la forma abstracta de espacio para la clasificación de los patrones neuronales de hecho existe, nos permitiría teorizar sobre las posibilidades de la cartografía del cerebro humano en los estados cognitivos Mapa Global Knowledge ha descrito anteriormente en este documento. Siempre que ello se logra, el mencionado "problema de la solicitud inicial" y se resolverá "ideal humano <-> KRS" cadena será posible establecer.

3,5 formativos Decodificador

Como ahora se sabe gracias a los últimos logros de imágenes del cerebro que es posible distinguir la activación de las diferentes áreas del cerebro cuando la persona está pensando en diferentes temas que podemos suponer que es posible crear un mapa para decodificador formativos iniciado cognitivo humano estados en conocimiento de un mapa de la representación del conocimiento del sistema. Por lo tanto, una forma ideal de interacción hombre-computadora puede permitir que se establezca una gran velocidad y precisión de la comunicación con un sistema. Habrá menos pérdida de datos debido a la eliminación de la etapa de interacción lingüística. La velocidad y la eficacia de la interacción aumentará en consecuencia. Estos dos factores permiten que las personas de diversas profesiones para aumentar la eficacia de su labor significativa. A partir de [6, 15], sabemos que hay ciertas regularidades de la localización de los impulsos del cerebro y el conocimiento de los temas que son comunes para todos los seres humanos, podemos llamar a estas características antropogénicas. Sin embargo, es sabido que la mayoría de estos enlaces debe ser individualista. Por lo tanto, el decodificador de adaptación debe ser individual.

También es obvio que la eficacia de la decodificador dependerá de las personas y su formación y con capacidad de aprender. Podemos suponer que esto de los experimentos con interfaces artificiales que se utilizan para reemplazar la pérdida de extremidades. Seres humanos y los animales fueron capaces de concentrarse mentalmente de una manera especial para mover un manipulador artificial e incluso aprender a controlar la parte real y artificial separado [20].

Teniendo en cuenta la mencionada creemos que una red neuronal artificial - mecanismo es la mejor solución de un problema de descodificación.

Decodificador en el proceso de aprendizaje

1) El punto con coordenadas al azar en el espacio multidimensional de GKM está seleccionado.

2) Varios documentos con sus asignaciones en el área vecina (métrica euclidiana se está utilizando) se seleccionan y se muestran a un operador humano.

3) Operador se concentra su mente para asistir a la cognitivamente tema determinado y los objetos en la memoria.

4) La neuroimagen se están recogiendo los datos por fMRI de hardware durante un periodo específico de tiempo.

5) Los datos se procesan a través de un muestreo espacial y reducción de ruido algoritmo de extracción de información destinadas a los patrones que caracterizan la iteración actual de la formación.

6) Preparado datos se obtienen a las entradas de la red neuronal. El GKM coordenadas de un punto seleccionado se buscan a las salidas, por lo tanto, la formación de redes neuronales para asociar los patrones de activación cerebral específico con GKM coordenadas.

Human brain to Knowledge Representation System bridge interface

Cerebro humano a la representación del conocimiento del sistema de interfaz puente

Figura 3.1 El proceso de formación de los descodificadores

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This