Vers idéalistes Knowledge Representation System: Global Knowledge Map

Taras Filatov

Résumé

L'un des problèmes les plus importants qui empêchent les nouveaux développements dans les domaines de la représentation de connaissances et intelligence artificielle est un problème de sémantique ou de l'alignement de cartographie des connaissances. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Les progrès dans la solution sera très bénéfique pour les tâches de récupération de l'information, l'alignement d'ontologies, de la pertinence de calcul, compréhension de texte etc Dans le papier le concept multidimensionnel de la carte mondiale de la connaissance, élaboré par l'extraction des dépendances non surveillée de grands corpus de documents, est proposé . En outre, le problème direct de l'homme - Connaissance du système de représentation de l'interface est adressée et d'adaptation d'un concept de décodeur proposé aux fins d'interaction avec la précédemment décrite modèle unifié de la cartographie. La combinaison de ces deux approches sont proposées comme base pour un développement d'une nouvelle génération de systèmes de représentation des connaissances.

Mots-clés: représentation des connaissances, la cartographie des connaissances, interaction homme-machine, l'alignement d'ontologies, supérieur ontologie, de la pertinence de calcul, de recherche d'information, document de similarité

1. Introduction

Dans la société, le domaine de la représentation des connaissances est devenue plus importante ces dernières années [25]. Les gens ont toujours tenté d'étudier et de classer les connaissances sur la connaissance. On peut trouver des références dès Socrates au cinquième siècle avant Jésus-Christ [33] à l'épanouissement de la logique et d'épistémologie [28] dans le moyen-âge. Depuis le problème a été jugé important dans le passé, il est difficile de surestimer son sens au cours de l'ère de l'information.

Les technologies modernes ont doté l'humanité d'inondations excessive des données qui sont difficiles à systématiser et de processus. Pour une personne à devenir un spécialiste dans un certain domaine, il faut des années d'apprentissage et nécessite une nouvelle race d'information et restez au fait des dernières tendances professionnelles.

C'est une croyance populaire parmi les connaissances des ingénieurs et des spécialistes de l'extraction de données que les informations disponibles en libre accès est assez pour en extraire la vérité des faits sur pratiquement n'importe quel aspect de notre vie et même de prédire l'avenir. Le seul problème à résoudre est de traiter l'information intelligemment multitude de sources. [35].

Cette nouvelle génération de facteurs de la demande de systèmes de représentation des connaissances pour aider à systématiser l'humanité, l'accès et l'utilisation de ses connaissances collectives.

Au cours du papier, nous proposons des idées pour le développement d'un nouvel âge de connaissances du système de représentation (KRS).

Nous croyons que les réalisations récentes dans certains domaines des sciences et va bientôt aboutir à une formidable percée dans le champ d'application de la représentation des connaissances et l'interaction homme-ordinateur. Cela ouvrira de nouveaux horizons et d'accroître l'efficacité du travail de l'homme dans de nombreuses applications. La seule chose à faire est de mettre ces résultats en même temps.

Idéal KRS devrait fournir à un utilisateur avec un accès facile à toutes les connaissances de l'humanité. Ses éléments sont donc:

  • un homme qui veut accéder à certaines pièces de la connaissance, il / elle est intéressé par
  • stockage de données, et
  • l'intermédiaire du système à l'interface pour un humain d'avoir accès aux connaissances.

Les obstacles qui se posent ici sont causés par des limitations de capacités humaines et le niveau technologique actuel.

2. Stockage de données

2.1 État de l'art

Système de représentation des connaissances exige de stockage de données, sauf si elle est capable de récupérer les documents nécessaires auprès de sources extérieures en temps réel. On peut décrire deux approches gagnantes pour un idéal de KRS aujourd'hui: structurés gérés manuellement connaissance globale de stockage tels que les ontologies et les systèmes d'indexation automatique et la récupération des plus complet et accessible de collecte des documents bruts (World Wide Web), tels que les moteurs de recherche. Le problème de la première approche est dans son manuel de la nature - à toute tentative de créer et de maintenir la base de connaissances de l'homme donnera lieu à un compromis entre le détail, l'actualité et la convivialité. ], UFO (Unified Framework Ontology) Nonobstant il existe de multiples succès supérieur ontologie des projets tels que Cyc [23], WordNet [12], DNS, etc SUMO et des débats théoriques en cours aussi longtemps que des recherches visant à élaborer un standard mondial unifié ontologie sous les noms de SUO (Standard Upper Ontology ) [27], UFO (Unified Framework Ontologies) etc

La deuxième approche est devenue historiquement répandu à cause de WWW est le plus important, complète et mise à jour du corpus de données disponibles pour le traitement automatisé de nos jours. Toutefois, contrairement à la première approche, les problèmes de recherche d'information automatisés jouent un rôle important ici. Les problèmes de compréhension de texte et de traitement du langage naturel sont l'une des plus difficiles à Amnesty International et néanmoins rester sans solution efficace. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Adjacent sont les problèmes de la classification et de calcul de pertinence, que l'on appelle «Web clustering" problème [1]. La deuxième approche (indexation automatique) est donc majeur dans le manque de précision de la recherche.

Il ya des efforts en cours portant sur des améliorations à ces approches afin de surmonter ces problèmes. Par exemple, avec l'ontologie de base unifiée projets (SUO, Bulo), certaines tentatives de mise au point d'alignement d'ontologie et de l'ontologie des techniques de cartographie afin de rendre inexistante ontologies avec eux et avec d'autres types de bases de connaissances [5, 17]. Il est souvent proposé de réduire les lacunes du manuel de l'administration en cas d'ontologies par le biais de systèmes automatisés de recherche d'informations (moteur de recherche de technologies). De l'autre côté, l'amélioration des normes de l'hypertexte sont en cours d'élaboration afin de rendre possible de spécifier manuellement des informations pour aider les moteurs de recherche commonsense comprendre le sens de documents sur le Web et les liens hypertextes entre eux [24]. Il est nécessaire de comprendre que ces solutions hybrides effectuer les lacunes des techniques correspondantes ainsi que des avantages.

Une lacune unit ces approches et rend impossible leur intégration: il n'ya pas de standard de la cartographie et l'établissement de relations entre les documents et les concepts dans des systèmes différents. Le problème serait résolu dans le cas où l'un des systèmes fixes mathématiquement interprétable comme la hiérarchie des ontologies de surmonter l'approche actuelle (WWW). Mais cela semble peu probable à cause de ces raisons. Intermédiaire indépendant norme est une solution potentielle à ce problème. Il ya de multiples initiatives de la direction d'établir des liens de réciprocité et de la cartographie des bases de connaissances des différents types parmi lesquels il ya une ontologie de domaine de la cartographie. Les initiatives communes ont un défaut: pas de norme unique de la cartographie et l'établissement de relations entre les documents. La suite, aucun d'entre eux est susceptible de devenir une norme largement reconnue, sauf si une solution plus durable est développée.

2.2 Le concept d'un Plan Global Knowledge (GKM)

Nous croyons qu'il est possible d'élaborer une norme unique pour la cartographie des connaissances par la réalisation d'un espace logique avec l'objectif de projection de la connaissance des concepts du monde réel. Ces modèles (nous l'appelons Global Knowledge Map) devrait refléter le niveau de similitude de documents et de concepts mappé sur elle.

Principal objectif du modèle est:

  • L'alignement et les contre-la cartographie des documents et des concepts (WWW, ontologies, e-bibliothèques, répertoires, etc)
  • La recherche d'information sur la navigation
  • Précise le calcul automatisé des commonsense pertinence

GKM nécessite donc une mathématique / modèle logique de la connaissance de stockage avec une condition: être optimal pour la tâche de représentation des connaissances c'est-à-dire l'interaction avec l'homme. Pour la réalisation de cette condition, le modèle doit tenir compte, dans ses dimensions ou dans sa structure, la structure de la connaissance humaine.

Les conditions sont donc les suivants:

  • Dimensionality et de la cartographie.

Le principal facteur de la dimension est le sens (ou d'un sujet).

  1. Chaque concept de la connaissance humaine mai être mappé sur un point avec un système de coordonnées dans l'espace.
  2. Chaque document ou texte mai être mappé sur un certain nombre de points (document est divisé en mèmes - significatif de pièces) ou un point.
  • Pertinence calcul.
  1. Il est possible de calculer mathématiquement la pertinence entre les deux concepts par le calcul de la distance entre leurs points de projection dans l'espace.
  2. Il est donc possible de calculer la «similitude» entre les documents et les concepts par le calcul de la distance entre leurs mappages.
  • L'homogénéité de l'espace.
  1. L'espace est uniforme (homogène) et continue
  2. Coordonnées de refléter le sens et les distances entre les points de refléter la différence de sens de sorte que si le point C est situé entre A et B, cela signifie concept C est liée à la fois A et B également.
  3. Il est possible de "naviguer" de l'espace de trouver les sources de connaissances associées à la voisines.

Construction d'un modèle mathématique de cet espace permet le développement de Global Knowledge Map. Il ne vaut pas la peine d'essayer d'élaborer un tel modèle (GKM) de façon manuelle en raison de raisons précitées de l'information et de la croissance des changements dans la compréhension du monde. Nous croyons qu'il est possible d'extraire les dépendances et les règles de la disposition corpus de textes et de les utiliser comme des processeurs de nos cartographie.

La pierre angulaire de nos hypothèses est qu'il est généralement possible de la carte des connaissances humaines sur les sujets même espace et les distances à l'intérieur de la dimension de celle-ci reflète un niveau de similitude entre des sujets. Cette hypothèse est fondée sur Johnson-Lindenstrauss Lemma que d'un ensemble de n points dans des dimensions d'espace euclidien peut être mappé à un espace euclidien N dimensions

(2,1)

tels que la distance entre deux points de changements que par un facteur (1 ) [7]. Le Vector Space Model couramment utilisés dans la recherche d'informations en texte et de catégorisation de documents représente le plus haut dimensions vecteurs [31]. Ces vecteurs contiennent certain niveau (en fonction de la fonction d'un indicateur choisi) de l'information qui est suffisante pour classer l'objet du document original.

Le théorème de Tychonoff [26] indique que les points représentant les propriétés des objets d'une classe, doit être situé plus près les uns des autres dans la propriété d'espace que pour les points représentant les propriétés des objets d'autres classes. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. Dans notre équipe, cela signifie l'original espace vectoriel de n textes mai sera projeté sur fixe N dimensions et en utilisant un algorithme de compression de données / dimension en raison de la réduction de la compacité theorem [22], la cartographie sera réalisée lorsque les distances entre les représentent des points de la pertinence des documents correspondants.

Les facteurs qui affectent la précision de la cartographie:

  • représentativité de la métrique et la fonction de la taille de la fonction de l'espace
  • taille, la dispersion et la qualité des documents corpus

Pourvu que la théorie est applicable dans les conditions actuelles, il reste à trouver des techniques qui sont utilisées pour élaborer la cartographie. Nous proposons de mettre l'accent sur des moyens automatiques en raison de nombreuses complications de manuel expert de cartographie sur le inapplicable.

2,3 GKM génération automatique sans surveillance par le biais de l'extraction (hypothèse)

Afin d'être utile GKM devrait contenir les mappages de nombre réel de mot (WWW) et de documents, dans sa structure, représente la commune de la compréhension humaine du monde. Il ne vaut pas la peine donc de tout manuel de moyens de création de GKM et le remplir avec le document mappings. Les principes d'extraction de données devrait être utilisé pour extraire des dépendances représentant les connaissances de l'existant corpus de documents disponibles pour le traitement informatique et de filtrer les données inutiles.

Il ya eu de nombreuses tentatives pour unsupervised extraction des dépendances dans les textes mais il est encore douteux question de savoir si une technique est capable de fournir durablement l'extraction de connaissances à travers l'analyse de grands documents collection [10, 11, 21, 30].

Let's divisent généralement les facteurs qui influent sur le contenu des documents en trois catégories:

  1. Auteurs de facteurs personnels (les sentiments et les motivations pour créer le texte, physique et morale au cours de la pensée et l'écriture)
  2. Langue (les règles, etc de la langue utilisée pour écrire le document)
  3. Connaissances (certaines parties de la connaissance humaine auteur transmet directement ou implicitement, par le biais du document)

Let's suppose qu'il est possible de traiter tous les documents texte de l'extrait de tous les auteurs et les règles de la dépendance. Dans ce cas, l'influence du facteur 1 sera minime. L'influence du facteur 2 n'est pas d'une grande importance pour les raisons suivantes:

a) documents dans plusieurs langues peut être indexé, donc la réduction de l'influence réciproque

b) la langue elle-même reflète la connaissance humaine [18], donc dans une certaine mesure, le facteur 2 est un sous-facteur de 3 et même de l'extraction de leur mélange constitue une réalisation satisfaisante

Il est théoriquement possible d'extraire puis d'infos correspondant à la plupart des connaissances humaines exposées à travers les documents disponibles. Cette info transformé à la cartographie de l'espace hypothèse nous fournir GKM durable.

2.4 Mise en oeuvre (expérience)

En l'espace construit chaque document doit être mappé à un seul coordonner. La «navigation» de l'espace ou des distances de comparaison fait apparaître que la situation des documents ou de leurs groupements de refléter leur importance et qu'il est possible d'attribuer des noms à certains sujets spécifiques coordonnées dans l'espace.

Nos expériences de l'utilisation de 2 et 3 dimensions Kohonen SOM avec une collection de documents révèlent que les distances entre les projections de documents ne sont pas stables dans l'ensemble de la série de lancements. Cela, à notre avis, est la preuve du fait que la dimension de la carte est suffisamment conforme à Johnson-Lindenstrauss Lemma mentionnés ci-dessus.

Malheureusement, il est impossible de mener à bien l'expérience avec une bonne dimension. Par exemple, selon Johnson-Lindenstrauss Lemma, à la carte 20000 documents permettant 10% d'erreur, il faudra 58 dimensions. Cela nécessite des calculs qui sont au-dessus des ordinateurs modernes des capacités.

La chose importante à mentionner ici est que, alors que le lemme donne une dimension maximale de la cartographie de l'espace permettant de satisfaire à la condition unique de projection, il n'est pas nécessaire, la valeur minimale efficace. Lemma donne une valeur d'un ensemble de n points, soit pour le pire des cas, ce qui n'est pas susceptible d'apparaître dans la pratique. Les méthodes de détection de la dimension doit être utilisé pour calculer l'efficacité de la dimensionnalité des données et donc de déterminer le nombre de dimensions pour la cartographie de l'ensemble de données particulier. Il existe des techniques connues pour ce qui viennent de l'arrière-plan de reconstruction de surface. Une des dernières est l'oeuvre de S. Cheng, Y. Wang et Wu Z. [4] où la dimension méthode de détection par analyse en composantes principales [8] est présenté. Ainsi, la dimension intrinsèque des données mai être extrait. Comme dans la pratique, cette valeur est inférieure à la dimension maximale nécessaire pour la projection de le même nombre de documents dans le pire des cas théorique, ce qui donne une réduction de temps de calcul. Sinon pour les mêmes fins, nous pouvons examiner les méthodes fondées sur des évaluations itératives. L'objectif de réduction de la dimensionnalité dans notre cas est d'établir une véritable cartographie commonsense où la similitude entre les sources d'information se traduit par la distance euclidienne entre les points de projection. Prenant toute la dimension technique de réduction basé sur une sélection aléatoire de l'entrée de données (telles que l'analyse en composantes principales cartes auto organisation, Sammon reconstruction ou la triangulation), dans le cas où la production est inférieure à la dimension appropriée, les projections seront instables et à chaque calcul la cartographie sera différent et les distances entre les projections ne préservera pas. Nous pouvons également supposer que, lorsque l'efficacité de la dimension de la tubulure d'entrée est utilisé pour la cartographie, les distances à préserver un certain degré de liberté en fonction de la dimension de réduction de méthode utilisée. Une autre solution est donc une sélection aléatoire dimension technique de réduction progressive combinée à la dimension parallèle d'évaluation de la cartographie. 32]. Prenons, par exemple, la technique de plus en plus SOMS indiqué dans [19, 32]. Destiné à réduire les temps de calcul, le nombre de noeuds est fortement augmenté avec de nouveaux nœuds étant répartie uniformément entre les anciens et de leurs vecteurs poids mis sur les moyens des pays voisins d'origine poids vecteurs. Même technique appliquée à la dimension (D) donne la possibilité d'évaluer chaque D, étape par étape. Les critères d'évaluation sera la stabilisation des distances entre les projections. À cet effet, deux ou plusieurs cartes d'auto organisation de mai se dérouler en parallèle avec pairwise distances entre certaines projections sont comparés à chaque itération. En vertu de l'itération, nous comprenons le stade où la dimension de la firme SOM a été augmenté et le réseau a donc été stabilisée avec de nouveaux paramètres.

Résumant les précités, nous proposons le modèle suivant pour l'évaluation expérimentale de la meilleure approche pour l'établissement de la Carte mondiale de connaissances de la collection de documents texte.

Le datase t: vecteur de modèle à utiliser (pour chaque document comme vecteur représentés avec des caractéristiques comme les dimensions et les caractéristiques rangs que les coordonnées correspondantes dans les dimensions).

Long fonction de sélection: les plus efficaces pour être définie.

Vecteur de taille: être établies empiriquement.

Le traitement de données et le stockage.

Une réduction de la dimension technique doit être utilisée pour la cartographie. Il ya deux approches possibles:

a) de pré-calculer la dimension intrinsèque et d'évaluer les différentes méthodes de réduction des dimensions avec une dimension connue de la cartographie;

b) «démarche d'évaluation progressive dimensionality 'avec quelques mappings être exécutés en parallèle - avec seulement les méthodes de sélection aléatoire des données mai être utilisés.

Entrées: documents des caractéristique de vecteurs.

Sorties: GKM coordonnées.

Evaluation:

1) Commonsense d'évaluation de la correspondance entre la formation initiale des documents et des distances euclidiennes de cartographie de leurs projections.

2) la stabilisation de ces pairwise distances entre les projections de différentes lance dans le cas où la technique de sélection aléatoire est utilisé.

3. Interface

3,1 Idéal interface de représentation des connaissances

L'interface de la connaissance du système de représentation est important quand le système idéal est discutée. Les deux tâches de réception des demandes des utilisateurs et la transmission de connaissances qui leur sont d'égale importance avec la mission de structuration et de stockage de données. Au cours du papier, nous discutons de la manière de connaissances vers les systèmes de représentation d'une nouvelle génération et, par conséquent, la question de l'interaction est supervisée afin d'établir s'il est possible de fournir une interface idéaliste par le biais d'une technologie moderne.

Les interfaces qui sont utilisées pour favoriser l'interaction de l'utilisateur avec les connaissances modernes de représentation et de systèmes de recherche d'information sont essentiellement des «indexation» de type, c'est-à-dire les utilisateurs doivent savoir exactement ce qu'ils recherchent, et ils doivent également préciser linguistique. Un exemple de cette interface est un moteur de recherche. Comme nous l'avons mentionné ci-dessus, le moteur de recherche et le corpus de documents WWW est la plus complète et mise à jour du système de représentation des connaissances disponibles aujourd'hui, ce qui est la raison de leur popularité. Dans le même temps, on sait que la «indexation interface n'est pas naturelle à utiliser pour les humains, mais elle est la seule alternative de« navigation »sont mis en place des approches très mal [16]. La raison en est que le problème de la cartographie des connaissances et d'alignement qui ne permettent pas une classification automatique et la représentation des documents en fonction de leurs sujets. Toutefois, le problème de la cartographie de l'espace unique de connaissances en voie de résolution, de nouvelles possibilités apparaissent pour la construction de l'amélioration, plus des interfaces naturelles de navigation de type.

3.2 Haut-dimensionnalité et de visualisation

Après avoir mentionné que la cartographie de l'espace global résultant est susceptible d'être n dimensions, où n est élevée, il est nécessaire de résoudre le problème de la représentation visuelle. Il est possible pour l'homme d'imaginer un espace 3D, par conséquent, la meilleure façon de nD-> représentation en 3D sont à évaluer. Dimensionality techniques de réduction ou de la représentation multiple approche via l'interface peut être utilisée.

Il est important que, avec l'aide de la cartographie de l'espace unique de connaissance de l'erreur est réduit au minimum lors du calcul de pertinence entre les documents, et, en outre, la recherche de documents pertinents, même provenant d'autres systèmes devient une tâche triviale. Pour l'utilisateur final, cela signifie une fois que le système a trouvé le sujet, il est intéressé, il ne conduira jamais à l'utilisateur des documents non pertinents.

3.3 Demande d'information chaîne

Lorsque les tâches de sujets de cartographie et de localisation, de calcul et de la pertinence des connaissances de navigation spatiale sont résolus la tâche la plus importante qui reste à résoudre est le problème d'une première demande. Dans l'état de l'information de pointe des systèmes de recherche les processus suivants sont habituellement lorsque l'information est demandée:

De l'homme: 1) Imagination -> 2) la formation linguistique des constructions -> 3) manuel de la saisie au clavier (voix d'entrée) -> Machine part: 4) décodage linguistique -> 5) correspondant et l'emplacement -> 6) correspondant à la visualisation de documents

La chaîne est longue et il est évident que la perte de données et de la corruption est importante en raison de la double linguistique de codage et de décodage. Tout d'abord, l'utilisateur doit formuler cognitif en images linguistique de courte phrase. Deuxièmement, le système a de la peine de le décoder afin de comprendre l'objet de l'intérêt de l'utilisateur. La description de la chaîne de la demande initiale causes d'insatisfaction des utilisateurs de moteurs de recherche modernes en raison de l'incapacité du système à «comprendre» la demande résultant de la perte de temps énorme de l'utilisateur final. Le degré de récupération de ces erreurs et les inconvénients causés par la limitation de l'interface est importante et grandement réduire les effets de la recherche plus précise et la localisation des documents présentés par l'unité de cartographie.

Il est donc nécessaire d'envisager, au moins théoriquement, la possibilité de création d'un idéal à chaîne courte de l'homme <-> Représentation des connaissances du système d'interaction avec les unités causant la perte de données en cours d'élimination:

De l'homme: 1) Imagination -> [demande d'être adopté via humaine directe cerveau-GKM coordonnées convertisseur] -> 2) correspondant et l'emplacement -> 3) correspondant à la visualisation de documents

Nous avons aperçu les dernières réalisations dans le domaine de Brain Computer Interfaces (BCI) à cette fin.

3.4 Brain-Computer Interfaces

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. La recherche sur la BCI est en cours depuis plus de 30 ans et le secteur est encore très jeune et se développe rapidement. Jusqu'à un moment récent m ost des avancées significatives dans le domaine ont été faites en jambe artificielle c'est-à-dire le contrôle des véhicules fonctions du cerveau [ 3] et de l'interprétation et le traitement de signaux visuels. Ces réalisations ont été vérifiées au cours de plusieurs expériences impliquant des animaux et des sujets humains. Les chercheurs rapportent la réussite de l'intégration de dispositifs mécaniques ou électroniques lorsque les animaux ou les humains apprennent à contrôler l'appareil à l'aide de leur cerveau, d'autres rapport de transfert et le décodage des signaux visuels [15, 20].

Brain-computer interfaces études sont étroitement liées au domaine de la neuro-imagerie fonctionnelle, où différentes technologies ont été développées pour enregistrer efficacement les états de la personne du cerveau par l'intermédiaire de certaines caractéristiques physiques. Les plus productives du point de vue de la BCI est une récente technique d'imagerie cérébrale fonctionnelle imagerie par résonance magnétique ) (IRMf) [6, 13]. Cette technique permet d'enregistrer la dynamique de l'écoulement du sang dans les différentes régions du cerveau au cours du temps et avec une grande précision. Cela permet par conséquent d'établir des connexions entre les modes d'activation des différentes régions du cerveau et de certaines activités et les processus cognitifs de l'homme. Il est important que cette technique, contrairement à de nombreuses variantes, est non-invasive et ne comporte pas d'injections. Il est à noter toutefois que le matériel de nos jours, l'IRMf est encore très coûteux et cumbrous.

Il est significatif que les expériences montrent que le cerveau s'adapte aux nouvelles conditions. Par exemple, lorsque les impulsions de l'automobile ont été utilisés pour contrôler un mécanicien de manipulateur ou d'un ordinateur le curseur de la souris, le cerveau a été en mesure de différencier et progressivement apprendre à contrôler séparément de manipulateur jambe artificielle. Lebedev mentionne l'incidence de la «plasticité cérébrale» qui peut permettre d'intégrer des dispositifs artificiels dans le corps de représentation. [20]

Dernières publications dans le domaine de la neuro-imagerie encore plus de discuter la possibilité de détecter les états cognitifs [15]. Elle stipule que la concentration de notre attention sur la possibilité d'application de la BCI en interaction homme-KRS.

Il est connu que les différents états cognitifs liés à certains objets du monde réel correspondant à certains modèles d'activation du cerveau. Le décodage de ces modèles permet de comprendre ce qui se superposent stimuli orientés vers une personne est actuellement assistant (où leur attention est dirigée) ou en cas de visualisation d'objets à identifier la classe d'objets la personne est d'imagerie (c'est-à-dire les visages, les bâtiments, le mobilier), et même les objets couleur et l'orientation. [15] Ces processus sont complexes et loin d'être entendu pour le moment. D'autres études révèlent comment est faible afin d'ordre supérieur et de signaux cérébraux en corrélation avec certaines fonctions cognitives, la façon dont les caractéristiques spatiales des modèles changent au fil du temps et sous diverses influences; dans quelle mesure il est possible d'extrapoler à l'activation des modes de diverses disciplines; etc On estime cependant que la connaissance précise des «calculs» effectués dans le cerveau humain n'est pas cruciale pour la construction des BCIS. [20] Les techniques d'extraction de données mai être appliquée à extraire des informations utiles à partir de différents capteurs neuro-imagerie et d'établir des connexions avec certains états cognitifs.

Il existe cependant des questions importantes qui peuvent affecter sérieusement le succès de l'appareil de BCI dans le domaine de la représentation des connaissances. Deux problèmes mineurs sont généralisation dans le temps et le problème des différentes instances d'un même état d'esprit. Il est connu que les modes d'activation du cerveau de la même des états mentaux mai changer au fil du temps. Différentes instances d'un même état mental mai donner des images, ainsi modifié, en fonction des variations contextuelles et d'autres facteurs. [15] Cela nécessite flexibilité spatiale et classification des algorithmes de ré-échantillonnage à utiliser comme suggéré par Haynes et Rees. Nous pensons que ces problèmes seront résolus sur le développement de techniques efficaces.

Plus discutable est le problème de l'extrapolation à de nouveaux états cognitifs. Haynes et Rees que le nombre de perceptuelles ou cognitives états est infini, alors que le nombre de catégories de la formation est nécessairement limité. [15] Il est essentiel donc que le décodeur peut être formé pour généraliser l'expérience acquise de la petite formation mis complètement à de nouvelles catégories. Il serait possible par le moyen d'une extrapolation, si les modes d'activation du cerveau sont en fait disposées dans certains systématique paramétrique espace. Cela reste à être trouvé, cependant, on estime qu'il est possible au moins pour certains types de contenu mentale [15]. Dans le cas où la forme abstraite d'espace pour le classement des modèles de neurones, il existe en effet nous permettrait de théoriser sur les possibilités de cartographie des états cognitifs du cerveau humain sur Global Knowledge Map décrit précédemment dans le présent document. À condition que cela se réalise, ces «problème de la demande initiale" sera résolu et «l'idéal de l'homme <-> KRS" la chaîne sera possible de mettre en place.

Learnable Decoder 3.5

Comme il est maintenant connu grâce aux dernières réalisations de l'imagerie du cerveau qu'il est possible de distinguer de l'activation de différentes régions du cerveau lorsque la personne est la réflexion sur les différents sujets que nous mai présume qu'il est possible de créer un décodeur learnable à la carte cognitive de l'homme engagé États des connaissances sur la carte d'un système de représentation de connaissances. C'est un moyen idéal de l'interaction homme-ordinateur peut être mis en place permettant une grande vitesse et la précision de la communication avec un système. Il y aura moins de perte de données due à l'élimination de la phase de l'interaction linguistique. La rapidité et l'efficacité de l'interaction augmentera en conséquence. Ces deux facteurs permettent aux personnes de diverses professions afin d'accroître l'efficacité de leur travail de manière significative. De [6, 15], nous savons qu'il ya certaines régularités de l'emplacement des impulsions du cerveau et les sujets de connaissances qui sont communes à tous les humains, on peut appeler ces fonctions d'origine anthropique. Toutefois, il est connu que la majorité de ces liens doivent être individualiste. Par conséquent, le décodeur doit être individuellement adaptées.

Il est également évident que l'efficacité du décodeur dépendra des individus et de leur formation avec lui et de sa capacité à apprendre. Nous pouvons présumer de ce artificielle, les expériences des interfaces utilisées pour remplacer les membres. Les humains et les animaux ont été en mesure de concentrer mentalement, en particulier, pour déplacer un manipulateur artificielle et même apprendre à maîtriser le réel et la branche artificielle séparément [20].

Compte tenu de la précitée, nous pensons qu'un réseau de neurones artificiels - mécanisme est la meilleure solution d'un problème de décodeur.

Decoder le processus d'apprentissage

1) Le point de coordonnées dans l'aléatoire espace multidimensionnel de GKM est sélectionné.

2) Plusieurs documents ayant leur mappages dans la région voisine (métrique euclidienne est utilisée) sont sélectionnés et affichés à un opérateur humain.

3) Opérateur concentre son esprit pour participer à la cognitivement sujet donné et les objets en mémoire.

4) La neuro-imagerie des données sont recueillies par IRMf matériel sur une période de temps spécifique.

5) Les données sont traitées par un ré-échantillonnage spatial et de l'algorithme de réduction du bruit en vue d'extraire des informations caractérisant les modes de formation en cours d'itération.

6) Préparé de données sont récupérées sur les entrées du réseau de neurones. GKM Les coordonnées d'un point sélectionné sont récupérées à la sortie donc la formation de réseaux de neurones spécifiques du cerveau associé à l'activation de modes de GKM coordonnées.

Human brain to Knowledge Representation System bridge interface

Cerveau humain à la connaissance du système de représentation de pont interface

Figure 3.1 Le processus de formation du décodeur

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This