Mod idealistisk Knowledge Repræsentation System: Global Knowledge Map

Taras FILATOV

Abstract

Et af de væsentligste problemer, som hæmmer den videre udvikling i de områder af Knowledge Repræsentation og kunstig intelligens er et problem af semantisk tilpasningen eller viden mapping. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. De fremskridt i sin løsning vil være en stor fordel for de opgaver informationsfremfinding, ontologi tilpasningen relevant beregning, tekst forståelse osv. I papiret begrebet multidimensionel globale viden kort, udarbejdet gennem ukontrolleret udvinding af afhængigheder fra store dokumenter corpus, foreslås . Desuden er problemet med direkte Human - Viden Repræsentation System Interface er rettet og en opfattelse af adaptive dekoder foreslået med henblik på samspil med tidligere beskrevet samlet kortlægning model. I kombination af disse to tilgange er foreslået som grundlag for en udvikling af en ny generation af viden repræsentation systemer.

Nøgleord: viden, repræsentation, viden kortlægning, menneskelige computer interaktion, ontologi tilpasning, øvre ontologi, relevans beregning, informationsfremfinding, dokument lighed

1. Indledning

I samfundet, inden for viden repræsentation blev større i løbet af de sidste år [25]. Mennesker altid gjort forsøg på at studere og klassificere viden om viden. Vi kan finde referencer fra så tidligt som Socrates i femte århundrede f.Kr. [33] for den fremvoksende logik og epistemologi [28] i middelalderen. Da problemet blev anset for at være vigtigt i fortiden, det er svært at overvurdere sin betydning i den æra af oplysninger.

Moderne teknologi har udstyret mennesket med uforholdsmæssigt store oversvømmelser af data, som er vanskelige at systematisere og proces. For en person til at blive en specialist i et bestemt område, det tager år at lære og kræver en efterfølgende informational kapløbet om at holde sig ajour med den nyeste faglige tendenser.

Det er en populær tro blandt viden ingeniører og data mining-specialister, at oplysninger, der findes i åben adgang er nok til at udtrække sandfærdige fakta om stort set alle aspekter af vores liv og endda forudsige fremtiden. Det eneste problem at løse, er at intelligent behandle information fra mange kilder. [35].

Dette forhold kræver en ny generation af viden repræsentation systemer til at hjælpe menneskeheden systematisere, få adgang til og bruge sin kollektive viden.

Under de nuværende papir vi foreslå ideer til udvikling af en ny tidsalder Knowledge Repræsentation System (KRS).

Vi mener, at de seneste resultater inden for visse områder og videnskaber vil snart føre til et enormt gennembrud i omfanget af menneskelige viden repræsentation og human-computer interaction. Dette vil åbne nye horisonter og øge effektiviteten af menneskers arbejde i mange applikationer. Den eneste ting, der skal gøres er at bringe disse resultater sammen.

Ideal KRS bør yde en bruger med en praktisk adgang til al viden om mennesket. Dens elementer er derfor:

  • et menneske, der ønsker at få adgang til visse dele af viden, han / hun er interesseret i,
  • en data-lagring, og
  • mellembetalingsformidleren system til at levere interface til et menneske for at få adgang til viden.

De hindringer, der opstår her, er forårsaget af begrænsninger af menneskelige evner og nuværende teknologiske niveau.

2. Datalagring

2.1 state of the art

Knowledge repræsentation system kræver datalagringsmedie, medmindre det er i stand til at hente de nødvendige dokumenter fra eksterne kilder i realtid. Vi kan skitsere to vindende tilgange til et ideelt KRS af i dag: struktureret manuelt styret globale viden oplagringer såsom ontologier og systemer involverer automatisk indeksering og søgning af de mest fuldstændige og tilgængelige rå dokumenter indsamling (World Wide Web) såsom søgemaskiner. Problemet med den første fremgangsmåde er i sin manual karakter - alle forsøg på at skabe og opretholde den globale menneskelige videngrundlag vil resultere i et kompromis mellem detaljer, virkelighed og usability. ], UFO (Unified Framework Ontology) Uanset der er flere vellykkede øverste ontologi projekter såsom Cyc [23], WordNet [12], DNS, SUMO etc og løbende teoretiske diskussioner, så længe forskning med henblik på at udarbejde en standardiseret forenet global ontologi under navnene på SUO (Standard Øvre ontologi ) [27], UFO (Unified Framework ontologi) osv.

Den anden fremgangsmåde blev historisk fremherskende på grund af WWW er det største, omfattende og up-to-date corpus af tilgængelige data for automatiseret behandling i dag. Men i modsætning til første fremgangsmåde, problemer af automatiserede informationsfremfinding spille en væsentlig rolle her. Problemerne med tekst forståelse og naturligt sprog behandling er en af de mest udfordrende i AI og alligevel stadig uden effektiv løsning. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Tilstødende er problemerne med klassifikation og relevans beregning, de såkaldte »web klyngedannelse 'problem [1]. Den anden fremgangsmåde (automatiske indeksering) derfor har store mangler i nøjagtigheden af hentning.

Der er igangværende bestræbelser på at bringe forbedringer til ovennævnte tiltag med henblik på at overvinde disse problemer. For eksempel, sammen med ensartet grundlag ontologi projekter (SUO, BULO) der er visse forsøg på at udvikle ontologi tilpasning og ontologi kortlægning teknikker med henblik på at bringe eksisterende ontologier sammen med hinanden og med andre former for videnbaser [5, 17]. Det er ofte foreslået at falde manglerne ved manuel administration i tilfælde af ontologier ved hjælp af automatiserede informationsfremfinding (søgemaskine-teknologier). Fra den anden side, forbedret hypertekst standarder bliver udviklet med henblik på at gøre det muligt manuelt at angive oplysninger for at hjælpe søgemaskinerne forstå commonsense betydningen af WWW dokumenter og hyperlinks mellem dem [24]. Det er nødvendigt at forstå, at disse hybride løsninger bære mangler tilsvarende teknikker sammen med fordele.

En mangel forener disse tilgange og gør umuligt deres integration: Der er ingen standard for kortlægning og etablere forbindelser mellem dokumenter og begreber i de forskellige systemer. Problemet vil blive løst, hvis et af de systemer med faste matematisk interpretable hierarki såsom ontologier svinder den eksisterende tilgang (WWW). Men dette synes usandsynligt på grund af ovennævnte årsager. Uafhængig mellemmand standard er en mulig løsning på dette problem. Der er flere initiativer på vej med at sammenkæde og gensidige kortlægning af videnbaser af forskellige typer blandt hvilke der er et område med ontologi mapping. Initiativerne har en fælles mangel: ingen fælles standard for kortlægning og etablere forbindelser mellem dokumenter. Efterfølgende, ingen af dem vil sandsynligvis blive en alment anerkendt standard, medmindre en mere bæredygtig løsning er udviklet.

2.2 Begrebet en Global Knowledge Map (GKM)

Vi mener, det er muligt at udarbejde en fælles standard for viden kortlægning ved at opbygge en logisk plads med det formål at projicere virkelige verden viden begreber. En sådan model (lad os kalde det Global Knowledge Map) bør afspejle graden af lighed af dokumenter og begreber kortlægges på det.

Hovedformålet med modellen er:

  • Tilpasning og tværs-kortlægning af dokumenter og begreber (WWW, ontologier, e-biblioteker, biblioteker osv.)
  • Hente oplysninger via browsing
  • Præcis automatisk beregning af commonsense relevant

GKM kræver derfor en matematisk / logiske model af viden oplagring med en udtrykkelig betingelse: at være optimal for opgaven viden repræsentation dvs samspil med menneskets. For at opfylde denne betingelse modellen skal afspejle i sin karakter eller i dets struktur strukturen af den menneskelige viden.

Kravene er derfor:

  • Dimensioner og kortlægning.

Den vigtigste faktor for dimensioner er meningen (eller et emne).

  1. Hver begreb af den menneskelige viden kan kortlægges på et punkt med et specifikt koordinater i systemet rummet.
  2. Hvert dokument eller tekst kan kortlægges på en række punkter (dokument er inddelt i memes - meningsfuld stykker) eller et enkelt punkt.
  • Relevans beregning.
  1. Det er muligt matematisk at beregne relevans mellem to begreber ved at beregne afstanden mellem deres tilsvarende fremskrivning punkter i rummet.
  2. Det er derfor muligt at beregne "lighed" mellem dokumenter og begreber ved at beregne afstanden mellem deres mappings.
  • Ensartethed i rummet.
  1. Den plads er ensartet (homogen) og kontinuerlig
  2. Koordinater afspejle betydningen og afstanden mellem de punkter afspejler forskellen i henhold så hvis punktet C ligger mellem A og B, så det betyder begrebet C er relateret til både A og B ens.
  3. Det er muligt at 'bladre' i rummet finde den viden kilder konverteres til nærliggende områder.

Opbygning af en matematisk model for det pågældende rum giver mulighed for udvikling af Global Knowledge Map. Det er ikke umagen værd at forsøge at udarbejde en sådan model (GKM) i en manual måde på grund af ovennævnte grunde af oplysninger vækst og stadige ændringer i menneskers forståelse af verden. Vi mener, det er muligt at udtrække afhængigheder og regler ud fra de tilgængelige corpuses af tekster og bruge disse som forarbejdningsvirksomhed for vores kortlægning formål.

Hjørnestenen i vores antagelser er, at det generelt er muligt at kortlægge forskellige menneskelige viden emner på en enkelt plads og afstande inden for de dimensioner af sidstnævnte afspejler et niveau af lighed mellem bestemt fag. Denne antagelse er baseret på Johnson-Lindenstrauss lemma, at et sæt af n punkter i høj dimensionale Euclidian rummet kan konverteres ned til en N dimensionale Euclidian rummet

(2,1)

sådan, at afstanden mellem to punkter ændringer kun med en faktor (1 ) [7]. Vektoren Space Model almindeligvis anvendes i informationssøgning og Tekst Inddeling repræsenterer dokumenter så høj dimensionale vektorer [31]. Disse vektorer indeholder bestemt niveau (afhængig af en parameter funktionen er valgt) for oplysninger, som er nok til at klassificere omfattet af det oprindelige dokument.

Den Tychonoff's teorem [26] hedder det, at punkter, der repræsenterer egenskaber for objekter af en klasse, skal være placeret tættere på hinanden i ejendommen plads end til punkt repræsenterer egenskaber for objekter af andre klasser. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. I vores opgave betyder det, at den oprindelige vektor rum for n Teksterne kan forventes på faste N-dimensionale rum og med en passende algoritme for datakomprimering / dimensioner reduktion på grund af teorem af kompakthed [22] kortlægning vil være opfyldt, hvis afstanden mellem punkter repræsenterer relevansen af de relevante dokumenter.

Faktorer, der påvirker præcision af den kortlægning:

  • repræsentative for de metriske funktion og omfanget af funktionen rummet
  • størrelse, dispersitet og kvaliteten af de dokumenter, corpus

Forudsat at den teori er relevant i den nuværende situation er det stadig at finde hvilke teknikker der skal anvendes til at udarbejde mapping. Vi foreslår at fokusere på elektronisk skyldes mange komplikationer gøre manuel ekspert-baseret kortlægning uanvendelig.

2.3 Automatisk GKM generation gennem opsyn udvinding (hypotese)

For at være nyttigt GKM bør indeholde mappings af betydeligt antal reelle ord (WWW) dokumenter og i sin struktur repræsenterer den fælles menneskelig forståelse af verden. Det er ikke umagen værd derfor til at overveje alle manuelle metoder til skabelse af GKM og påfyldning det dokument mappings. De data mining principper bør anvendes til at udvinde afhængigheder repræsenterer viden fra de eksisterende korpus af dokumenter til rådighed for edb-behandling og bortfiltrere unødvendige data.

Der har været adskillige forsøg for opsyn udvinding af afhængigheder i tekster, men det er stadig et tvivlsomt spørgsmål, om en bestemt teknik er i stand til at levere en bæredygtig viden udvinding gennem analyse af store dokumenter indsamling [10, 11, 21, 30].

Lad os opdele de faktorer, der generelt påvirke indholdet af de dokumenter i tre kategorier:

  1. Forfattere personlige faktorer (følelser og motiver til at skabe den tekst, fysiske og moralske stater under tænkning og skriftligt)
  2. Language (reglerne etc af det sprog, der bruges til at skrive dokumentet)
  3. Viden (visse dele af den menneskelige viden forfatter transmitterer direkte eller indirekte gennem dokumentet)

Lad os antage, at det er muligt at behandle alle tilgængelige tekstdokumenter af menneskelige forfattere og uddrag alle afhængighed regler. I dette tilfælde indflydelse af faktor 1 vil være minimal. Indflydelse af faktor 2 er ikke af stor betydning på grund af følgende:

a) dokumenter på flere sprog kan være indekseret, derfor gensidigt at reducere den indflydelse

b) selve sproget afspejler menneskelige viden [18], og så til en vis grad den faktor 2 er en subfactor af 3. og endog udvinding af deres blanding udgør en tilfredsstillende præstation

Det er teoretisk muligt derefter at udvinde info meste svarer til den menneskelige viden eksponeret gennem de tilgængelige dokumenter. Denne info transformeret til kortlægning rummet hypotetisk give os en bæredygtig GKM.

2.4 Gennemførelsesmetode (eksperiment)

I rummet er bygget hvert dokument bør konverteres til enkelt koordinat. De "browsing" i rummet eller afstande sammenligning vil vise, at situationen for dokumenter eller deres klynger afspejler deres relevans, og at det er muligt at tildele visse emne navne på specifikke koordinater i rummet.

Vores eksperimenter for at bruge 2 og 3 dimensionale Kohonen SOM med en lokal indsamling af dokumenter afslører, at afstanden mellem fremskrivninger af dokumenter ikke er stabil i hele den række af lanceringer. Dette efter vores mening er det et bevis på, at dimensioner af kortet, er utilstrækkelig, som svarer til Johnson-Lindenstrauss lemma nævnt ovenfor.

Desværre er det umuligt at gennemføre forsøget med en ordentlig karakter. For eksempel, ifølge Johnson-Lindenstrauss lemma, at kortet 20.000 dokumenter tillade 10% fejl, det vil kræve 58 dimensioner. Dette kræver beregninger, som ligger over moderne computere 'kapacitet.

Det er vigtigt at nævne her, er, at mens lemma giver en maksimal dimensioner af den kortlægning plads giver mulighed for at opfylde betingelsen om én fremskrivning, er det ikke nødvendigt den minimale effektive værdi. Lemma giver en værdi for et sæt af n punkter dvs. for den værste sag, der ikke kan forventes at forekomme i praksis. Metoderne til dimensioner afsløring bør anvendes til at beregne en effektiv dimensioner af data og dermed fastslå den korrekte antal dimensioner for kortlægning af særlig datasæt. Der er kendte teknikker til dette, som kommer fra baggrunden af overfladevand genopbygning. Et af de seneste er det arbejde ved S. Cheng, Y. Wang og Z. Wu [4], hvor dimension påvisningsmetoden gennem Principal Component Analyse [8] præsenteres. Således iboende karakter af data kan udvindes. Da denne værdi i praksis er lavere end den maksimale dimensioner er nødvendige for projektion af det samme antal dokumenter i et worst case-teoretisk sag, dette giver en betydelig reduktion i beregningen tid. Alternativt til samme formål kan vi overveje metoder, der bygger på iterativ evalueringer. Formålet med dimensioner reduktion i vores tilfælde er at etablere en effektiv kortlægning hvor commonsense lighed mellem informational kilder udtrykkes gennem Euclidian afstanden mellem projektion punkter. Tager nogen dimensioner reduktion teknik baseret på tilfældig udvælgelse fra inputdata sæt (såsom Principal Component Analyse, Self Organisationskomitéen Maps, Sammon genopbygning eller triangelhandel), i tilfælde, når de udsendes dimensioner er mindre end passende, at fremskrivningerne vil blive ustabil, og med hver genberegning kortlægning vil være anderledes, og afstandene mellem fremskrivninger vil ikke bevare. Vi kan også antage, at når den faktiske karakter af input manifold anvendes til kortlægning, afstandene vil bevare en vis grad af frihed, afhængigt af dimensioner reduktion anvendte metode. En alternativ løsning er derfor en tilfældig udvælgelse dimensioner reduktion teknik kombineret med ekstra dimensioner sideløbende evaluering af mapping. 32]. Tag for eksempel en teknik voksende SOMs beskrevet i [19, 32]. Havde til formål at mindske beregning tid er antallet af knudepunkter er vokset drastisk med nye knudepunkter bliver jævnt fordelt mellem de gamle og deres vægte vektorer blive indstillet til midlerne til de omkringliggende oprindelige vægte vektorer. Samme teknik anvendt på dimensioner (D) ville give en mulighed for at vurdere hvert enkelt D trin for trin. Evalueringskriterier ville være stabilisering af afstande mellem fremskrivninger. Til dette formål to eller flere selvstændige arrangørlandet kort kan køre parallelt med pairwise afstande mellem visse fremskrivninger, der sammenlignes på hver iteration. Under iterationsprocedure her vi forstår den fase, hvor de dimensioner af SOM blev øget og netværket blev derfor stabiliseret med nye parametre.

Sammenfatter de ovennævnte foreslår vi følgende model for eksperimentel vurdering af den bedste tilgang til fastlæggelse af Global Knowledge Map fra indsamling af tekstdokumenter.

Den datase t: vektor space model der skal anvendes (hvert dokument repræsenteret som vektor med funktioner som dimensioner og funktioner 'rangerer som koordinater i tilsvarende dimensioner).

Feature udvælgelse funktion: mest effektive til at være defineret.

Vector størrelse: der skal etableres empirisk.

Databehandling og-lagring.

En dimensioner reduktion teknik bør anvendes til kortlægning. Der er to mulige fremgangsmåder:

a) pre-beregne iboende karakter og evaluere forskellige dimensioner reduktion metoder med en kendt dimensioner af den kortlægning;

b) »incremental dimensioner evaluering metode« med få mappings køres parallelt - kun metoder med tilfældige udvælgelse af input-data kan anvendes.

Indgange: dokumenter «feature vektorer.

Udgange: GKM koordinater.

Evaluering:

1) Commonsense evaluering af korrespondance mellem de oprindelige dokumenter og Euclidian afstande af deres kortlægning fremskrivninger.

2) Stabilisering af disse pairwise afstande mellem fremskrivninger gennem forskellige lancerer i tilfælde tilfældig udvælgelse teknik anvendes.

3. Interface

3,1 Ideal viden repræsentation interface

Grænsefladen del af Knowledge Repræsentation System er vigtigt, når det ideelle system er drøftet. Begge opgaver for at modtage henvendelser fra brugere og videregive viden tilbage til dem er af samme vigtighed i de opgaver af data strukturering og opbevaring. Under de nuværende papir vi diskutere måder mod viden Repræsentation Systemer for en ny generation, og derfor er spørgsmålet om interaktion er styres med henblik på at fastslå, om det er muligt at give et idealistisk interface ved hjælp af en moderne teknologi.

De grænseflader, der bruges til at støtte samspillet mellem en menneskelig bruger med moderne viden repræsentation og hente oplysninger systemer er hovedsagelig af 'indeksering "type, dvs brugere har brug for at vide præcis, hvad de søger efter, og de har også til at angive det sprogligt. Et almindeligt eksempel på en sådan grænseflade er en søgemaskine. Som vi har nævnt ovenfor, søgemaskine og corpus af WWW dokumenter er den mest komplette og up-to-date viden repræsentation system til rådighed i dag, hvilket er grunden til deres popularitet. Samtidig er det kendt, at »indeksering 'grænseflade er ikke naturligt at bruge for mennesker, men det er det eneste alternativ som" browsing "-metoderne er ved at blive etableret meget dårligt [16]. Grunden til dette er problemet med viden kortlægning og tilpasning som ikke tillader automatisk klassificering og repræsentation af dokumenter i henhold til deres fag. Men problemet med samlet viden kortlægning rummet blive løst, nye muligheder synes til opførelse af en bedre, mere naturlige grænseflader af "browsing"-typen.

3.2 High dimensioner og visualisering

Have nævnt, at den deraf følgende globale kortlægning plads sandsynligvis være n-dimensional hvor n er høje, er det nødvendigt at løse problemet med visuel repræsentation. Det er muligt for mennesker at forestille sig 3D-rum, derfor den optimale metoder til ND-> 3D-repræsentation, der skal evalueres. Dimensioner reduktion teknikker eller flere repræsentation tilgang via interface kan anvendes.

Det er vigtigt, at med hjælp fra de samlet viden kortlægning plads fejlen er minimeret i beregningen af relevans mellem dokumenter, og desuden for udlæsning af relevante dokumenter selv fra andre systemer bliver en nem opgave. For slutbrugeren betyder dette, når systemet har placeret det emne han / hun er interesseret i, det vil aldrig føre brugeren irrelevante dokumenter.

3.3 Oplysninger anmodning kæde

Når opgaverne for emner kortlægning og placering, relevans beregning og viden plads browsing er løst den vigtigste opgave, som stadig er til at løse det problem med en første anmodning. I state-of-the-art informationsfremfinding systemer følgende processer er normalt at være involveret, når der anmodes om oplysninger:

Menneskelige del: 1) Imagination -> 2) dannelse af sproglige konstruktioner -> 3) manuel tastaturinput (voice input) -> Machine del: 4) sproglige afkodning -> 5) matching og placering -> 6) visualisering af matchende dokumenter

Kæden er lang og det er indlysende, at data tab og korruption bliver væsentlig grund til at fordoble sproglige kodning og dekodning. Først og brugeren har til at formulere de kognitive billeder ind kort sproglig sætning. Det andet system er til at afkode de sætning for at forstå emnet for brugernes interesse. Den beskrevne kæde af oprindelige anmodning skaber utilfredshed blandt brugere af moderne søgemaskiner på grund af manglende evne til at systemet "forstå" anmodningen medfører enorme tid tab af slutbrugeren. Graden af disse Hentningsfejl og ulemper forårsaget af interface begrænsning er betydelig og vil i høj grad minimere virkningen af en mere præcis søgning og placering af dokumenter indført ved fælles kortlægning.

Det er derfor nødvendigt at overveje, i teorien i det mindste muligheden for oprettelsen af en ideel kort kæde menneskelige <-> Knowledge Repræsentation System samspil med enheder forårsage tab af data, der elimineres:

Menneskelige del: 1) Imagination -> [anmodning forbikøres gennem direkte menneskelige hjerne-GKM koordinater konverterens] -> 2) matching og placering -> 3) visualisering af matchende dokumenter

Vi overblik over de nyeste resultater på området Brain Computer Interfaces (BCI) til dette formål.

3.4 Brain-Computer Interfaces

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Forskningen på BCI har stået på i mere end 30 år og det område er stadig meget ung og udvikler sig hurtigt. Op til en nylig øjeblik m ost betydelige fremskridt på området er blevet gjort i kunstige lemmer kontrol dvs kørepunkterne funktioner i hjernen [ 3] og fortolkning og behandling af visuelle signaler. Disse resultater er blevet bekræftet i flere eksperimenter involverer dyr og mennesker. Forskere rapport vellykket integration af mekanisk eller elektronisk udstyr, når dyr eller mennesker lære at styre enheden ved hjælp af deres hjerne, andre rapport vellykket overdragelse og afkodning af visuelle signaler [15, 20].

Brain-computer interfaces undersøgelser er tæt knyttet til det område af funktionelle neuroimaging, hvor forskellige teknologier er blevet udviklet til effektivt at optage staterne persons hjerne gennem visse fysiske egenskaber. Mest produktive fra et synspunkt om BCI er en nylig neuroimaging teknik kaldet Functional Magnetic Resonance Imaging ) (FMRI) [6, 13]. Denne teknik gør det muligt at optage dynamikken i blodgennemstrømningen i forskellige hjerne områder over tid og med en høj præcision. Denne dermed gør det muligt at skabe forbindelse mellem mønstre for aktivering af forskellige hjerne-områder og visse aktiviteter og kognitive processer i den menneskelige. Det er vigtigt, at denne teknik, i modsætning til mange alternativer, er non-invasive og ikke indebærer injektioner. Det er nødvendigt at bemærke, imidlertid, at fMRI hardware i dag stadig er meget dyrt og cumbrous.

Det er betegnende, at forsøgene viser, at hjernen tilpasser sig de nye betingelser. For eksempel når kørepunkterne impulser blev brugt til at kontrollere en mekaniker manipulator eller en computer musemarkøren, hjerne var i stand til gradvist at differentiere og lære at kontrollere manipulator adskilt fra kunstige lemmer. Lebedev nævner effekten af 'brain plasticitet «, som potentielt giver mulighed for at optage kunstige enheder i kroppen repræsentation. [20]

Seneste publikationer inden for neuroimaging yderligere stadig drøfte muligheden for at opdage de kognitive stater [15]. Heri står, at fokusere vores opmærksomhed på muligheden for anvendelse af BCI i human-KRS interaktion.

Det er velkendt, at forskellige kognitive stater i forbindelse med visse virkelige verden genstande svarer til visse mønstre i hjernen områder aktivering. Afkode disse mønstre gør det muligt at forstå, hvilke overlejret orienteret stimuli en person er i færd med at deltage (hvor deres opmærksomhed er rettet) eller i tilfældet med visuelle objekter til at identificere, hvilken klasse af genstande personen er billedsystemer (dvs. ansigter, bygninger, møbler), og selv de objekter »farve og orientering. [15] Disse processer er komplekse og langt fra forstået i øjeblikket. Yderligere undersøgelser skal vise, hvordan lav orden og høj for hjernen signaler korrelere med visse kognitive funktioner, hvor den fysiske karakteristika for de ændrer sig over tid og under forskellige påvirkninger, i hvilket omfang det er muligt at ekstrapolere aktivering mønstre i forskellige fag; osv. Det menes dog, at præcis viden om 'beregninger' udføres i menneskelige hjerne er ikke afgørende for opbygningen af relevante BCIs. [20] Fælles data mining teknikker kan anvendes til at udtrække nyttig information fra forskellige neuroimaging sensorer og etablere forbindelser med visse kognitive stater.

Der er dog vigtige spørgsmål, hvilket kan få alvorlige succes apparat af BCI inden for viden repræsentation. To mindre problemer er generalisering på tværs af tid og problemet med forskellige forekomster af den samme mentale tilstand. Det er velkendt, at hjernen områder aktivering mønstre samme mentale stater kan variere over tid. Forskellige forekomster af den samme mentale tilstand kan give modificerede billeder og, afhængigt af kontekstuelle variationer og andre faktorer. [15] Dette kræver fleksible rumlige resampling og klassificering algoritmer, der skal anvendes som foreslået af Haynes og Rees. Vi mener, at disse problemer vil blive løst ved udvikling af effektive teknikker.

Mere tvivlsomme spørgsmål er problemet med ekstrapolering til nye kognitive stater. Haynes og Rees bemærke, at antallet af mulige perceptual eller kognitive stater er uendelig, mens antallet af uddannelse kategorier er nødvendigvis begrænset. [15] Det er afgørende derfor, at dekoderen kan være uddannet til at generalisere Erfaringen fra små uddannelse indstillet til helt nye kategorier. Det ville være muligt ved hjælp af ekstrapolering hvis hjernen aktivering mønstre er faktisk indrettet i nogle systematiske parametriske rum. Dette er endnu ikke fundet, men det menes at det er muligt i det mindste for nogle typer af mentale indhold [15]. I tilfælde abstrakt form plads til klassificering af neurale mønstre faktisk eksisterer det ville give os mulighed for at theorize om mulighederne for kortlægning af den menneskelige hjerne kognitive stater på Global Knowledge Kort beskrevet tidligere i dette dokument. Forudsat at dette ikke er sket, er ovennævnte "problemet med oprindelige anmodning" vil blive løst og "ideelle menneskelige <-> KRS" kæden vil være muligt at etablere.

3.5 Learnable Decoder

Som det er nu kendt takket være de nyeste resultater af brain imaging, at det er muligt at skelne mellem aktivering af forskellige hjerne-områder, når personen er tanker om forskellige emner, kan vi antage at det er muligt at oprette en learnable dekoder til kort menneskelige indledt kognitive stater på viden kort af en Knowledge Repræsentation System. Derfor en ideel måde at menneske-computer interaktion kan være etableret som tillader en enorm hastighed og præcision i kommunikationen med et system. Der vil være færre data tab som følge af afskaffelsen af sproglige etape af interaktion. Hastigheden og effektiviteten af interaktion vil øge dermed. Disse to faktorer vil gøre det muligt for folk i forskellige erhverv, til at øge effektiviteten af deres arbejde betydeligt. Fra [6, 15] vi ved, at der er visse regelmæssig af placeringen af hjernens impulser og de emner af viden, som er fælles for alle mennesker, vi kan kalde disse funktioner menneskeskabte. Men det vides, at flertallet af disse links burde være individualistisk. Derfor dekoderen skal individuelt justerbar.

Det er også indlysende, at effektiviteten af dekoder vil afhænge af enkeltpersoner og deres uddannelse med det og evnen til at lære. Vi kan antage dette fra forsøg med kunstige grænseflader, der anvendes til at erstatte mistet lemmer. Mennesker og dyr var i stand til at koncentrere sig mentalt på en særlig måde at flytte en kunstig manipulator og selv lære at kontrollere den reelle lemmer og kunstige en separat [20].

I betragtning af ovennævnte mener vi, at en kunstige neurale netværk - baseret mekanisme er den bedste løsning for en dekoder problem.

Decoder's indlæringsprocessen

1) Pointen med tilfældige koordinater i det flerdimensionale rum for GKM er valgt.

2) Flere dokumenter, der har deres mappings i nabostaten område (Euclidian metriske bliver brugt) er valgt, og der vises for en menneskelig operatør.

3) Operatør koncentrater hans / hendes sind til kognitivt deltage i det givne emne og relaterede objekter i hukommelsen.

4) Den neuroimaging data blev indsamlet ved fMRI hardware over en bestemt periode.

5) De data, der behandles gennem en fysisk resampling og støjreduktion algoritme til formål at udvinde informative mønstre, der kendetegner den nuværende iteration af uddannelse.

6) Tilberedte data er hentet til indgangene af neurale netværk. Den GKM koordinaterne for et udvalgt punkt er hentet til output derfor uddannelse af de neurale netværk for at tilknytte særlige hjerne aktivering mønstre med GKM koordinater.

Human brain to Knowledge Representation System bridge interface

Menneskelige hjerne at Knowledge Repræsentation System bro interface

Figur 3.1 Processen med uddannelse af dekoderen

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This