Ideal Knowledge representation System eller Global Knowledge Map
Mot idealistiska Knowledge representation System: Global Knowledge Map
Taras Filatov
Sammanfattning
En av de stora problem som hämmar den fortsatta utvecklingen på området för kunskapsrepresentation och artificiell intelligens är ett problem av semantiska anpassning eller kunskap kartläggning. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. De framsteg som i sin lösning kommer att vara mycket fördelaktigt för uppgifter informationssökning, ontologi anpassningen, relevans beräkning text förståelse etc. I uppsatsen begreppet multidimensionell global kunskap kartan utarbetats genom utan utvinning av beroenden från stora dokument corpus, föreslås . Dessutom har problemet med direkt mänskliga - Knowledge representation systemgränssnittet riktar och en begreppet adaptiv dekoder föreslås för interaktion med tidigare beskrivna enhetlig kartläggning modell. I kombination av dessa två strategier föreslås som grund för en utveckling av en ny generation av kunskapsrepresentation system.
Nyckelord: kunskapsrepresentation, kunskap kartläggning, mänskliga dator interaktion, ontologi anpassningen, övre ontologi, relevans beräkning, informationssökning, dokument likheten
1. Inledning
I samhället, det gäller kunskap representation blev större under senare år [25]. Människor alltid gjorts försök att undersöka och klassificera kunskap om kunskap. Vi kan hitta referenser från så tidigt som Sokrates i femte-talet [33] till blomstrande för logik och kunskapsteori [28] i medeltiden. Eftersom problemet ansågs vara viktigt i tidigare, det är svårt att överskatta dess betydelse under den tid av information.
Modern teknik har försett människan med alltför stora översvämningar av uppgifter som är svåra att systematisera och process. För en person att bli specialist inom ett visst område som det tar år att lära sig och kräver en efterföljande Informationsansvarig kapplöpning för att hålla jämna steg med den senaste professionella trender.
Det är en populär uppfattning bland kunskap ingenjörer och data mining specialister att information som finns i öppna är tillräckligt för att extrahera sanningsenlig fakta om nästan alla aspekter av våra liv och även förutsäga framtiden. Det enda problemet att lösa är att intelligent bearbeta information från många källor. [35].
Det faktorer som kräver en ny generation av kunskap representation för att hjälpa mänskligheten systematisera, tillgång till och använda sin kollektiva kunskap.
I nuvarande pappersformulär som vi föreslår idéer för att utveckla en ny epok kunskapsrepresentation System (KRS).
Vi tror att den senaste tidens framgångar på vissa områden och vetenskapen snart kommer att leda till ett enormt genombrott i omfattningen av mänsklig kunskap representation och människa-dator-interaktion. Detta öppnar nya möjligheter och att öka effektiviteten i människors arbete i många program. Det enda som behöver göras är att sätta dessa resultat tillsammans.
Ideal KRS skall ge användaren en bekväm tillgång till all kunskap om människan. Dess element är därför:
- en människa som vill komma åt vissa bit kunskap han / hon är intresserad av,
- ett datalagring och
- förmedlaren system att tillhandahålla gränssnitt för en människa att få tillgång till kunskap.
De hinder som uppstår orsakas av begränsningar i mänsklig förmåga och nuvarande teknisk nivå.
2. Datalagring
2.1 State of the art
Knowledge representation kräver datalagring om det inte är möjligt att hämta nödvändiga handlingar från externa källor i realtid. Vi kan beskriva två vinnande strategier för en idealisk KRS i dag: strukturerad manuellt lyckades global kunskap lager såsom ontologier och som omfattar automatisk indexering och sökning av mest fullständiga och tillgängliga råa handlingar insamling (World Wide Web), t.ex. sökmotorer. Problemet med den första metoden är i sin handledning natur - alla försök att skapa och bibehålla den globala mänskliga kunskapsbasen kommer att leda till kompromiss mellan detalj, aktualitet och användbarhet. ], UFO (Unified Framework Ontology) Trots det finns flera framgångsrika övre ontologi projekt såsom Cyc [23], WordNet [12], DNS, Sumo etc och pågående teoretiska diskussioner så länge forskning som syftar till att utarbeta en standardiserad enhetlig global ontologi enligt namnen på SUO (Standard Övre Ontology ) [27], UFO (Unified Framework Ontology) etc.
Den andra metoden blev historiskt förekommande på grund av WWW är den största, omfattande och aktuell samling av uppgifter för automatisk behandling idag. Men i motsats till första tillvägagångssätt, problemen med automatisk informationssökning spela en viktig roll här. Problemen med texten förståelse och naturligt språk behandling är en av de mest utmanande i AI och ändå fortfarande utan effektiv lösning. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Intill är problemen för klassificering och relevans beräkning, sk web clustering "problem [1]. Den andra strategin (automatisk indexering) därför har stora brister i noggrannhet hämtning.
Det pågår arbete på att förbättringar av ovan nämnda metoder för att lösa dessa problem. Till exempel, tillsammans med enhetlig bas ontologi projekt (SUO, BULO) finns det vissa försök att utveckla ontologi anpassningen och ontologi metoder för att få existerande ontologier tillsammans med varandra och med andra typer av kunskap grunder [5, 17]. Det är ofta föreslås för att minska bristerna i manuell administration vid ontologier med hjälp av automatisk informationssökning (sökmotor teknik). Från den andra sidan, bättre hypertextsystem standarder håller på att utvecklas för att göra det möjligt att manuellt ange information för att hjälpa sökmotorerna förstå commonsense innebörden av WWW dokument och länkar mellan dem [24]. Det är nödvändigt att förstå att dessa hybrid lösningar bära bristerna i motsvarande tekniker tillsammans med fördelar.
En brist som förenar dessa metoder och gör omöjligt deras integration: det finns ingen standard för kartläggning och upprättande av förbindelser mellan dokument och begrepp i olika system. Problemet skulle kunna lösas vid ett av de system med fasta matematiskt TYDBAR hierarki såsom ontologier överbryggar det nuvarande tillvägagångssättet (WWW). Men detta verkar osannolikt på grund av ovan nämnda skäl. Oberoende mellanhand standard finns en möjlig lösning på detta problem. Det finns flera initiativ för riktning att knyta och ömsesidig kartläggning av kunskapsbaser av olika slag bland vilka det finns ett område med ontologi kartläggning. De initiativ som har ett gemensamt problem: ingen enhetlig standard för kartläggning och upprättande av förbindelser mellan dokument. Därefter har ingen av dem kommer troligen att bli en allmänt erkänd standard om inte en mer hållbar lösning utvecklas.
2.2 Begreppet en Global Knowledge Map (GKM)
Vi anser att det är möjligt att utarbeta en gemensam standard för kunskap kartläggning genom att bygga en logisk plats i syfte att projektion av verkligheten kunskap begrepp. En sådan modell (låt oss kalla det för Global Knowledge Map) bör återspegla graden av likhet av dokument och begrepp stakats ut det.
Huvudsyftet med modellen är:
- Anpassning och övergripande kartläggning av dokument och begrepp (WWW, ontologier, e-bibliotek, kataloger etc.)
- Informationssökning genom webbläsning
- Exakt beräkning av commonsense relevans
GKM kräver därför en matematisk / logisk modell av kunskap lagring med ett särskilt villkor: att vara optimal för uppgiften att kunskapsrepresentation dvs interaktion med människor. För att uppfylla detta villkor modellen skall återspegla i problemet eller dess struktur strukturen av mänsklig kunskap.
Kraven är därför:
- Problemet och kartläggning.
Den viktigaste faktorn för problemet är meningen (eller ett ämne).
- Varje koncept av mänsklig kunskap kan vara mappade till en punkt med en specifik koordinater i systemet utrymme.
- Varje handling eller text kan kartläggas på ett antal punkter (Dokumentet är indelat i memes - meningsfull styck) eller en punkt.
- Relevans beräkningen.
- Det är möjligt matematiskt beräkna relevans mellan två begrepp genom att beräkna avståndet mellan deras motsvarande prognos punkter i rymden.
- Det är därför möjligt att beräkna "likhet" mellan dokument och koncept genom att beräkna avståndet mellan deras avbildningar.
- Homogena utrymmet.
- Utrymmet är enhetlig (homogen) och kontinuerlig
- Koordinater återspeglar innebörden och avstånden mellan de punkter återspeglar skillnaden i betydelse så att om punkten C ligger mellan A och B då det innebär begreppet C är relaterad till både A och B lika.
- Det är möjligt att "bläddra" blankstegs finna kunskap källor mappad till angränsande områden.
Att bygga en matematisk modell av sådant utrymme möjliggör utveckling av Global Knowledge Map. Det är inte värt att försöka utarbeta en sådan modell (GKM) i en handbok sätt på grund av ovan nämnda skäl information tillväxt och ständiga förändringar i människors förståelse av världen. Vi anser att det är möjligt att utvinna beroenden och regler från tillgängliga corpuses texter och använda dessa som registerförare för vår kartläggning ändamål.
Hörnstenen i våra antaganden är att det i allmänhet möjligt att kartlägga olika mänsklig kunskap ämnen på en enda plats och avstånden inom problemet med det sistnämnda återspeglar en nivå av likhet mellan tanke ämnen. Detta antagande bygger på Johnson-Lindenstrauss Lemma om att en uppsättning av n punkter i hög dimensionsmätinstrument Euclidian rymden kan kopplas till en N dimensionsmätinstrument Euclidian rymden
(2,1)
sådan att avståndet mellan två punkter förändringar av endast en faktor (1
) [7]. Vektorns Space modell som vanligen används i informationssökning och Text Kategoriindelning representerar dokument så hög dimensionella vektorer [31]. Dessa vektorer innehålla viss nivå (beroende på en variabel funktionen valts) av information som är tillräckligt för att klassificera föremål för det ursprungliga dokumentet.
Den Tychonoff sats [26] anges att punkter, som representerar egenskaper objekt av en klass ska vara närmare varandra i den egendom utrymme än punkterna representerar egenskaper objekt av andra klasser. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. I vår uppgift här: den ursprungliga vektorn rymden n texter kan projiceras på fasta N-dimensionell rymd och användning av en lämplig algoritm för datakomprimering / problemet minskning på grund av teorem av kompakthet [22] kartläggning kommer att ske där avstånden mellan punkterna representerar betydelsen av motsvarande handlingar.
Faktorer som påverkar precisionen i kartläggningen:
- representativitet i metriska funktion och storlek funktionen rymden
- storlek, dispersity och kvaliteten på de handlingar corpus
Förutsatt teorin gäller under nuvarande förhållanden det återstår att finna vilka metoder som skall användas för att utveckla kartläggningen. Vi föreslår att fokusera på automatisk väg på grund av många komplikationer göra manuella expert-baserad kartläggning inte.
2.3 Automatisk GKM generation genom oövervakad extraktion (hypotes)
För att vara användbara GKM innehåller avbildningar av betydande antal verkliga ord (WWW) handlingar och i dess struktur utgör den gemensamma mänskliga förståelse av världen. Det är inte värt det för att behandla alla manuella sätt att skapa GKM och fylla den med dokumentet avbildningar. De data mining principer bör användas för att extrahera beroenden representerar kunskap från existerande korpus av dokument som finns tillgängliga för databehandling och filtrera bort onödig information.
Det har gjorts många försök för oövervakad utvinning av beroenden i texterna men det är fortfarande ett tveksamt huruvida tekniken är kapabel att ge en hållbar kunskap utvinning genom analys av stora dokument samling [10, 11, 21, 30].
Låt oss dela upp de faktorer som påverkar innehållet i de handlingar i tre kategorier:
- Författare personliga faktorer (känslor och motiv för att skapa text, fysiska och moraliska stater under tänka och skriva)
- Språk (regler etc av det språk som används för att skriva dokumentet)
- Knowledge (vissa delar av mänsklig kunskap författaren sänder direkt eller indirekt genom dokument)
Låt oss förutsätta att det är möjligt att behandla alla tillgängliga textdokument av mänskliga författare och extrahera alla beroende regler. I detta fall inflytande av faktor 1 kommer att vara minimala. Påverkan av faktor 2 inte är av stor vikt på grund av följande:
a) dokument på flera språk kan vara indexerad, därför ömsesidigt minska påverkan
b) själva språket speglar människans kunskaper [18], så i viss mån den faktor 2 är en subfactor av 3 och utvinning av deras blandning utgör ett tillfredsställande prestation
Det är teoretiskt möjligt därefter för att hämta info oftast motsvarar den mänskliga kunskapen exponeras genom de tillgängliga dokumenten. Denna info omvandlas till kartläggning utrymme hypotetiskt ge oss en hållbar GKM.
2.4 Genomförande (experiment)
Inom loppet byggas varje dokument bör kartläggas att enda koordinat. "Webbsökning" i rymden eller avstånd jämförelse visar sig att situationen för de handlingar eller deras kluster återspeglar deras relevans och att det är möjligt att tilldela vissa ämne namn till specifika koordinater i rymden.
Vårt försök med att använda 2 och 3 dimensionella Kohonen SOM med en lokal insamling av dokument som visar att avståndet mellan projektionerna av handlingarna inte är stabil under raden av lanseringar. Detta enligt vår mening är det ett bevis på att problemet med kartan är otillräcklig som överensstämmer med Johnson-Lindenstrauss Lemma som nämns ovan.
Tyvärr är det omöjligt att utföra experimentet med en ordentlig problemet. Till exempel, enligt Johnson-Lindenstrauss Lemma, att kartlägga 20000 dokument medger 10% fel det kommer att kräva 58 dimensionerna. Detta kräver beräkningar som ligger över moderna datorer förmåga.
Det viktiga att nämna här är att, medan Lemma ger en maximal problemet med kartläggningen utrymme som gör det möjligt att uppfylla villkoret om enda prognos är det inte nödvändigt den minimala effektiva värdet. Lemma ger ett värde för en uppsättning av n punkter dvs värsta fall som troligtvis inte kommer att visas i praktiken. Metoderna för problemet upptäckt bör användas för att beräkna ett effektivt problemet med data och därmed fastställa det korrekta antalet dimensioner för kartläggning av särskilt dataregister. Det finns kända metoder för detta som kommer från bakgrund av ytan återuppbyggnad. Ett av de senaste är arbetet med S. Cheng, Y. Wang och Z. Wu [4] där dimension detektionsmetod genom Principal Component Analysis [8] presenteras. Det inneboende problemet med kan hämtas. Eftersom detta värde i praktiken är lägre än maximal problemet krävs för projektionen av samma antal dokument i ett värsta tänkbara teoretiska fallet, detta ger en betydande minskning i beräkningen tid. Alternativt för samma ändamål kan vi överväga metoder som bygger på återkommande utvärderingar. Syftet med problemet minskning i vårt fall är att skapa en effektiv kartläggning där commonsense likhet mellan Informationsansvarig källor uttrycks genom Euclidian avståndet mellan prognos punkter. Med några problemet minskning Tekniken bygger på ett slumpmässigt urval från indata (t.ex. Principal Component Analysis, Self Organising Maps Sammon ombyggnad eller triangulering), i fall då produktionen problemet är mindre än lämpligt prognoserna kommer att vara instabil och med varje omberäkningar kartläggningen kommer att vara annorlunda och avstånden mellan prognoser kommer inte att bevara. Vi kan också anta att när det faktiska problemet med input Samlingsröret används för kartläggning, avståndet kommer att bevara en viss grad av frihet beroende på problemet minskning som använts. En alternativ lösning är därför ett slumpmässigt urval problemet minskning teknik kombineras med tillkommande problemet parallell utvärdering av kartläggning. 32]. Ta till exempel den teknik som i växande SOMs beskrivs i [19, 32]. Syftar till att minska beräkning tid, antalet noder ökar kraftigt med nya noder är jämt fördelad mellan de gamla och deras vikter vektorer är inställd på att angränsande ursprungliga vikterna vektorer. Samma teknik som tillämpas på problemet (D) skulle ge en möjlighet att utvärdera varje D steg för steg. Utvärderingskriterier skulle stabilisera avstånden mellan prognoserna. För detta ändamål två eller flera själv organisera kartor kan köras parallellt med pairwise avstånd mellan vissa prognoser som jämförs för varje iteration. Enligt iterationsomgången här vi förstår det stadium då problemet av SOM ökades och nätet var därför stabiliseras med nya parametrar.
Sammanfattar ovannämnda föreslår vi följande modell för experimentell utvärdering av ett bättre tillvägagångssätt för upprättandet av Global Knowledge Karta från insamling av textdokument.
Den datase t: vektor utrymme modell som skall användas (varje dokument representeras som vektor med funktioner som dimensioner och funktioner "rankas som koordinater i motsvarande dimensioner).
Feature urval funktion: effektivaste att fastställa.
Vektor storlek som skall fastställas empiriskt.
Databehandling och lagring.
Ett problemet minskning tekniken bör användas för kartläggning. Det finns två möjliga lösningar:
a) på förhand beräkna inneboende problemet och utvärdera olika problemet minimeringsmetoder med kända problemet med kartläggningen;
b) tillkommande problemet Utvärderingsmetod "med några avbildningar drivs parallellt - Endast metoder med slumpmässigt urval av indata kan användas.
Ingångar: dokument "-funktionen vektorer.
Utgångar: GKM koordinater.
Utvärdering:
1) Commonsense utvärdering av korrespondens mellan inledande dokument och Euclidian sträckor av deras kartläggning prognoser.
2) Stabilisering av dessa pairwise avstånden mellan prognoser genom olika uppskjutningar vid slumpmässigt urval tekniken används.
3. Interface
3,1 Ideal kunskapsrepresentation gränssnitt
Gränssnittet del av kunskapsrepresentation System är viktigt när det ideala systemet diskuteras. Båda dessa uppgifter för att ta emot förfrågningar från användare och överföra kunskaper tillbaka till dem är lika viktiga i uppdrag att data strukturering och lagring. I nuvarande pappersformulär vi diskutera vägar mot Knowledge representation System för en ny generation och därmed frågan om interaktion ses över i syfte att fastställa huruvida det är möjligt att ge en idealistisk gränssnittet med hjälp av modern teknik.
De gränssnitt som används för att stödja samverkan mellan en mänsklig användare med modern kunskap representation och informationssökning är huvudsakligen av indexering "typ, det vill säga användarna måste veta exakt vad de söker och de har även ange det språkligt. Ett vanligt exempel på sådana gränssnitt är en sökmotor. Som vi har nämnt ovan, sökmotor och corpus av WWW-dokument är det mest kompletta och aktuell kunskap representation system finns idag, vilket är anledningen till deras popularitet. Samtidigt är det känt att "indexera" gränssnitt är inte naturligt att använda för människa men det är det enda alternativet som "surfa" metoder håller på att inrättas mycket dåligt [16]. Skälet till det är problemet med kunskap kartläggning och anpassning som inte tillåter automatiserad klassificering och representation av handlingar i enlighet med sina ämnen. Men problemet med samlad kunskap kartläggning utrymmet lösas, nya möjligheter finns för att bygga bättre och mer naturliga gränssnitt för "surfning" typ.
3.2 High problemet och visualisering
Har nämnt att den globala kartläggning utrymme sannolikt är n-dimensionell där n är stor är det nödvändigt att lösa problemet med visuell representation. Det är möjligt för människor att tänka 3D space därför optimalt sätt att ND-> 3D-representation skall kunna utvärderas. Problemet minskning teknik eller flera representation strategi via gränssnittet kan användas.
Det är viktigt att med hjälp av gemensam kunskap kartläggning utrymme felet minimeras vid beräkningen av relevans mellan dokument, och dessutom för hämtning av relevanta handlingar även från andra system blir en trivial uppgift. För slutanvändaren betyder det när systemet har hittat det ämne han / hon är intresserad av, det kommer aldrig att leda användaren att irrelevanta dokument.
3.3 Information begäran kedja
När uppgifter ämnesområden kartläggning och plats, relevans beräkning och kunskap utrymme surfa är löst viktigaste uppgift som återstår att lösa är problemet med en första ansökan. I state-of-the-art informationssökning system följande processer är vanligtvis att inblandade när information skall lämnas:
Mänskliga delar: 1) Imagination -> 2) bildandet av språkliga konstruktioner -> 3) manuella tangentbordet ingång (röst input) -> Machine del: 4) språkliga avkodning -> 5) matchning och plats -> 6) visualisering av motsvarande handlingar
Kedjan är lång och det är uppenbart att dataförlust och korruption är stora på grund av dubbla språkliga kodning och avkodning. Först och främst användaren att formulera den kognitiva bilder till kort språklig mening. Andra har att avkoda den meningen för att förstå ämnet för användarens intresse. Den beskrivna kedjan av ursprungliga begäran orsakar missnöje användare av moderna sökmotorer på grund av oförmåga att systemet "förstår" begäran resulterar i enorma tid förlust av slutanvändaren. Graden av dessa Hämtningsfel och problem orsakade av gränssnittet begränsning är betydande och i hög grad kommer att minska effekten av mer exakta hämtning och lokalisering av handlingar som införts av enhetlig kartläggning.
Det är därför nödvändigt att, åtminstone teoretiskt, möjligheten att skapa ett perfekt kort kedja mänskliga <-> Knowledge representation System Interaktion med enheter som orsakar förlust av data har utelämnats:
Mänskliga delar: 1) Imagination -> [begäran vidare genom direkta mänskliga hjärnan GKM koordinater omvandlare] -> 2) matchning och plats -> 3) visualisering av motsvarande handlingar
Vi översikt över de senaste landvinningarna inom området Brain Computer Interface (BCI) för detta ändamål.
3.4 Brain-Computer Interface
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Forskningen om BCI har pågått i mer än 30 år och är fortfarande mycket ung och utvecklas snabbt. Upp till en senare tidpunkt m ost betydande framsteg på området har gjorts i konstgjorda kroppsdelar kontroll dvs bilismen funktioner i hjärnan [ 3] och tolkning och bearbetning av visuella signaler. Dessa framgångar har kontrollerats under flera experiment med djur och människor. Forskare rapport framgångsrik integration av mekaniska eller elektroniska apparater när djur eller människor lära sig att styra enheten med hjälp av hjärnan, andra rapport framgångsrik överföring och avkodning av visuella signaler [15, 20].
Brain-dator gränssnitt studier är nära knuten till området funktionell neuroimaging, där olika tekniker har utvecklats för att effektivt titelinformation delstaterna persons hjärna genom vissa fysiska egenskaper. Mest produktiva ur av BCI är en nyligen neuroimaging teknik som kallas Functional Magnetic Resonance Imaging ) (FMRI) [6, 13]. Denna teknik gör det möjligt att registrera dynamik blodflödet i olika områden i hjärnan med tiden och med hög precision. Detta därmed gör det möjligt att upprätta förbindelser mellan mönster av aktivering av olika områden i hjärnan och vissa verksamheter och kognitiva processer i den mänskliga. Det är viktigt att denna teknik, till skillnad från många andra alternativ, är icke-invasiv och inte innebär injektionsvätskor. Det är nödvändigt att notera dock att fMRI hårdvara nuförtiden fortfarande är mycket dyra och OHANTERLIG.
Det är talande att experiment visar att hjärnan anpassar sig till nya förhållanden. Till exempel när bilismen impulser användes för att kontrollera en mekaniker manipulatorn eller en dator muspekaren, hjärna kunde gradvis differentieras och lära sig att kontrollera manipulatorn separat från artificiella kroppsdelar. Lebedev nämner effekten av "hjärnans plasticitet" som potentiellt kan införliva artificiella enheter i kroppen representation. [20]
Senaste publikationer inom neuroimaging ytterligare diskutera möjligheten att upptäcka den kognitiva staterna [15]. Detta innebär att fokusera vår uppmärksamhet på möjligheten att tillämpa BCI i human-KRS interaktion.
Det är känt att olika kognitiva stater är förknippade med vissa verkliga världen objekt motsvarar vissa mönster för områden i hjärnan aktiveras. Decoding dessa mönster gör det möjligt att förstå vilka överlagrade orienterade stimuli en person är närvarande deltar (om deras uppmärksamhet är riktad) eller i fallet med visuella objekt för att identifiera vilken klass av objekt personen imaging (dvs. ansikten, byggnader, inventarier) och även de objekt "färg och riktning. [15] Dessa processer är komplexa och långt ifrån att förstå just nu. Ytterligare undersökningar skall avslöja hur låg ordning och hög för hjärnans signaler korrelerar med vissa kognitiva funktioner, hur de rumsliga egenskaperna hos de förändras över tid och under olika influenser, i vilken utsträckning det är möjligt att extrapolera aktiveringsavgiften mönster av olika ämnen; etc. Man tror dock att en exakt kunskap om "beräkningar" som utförs i människans hjärna inte är avgörande för att bygga relevanta BCIs. [20] Gemensam data mining tekniker kan användas för att utvinna användbar information från olika neuroimaging sensorer och upprätta förbindelser med vissa kognitiva stater.
Det finns dock viktiga frågor som kan allvarligt påverka framgången av apparat av BCI inom kunskapsrepresentation. Två mindre problem är generalisering över tid och problemet med olika instanser av samma mentala tillstånd. Det är känt att områden i hjärnan aktiveras mönster av samma psykiska stater kan variera över tiden. Olika instanser av samma mentala tillstånd kan ge modifierade bilder också, beroende på kontextuella variationer och andra faktorer. [15] Detta kräver en flexibel fysisk resampling och klassificering algoritmer för att användas som föreslagits av Haynes och Rees. Vi anser att dessa problem kommer att lösas på utveckling av effektiv teknik.
Mer tveksamt är problemet med extrapolering till nya kognitiva stater. Haynes och Rees notera att antalet möjliga perceptuella eller kognitiva stater är oändliga, medan antalet utbildningsplatser kategorier är med nödvändighet begränsad. [15] Det är mycket viktigt därför att dekodern skulle kunna utbildas till att generalisera erfarenheterna från små utbildning för att helt nya kategorier. Det skulle vara möjligt med hjälp av extrapolering om hjärnans aktivering mönster faktiskt anordnas i vissa systematiska parametriska utrymme. Det återstår att finna, men man tror det är möjligt åtminstone för vissa typer av psykiska innehåll [15]. Vid abstrakt form utrymme för klassificering av neurala mönster verkligen existerar det skulle tillåta oss att TEORETISERA om möjligheterna att kartlägga den mänskliga hjärnans kognitiva stater på Global Knowledge Map beskrivits tidigare i detta dokument. Om detta sker, skall de ovan nämnda "problem ursprungliga begäran" kommer att lösas och "ideal mänskliga <-> KRS" kedja kommer att vara möjligt att fastställa.
3.5 Learnable Dekoder
Som det är nu kända tack till de senaste landvinningarna för hjärnavbildning att det är möjligt att skilja mellan aktivering av olika områden i hjärnan när personen tänker om olika ämnen kan vi förutsätta att det är möjligt att skapa en learnable dekodern att kartlägga mänskliga inledde kognitiva stater på kunskap karta över en kunskapsrepresentation System. Därför ett idealiskt sätt för människa-dator-interaktion kan fastställas som möjliggör en enorm hastighet och precision kan kommunicera med systemet. Det kommer att bli mindre dataförlust på grund av avskaffandet av språkliga stadium av interaktion. Snabbheten och effektiviteten i samverkan ökar därmed. Dessa två faktorer gör att människor i olika yrken att öka effektiviteten i deras arbete betydligt. Från [6, 15] Vi vet att det finns vissa regelbundenheter i placeringen av hjärnans impulser och frågor av kunskaper som är gemensamma för alla människor, vi kan kalla dessa funktioner antropogena. Men det är känt att majoriteten av dessa länkar borde vara individualistisk. Därför avkodaren måste individuellt anpassningsbar.
Det är också uppenbart att effektiviteten i dekodern kommer att bero på enskilda personer och deras utbildning med sig och förmåga att lära sig. Vi kan anta detta från experiment med artificiella gränssnitt används för att ersätta förlorade lemmar. Människor och djur kunde koncentrera sig mentalt på ett speciellt sätt att röra sig en konstgjord manipulatorn och även lära sig att kontrollera den verkliga extremiteter och artificiella ett separat [20].
Med tanke på det ovan nämnda anser vi att en konstgjord neurala nätverk - mekanism är den bästa lösningen för en dekoder problem.
Dekoder lärande process
1) Poängen med slumpmässiga koordinater i flerdimensionell rymd av GKM väljs.
2) Flera dokument med sina avbildningar i angränsande område (Euclidian variabel som används) väljs ut och visas för en mänsklig operatör.
3) Operatör koncentrerar sitt sinne för kognitivt närvara vid visst ämne och närliggande objekt i minnet.
4) Den neuroimaging information samlas in av fMRI hårdvara under en viss tidsperiod.
5) Uppgifterna bearbetas genom en fysisk resampling och brusreducering algoritm syfte att utvinna informativt mönster kännetecknar den nuvarande iterationen av utbildning.
6) Beredda data hämtas till ingångarna på neurala nätverk. Den GKM koordinaterna för en viss punkt hämtas till utgångarna därför utbildning av neurala nätverk för att koppla specifika hjärnans aktivering mönster med GKM koordinater.
Figur 3.1 Processen för utbildning av dekoder
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Recent Comments