Link idealistinis žinių Atstovavimas sistema: Visuotinis Žinios žemėlapis

Taras Filatov

Anotacija

Vienas iš svarbiausių problemų, kurios trukdo tolesnių įvykių srityse žinių Atstovavimas ir dirbtinis intelektas yra problema popierius derinimą arba žinių žemėlapius. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Pažanga jos sprendimas bus labai naudinga užduotis informacijos paieškos, ontologijos derinimą, tinkamumą apskaičiuojant, teksto suvokimo ir tt Šiame straipsnyje sąvoka įvairiais pasaulio žinių struktūra, sukurta per nestebimų ekstrahuojant priklausomos nuo didelių dokumentų korpusas, siūloma . Be to, problema tiesiogiai žmogaus - žinių Atstovavimas sistemos sąsaja skirta ir koncepcija adaptuotųjų dekoderis siūlomos siekiant sąveikos su anksčiau aprašyta unifikuotus kartografavimo modelį. Kartu šių dviejų požiūrių yra siūloma kaip pagrindą plėtojamos naujos kartos žinių sistemos.

Raktažodžiai: žinių, žinių kartografavimą, žmogaus kompiuterio sąveikos, ontologijos derinimą, viršutinių ontologijos, aktualumą skaičiavimo, informacijos paieškos, dokumentų panašumo

1. Įvadas

Visuomenėje, srityje žinių atstovavimas tapo žymiai per pastaruosius metus [25]. Žmonės visada bando tyrimą ir klasifikuoti žinias apie žinių. Mes galime rasti nuorodas nuo taip anksti, kaip "Socrates" ir penktoji Kr [33] į klesti logika ir Epistemologija [28] vidutinio amžiaus. Kadangi ši problema buvo laikomi svarbūs praeityje, sunku pervertinti jo reikšmę per eros informacijos.

Šiuolaikinės technologijos yra skirtos žmonėms su didelių potvynių duomenų kurias sunku susisteminti ir apdoroti. Dėl asmens tapti specialistu tam tikroje srityje reikia metų mokymosi ir reikalauja vėlesnis informacinių varžybos siekiant neatsilikti nuo naujausių profesionalių tendencijas.

Jis yra populiarus tikėjimas be žinios inžinieriai ir duomenų gavybos specialistai, kad informacija atviros prieigos Pakanka ekstrakto teisingi faktai apie beveik visas mūsų gyvenimo ir net prognozuoti ateitį. Vienintelė problema, kurią išspręsti yra protingai tvarkyti informaciją iš daugelio šaltinių. [35].

Šis veiksnių paklausa naujos kartos žinių sistemų, siekiant padėti žmonėms systematise, prieitų prie ir naudotųsi savo žinių.

Į dabartines popierines siūlome idėjas, kaip sukurti naujo amžiaus žinių Atstovavimas sistemos (KRS).

Manome, kad pastarojo meto pasiekimai tam tikrose srityse ir mokslo netrukus sukelti didžiulį laimėjimas srityje žmogaus žinių ir žmogaus ir kompiuterio sąveiką. Tai atvers naujas perspektyvas ir žymiai padidinti žmogaus dirbti su įvairiais priedais. Vienintelis dalykas, kad reikia padaryti tai, kad šiuos pasiekimus kartu.

Idealus KRS turėtų suteikti vartotojui patogią prieigą prie visų žinių žmonijos. Jos elementai Todėl yra:

  • žmonių, kurie nori gauti prieigą prie kai kurių gabalas žinias jis / ji yra suinteresuota,
  • duomenų saugojimo ir
  • tarpininkas sistemoje numatyti sąsają žmogaus prieiti prie žinių.

Kliūtis, kurios atsiranda čia sukelia apribojimus žmogaus sugebėjimus ir dabartinės technologijų lygį.

2. Duomenų saugojimas

2,1 narė menas

Žinių atstovavimo sistema reikalauja duomenų saugojimo, nebent ji gali priimti būtinus dokumentus iš išorinių šaltinių realiu laiku. Mes galime apibrėžti dvi pergalės priėjimus ideali KRS šiuolaikinės: struktūrizuotas rankiniu būdu valdomos globalios žinių saugyklų, tokių kaip ontologijomis ir sistemos, apimančios automatizuotą indeksavimo ir paieškos labiausiai pilna ir prieinama žaliavinio dokumentų kolekcija (World Wide Web), pavyzdžiui, paieškos sistemų. Problema pirmasis požiūris į savo vadovą pobūdžio - visi bandymai sukurti ir palaikyti pasaulio žmonių žinių bazę sukels kompromiso tarp išsamiai, aktualumą ir naudingumą. ], UFO (Unified Framework Ontology) Nepaisant yra daug sėkmingai viršutiniame ontologijos tokių projektų kaip Cyc [23], WordNet [12], DNS, SUMO tt ir nuolatinį teorinių diskusijų, kol moksliniai tyrimai, kuriais siekiama parengti standartizuotus unifikuotus pasauliniu ontologijos pagal pavadinimus Suo (Standard Upper Ontology ) [27] UFO (Unified pagrindų ontologija) ir tt

Antrasis požiūris tapo istoriškai paplitę dėl WWW yra didžiausia, išsamią ir naujausią korpusem duomenų automatinio tvarkymo šiandien. Tačiau priešingai nei pirmąjį požiūrį, problemas automatizuota informacijos paieškos sistema vaidina svarbų vaidmenį čia. Problemos teksto supratimu ir natūralios kalbos apdorojimas yra viena iš sudėtingiausių ir AI ir vis dar lieka be veiksmingo sprendimo. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Kaimynystėje yra problemų klasifikacija ir tinkamumą apskaičiuojant, vadinamoji "žiniatinklio grupavimo" problema [1]. Antrasis metodas (automatinis indeksavimas) Todėl yra didelių trūkumų ir tikslumą paieškos.

Yra pastangas užtikrinant pagerinti pirmiau minėtų metodų, siekiant įveikti šias problemas. Pavyzdžiui, kartu su vieninga bazė ontologijos projektai (Suo, BULO) yra tam tikrų bandymų kurti ontologijos derinimą ir ontologijos kartografavimo metodus siekiant esamų ontologijomis kartu tarpusavyje ir su kitų rūšių žinių pagrindą [5, 17]. Jis dažnai yra siūlomos siekiant sumažinti trūkumus vadove administravimo atveju ontologijomis būdu automatizuota informacijos paieškos (paieškos technologijos). Iš kitos pusės, pagerėjo hiperteksto standartai yra rengiami, kad galima rankomis nurodyti informaciją, kuri padėtų paieškos suprasti CommonSense apibrėžta WWW dokumentų ir Hipersaitai tarp jų [24]. Būtina suprasti, kad šių hibridinių sprendimų vežti trūkumų atitinkamas technologijas kartu su privalumais.

Vienas trūkumas vienija šiuos požiūrius ir daro neįmanoma jų integracija: nėra standartinių žemėlapių ir nustatyti santykių tarp dokumentų ir sąvokų skirtingas sistemas. Ši problema būtų išspręsta, jei viena iš sistemų su fiksuotais matematiškai interpretable hierarchija pvz ontologijomis įveikti esamą metodą (WWW). Tačiau tai atrodo mažai tikėtina, dėl minėtų priežasčių. Nepriklausomų tarpininkų standartas yra galimas šios problemos sprendimo būdą. Yra daug iniciatyvų kryptimi susiejimo ir abipusių parodyti žinių bazės įvairių rūšių, tarp kurių yra srities ontologijos rodymo. Šios iniciatyvos turi vieną bendrą trūkumą: nėra vieno standarto žemėlapius ir nustatyti santykių tarp dokumentų. Vėliau nė vienas iš jų galėtų tapti visuotinai pripažinta standartinių nebent darnesnės tirpalas yra sukurta.

2.2 sąvoka Pasaulinės žinių struktūra (GKM)

Mes manome, kad būtų galima parengti vieną bendrą standartą žinių kartografavimo statant logiška erdvėje su tikslu projekcija realaus pasaulio žinių sąvokos. Toks modelis (mes vadiname tai Visuotinis Žinios planas) turėtų atspindėti lygis panašumo dokumentų ir koncepcijų zamapowany į jį.

Pagrindinis tikslas modelis:

  • Suderinimas ir kryžminių planavimo dokumentų ir koncepcijos (WWW, ontologijomis, e-bibliotekos, katalogai ir tt)
  • Informacijos paieškos per naršyti
  • Tiksli automatinis apskaičiavimas CommonSense tinkamumą

GKM todėl reikalauja matematinių / loginis modelis žinių saugykla su ypatinga sąlyga: kad optimalus užduotį žinių ty sąveiką su žmogaus. Norėdami atlikti šią sąlygą modelis turi atspindėti jos Dimensija arba jos struktūros struktūra žmogaus žinių.

Reikalavimus, todėl:

  • Dimensija ir kartografavimas.

Pagrindinis veiksnys, dėl Dimensija yra prasme (ar tema).

  1. Kiekviena sąvoka žmogaus žinias, gali būti zamapowany į tašką su konkrečiu koordinates sistemos erdvėje.
  2. Kiekvienas dokumentas arba tekstas gali būti zamapowanym ant taškų skaičių (dokumentas yra suskirstytas į mêmes - prasmingas gabalus) arba vienas taškas.
  • Aktualumas apskaičiavimas.
  1. Tai galima matematiškai apskaičiuoti svarba tarp dviejų sąvokų apskaičiuojant atstumą tarp jų atitinkamą projektavimo taškų erdvėje.
  2. Todėl yra įmanoma apskaičiuoti "panašumo" tarp dokumentų ir koncepcijų apskaičiuojant atstumą tarp jų rodymo.
  • Vienarūšiškumą erdvėje.
  1. Erdvė yra vienodas (vienalytei) ir nuolat
  2. Koordinatės atspindi, kaip ir atstumai tarp taškų atspindėti skirtumą apibrėžta taip, kad jei taškas C yra tarp A ir B tai reiškia sąvoka C yra susiję su abiejų A ir B lygiai.
  3. Tai galima "peržiūrėti" erdvėje rasti žinių šaltinių mapowana kaimyninėse vietovėse.

Sukurti matematinį modelį tokios erdvės leidžia plėtoti Visuotinis Žinios planas. Tai ne verta bandyti parengti tokį modelį (GKM) ir rankiniu būdu dėl minėtų priežasčių informacija augimo ir nuolat pakeisti žmonių supratimą apie pasaulį. Mes manome, kad galima išgauti priklausomybių ir taisyklės iš turimų corpuses tekstų ir naudoti juos kaip perdirbėjų mūsų rodymo tikslais.

Šis kertinis akmuo mūsų prielaidų yra ta, kad paprastai įmanoma struktūra įvairiose žmogaus žinių dalykų į vieną erdvę ir atstumai per Dimensija pastaroji atspindi lygis panašumui pateikta dalykų. Ši prielaida remiasi Johnson-Lindenstrauss Lema, kad rinkinys n punktų aukštos Dimensija Euklidas erdvėje galima zamapowanym iki N matmenų Euklidas erdvės

(2,1)

tokia, kad atstumas tarp dviejų taškų pakeitimus tik veiksnys (1 ) [7]. Vector Erdvė Modelis dažniausiai naudojami informacijos paieškos ir tekstas Rūšiavimas atstovauja dokumentus aukšto Vektorius [31]. Šie vektoriai yra tam tikras lygis (priklausomai nuo metrinė funkcija pasirinkta) informacija, kuri yra pakankamai klasifikuoti temą, kuria parengtas originalus dokumentas.

Į Tychonoff Tvirtinimas [26] teigiama, kad taškus, atstovauja nekilnojamojo turto objektų vienai klasei, turėtų būti arčiau vienas kito turto vietos nei punktų atstovaujančių savybės objektų kitų klasių. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. Mūsų užduotis tai originalus Erdvė n tekstų gali būti projektuojamam į fiksuoto N-erdvėje ir naudojant atitinkamus algoritmus duomenų suspaudimo / Dimensija sumažinti dėl teorema Kompaktiškas [22] kartografavimo bus pasiekta, kai atstumas tarp klausimais svarbą, atitinkami dokumentai.

Veiksniai, turintys įtakos tikslumas rodyti:

  • reprezentatyvumu metrinė funkcijos ir dydžio, funkcijų erdvėje
  • dydis, Tona ir kokybės dokumentus korpusas

Jei teorija yra taikomas esamas sąlygas vis dar turi būti nustatyta, kuri technika turi būti naudojama parengti žemėlapius. Siūlome atkreipti dėmesį į automatinėmis priemonėmis, nes daug komplikacijų padaryti rankiniu ekspertų pagrindu kartografavimo netaikytinu.

2,3 Automatinis GKM karta per nestebimų gavyba (hipotezė)

Tam, kad būtų naudinga GKM turėtų parodyti nemažai nekilnojamojo žodis (WWW) dokumentus ir jos struktūrą sudaro bendrą žmonių supratimą apie pasaulį. Tai ne todėl verta apsvarstyti bet rankiniu būdų sukurti GKM ir užpildyti jį dokumento rodymo. Duomenų gavybos principai turėtų būti naudojamas ekstrakto priklausomybių atstovaujančių žinias iš esamų korpusem dokumentus galima kompiuterinis apdorojimas ir filtruoti nereikalingus duomenis.

Būta daugybės bandymų ir nestebimų ekstrahuojant priklausomybės tekstų, tačiau vis dar abejotina, ar bet kokia technika yra pajėgi užtikrinti tvarią žinių gavybos per analizė didelės dokumentų kolekcijos [10, 11, 21, 30].

Let's atskirties veiksnius, kurie paprastai turi įtakos turinį dokumentus į tris kategorijas:

  1. Autoriai asmeninius veiksnius (jausmus ir motyvus sukurti tekstą, fizinę ir moralinę teigiama per mąstymą ir rašymas)
  2. Kalba (taisyklės ir tt nuo kalbos rašyti dokumentas)
  3. Žinių (tam tikrų žmonių žinias autorius perduoda tiesiogiai arba netiesiogiai per dokumentas)

Let's preziumuoja įmanoma procesą visiems prieinamų dokumentų žmogaus autorių ir išrašo visus priklausomybę taisykles. Šiuo atveju poveikio koeficientas 1 bus minimalus. Įtaka 2 veiksnio nėra labai svarbi, nes taip:

a) dokumentų įvairiomis kalbomis, gali būti indeksuota, todėl tarpusavyje sumažinti įtaką

b) kalba pati atspindi žmogaus žinias [18], todėl tam tikra prasme 2 veiksnio yra subfactor 3 ir net išgaunant jų mišinio yra patenkinamas pasiekimų

Tai teoriškai įmanoma tada išgauti informacijos dažniausiai atitinkantis žmogaus žinių poveikį per turimais dokumentais. Ši informacija virsta kartografavimo erdvėje bus hipotetiškai pateikti mums tvaraus GKM.

2,4 įgyvendinimas (eksperimentas)

Per pastatytas kiekvieno dokumento turi būti priskirti vieną koordinuoti. Į "peržiūrėti" iš kosmoso ar atstumai turėtų palyginimas atskleidžia, kad padėtis dokumentų arba jų grupių atspindi jų tinkamumą ir, kad būtų galima priskirti tam tikrą temą pavadinimuose konkrečias koordinates erdvėje.

Mūsų eksperimentai taikant 2 ir 3 matmenų Kohonen SOM su vietinės surinkimo dokumentai rodo, kad atstumas tarp projekcijų dokumentų nėra stabilus visoje serijoje paleidžia. Tai, mūsų nuomone, tai liudija faktas, kad Dimensija žemėlapyje yra nepakankama, kurie atitinka Johnson-Lindenstrauss Lema minėta.

Deja neįmanoma atlikti eksperimentą su tinkamą Dimensija. Pavyzdžiui, pagal "Johnson-Lindenstrauss Lema, į žemėlapį 20000 dokumentų leidžiant 10% paklaida reikės 58 matmenys. Tam reikia skaičiavimų, kurie yra virš šiuolaikinių kompiuterių pajėgumą.

Svarbus dalykas paminėti tai, kad, nors Lema suteikia didžiausias Dimensija kartografavimo erdvė, leidžianti įvykdyti sąlyga viena projekcija, nebūtina minimalų veiksmingo vertę. Lema suteikia vertę rinkinys n punktus ty blogiausiu atveju, kuris nėra tikėtina, kad atsiras praktika. Metodai Dimensija nustatyti turi būti naudojamas apskaičiuoti efektyvų Dimensija duomenų ir nustatyti teisingą skaičių matmenys kartografavimo ypač duomenų rinkinys. Yra žinoma metodai kuriuose iš fono paviršius rekonstrukcijos. Vienas iš naujausių yra darbas S. Cheng Y. Wang ir Z. Wu [4], kai dimensiją aptikimo metodą per komponentų analizės pagrindinių tyrimų [8] yra pateiktas. Taigi, būdingąsias Dimensija duomenys gali būti išgaunami. Kadangi ši vertė praktiškai yra žemesnis nei maksimalus Dimensija būtina projekcija tą patį skaičių dokumentų Blogiausiu atveju teorines atveju, tai suteikia žymiai sumažinti skaičiavimo laiką. Arba tam pačiam tikslui mes galime išnagrinėti metodai grindžiami Pasikartojančio įvertinimai. Tikslas Dimensija mažinimas mūsų atveju yra sukurti veiksmingą žemėlapių kur CommonSense panašumas tarp informacinių šaltinių yra išreiškiamas per Euklidas atstumas tarp prognozės taškus. Atsižvelgdama bet Dimensija mažinimo metodas remiasi atsitiktine atranka, iš įvesties duomenų rinkinį (pvz., pagrindinių komponentų analizė, Savarankiškas organizavimas Maps Sammon rekonstrukcijos ar trianguliacijos), atveju, kai produkcija Dimensija yra mažiau negu reikia, kad prognozės bus nestabili ir su kiekviena perskaičiavimas kartografavimo bus kitoks ir atstumas tarp prognozės nebus išsaugoti. Mes galime manyti, kad kai veiksminga Dimensija įvedimo įvairovė naudojamas kartografavimo, atstumas bus išsaugoti su tam tikra laisvė, atsižvelgiant į Dimensija mažinimo metodas. Kita alternatyva todėl yra atsitiktinės atrankos Dimensija mažinimo metodą kartu su padidinta Dimensija lygiagrečiai įvertinti priskyrimo. 32]. Apsvarstykite, pavyzdžiui, technikos auga COM aprašytos [19, 32]. Siekiama sumažinti skaičiavimo laiką, skaičius mazgai padidėja dinamiškai naujų mazgų yra tolygiai paskirstytos tarp senųjų ir jų svorių vektoriai yra nustatytas priemones kaimyninių originalią svorių vektorių. Tas pats metodas taikomas Dimensija (D) suteiktų galimybę įvertinti kiekvienos D žingsnis po žingsnio. Vertinimo kriterijai būtų stabilizavimo atstumas tarp prognozės. Šiam tikslui du ar daugiau savarankiškai organizuoti žemėlapiai gali būti vykdomi lygiagrečiai su poravimas atstumai tarp tam tikrų prognozės buvo lyginamos kiekvieno pakartojimo. Pagal iteraciją čia suprantame etape, kai Dimensija iš SOM buvo padidintas ir tinklo buvo stabilizuojamas su naujais parametrais.

Apibendrinant pirmiau siūlome šiuos modelis eksperimentine vertinimo geresnio metodo nustatymo Visuotinis Žinios žemėlapis iš kolekcijos tekstinius dokumentus.

Į datase t: Erdvė modelis turi būti naudojamas (kiekvieno dokumento atstovaujama Vektorius funkcijas kaip matmenis ir savybes "užima koordinates atitinkamas matmenys).

Funkcijų pasirinkimo funkcija: efektyviausių būtų apibrėžta.

Vektorius dydis: turi būti nustatyta empiriškai.

Duomenų tvarkymo ir saugojimo.

A Dimensija mažinimo metodas turėtų būti naudojamas rodyti. Yra du galimi metodai:

a) iš anksto apskaičiuoti būdingąsias Dimensija ir įvertinti įvairių Dimensija mažinimo metodus, žinoma Dimensija kartografavimo;

b) "pavieniai Dimensija vertinimo metodą" su kelių rodymo vyksta lygiagrečiai - tik metodai su atsitiktine atranka iš sąnaudų duomenys gali būti naudojami.

Sudėtis: dokumentai "funkcija vektoriai.

Pramogos: GKM koordinates.

Vertinimas:

1) CommonSense įvertinimas korespondencijoje tarp pradinių dokumentų ir Euklidas atstumai jų žemėlapių projekcijos.

2) stabilizavimo šių poravimas atstumas tarp prognozės per skirtingus atidaro atveju atsitiktinės atrankos metodas yra naudojamas.

3. Sąsaja

3,1 Idealus žinių sąsaja

Sąsaja dalis žinių atstovavimo sistema yra svarbi, kai yra puikus sistemos. Abiejuose uždavinius Gavusi prašymus iš naudotojų ir perduoti žinias atgal į juos yra vienodai svarbūs uždaviniai struktūros ir duomenų saugykla. Į dokumente aptariami būdai siekti žinių Atstovavimas sistemos naujos kartos, ir todėl klausimas dėl sąveikos overviewed siekiant nustatyti, ar galima suteikti idealistinis sąsaja būdu šiuolaikinės technologijos.

Sąsajų, kurios yra naudojamos remti sąveiką žmogaus vartotojo su modernia žinių ir informacijos paieškos sistemų yra daugiausia "indeksavimo", ty vartotojai turi tiksliai žinoti, ko jie ieško, ir jie taip pat turi nurodyti jo kalbos. Bendra pavyzdys sąsajos paieškos. Kaip jau minėta, paieškos ir korpusas WWW dokumentai yra išsamūs ir naujausios žinios atstovavimo sistema prieinama šiandien, tai dėl jų populiarumo. Tuo pačiu metu ji yra žinoma, kad "indeksavimo" sąsaja nėra gamtinių naudoti žmonėms, tačiau ji yra vienintelė alternatyva "peržvelgdami požiūrių yra įsisteigę labai prastai [16]. Priežastis, kad yra problema žinių žemėlapius ir derinimą, kuri neleidžia automatiškai klasifikaciją ir atstovavimo dokumentus pagal jų temos. Tačiau su problema vieningą žinių kartografavimo erdvėje buvo išspręstos, naujas galimybes pasirodyti statybos pagerėjo, daugiau fizinių sąsajų "naršyti" tipo.

3,2 aukšto Dimensija ir vizualizacija

Įvertinusi paminėti, kad dėl pasaulio žemėlapio erdvėje gali būti n-dimensional, kur n yra didelis, būtina išspręsti šią problemą vaizdo atstovavimą. Tai galima žmogui įsivaizduoti 3D erdvėje, todėl optimalius būdus TP-> 3D atstovavimas turi būti įvertinta. Dimensija mažinimo metodus ar kelis atstovavimo požiūris naudojant sąsajos gali būti naudojami.

Svarbu, kad naudojant vieningą žinių rodymo erdvės klaidos mažinimą per apskaičiavimo svarbą tarp dokumentų, ir, be to, gauti atitinkamus dokumentus, net ir iš kitų sistemų tampa trivialus uždavinys. Dėl galutiniam vartotojui tai reiškia, kai sistemoje yra įsikūrusi temą jis / ji yra suinteresuota, niekada neduos vartotojo nereikšmingus dokumentus.

3,3 Proœba grandinės

Kai užduotis dalykų rodymo ir vietos, svarbą skaičiavimo ir žinių erdvę naršyti yra išspręsti svarbiausias uždavinys, kuris lieka išspręsti yra problema pradinį prašymą. Į state-of-the-art informacijos paieškos sistemų šiuos procesus paprastai yra dalyvauti, kai informacijos prašoma:

Žmogaus dalis: 1) Vaizduotė -> 2) formuoti kalbinės konstrukcijos -> 3) rankinio įvesčių klaviatūra (balso įvedimo) -> Mašinų dalis: 4) kalbų dekodavimo -> 5) atitikimo ir vietą -> 6) vizualizavimo atitinkančių dokumentų

Grandinės yra ilgos ir akivaizdu, kad duomenų praradimo ir korupcija yra reikšmingas dėl dvigubo kalbų kodavimo ir dekodavimo. Pirma, vartotojas turi suformuluoti pažinimo vaizdai į trumpą kalbų sakinį. Antra, sistema turi iššifruoti sakinio, kad suprastų, kokia tema naudotojų interesų. Aprašyta grandinės pirminio prašymo sukelia nepasitenkinimo vartotojų šiuolaikinių paieškos dėl nesugebėjimo sistema "supranta" prašymu dėl didžiulės laiko praradimas galutiniam vartotojui. Laipsnis šių paieškos klaidų ir nepatogumų sukelia sąsaja apribojimas yra reikšmingas ir labai sumažinti poveikį tikslesnius paieškos ir vieta dokumentus pateikė vieningą rodymo.

Todėl būtina išnagrinėti, teoriškai bent galimybė sukurti idealią trumposios grandinės žmogaus <-> Žinių atstovybės sistemos sąveika su vienetais sukelti duomenų praradimą yra panaikinami:

Žmogaus dalis: 1) Vaizduotė -> [prašymu pervedama pro tiesioginis žmogaus smegenų GKM koordinačių konverterį] -> 2) atitikimo ir vietą -> 3) vizualizavimo atitinkančių dokumentų

Mes apžvelgti naujausius pasiekimus srityje Brain Kompiuterių sąsajos (TSI) šiam tikslui.

3,4 Brain-Computer Sąsajos

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Mokslinių tyrimų dėl BCI vyksta jau daugiau nei 30 metų ir rajone vis dar labai jaunas ir vystosi sparčiai. Iki paskutinio momento M Ost didelė pažanga šioje srityje buvo į dirbtinės galūnės kontrolės ty automobilių funkcijų smegenų [ 3] ir aiškinant ir tvarkant vaizdo signalus. Šie pasiekimai buvo patikrinta per daug eksperimentų su gyvūnais ir žmonėmis. Mokslininkai pranešimas sėkmingai integracijai mechaninius arba elektroninius prietaisus, kai gyvūnams arba žmogui išmokti valdyti prietaisą naudojant jų smegenų, kiti pranešimas sėkmingai perkelti ir iškoduoti vaizdo signalus [15, 20].

Smegenų ir kompiuterio sąsajų tyrimai yra glaudžiai susiję su srities funkcinės neuroimaging, kur įvairias technologijas buvo sukurta veiksmingai registruoti būklės asmens smegenų per tam tikras fizines savybes. Dauguma produkciniai nuo požiūriu BCI yra neseniai neuroimaging technika vadinama Funkciniai magnetic resonance imaging ) (FMRI) [6, 13]. Šis metodas leidžia įrašyti dinamikos kraujotaka skirtingose smegenų srityse, laikui bėgant, ir su didelio tikslumo. Tai leidžia nustatyti ryšius tarp modelių aktyvinimas įvairių smegenų sričių ir tam tikrų veiklos rūšių ir pažinimo procesai žmogaus. Svarbu, kad šis metodas, skirtingai nuo daugelio alternatyvų, yra neinvaziniai ir nėra susijusi su investicijomis. Būtina pažymėti, tačiau, kad fMRI aparatūros šiandien vis dar yra labai brangus ir gremėzdiškas.

Svarbu, kad eksperimentai rodo, kad smegenys prisitaiko prie naujų sąlygų. Pavyzdžiui, jeigu automobilių impulsų buvo panaudoti kontrolės mechanikas manipuliatorius arba kompiuterio pelės kursorių, smegenų galėtų laipsniškai atskirti ir išmokti valdyti manipuliatorius atskirai nuo dirbtinės galūnės. Gulbės minimas poveikis "protų plastiškumas", kurie potencialiai leidžia įtraukti dirbtinių įrenginių kūno atstovavimas. [20]

Naujausi leidiniai srityje neuroimaging dar vis dar svarsto galimybę aptikti pažinimo teigiama [15]. Ši numatoma sutelkti mūsų dėmesį į galimybę taikyti BCI žmogiškųjų KRS sąveika.

Yra žinoma, kad įvairių pažinimo valstybių, susijusių su tam tikrų realaus pasaulio objektų, atitinka tam tikrus modelius smegenų sričių aktyvacijos. Dekodowaniu šių modelių leidžia suprasti, kokios iškaltas orientuotas dirgiklius asmuo šiuo metu dalyvauti (jei jų dėmesys yra nukreiptas) arba jei su regėjimo objektams nustatyti kurios klasės objektų asmuo vaizdavimo (ty asmenys, pastatai, baldai) ir net objektai "spalvos ir orientacijos. [15] Šie procesai yra sudėtingi ir toli gražu ne suprato metu. Tolesni tyrimai turi atskleisti, kaip mažas rašto ir aukšto tvarkos smegenų signalus koreliuoja su tam tikrų pažinimo funkcijas, kaip erdvinės charakteristikos modeliai kinta laikui bėgant, ir pagal įvairių poveikių; kokiu mastu būtų galima ekstrapoliuoti aktyvinimo modelius įvairių temų; ir tt Manoma, kad tiksliai žinoti "skaičiavimai" atlikti žmogaus smegenis nėra esminis statybos atitinkamų BCIs. [20] Bendrosios duomenų gavybos metodai gali būti taikomi išgauti naudingos informacijos iš įvairių neuroimaging jutikliai ir užmegzti ryšius su tam tikromis pažinimo teigiama.

Yra nors svarbius klausimus, kurie gali rimtai paveikti sėkmę prietaisą iš BCI srities žinių. Du nedidelius problemos yra apibendrintas laiko ir problema įvairių pasisakymų to paties psichinės būklės. Yra žinoma, kad smegenų sričių aktyvacijos modelius tos pačios psichikos narės gali skirtis laikui bėgant. Įvairios atvejais tos pačios psichinės būklės, gali būti modifikuoti vaizdus, taip pat, priklausomai nuo konteksto variantus ir kitų veiksnių. [15] Tam reikia lanksčių erdvinių resampling ir algoritmai turi būti naudojami kaip siūlė Haynes ir Rees. Manome, kad šios problemos bus išspręstos kai plėtodamos veiksmingus metodus.

Daugiau abejotinas klausimas yra problema ekstrapoliavimo į naują pažinimo teigiama. Haynes ir Rees dėmesį, kad keletas galimų suvokimo ar pažinimo valstybių begalybės, kadangi skaičių mokymo kategorijas yra neišvengiamai ribotas. [15] Tai yra svarbu todėl, kad dekoderis gali būti mokomi apibendrina patirtį, gautų iš mažų mokymo nustatyti visiškai naujas kategorijas. Būtų galima būdu ekstrapoliavimo jei smegenų aktyvinimo modeliai iš tikrųjų yra išdėstomos kai kurios sistemingai parametrų erdvėje. Tai dar turi būti nustatyta, tačiau, manoma, yra įmanoma bent jau kai kurių rūšių psichikos turinio [15]. Jei abstrakčių formos erdvės klasifikavimo neuroninis modelius iš tiesų egzistuoja, tai leidžia mums Steoretyzować dėl galimybių rodyti žmogaus smegenų pažinimo nurodo į globalių žinių struktūra aprašyta anksčiau šiame dokumente. Jei tai būtų pasiekta pirmiau minėta "problema pradinį prašymą" bus išspręstas ir "idealios žmogaus <-> KRS" tinklas bus įmanoma nustatyti.

3,5 Learnable Dekoderis

Kaip dabar ji žinoma dėka naujausius pasiekimus smegenų vaizdus, kad būtų galima atskirti aktyvinimas įvairių smegenų sričių, kai žmogus galvoja apie įvairius dalykus mes galime daryti, kad būtų galima sukurti learnable dekoderį į žemėlapį žmonių pradėjo pažinimo nurodo į žinių žemėlapį žinių atstovavimo sistema. Todėl idealus būdas Interakcija žmogus-kompiuteris gali būti nustatytos leidžiant didžiulis greitis ir tikslumas ryšius su sistema. Bus mažiau duomenų praradimo dėl panaikinimo kalbų etape sąveika. Greitis ir veiksmingumas sąveika didės todėl. Šie du veiksniai padės žmonėms įvairių profesijų padidinti jų darbo efektyvumą smarkiai. Nuo [6, 15] mes žinome, kad esama tam tikrų dėsningumų vietą smegenų impulsus ir dalykų žinias, kurios yra bendros visiems žmonėms; galėtume šias funkcijas antropogeninius. Tačiau yra žinoma, kad dauguma iš šių saitų turi būti individualus. Todėl, kad dekoderis turi būti individualiai pritaikomas.

Taip pat akivaizdu, kad efektyvumo dekoderis priklausys nuo atskirų asmenų ir jų mokymą, ir gebėjimą mokytis. Mes galime daryti tai, kad eksperimentai su dirbtinėmis sąsajas naudojamas vietoj prarastų galūnių. Žmonėms ir gyvūnams galėjo sutelkti protiškai ir specialiu būdu perkelti dirbtinio manipuliatorius ir net išmokti kontroliuoti realiuoju galūnių ir dirbtinis atskirai [20].

Atsižvelgiant į pirmiau mes manome, kad Dirbtinis neuroninis tinklas - pagrįsta sistema yra geriausia išeitis iš dekoderis problema.

Dekoderis mokymosi proceso

1) Taškas su atsitiktinių koordinates įvairiamatį erdvėje GKM yra pasirinktas.

2) Daug dokumentų, kurių rodymo ir kaimyninėse plotas (Euklidas Metrikoje yra naudojamas) yra atrenkami ir rodomas žmogaus operatoriaus.

3) Operatoriaus koncentratai jo protas cognitively dalyvauti šioje temoje ir susijusių objektų atmintyje.

4) Į neuroimaging duomenys yra renkami fMRI aparatūros per tam tikrą laikotarpį.

5) Duomenys būtų tvarkomi per erdvinių resampling ir triukšmo mažinimo algoritmas siekiama ekstrakto informaciniai modeliai apibūdinančių dabartinę Iteration mokymo.

6) Paruošti duomenis įkelta į naudojamų neuroninis tinklas. Į GKM koordinates pasirinkto taško įkelta į rezultatus, todėl mokymo neuroninis tinklas susieti konkrečią smegenų aktyvinimo modelius su GKM koordinates.

Human brain to Knowledge Representation System bridge interface

Žmogaus smegenys į žinių Atstovavimas sistema tiltas sąsaja

Pav 3.1 mokymo procesą ir dekoderis

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This