Ideal de cunoştinţe Reprezentarea Global System sau cunoştinţe Harta
Spre idealist cunoştinţe Reprezentarea Sistem: Global de cunoştinţe Harta
Taras Filatov
Rezumat
Unul dintre cele mai importante probleme care inhibă în continuare evoluţia situaţiei în următoarele domenii de cunoştinţe şi de Inteligenta Artificiala Reprezentarea este o problemă de aliniere semantic sau cunoştinţe de cartografiere. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Progresul în soluţie va fi foarte benefic pentru sarcinile de informaţii extragerea, ontologie aliniere, relevanţă calcul, text etc înţelegere în ziar conceptul de cunoştinţe globale multidimensionale harta, elaborat prin nesupravegheat de extracţie de dependenţe corpus de documente de mare, este propusă . În plus, problema uman direct - cunoştinţe Reprezentarea interfaţă Sistemul se adresează şi un concept de adaptive de decodare a propus, în scopul de interacţiune cu descrise anterior unificat de cartografiere model. În combinaţie aceste două abordări sunt sugerat ca bază pentru o dezvoltare a unei noi generaţii de sisteme de reprezentare a cunoştinţelor.
Cuvinte cheie: reprezentare a cunoştinţelor, a cunoştinţelor de cartografiere, computer de interacţiune umană, ontologie aliniere, superioară ontologie, relevanţă calcul, extragerea de informaţii, document de similitudine
1. Introducere
În societate, în domeniul de cunoaştere de reprezentare a devenit mai semnificativ peste ultimii ani [25]. Oamenii întotdeauna făcute încercări de a studia şi de a clasifica cunoştinţe despre cunoaştere. Putem găsi referinţe de la cât mai curând în cincea Socrates-lea î.en [33] pentru a înfloritoare de logică şi epistemologie [28] în Evul Mediu. Având în vedere că problema a fost considerată a fi importantă în trecut, este greu de supraestimezi sensul său în timpul epocii de informaţii.
Tehnologiilor moderne au dotat cu omenirea excesive inundaţii a datelor, care sunt dificil de a sistematiza şi de proces. Pentru o persoană pentru a deveni un specialist într-un anumit domeniu este nevoie de ani de învăţare şi necesită o cursa informaţional pentru a ţine pasul cu cele mai recente tendinţe profesionale.
Este o credinţă populară printre cunoştinţe şi de data mining ingineri specialisti care informaţiile disponibile în deschide accesul este de ajuns pentru a extrage veridică faptele despre practic orice aspect al vieţii noastre şi chiar prezice viitorul. Singura problemă este de a rezolva inteligent pentru a procesa informaţii de la o multitudine de surse. [35].
Acest factori cerere nouă generaţie de sisteme de reprezentare a cunoştinţelor, pentru a ajuta omenirea sistematiza, de acces şi de a folosi cunoştinţele sale colective.
În curent hârtie propună idei noi pentru dezvoltarea unui nou vârstă de cunoştinţe Reprezentarea System (KRS).
Noi credem că recente realizări în anumite zone şi ştiinţele curând va duce la o mare descoperire în domeniul de aplicare a cunoştinţelor umane reprezentare şi interacţiune om-calculator. Aceasta va deschide noi orizonturi şi creşte foarte mult eficienţa muncii umane în multe aplicaţii. Singurul lucru care trebuie făcut este de a aduce aceste realizări împreună.
KRS Ideal ar trebui să ofere un utilizator cu o convenabil de acces la toate cunoştinţele omenirii. Elementele sale, prin urmare, sunt:
- un om care vrea să acceseze unele piese de cunoştinţe el / ea este interesată,
- o stocare de date, precum şi
- intermediul sistemului de a furniza o interfaţă de acces la cunoaştere umană.
Obstacolele care apar aici sunt cauzate de limitările umane şi abilităţile curent nivel tehnologic.
2. De stocare a datelor
2.1 membru de arta
Sistem de reprezentare necesită cunoştinţe de stocare a datelor în cazul în care nu este capabil de a prelua documentele necesare din surse externe, în timp real. Ne putem contura două abordări câştigătoare pentru un ideal KRS din ziua de azi: manual structurat gestionate la nivel global de cunoştinţe ontologii depozite, precum şi a sistemelor care implică automat indexare şi regăsire de cel mai complet şi accesibil, documente colecţie brut (World Wide Web), cum ar fi motoarele de căutare. Problema de la prima abordare este în natura sa manual - orice încercări de a crea şi a menţine în Baza de cunoştinţe umane la nivel global va duce la un compromis între detaliu, actualitatea şi utilitatea. ], UFO (Unified Framework Ontology) Prin derogare de acolo sunt mai multe de succes superioară-ontologie proiecte, cum ar fi Cyc [23], WordNet [12], DNS, sumo, etc şi în curs de desfăşurare discuţii teoretice, atâta timp cât de cercetare cu scopul de a elabora un standard unificat ontologie global sub numele de SUO (Standard Upper ontologie ) [27], UFO (Unified cadru ontologie) etc
Cea de-a doua abordare a devenit istoric predominante datorită WWW fiind cea mai mare, complete şi actualizate corpus de date disponibile pentru automate de prelucrare in ziua de azi. Cu toate acestea, în contrast cu prima abordare, de probleme de automate de regăsire informaţii joacă un rol important aici. Problemele de înţelegere de text şi de prelucrare a limbajului natural sunt unul dintre cele mai dificile în AI şi, totuşi, rămân încă fără eficientă soluţie. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Adiacente, sunt probleme de clasificare şi relevanţa calcul, aşa-numitul "web gruparea" problema [1]. Cea de-a doua abordare (automate de indexare), prin urmare, a major lipsesc în precizie de regăsire.
Nu sunt în curs de desfăşurare cu privire la eforturile de a aduce îmbunătăţiri abordări menţionate mai sus, pentru a trece peste aceste probleme. De exemplu, împreună cu unificat de bază ontologie proiecte (SUO, BULO) există anumite încercări de a dezvolta ontologie aliniere şi ontologie tehnici de cartografiere pentru a aduce existente ontologii, împreună cu ele şi cu alte tipuri de baze de cunoştinţe [5, 17]. Este adesea propuse pentru a micşora deficienţe de administrare manuală în caz de ontologii de către mijloacele de informare automatizat de preluare (motor de căutare tehnologii). De partea cealaltă, îmbunătăţirea standardelor de hypertext sunt dezvoltate pentru a face posibil să specificaţi manual de informaţii pentru a ajuta motoarele de căutare să înţeleagă sensul commonsense WWW documente şi hyperlink între ele [24]. Este necesar să se înţeleagă că aceste soluţii hibride poarte deficienţe de tehnici corespunzătoare, împreună cu avantaje.
Un neajuns uneşte aceste abordări şi face imposibilă integrarea lor: nu există nici un standard de cartografiere şi de stabilire a relaţiilor între documente şi concepte în diferite sisteme. Problema va fi rezolvată în cazul în care unul din sistemele cu fix matematic interpretable ierarhie, cum ar fi ontologii overcomes existente abordare (WWW). Totuşi, aceasta pare a fi puţin probabil datorită motivele menţionate mai sus. Independent de intermediar standard este un potenţial soluţie la această problemă. Există mai multe iniţiative de pe direcţia de legătură şi de cunoaştere reciprocă cartografiere de baze de diferite tipuri, printre care exista o zona de ontologie cartografiere. De iniţiative comune au un neajuns: nu singur standard de cartografiere şi de stabilire a relaţiilor dintre documente. Ulterior, niciunul dintre acestea nu este posibil pentru a deveni un standard recunoscut pe scară largă cu excepţia cazului în care mai multe soluţii durabile este dezvoltat.
2.2 Conceptul de cunoştinţe Global Map (GKM)
Noi credem că este posibil să se elaboreze un singur standard de cunoştinţe de cartografiere prin construirea unui spaţiu logic, cu scopul de a proiecţie de cunoştinţe concepte din lumea reală. O astfel de model (să ne numim Global cunoştinţe harta) ar trebui să reflecte nivelul de similitudine de documente şi conceptele mapate pe ea.
Principalul scop al modelului este:
- Aliniere şi eco-cartografiere a documentelor şi a conceptelor (WWW, ontologii, e-biblioteci, directoare, etc)
- Informaţiilor de navigare prin
- Precizări automate de calcul al commonsense relevanţă
GKM, prin urmare, necesită o matematice / logică model de cunoaştere de stocare cu o condiţie: să fie optime pentru sarcina de a cunoştinţelor reprezentare adică interacţiune cu umane. Pentru îndeplinirea acestei condiţii de model trebuie să reflecte în dimensionality sau în structura sa de structură a cunoaşterii umane.
Cerinţele, prin urmare, sunt:
- Dimensionality şi cartografiere.
Principalul factor de dimensionality este sensul (sau un subiect).
- Fiecare concept al cunoaşterii umane pot fi mapate pe un punct cu un anumit sistem de coordonate în spaţiu.
- Fiecare document sau text pot fi mapate pe un număr de puncte (document este împărţit în memes - semnificative piese) sau de un punct.
- Relevanta calcul.
- Este posibil matematic pentru a calcula relevanţă între două concepte de calcul a distanţei dintre punctele lor corespunzătoare proiecţie în spaţiu.
- Prin urmare, este posibil să se calculeze "similitudine" între documente şi conceptele de calcul a distanţei dintre mapările lor.
- Omogenitate a spaţiului.
- Spaţiul este uniformă (omogene) şi continuă
- Coordonate reflecta, în sensul şi distanţele între puncte reflecta diferenţa în sensul că, dacă acest lucru la punctul C se situează între A şi B, atunci înseamnă conceptul C se refera la ambele A şi B, în mod egal.
- Este posibil să se "Răsfoiţi" de spaţiu de cunoaştere a găsi surse de mapat la zonele vecine.
Construirea unui model matematic a unor astfel de spaţiu permite dezvoltarea de cunoştinţe Global Map. Nu se merită încercat să elaboreze un astfel de model (GKM), într-un mod manual din cauza menţionată anterior, din motive de informaţii şi de creştere continuă schimbare în umane de înţelegere a lumii. Noi credem că este posibil să se extrage dependenţe şi normele de la dispoziţia corpuses de texte şi de a folosi aceste procesoare pentru ca scopul nostru de cartografiere.
În colţul din piatră noastre ipoteze este că aceasta este, în general, posibilitatea de a harta diferite subiecte pe cunoaştere umană singur spatiu si de distantele în dimensionality a acestuia din urmă reflectă un nivel de similitudine între dat subiecte. Această presupunere se bazează pe Johnson Lindenstrauss-lemă, declarând că un set de n puncte în mare dimensional spaţiu Euclidian pot fi mapate în jos la o N dimensional spaţiu Euclidian
(2,1)
astfel încât distanţa între oricare două puncte de modificări doar de un factor (1
) [7]. The Vector Space Model frecvent utilizate în informaţiilor şi Text Categorizarea reprezintă documente de mare ca vectori dimensionale [31]. Acestea conţin vectori anumit nivel (în funcţie de o măsurătoare funcţia ales) de informaţii care este suficientă pentru a clasifica obiectul documentului original.
De Tychonoff teorema lui [26] afirmă că puncte, reprezentând proprietăţile de obiecte de o clasa, ar trebui să fie situat mai aproape de fiecare în alt spaţiu decât în proprietatea sa de puncte, reprezentând proprietăţile de obiecte din alte clase. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. În sarcina noastră, aceasta înseamnă original vectorul spaţiu de n textele pot fi proiectate pe fix N-dimensional şi utilizând un spaţiu adecvat pentru algoritmul de compresie de date / dimensionality reducere ca urmare a teorema de compactitatea [22] de cartografiere vor fi realizate în cazul în care distanţele dintre puncte reprezinta relevanţă de documentele corespunzătoare.
Factorii care afectează nivelul de precizie de cartografiere:
- reprezentativitate a metrice funcţie de mărimea şi de facilitatea de spaţiu
- dimensiune, dispersity şi de calitate a documentelor corpus
Cu condiţia ca teoria se aplică în condiţiile curente este în continuare pentru a fi găsit tehnici care vor fi utilizate pentru a elabora de cartografiere. Noi propunem să se concentreze asupra mijloace automate, datorită multe complicaţii a face manual expert pe baza de cartografiere inaplicabilă.
2.3 Automatic GKM generaţie prin nesupravegheat de extracţie (ipoteză)
În scopul de a fi util GKM ar trebui să conţină mapările de număr semnificativ de real cuvânt (WWW) documente şi în structura sa reprezinte comune uman de înţelegere a lumii. Este, prin urmare, nu merită să ia în considerare orice manual moduri de creare a GKM şi completarea acestuia cu documentul mapările. De data mining principii ar trebui să fie folosite pentru a extrage dependenţele care reprezintă cunoştinţe de la existent corpus de documente disponibile pentru prelucrarea pe calculator şi filtra date inutile.
Au existat numeroase încercări de nesupravegheat de extracţie de dependenţe în texte cu toate acestea, este încă un suspect întrebarea dacă orice tehnica este capabil de a oferi o cunoaştere extracţie durabilă prin analiza documentelor de colectare de mare [10, 11, 21, 30].
Să împărţire a factorilor care afectează în general, conţinutul de documente în trei categorii:
- Autori personale factori (sentimente şi motive de a crea text, fizică şi morală state în timpul de gândire şi de scris)
- Limba (normele etc de limbajul folosit pentru a scrie documentul)
- Cunoştinţe (anumite părţi ale cunoaşterii umane autor transmite direct sau implicit, prin intermediul documentului)
Să presupunem, este posibil pentru a procesa toate disponibile documente text umane autorilor şi extras toate normele de dependenţă. În acest caz, influenţa factorului 1 va fi minim. Influenta factorului 2 nu este de mare importanţă din următoarele:
a) documente, în mai multe limbi ar putea fi indexate, reciproc, prin urmare, reducerea influenţei
b) limba în sine reflectă cunoştinţele umane [18], astfel că într-o anumită măsură de factorul 2 este un subfactor de 3 şi chiar şi de extracţie a acestora reprezintă un amestec satisfăcătoare realizarea
Este teoretic posibil atunci pentru a extrage informaţii de cele mai multe ori în funcţie de cunoştinţele umane expuse prin documentele disponibile. Acest info transformat în spaţiu de cartografiere vor ipotetic ne furniza GKM durabile.
2.4 Punerea în aplicare (experiment)
În spaţiul construit fiecare document ar trebui să fie identificate pentru a coordona singur. De navigare "de spaţiu sau de distantele comparaţie ar trebui să evidenţieze faptul că situaţia de documente sau grupările lor reflectă relevanţa acestora şi că este posibil să se atribuie anumite nume de subiect la anumite coordonate în spaţiu.
Experimentele noastre de a folosi 2 şi 3 dimensional Kohonen SOM locale, cu o colecţie de documente arată că la distanţe între proiecţiile de documente nu sunt stabile în întreaga serie de lansări. Acest lucru, în opinia noastră este o dovadă a faptului că dimensionality de harta este insuficientă, care se conformează Johnson-lemă Lindenstrauss menţionate mai sus.
Din păcate, este imposibil să se efectueze experimentul cu o buna dimensionality. De exemplu, în funcţie de Johnson Lindenstrauss-lemă, la harta 20000 documente care să permită 10% de eroare, va necesita 58 dimensiuni. Acest lucru necesită calcule care sunt mai sus de calculatoare moderne "capacitate.
Cel mai important lucru pentru a menţiona aici este că, în timp ce lemă ofera un maxim de dimensionality de cartografiere spaţiu care să permită să-şi îndeplinească condiţia de proiecţie unică, nu este necesar de valoare minimă eficace. Lemă dă o valoare pentru un set de n puncte adică de cel mai grav caz care nu este probabil să apară în practică. Metodele de detectare dimensionality ar trebui să fie utilizate pentru a calcula un mod eficient dimensionality de date şi, prin urmare, determină corect numărul de dimensiuni pentru cartarea special set de date. Nu sunt cunoscute tehnici pentru acest care provin de la fondul de suprafaţă de reconstrucţie. Una din cele mai recente este opera de S. Cheng, Y. Wang şi Wu Z. [4] în cazul în care metoda de detectare a dimensiunii principal prin Component Analysis [8] este prezentat. Astfel, în intrinsec dimensionality de date pot fi extrase. Deoarece această valoare, în practică, este mai mic decât maxim dimensionality necesare pentru proiectarea acelaşi număr de documente într-o cel mai rău caz teoretice cazul, acest lucru oferă o reducere semnificativă în calcul timp. Alternativ, în aceleaşi scopuri, ne putem lua în considerare metode bazate pe iterativ evaluări. Scopul dimensionality reducere în cazul nostru este de a stabili un mod eficient de cartografiere în cazul în care commonsense similitudine între sursele de informare este exprimată printr-Euclidian distanţa dintre punctele de proiecţie. A lua orice dimensionality reducere tehnica pe baza de selecţie aleatoare de la intrare set de date (cum ar fi Principal Component Analysis, Self Organizarea Maps, Sammon de reconstrucţie sau de triangulaţie), în cazul în care, atunci când dimensionality de ieşire este mai mică decât este cazul, de proiecţii va fi instabilă şi cu fiecare recalcularea de cartografiere vor fi diferite şi de distanţele dintre proiecţii nu va păstra. De asemenea, putem presupune că, atunci când dimensionality eficientă a galeriei de intrare este utilizat pentru cartografiere, de distantele va păstra cu un anumit grad de libertate în funcţie de metoda de reducere a dimensionality utilizat. O soluţie alternativă, prin urmare, este o selecţie aleatorie dimensionality reducere tehnica combinata cu incrementală dimensionality paralel evaluare a cartografiere. 32]. Luaţi în considerare, de exemplu, tehnica din ce în ce mai SOMs descris în [19, 32]. Cu scopul de a reduce timpul de calcul, numărul de noduri este crescut dinamic cu noi noduri fiind uniform distribuite între cele vechi şi greutăţile lor vectori fiind stabilit la mijloacele de vecine original greutăţi vectori. Aceeaşi tehnică aplicată dimensionality (D), ar oferi o oportunitate de a evalua fiecare D pas cu pas. Criteriile de evaluare va fi de stabilizare a distantele între proiecţii. În acest scop, două sau mai multe hărţi organizarea auto poate fi rulat în paralel cu pairwise distantele între anumite proiecţii fiind comparat cu privire la fiecare repetare. În conformitate cu repetare aici am înţeles de pe scenă, atunci când dimensionality de SOM a fost crescut şi în reţea în consecinţă, a fost stabilizat cu noi parametri.
Rezumând menţionate mai sus va propunem următoarele model experimental de evaluare a mai bine de abordare pentru stabilirea Harta globală de cunoştinţe de la o colecţie de documente de tip text.
De datase t: vector spaţiu model care urmează a fi utilizate (fiecare document reprezentat ca vector cu caracteristici ca dimensiuni şi caracteristici "rândurile corespunzătoare în coordonate ca dimensiuni).
Caracteristicã selecţie funcţie: cele mai eficiente pentru a fi definite.
Vector Marime: pentru a fi stabilit empiric.
Prelucrarea şi stocarea datelor.
O reducere dimensionality tehnica ar trebui să fie utilizate pentru cartografiere. Sunt posibile două abordări:
a) pre-calcula intrinsec dimensionality şi evalua diferite dimensionality metodelor de reducere cu un cunoscut dimensionality de cartografiere;
b) "incrementală dimensionality evaluare abordare" cu câteva mapările fiind rula în paralel - numai cu metode de selecţie aleatorie de date de intrare pot fi utilizate.
Consumul: documente "facilitate vectori.
Rezultate: GKM coordonate.
Evaluare:
1) Commonsense de corespondenţă între evaluarea iniţială şi documente Euclidian distantele lor de cartografiere proiecţii.
2) de stabilizare a acestor pairwise distantele între proiecţiile prin diferite lansează în caz de selecţie aleatoare tehnica este utilizat.
3. Interfata
3,1 Ideal cunoaştere reprezentare interfaţă
Interfaţa parte a Sistemului de cunoştinţe Reprezentarea este importantă în cazul în care sistemul este ideal discutat. Ambele sarcini de la primirea cererilor din partea utilizatorilor şi transmiterea de cunoştinţe înapoi pentru a le sunt de importanţă egală cu sarcinile de structurare a datelor şi de stocare. În curent hârtie am discuta modalitatile de cunoştinţe spre Reprezentarea Sisteme de o nouă generaţie şi, prin urmare, problema de interacţiune este overviewed pentru a stabili dacă este posibil pentru a furniza o interfaţă idealist de mijloace de o tehnologie moderna.
De interfeţe care sunt folosite pentru a sprijini un om de interacţiune cu utilizatorul modern de reprezentare a cunoştinţelor şi informaţiilor sisteme sunt în principal de "indexarea" de tip, adică utilizatorii trebuie să ştie exact ceea ce ei caută şi ei au, de asemenea, să specificaţi aceasta lingvistic. Un exemplu de astfel de comune interfaţă este un motor de căutare. Aşa cum am menţionat mai sus, motorul de căutare şi corpus de documente WWW este cea mai completă şi actualizată a sistemului de reprezentare a cunoştinţelor disponibile în prezent, aceasta fiind un motiv de popularitate. În acelaşi timp, în care se ştie că "indexarea" interfaţă nu este natural să o utilizaţi pentru om, dar este singura alternativă ca "răsfoirea" abordări se stabilesc foarte slab [16]. Motivul pentru aceasta este o problemă de cunoaştere şi de cartografiere aliniere care nu permit o clasificare automată a documentelor şi de reprezentare, în funcţie de discipline. Cu toate acestea, cu o problemă de cunoaştere unificat de cartografiere spaţiu fiind rezolvate, apar noi posibilităţi de construcţie a unei mai bune, mai multe interfeţe naturale de "navigare" de tip.
3.2 High dimensionality şi de vizualizare
După ce a menţionat că la rezultate la nivel global de cartografiere spaţiu este posibil să fie n-dimensional, unde n este mare, este necesar de a rezolva problema de reprezentare vizuală. Este posibil pentru oameni să-şi imagineze 3D spaţiu, de aceea, optim de moduri de a II-> 3D reprezentare trebuie să fie evaluată. Dimensionality reducere sau mai multe tehnici de reprezentare, prin intermediul interfeţei de abordare ar putea fi folosite.
Este important ca, cu ajutorul a unificat cunoştinţe de cartografiere spaţiu de eroare este minimizată în calcul de relevanţă între documente, şi, în plus, de regăsire a documentelor relevante chiar şi de la alte sisteme de banal devine o sarcină. Pentru utilizatorul final, aceasta înseamnă o dată în sistem a localizat subiect el / ea este interesată, aceasta nu va duce la utilizator irelevante documente.
3.3 lanţ de cerere de informaţii
În cazul în care sarcinile de subiecţi de cartografiere şi locaţie, relevanţă de calcul şi de cunoştinţe spaţiu de navigare sunt rezolvate cel mai important care rămâne sarcina de a rezolva problema este de o primă cerere. În state-of-the-art informaţiilor sisteme următoarele procese sunt, de obicei, fiind implicate, atunci când se solicită informaţii:
Omului parte: 1) Imagination -> 2) formarea lingvistică constructii -> 3) manual tastatura de intrare (voce de intrare) -> Machine parte: 4) lingvistice decodificare -> 5) de potrivire şi de locaţie -> 6) vizualizarea de documente de potrivire
Lanţul este lung şi este evident că pierderea datelor şi a corupţiei este semnificativ ca urmare a dublei lingvistice de codificare şi decodificare. În primul rând, utilizatorul trebuie să formuleze cognitive imagini în scurt lingvistice teză. În al doilea rând, sistemul trebuie să decodeze teză pentru a înţelege de obiectul de interes al utilizatorului. Descrise lanţ de cererea iniţială cauzele nemultumirea utilizatorilor de moderne de motoare de căutare din cauza imposibilităţii de a sistemului de a "înţelege" cererea rezultă în timp pierderi enorme de la utilizatorul final. Gradul de recuperare a acestor erori şi inconvenientele cauzate de interfaţă limitare este semnificativ şi va minimiza efectul de a mai precise şi o locaţie de regăsire a documentelor introduse de unificat de cartografiere.
Prin urmare, este necesar să ia în considerare, cel puţin teoretic, posibilitatea de creare a unui ideal scurt-lanţ uman <-> Sistem de cunoştinţe Reprezentarea interacţiune cu unităţile care cauzează pierderea datelor fiind eliminat:
Omului parte: 1) Imagination -> [cererea fiind trecut prin uman direct creier-GKM coordonatele Convertor] -> 2) de potrivire şi de locaţie -> 3) vizualizarea de documente de potrivire
Noi de ansamblu a mai recente realizări în domeniul Brain Computer Interfeţe (BCI) în acest scop.
3.4 Brain-Computer Interfaces
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. De cercetare pe BCI a fost petrece mai mult de 30 de ani, iar zona este inca foarte tinere şi se dezvoltă rapid. Până la un moment m ost progrese semnificative în domeniu au fost făcute în artificiale corporale de control şi anume automobilism funcţii ale creierului [ 3] şi de interpretare şi de prelucrare a semnalelor vizuale. Aceste realizări au fost verificate în timpul experimentelor care implică mai multe animale şi pe subiecţi umani. Cercetatori raport cu succes integrarea mecanice sau aparate electronice, atunci când animale sau la om învăţa pentru a controla aparatul cu ajutorul lor creier; altele raport cu succes de transfer şi decodificare a semnalelor vizuale [15, 20].
Brain-computer interfaces studii sunt strâns legate de zona de funcţionale neuroimaging, în cazul în care diferite tehnologii au fost dezvoltate în mod eficient de a înregistra membre ale persoanei creier prin anumite caracteristici fizice. Cele mai productive din punct de vedere al BCI este o tehnică numită recent neuroimaging Functional Magnetic Resonance Imaging ) (FMRI) [6, 13]. Aceasta tehnica permite de a înregistra dinamica a fluxului sanguin în diferite domenii creierului în timp şi cu un înalt grad de precizie. Aceasta în consecinţă, permite de a stabili conexiuni între modele de activare a creierului, de diferite domenii şi anumite activităţi şi procesele cognitive ale omului. Este important ca aceasta tehnica, spre deosebire de multe alternative, este non-invazive şi să nu implice preparate injectabile. Este necesar să reţineţi, totuşi, că a fMRI hardware-ul in ziua de azi este încă foarte costisitoare şi de stânjenitor.
Este semnificativ faptul că experimente arată că creierul se adaptează la noile condiţii. De exemplu, atunci când impulsurile automobilism au fost folosite pentru a controla un mecanic manipulator sau un computer cursorul mouse-ului, creierul a fost capabil să se diferenţieze şi să înveţe treptat, pentru a controla separat de manipulator artificiale corporale. Lebedev menţionează efectul de "creier plasticitate", care ar putea permite să includă dispozitive artificiale în corpul reprezentare. [20]
Publicaţii recente în domeniul neuroimaging suplimentare inca discuta posibilitatea de a detecta cognitive membre [15]. Aceasta prevede concentrându-se de atenţia cu privire la posibilitatea de aplicare a omului în BCI-KRS interacţiune.
Este cunoscut faptul că diferite cognitive membre în legătură cu anumite obiecte din lumea reală să corespundă anumitor modele de creier zonele de activare. Decodare aceste modele, care permite de a înţelege suprapuse orientate spre stimuli o persoană este în prezent participarea (în cazul în care este îndreptat atenţia lor), sau în cazul în care, cu obiecte vizuale pentru a identifica care clasa de obiecte în care persoana este de imagini (de exemplu, se confruntă cu, constructii, mobilier) şi chiar de obiecte "culoare şi orientare. [15] Aceste procese sunt complexe şi departe de a fi înţeleasă în acest moment. Mai multe studii au evidenţiat cât de mică şi mare-pentru-pentru creier semnale corela cu anumite funcţii cognitive, cum spaţiale caracteristici ale modelelor modifica în timp şi sub diverse influente; în ce măsură este posibil să se extrapoleze de activare diverse modele de subiecte; etc Se crede, totuşi, că precis cunoştinţe de "calculele" efectuate în creierul uman nu este esenţială pentru construirea de BCIs relevante. [20] Frecvente data mining tehnici pot fi aplicate pentru a extrage informaţii utile din diferite neuroimaging senzori si stabili conexiuni cu anumite cognitive membre.
Există totuşi probleme importante care pot afecta grav succesul aparat de BCI, în domeniul de cunoaştere reprezentare. Două probleme sunt minore generalizare dincolo de timp şi de problema diferite instanţe de aceeaşi stare mentală. Este cunoscut faptul că creierul zonele de activare a modelelor de aceeaşi mentală membre pot fi diferite în timp. Diferite instanţe de aceeaşi stare mentală pot da imagini modificate, de asemenea, în funcţie de variaţiile contextuale şi de alţi factori. [15] Acest lucru necesită flexibil spaţiale resampling şi algoritmi de clasificare pentru a fi utilizate după cum a sugerat Haynes şi Rees. Credem că aceste probleme vor fi rezolvate, la dezvoltarea de tehnici eficiente.
Mai multe dubioase întrebare este problema de extrapolare a romanului cognitive membre. Haynes şi Rees nota că numărul de posibil perceptuale sau cognitive state este infinit, întrucât numărul de categorii de formare este în mod necesar limitată. [15] Este esenţial, prin urmare, că decodorul ar putea fi instruiţi pentru a generaliza experienţa obţinute de la mici de formare set complet de noi categorii. Ar fi posibil prin mijloace de extrapolare dacă creier de activare modele sunt, de fapt, în unele sistematic aranjate parametric spaţiu. Acest lucru rămâne de găsit, cu toate acestea, se crede că este posibil, cel puţin pentru anumite tipuri de conţinut mentale [15]. În cazul în care spaţiul abstract forma de clasificare a modelelor neuronale există într-adevăr s-ar permite să ne teoretiza asupra posibilităţilor de cartografiere a creierului uman cognitive state pe Global de cunoştinţe Harta descrise mai devreme în această lucrare. Cu condiţia ca acesta este atins, mai sus menţionate "problemă de cerere iniţială" vor fi rezolvate şi "ideal uman <-> KRS" lanţ va fi posibil să se stabilească.
3.5 Learnable Decoder
Ca şi în prezent este cunoscut datorită la cele mai recente realizări ale creierului imagistica că este posibil să se distingă de activare din diferite domenii creierului în cazul în care persoana se gândesc la diferite subiecte, putem presupune că este posibil să se creeze un decodor learnable harta umane pentru a iniţiat cognitive membre pe o hartă a cunoştinţelor de cunoştinţe Reprezentarea System. Prin urmare, un mod ideal de interacţiune om-calculator ar putea fi stabilit, permiţând o mare viteză şi precizie de comunicare cu un sistem. Nu va fi mai puţin de pierderi de date datorită eliminării lingvistice stadiu de interacţiune. Viteza şi eficienţa de interacţiune va creşte în consecinţă. Aceste două elemente vor permite oamenilor de diferite profesii de a creşte eficienţa muncii lor în mod semnificativ. Din [6, 15] ştim că există anumite regularities de locaţie din creier impulsurile şi subiecte de cunoaştere, care sunt comune pentru toate om; putem apela aceste funcţii antropice. Cu toate acestea, este cunoscut faptul că majoritatea din aceste link-uri ar trebui să fie individualişti. Prin urmare, trebuie să fie individual, decodor adaptive.
De asemenea, este evident că eficienţa de decodorul va depinde de persoanele fizice şi formarea lor cu ea şi capacitatea de a învăţa. Putem presupune acest lucru de la experimente cu interfeţe artificiale fiind folosite pentru a înlocui pierdut membrelor. Oameni şi animale au fost capabili să-şi concentreze mental într-un mod special pentru a muta un manipulator artificiale şi chiar de a învăţa de control real corporale şi artificiale o separat [20].
Având în vedere menţionate mai sus, noi credem că o reţea neuronale artificiale - mecanism este cea mai bună soluţie de un decodor problema.
Decoder procesul de invatamant,
1) Aleatoare, cu punctul de coordonate în spaţiu de GKM multidimensionale este selectat.
2) Mai multe documente care au mapările în zona vecina (Euclidian metric este utilizat) sunt selectate şi afişate la un operator uman.
3) Operator concentratele sale de vedere pentru a participa la cognitively anumit subiect şi legate de obiectele din memorie.
4) Neuroimaging de date este în curs de colectate de fMRI hardware peste o anumită perioadă de timp.
5) Datele sunt prelucrate prin intermediul unui resampling spaţiale şi de reducere a zgomotului algoritm care au ca scop de a extrage informativ modele caracterizează curent repetare de formare.
6) Preparate de date sunt preluat la intrările de neuronale reţea. GKM de coordonatele unui punct selectate sunt preluat de rezultate, prin urmare, formarea de reţele neuronale de a se asocia specifice creierului activare modele cu GKM coordonate.
Figura 3.1 Procesul de formare a decodor
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Comentarii recente