Idealna znanja ili Global System Knowledge Map
Prema Zastupanje idealistički Knowledge System: Global Knowledge Map
Taras Filatov
Sažetak
Jedan od najznačajnijih problema s kojima spriječiti daljnji razvoj u područjima znanja i Umjetna inteligencija je problem semantičke poravnanje ili znanje mapping. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Napredak u svojoj rješenje će biti uvelike od koristi za zadaćama pronalaženja informacija, ontologija poravnavanje, relevantnost izračun razumijevanje teksta itd. U radu se koncept višedimenzionalno globalnom znanju sitea, razrađene kroz bez nadzora ekstrakciju zavisnosti od velikih dokumenata korpusa je predložila . Osim toga, problem izravne Human - sustav znanja sučelje obratio i jedan pojam adaptivne dekoder predloženi za interakciju s prethodno opisanim ujedinjen mapping model. U kombinaciji ta dva pristupa su predloženi kao osnova za razvoj nove generacije znanja sustava.
Ključne riječi: znanja, znanje kartiranje, ljudska računalu interakcije, ontologija poravnavanje, gornji ontologija, relevantnost izračun, pretraživanje informacija, dokument sličnosti
1. Uvod
U društvu, u području znanja postaje značajniji od prošle godine [25]. Ljudi uvijek su pokušaji da se proučavanje i klasificirati znanje o znanju. Ne možemo naći reference s već Sokrat u peti stoljeću prije Krista [33] na rascvjetan logika i epistemologija [28] u srednjem vijeku. Budući da se problem smatra se da je važno u prošlosti, teško je precijeniti njegova značenja tijekom ere informacija.
Moderna tehnologija pretjeranih obdarila čovjeka s poplavama podataka koji se teško systematise i procesa. Za osobu koja će postati specijalisti u određenom području koje je potrebno godinama učenja i zahtijeva naknadno informativan utrku kako bi išli ukorak s najnovijim profesionalnim trendove.
To je popularno mišljenje među znanja inženjera i data mining stručnjaci koji podaci dostupni u otvoreni pristup je dovoljno za izdvajanje istinoljubiv činjenica o praktički bilo koji aspekt našeg života, pa čak i predvidjeti buducnost. Jedini problem je da na rješavanju inteligentniji obraditi podatke iz mnoštva izvora. [35].
Ovaj faktorima potražnje nove generacije znanja sustave kako bi pomogli čovječanstvu systematise, pristup i korištenje svoj kolektivni znanja.
U trenutnom papira smo predložiti idejama za razvoj novog doba znanja sustava (KRS).
Vjerujemo da nedavna dostignuća u pojedinim područjima znanosti i uskoro će dovesti do ogromne proboj u okviru ljudskih znanja i ljudske interakcije-računalo. Ovo će otvoriti nove horizonte i uvelike povećati efikasnost ljudskog rada u mnogim aplikacijama. Jedina stvar koju treba uraditi je da ta dostignuća zajedno.
Idealna KRS treba osigurati korisnik sa praktičniji pristup svim znanja čovječanstva. Njezini elementi su dakle:
- ljudsko koji želi pristupiti nekim komadom znanja je on / ona zainteresovani,
- skladištenje podataka, a
- posrednik u sustav pružiti sučelje za ljudska za pristup znanju.
Prepreke koje nastaju tu su uzrokovane ograničenja ljudskih sposobnosti i sadašnje tehnološke razine.
2. Data storage
2,1 state of the art
Znanja zahtijeva sustav za pohranu podataka, osim ako je u mogućnosti da preuzmete potrebne dokumente iz vanjskih izvora u stvarnom vremenu. Možemo Outlineu dvije pobjede pristupi za idealan KRS od danas: struktriran ručno upravljani globalni znanja kao što su skladišta ontologies i automatizirane sustave koji uključuju indeksiranje i pronalaženje većine i dostupan puni sirovom zbirka dokumenata (World Wide Web) kao što je tražilicama. Problem je prvi pristup je u svojim ručnim prirodi - bilo kakve pokušaje da izradi i održavanju globalne ljudske baze znanja rezultirat će kompromis između detalj, aktualnosti i upotrebljivost. ], UFO (Unified Framework Ontology) Bez obzira ima više uspješnih gornjem ontologija projekte kao što su Cyc [23], WordNet [12], DNS, Sumo itd i teorijsko tijeku rasprava kao čeznuti kao istraživački cilj razraditi standardizirani jedinstvenog globalnog ontologija pod imenima SUO (Standard Upper ontologija ) [27], UFO (Unified Okvirni ontologija) itd.
Drugi pristup je postao povijesno preovlađujući zbog WWW bude najveći, opsežan i up-to-date korpus dostupnih podataka za automatizirane obrade današnjice. Ipak, u kontrastu najprije pristupa problemima automatizirano pronalaženje informacije značajnu ulogu ovdje. Problemi razumijevanja teksta i obrada prirodnoga jezika su jedan od najzahtjevnija u AI ipak i dalje ostaje bez učinkovite rješenje. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. U susjedstvu su problemi klasifikacije i relevantnosti izračun, takozvani 'web uskupljavanje' problema [1]. Drugi pristup (automatizirani indeksiranje), dakle, ima velike nedostatke u točnost aportiranje.
Postoji stalna nastojanja na unošenje poboljšanja navedenih pristupa u cilju prevazilaženja tih problema. Na primjer, uz jedinstven base ontologija projekata (SUO, BULO) ima nekih pokušaja da se razvije ontologija poravnanje i ontologija mapping tehnike kako bi se postojeći ontologies donose zajedno međusobno i sa drugim vrstama baza znanja [5, 17]. Često se predlažu za smanjenje nedostataka priručnika administracije u slučaju ontologies kroz automatizirani dohvat informacija (pretraživač tehnologije). S druge strane, bolje standarde hipertekstualni se razvijaju kako bi moguće ručno odrediti informacije koje pomažu tražilicama razumjeti značenje commonsense WWW dokumenata i hiperveze među njima [24]. Potrebno je shvatiti da su ta hibridna rješenja nose nedostataka u odgovarajuće tehnike uz prednosti.
Jedan od tih mana objedinjuje pristupe i njihovu integraciju čini nemogućim: nema standarda kartiranje i uspostavi odnosa između dokumenata i pojmova u različitim sistemima. Problem će biti riješen u slučaju jedan od sustava s fiksnom matematički interpretable hijerarhije, kao što su ontologies svlada postojeće pristup (WWW). Ipak ovo se čini malo vjerojatno zbog navedenih razloga. Nezavisni posrednik standard je potencijalna rješenja ovog problema. Ima više inicijativa o smjeru povezivanja i uzajamno preslikavanje baze znanja različitih vrsta među kojima se nalazi na površini od ontologija mapping. Inicijative imaju jednu zajedničku mana: no single standard kartiranje i uspostavi odnosa između dokumenata. Nakon toga, nijedan od njih je vjerojatno da će postati široko priznata, osim standardnih više održivo rješenje je razvijeno.
2.2 koncepta globalne Knowledge Map (GKM)
Vjerujemo da je moguće razraditi jednu standard za mapiranje znanja po izgradnji logički prostor s ciljem projekcija stvarnog svijeta poznavanje pojmova. Takav model (neka nas nazvati Global Knowledge Map) treba odražavati razinu sličnosti dokumenata i koncepte mapirani na njega.
Glavna svrha model je:
- Poravnanje i unakrsne kartiranje dokumenata i koncepata (WWW, ontologies, e-knjižnice, imenike i sl.)
- Pronalaženje informacije kroz pregledavanja
- Precizno automatiziran obračun commonsense relevantnosti
GKM stoga zahtijeva matematičko / logički model znanja skladiątenja s određenim uvjetom: bića optimalno za zadatak znanja, odnosno interakciju s ljudskim. Za ispunjenje ovog stanja modela moraju odražavati u dimenzionalnost ili njegova struktura je struktura ljudskog znanja.
Zahtjevi stoga su:
- Dimenzionalnost i kartiranje.
Glavni faktor za dimenzionalnost je značenje (ili teme).
- Svaki koncept ljudskog znanja svibanj se preslikavaju na točku s određenim koordinatama u sustavu prostora.
- Svaki dokument ili teksta svibanj se preslikavaju na broj bodova (Dokument je podijeljen na memi - smislene dijelove) ili jedan bod.
- Relevantnost izračuna.
- To je moguće matematički izračunati relevantnošću između dva koncepta po izračuna udaljenost između njihova odgovarajuća projekcija točaka u prostoru.
- Stoga je moguće izračunati 'sličnosti' između dokumenata i koncepata koje izračuna udaljenost između njihovih preslikavanje.
- Homogenost prostora.
- Prostor je jednoliko (homogenost) i kontinuiranog
- Koordinate odražava smisao i udaljenosti između točaka odražava razliku u značenju, tako da ako se točke C nalazi se između A i B onda to znači da je koncept C odnose na oba A i B jednako.
- Moguće je 'browse' prostora nalaženju izvora znanja preslikanog od susjednog područja.
Izgradnja matematičkog modela takvih prostora omogucuje razvoj Global Knowledge Map. Nije vrijedno pokušava razraditi takav model (GKM) u priručniku način zbog razloga navedenih informacija rast i trajne promjene u ljudskom razumijevanju svijeta. Vjerujemo da je moguće izvaditi i pravila zavisnosti od raspoloživih corpuses tekstova i koristiti kao procesora za naše mapiranje svrhe.
U kamen naših pretpostavki je da je uopće moguće sitea razne predmete na ljudsko znanje jednog prostora i udaljenosti unutar dimenzionalnosti u potonjem odražava stupanj sličnosti između given subjekata. Ova pretpostavka se temelji na Johnson-Lindenstrauss njima se navodi da je skup točaka u srednjim n dimenzionalni prostor mogu Euclidian preslikanog dolje do N dimenzionalnog prostora Euclidian
(2,1)
tako da je udaljenost između bilo koje dvije točke promjene samo faktor (1
) [7]. The Vector Space Model se uobičajeno koristi u pronalaženje informacije i dokumente Tekst Kategorizacija predstavlja kao visoka dimenzionalna vektore [31]. Ovi vektori sadrže određene razine (ovisno o izabranom metric function) informacije koje je dovoljno da klasificirati temu originalnog dokumenta.
The Tychonoff's teorem [26] navodi da boda, što predstavlja svojstva objekti jedne klase, bi trebao biti smješten bliže jedni drugima u vlasništvu prostora od točke do koje predstavljaju svojstva objekata drugih klasa. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. U našem zadatku to znači originalni vektor prostora n tekstova svibanj biti projicirana na fiksno N-dimenzionalnog prostora i korištenjem odgovarajućeg algoritma za kompresiju podataka / smanjenje dimenzionalnosti obzirom na teorem kompaktnosti i [22] kartiranje će se postići gdje su udaljenosti između točke predstavljaju relevantnost odgovarajuće dokumente.
Čimbenici koji utječu na preciznost od kartiranje:
- representativeness od metričku funkciju i veličinu značajke prostora
- veličinu, dispersity i kvalitetu dokumenata corpus
Pod uvjetom da je teorija je primjenjiva u današnjim uvjetima to ostaje da se nađe tehniku koja će se koristiti za razraditi i kartiranje. Predlažemo da se usredotočite na automatskim sredstvima zbog brojnih komplikacija izradu stručnih priručnika-based mapiranje neprimjenjiv.
2,3 Automatic GKM kroz generacije bez nadzora ekstrakcija (hipoteza)
Da bi se trebali sadržavati korisno GKM preslikavanje od značajnog broja stvarnih riječ (WWW) i dokumenata u svojoj strukturi predstavljaju zajedničko ljudsko razumijevanje svijeta. Nije stoga valja razmotriti bilo koji priručnik načine stvaranja GKM i punjenje s dokumenta preslikavanje. The data mining principe treba koristiti za izdvajanje zavisnosti zastupaju znanja iz postojećih korpusa dokumenata dostupnih za računalnu obradu i filtrirati nepotrebne podatke.
Tu su brojni pokušaji za ekstrakciju bez nadzora u zavisnosti tekstove ali je još uvijek sporna pitanje je li bilo koja tehnika je sposoban da pruži održivi ekstrakcija znanja kroz analizu velike zbirke dokumenata [10, 11, 21, 30].
Let's podijeliti faktora koji općenito utječu na sadržaj dokumenata u tri kategorije:
- Autori osobni faktori (osjećaje i motive za stvaranje teksta, fizičkog i moralnog stanja tijekom razmišljanja i pisanja)
- Jezik (pravila itd je jezik koji se koristi za pisanje dokumenta)
- Znanja (pojedinih dijelova ljudskog znanja autora odašilje izravno ili implicitno kroz dokument)
Ajmo pretpostaviti da je moguće obraditi sve tekstualne dokumente dostupne ljudskih autorima i ekstrakt svi ovisnost pravila. U ovom slučaju utjecajem faktora 1 će biti minimalne. Utjecaj faktora 2 ne mnogo važnosti s obzirom na sljedeće:
a) dokumente na više jezika može biti indeksirana, pa recipročno smanjenje utjecaja
b) jezik sama odražava ljudsko znanje [18], tako da se donekle je faktor 2 je subfactor od 3 pa čak i vađenje njihovih smjesa predstavlja zadovoljavajuće postignuće
To je teoretski moguće onda izvaditi info uglavnom odgovara ljudskog znanja izložena kroz raspoložive dokumente. Ove informacije transformiraju prostor za kartiranje će nam pružiti hipotetično održivog GKM.
2,4 Implementacija (eksperiment)
U prostoru izgrađena svakog dokumenta treba biti jedinstveno na preslikanog koordinirati. The 'pregledavanja' u prostor ili udaljenosti usporedba trebala bi otkriti da situacija dokumenata ili njihovi klasteri odraz njihove relevantnosti i da je moguće dodijeliti određenom temom imena na određene koordinate u prostoru.
Naši eksperimenti korištenjem 2 i 3-dimenzionalnim Kohonen SOM s lokalnom zbirke dokumenata otkriva da su udaljenosti između projekcije dokumenti nisu stabilni tijekom niza pokreće. To je po našem mišljenju dokaz o činjenici da dimenzionalnosti od sajta koji je nedovoljno usklađeno u Johnson-Lindenstrauss njima spomenuto.
Nažalost, nemoguće je provesti eksperiment s pravom dimenzionalnost. Na primjer, prema Johnson-Lindenstrauss njima, na karti 20.000 dokumenata dopuštajući 10% error on će zahtijevati 58 dimenzija. To zahtijeva proračuni koji su iznad modernim računalima 'kapacitet.
Vazno je napomenuti da se ovdje, dok se njima daje maksimalnu dimenzionalnosti za mapiranje prostora dozvoljava da ispuni uvjet single projekcija, nije potrebno minimalne efektivne vrijednosti. Lema daje vrijednosti za skup n bodova tj. za najgori slučaj koji nije vjerojatno da će se pojaviti u praksi. Metode detekcije dimenzionalnost treba koristiti za izračunavanje efektivne dimenzionalnost podataka i stoga utvrditi točan broj dimenzija za kartiranje pojedinih podataka set. Postoje poznate tehnike za to što dolaze iz pozadine površinske obnove. Jedan od najnovijih je djelo S. Cheng, Y. i Z. Wang Wu [4] u kojoj dimenziji metode detekcije preko Principal Component Analysis [8] predstavljaju. Dakle, unutarnji dimenzionalnost podataka svibanj biti izlučene. Kako je ova vrijednost u praksi je niži od maksimalnog dimenzionalnost potrebnih za projekciju isti broj dokumenata u najgorem slučaju teorijskih predmeta, ovo daje značajan smanjiti u izračun vremena. Alternativno za istu svrhu možemo uzeti u obzir na temelju iterativne metode evaluacije. Svrha je smanjenje dimenzionalnosti u našem slučaju je uspostaviti učinkovit kartiranje gdje commonsense sličnost između informacijski izvori se izražava kroz Euclidian udaljenost između projekcija točaka. Uzimanje bilo koje tehnike redukcije dimenzionalnosti na temelju slučajnog odabira iz ulaznih podataka set (kao što su Principal Component Analysis, Samopomoć organizacijskog Mape, Sammon obnovu ili triangulation), u slučaju kada izlazna veličina je manja od odgovarajućim, projekcije će biti nestabilna i uz svaki recalculation na kartiranje će biti drugačija, a udaljenosti između projekcije neće sačuvati. Možemo također pretpostaviti da kad je na snazi od dimenzionalnost ulaznih mnogolika se koristi za kartiranje, na udaljenosti će sačuvati s određeni stupanj slobode, ovisno o redukcija dimenzionalnosti metodom koja se koristi. Alternativa, dakle, rješenje je slučajni izbor redukcije dimenzionalnosti tehniku u kombinaciji sa inkrementalni dimenzionalnost paralelno evaluaciju u mapping. 32]. Razmotrimo, primjerice, tehnike uzgoja SOMs opisano u [19, 32]. S ciljem da se smanji Izračun vrijeme, broj se povećava dinamički čvorovi s novim čvorovi se ravnomjerno raspodijeljena među one stare i njihove težine vektori se postaviti na sredstva za susjednim vektore originalne težine. Istom tehnikom primijenjena dimenzionalnosti za (D) će dati priliku da procijene D svaki korak po korak. Vrednovanje kriterija bi se stabilizacija od udaljenosti između projekcija. U tu svrhu su dva ili više samostalno organiziranje karte svibanj se izvoditi paralelno s udvojenih udaljenosti između pojedinih projekcija bića u odnosu na svaki iteracija. Pod iteracija ovdje shvaćamo u fazi kada je dimenzionalnosti od SOM je porasla, a mreža je stoga stabiliziran s novim parametrima.
Sažetka navedene ćemo predložiti sljedeće eksperimentalni model za evaluaciju su bolji pristup za utvrđivanje Globalna Mapa znanja iz zbirke tekstualne dokumente.
The datase t: vektorski prostor modela koji će se koristiti (svaki dokument prikazan kao vektor sa značajkama kao dimenzije i značajke 'redovima kao koordinate u odgovarajuće dimenzije).
Značajka odabira funkcija: najučinkovitije biti definirana.
Vektorska veličina: biti uspostavljena empirijski.
Obrada podataka i skladištenje.
A smanjenje dimenzionalnosti tehniku treba koristiti za preslikavanje. Postoje dva moguća pristupa:
a) unaprijed izračunati unutarnji dimenzionalnost i vrednovati različite metode redukcije dimenzionalnosti sa poznatim dimenzionalnosti od mapping;
b) 'inkrementalni pristup vrednovanja dimenzionalnost' s nekoliko preslikavanje se pokretati paralelno - samo metode sa slučajnim izborom ulaznih podataka svibanj se koristiti.
Ulazi: dokumenti 'značajka vektori.
Izlazi: GKM koordinata.
Evaluacija:
1) Commonsense vrednovanje prepiska između inicijalne dokumente i njihove udaljenosti Euclidian kartiranje projekcija.
2) Sporazum o stabilizaciji ovih udvojenih udaljenosti između projekcija kroz različite lansira u slučaju slučajnog odabira tehnikom koja se koristi.
3. Interface
3,1 Idealna znanja sučelje
Sučelje dio znanja System je važno kada je idealan sustav je objašnjeno. Obje zadaće prima zahtjeve od korisnika i prenošenje znanja natrag u njima su jednake važnosti sa zadaćama strukturiranje i pohranu podataka. U trenutnom papira Raspravljajuci putove prema znanja Systems novu generaciju i stoga je pitanje je overviewed interakciji kako bi se utvrditi da li je moguće da pruži idealistički sučelje kroz modernu tehnologiju.
The sučelja koje se koristi za podršku interakcije korisnika s ljudskom modernog znanja i informacija dohvat sustavi su uglavnom 'indeksiranje' tipa, odnosno korisnici moraju znati točno ono što su tražili i oni isto tako moram navesti da jezično. Čest primjer takvih sučelja je tražilici. Kao što smo gore navedenih, tražilice i korpus WWW dokumenata je najcjelovitijih i up-to-date znanja sustav dostupan danas, to je razlog njihove popularnosti. Istodobno je poznato da je 'indeksiranje' sučelje nije prirodno da se koristi za ljude, ali to je jedina alternativa kao 'pregledavanja' prilazi se uspostavio vrlo slabo [16]. Razlog za to je problem znanja kartiranje i poravnanje koje ne dopušta automatizirane klasifikacije i predstavljanje dokumenata u skladu sa svojim temama. Međutim, problem jedinstvenog znanja kartiranje biti riješen prostor, pojavljuju se nove mogućnosti za izgradnju popravila, više od prirodnih sučelja 'pregledavanja' tipa.
3,2 Visoka dimenzionalnost i vizualizaciju
Nakon što se spominje da je rezultiralo globalnom kartiranje prostor je vjerojatno da će biti n-dimensional gdje je n visok je potrebno za rješavanje problema vizualne reprezentacije. To je moguće za ljude da se zamisle 3D prostor, dakle, optimalne načine nd-> 3D reprezentacija se vrednovati. Redukcija dimenzionalnosti tehnike ili više zastupljenost pristupa preko sučelja se mogu koristiti.
Važno je da, uz pomoć znanja u ujedinjenoj mapiranje prostora greška minimiziran u obračun između relevantnosti dokumenata, i, štoviše, za pronalaženje relevantnih dokumenata pa čak i iz drugih sustava postaje trivijalan zadatak. Za krajnjeg korisnika to znači jednom sustavu je smještena na temu je on / ona zanimati, ona nikada neće dovesti korisnik nerelevantne dokumenata.
3,3 Informacije zahtjev lanac
Kada je zadaća predmeta kartiranje i lokacija, relevantnošću Izračun i znanja pregledavanja su prostor riješen najvažniji zadatak koji ostaje da se riješi problem početnih zahtjeva. U državnom-of-the-art pronalaženje informacije sustavi sljedeće procese koji se obično uključiti se tražene informacije kada:
Ljudski dijela: 1) imaginacije -> 2) formiranju jezične konstrukcije -> 3) ručna tipkovnica unosa (glas unos) -> Machine dio: 4) jezične dekodiranje -> 5) podudaranja i lokacije -> 6) vizualizacija odgovarajućih dokumenata
Lanac je dug i očito je da gubitak podataka i korupcije je značajna zbog bračne jezične kodiranje i dekodiranje. Kao prvo, korisnik mora oblikovati na kognitivni slika u kratkim jezične kaznu. Kao drugo, sustav mora dekodirati kaznu, kako bi se razumjeli temu korisnika interesa. Opisani lanac inicijalni zahtjev uzroke nezadovoljstva korisnika moderne pretraživače zbog nemogućnosti da se sustav "Razumijem" zahtjev rezultiralo strahoviti gubitak vremena za krajnjeg korisnika. Stupnja te pronalaženje pogrešaka i inconveniences uzrokovane sučelje je značajna ograničenja te će uvelike smanjiti učinak preciznijeg pronalaženja i lokacija dokumenata koje je uvela jedinstven mapping.
Stoga je potrebno uzeti u obzir, barem teoretski, mogućnost stvaranja idealno kratki lanac ljudske <-> System znanja interakcijom s jedinicama uzrokuje gubitak podataka biće eliminirani:
Ljudski dijela: 1) imaginacije -> [zahtjev bitak minuli kroz izravne ljudske mozga-konverter GKM koordinira] -> 2) Usklađivanje i lokacije -> 3) vizualizacija odgovarajućih dokumenata
Mi pregled najnovijih dostignuća u području Brain Computer sučelja (BCI), za ovu svrhu.
3,4 Brain-Computer Sučelja
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Istraživanje o BCI je odlazeći na za više od 30 godina, a područje je još uvijek jako mlada i razvija se veoma brzo. Do nedavno trenutak m ost značajan napredak na tom području su u umjetni ud kontrolu automobila tj. funkcije mozga [ 3] te interpretaciju i obradu vizualnih signala. Ovi uspjesi su verificirana tijekom višestrukih eksperimenata koji uključuju životinjskih i ljudskih subjekata. Istraživači izvješće uspješnu integraciju mehaničkih ili elektroničkih uređaja kada životinja ili ljudi saznali za kontrolu uređaja, uz pomoć svog mozga; drugi izvještaj uspješan transfer i vizualnog dekodiranja signala [15, 20].
Mozak-računalo sučelja studije usko su vezani za područje funkcionalni neuroimaging, gdje različitih tehnologija razvijeni su za efikasno snimanje stanja mozga osobe kroz određene fizičke karakteristike. Većina od produktivnog aspekta BCI je nedavna zovu Funkcionalni neuroimaging tehnika Magnetic Resonance Imaging ) (FMRI) [6, 13]. Ova tehnika omogućuje snimanje dinamike krvi u različitim područjima mozga tijekom vremena, i sa visokom preciznošću. Ovo stoga omogućava da se uspostavi veza između obrasce aktivacije mozga različitih područja i određene aktivnosti i kognitivni procesi ljudskog. Važno je da ove tehnike, za razliku od mnogih alternativa je neinvazivni i ne uključuju injekcija. Neophodno je napomenuti da se ipak fMRI hardvera danas je još uvijek vrlo skupo i nezgrapan.
To je značajan da eksperimenti pokazuju da je mozak prilagođava na nove uvjete. Na primjer, kada su impulsi automobila koristi se za kontrolu automehaničara namještač ili računalo pokazivač miša, mozak je u stanju razlikovati i postupno naučiti kontrolirati namještač odvojeno od umjetnih ud. Lebedev spominje efekt 'plastičnost mozga "koja potencijalno omogućava da ugradite umjetne uređaji u tijelo reprezentacije. [20]
Novije publikacije u području neuroimaging još dodatno raspraviti mogućnost otkrivanja kognitivne države u [15]. To navodi na naše fokusiranje pozornosti na mogućnost primjene BCI-KRS u ljudske interakcije.
Poznato je da različiti kognitivni stanja povezanih s određenim objektima stvarnog svijeta odgovaraju određenim područjima mozga obrasce aktivacije. Dekodiranje tih obrazaca omogućuje da shvate što preklapaju osjeta orijentirana osoba je trenutno pohađa (gdje je njihova pažnja usmjerena je) ili u slučaju s vizualne objekte identificirati klasa objekata koja je osoba imaging (odnosno lica, objekti, namještaj), pa čak i objekte 'boje i orijentaciju. [15] Ovi procesi su složeni i daleko od toga da bude shvaćeno u ovom trenutku. Daljnja studija će otkriti kako niskog reda i visoke naručiti mozak signale korelacija sa određenim kognitivnim funkcijama; kako prostorne karakteristike i obrasci promijeniti tijekom vremena i pod različitim utjecajima, u kojoj mjeri je moguće izvesti potaknuće uzoraka različitih predmeta; i sl. Smatra se međutim da je preciznim znanjem 'izračunavanje' izvode u ljudski mozak nije presudno za izgradnju relevantnih BCIs. [20] Common Data Mining tehnike svibanj biti primijenjena na izvuci korisne informacije iz raznih neuroimaging senzora i uspostaviti veze s određenim kognitivnim stanjima.
Postoje ipak važnim pitanjima koja mogu ozbiljno utjecati na uspjeh primjena BCI u području znanja. Dvije manje problema generalizacija preko vrijeme i problem različitih primjera iz istog mentalnog stanja. Poznato je da aktivacija mozgu područjima obrazaca istog mentalnog stanja svibanj razlikuju se tijekom vremena. Različite instance istog mentalnog države svibanj popuštanje modificirana slika kao i, ovisno o kontekstualnom varijacije i drugim čimbenicima. [15] To zahtijeva fleksibilan i klasifikacija prostornih resampling algoritme koji će se koristiti kao predlaže Haynes i Rees. Vjerujemo da će ti problemi biti riješeni na razvoj efektivne tehnike.
Više sumnjivo pitanje je problem u romanu ekstrapolaciji kognitivnog stanja. Haynes i Rees, imajte na umu da je broj mogućih uočljive ili kognitivnim država je beskonacan, dok je broj treninga kategorije je nužno ograničen. [15] To je, dakle, da je presudna dekoder može biti osposobljeni za generalizirati iskustva dobivena iz malih trening postavljen na potpuno nove kategorije. Bilo bi moguće kroz ekstrapolaciji ako mozga obrasce aktivacije zapravo uređen u nekom sustavnom parametarski prostor. To ostaje da se nađe, međutim, vjeruje se da je moguće barem za neke vrste mentalnih sadržaja [15]. U slučaju sažetak oblik prostora za klasifikaciju neuronskih obrazaca zaista postoji da bi nam omogućiti da teoretizirati o mogućnostima mapiranje ljudskog mozga spoznajna stanja na Global Knowledge Map opisano ranije u ovom članku. Provided To se postiže, navedene "problem početnih zahtjev će se riješiti i" idealne ljudske <-> KRS "lanac će biti moguće uspostaviti.
3,5 Learnable dekoder
Kao i sada je poznato zahvaljujući najnovijim dostignućima oslikavanje mozga da je moguće razlikovati aktivaciju različitih područja mozga kad osoba razmišlja o različitim temama koje svibanj pretpostaviti da je moguće stvoriti learnable dekoder na kartu ljudske inicirane kognitivni državama na spoznaja mapa znanja Zastupanje System. Dakle idealan način ljudskom interakcijom računalo može biti uspostavljena dopuštajući ogromne brzine i preciznosti za komunikaciju sa sustavom. Tu će biti manji gubitak podataka uslijed uklanjanja jezičkih fazi interakcije. Brzine i učinkovitosti interakcije će povećati konzekventno. Ova dva faktora će omogućiti ljudima različitih zanimanja za povećanje djelotvornosti njihova rada značajno. From [6, 15] znamo da postoje određene zakonitosti lokacije mozga impulse i subjekata znanja koja su zajednička za sve ljude; možemo nazvati ovih značajki antropogenih. Međutim poznato je da većina od tih linkova dužni biti individualistički. Stoga je dekoder mora biti individualno prilagodljiva.
Također je očito da je učinkovitost dekoder će ovisiti o pojedincima i njihovim trening s njom i sposobnost da uče. Možemo pretpostaviti iz ovog eksperimenti s umjetnom sučelja se koriste za zamjenu izgubljene udove. Ljudi i životinje su mogli koncentrirati mentalno na poseban način za pomicanje umjetno manipulator i čak naučiti kontrolirati real grana i umjetne jedan zasebno [20].
S obzirom na navedene vjerujemo da umjetne neuronske mreže - mehanizam zasnovan je najbolje rješenje je dekoder problem.
Dekoder's proces učenja
1) Stvar sa slučajnim koordinate u prostoru višedimenzionalno GKM je odabrana.
2) Višestruki dokumenti vlasništvo njihovih preslikavanje u susjednom području (metric Euclidian se koristi) odabrana su i prikazani u ljudskom operateru.
3) Operator koncentrira njegov / njezin um cognitively da prisustvuju given topic i srodnih objekata u memoriji.
4) The neuroimaging Podaci se prikupljaju putem fMRI hardvera u određenom vremenskom razdoblju.
5) Podaci su obrađeni kroz prostorne resampling i buke s ciljem smanjenja algoritam za izdvajanje informativan obrasce characterizing trenutni iteracija obuke.
6) Pripremili podaci su preuzeta do ulaza u neuronske mreže. U GKM koordinate točke odabrane su preuzeta do izlaza stoga obuku neuronskih mreža u mozgu suradnik specifične obrasce aktivacije s GKM koordinata.
Slika 3.1 Proces obuke od dekoder
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Recent Comments