Ideale Knowledge Representation System o Global Knowledge Mappa
Verso idealistica Knowledge Representation System: Global Knowledge Mappa
Taras Filatov
Abstract
Uno dei più importanti problemi che ostacolano l'ulteriore sviluppo nei settori della conoscenza e di rappresentanza di Intelligenza Artificiale è un problema di allineamento o di conoscenza semantica mappatura. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. I progressi nella sua soluzione sarà molto utile per i compiti di recupero delle informazioni, ontologia di allineamento, la pertinenza di calcolo, la comprensione del testo ecc Nel documento il concetto di conoscenza globale multidimensionale mappa, elaborata attraverso senza estrazione di dipendenze dai grandi corpus dei documenti, si propone . Inoltre, il problema della diretta umani - Knowledge Representation Sistema interfaccia è destinataria e un concetto di adaptive decoder proposto ai fini di interazione con precedentemente descritto mappatura modello unificato. In combinazione questi due approcci sono proposti come base per uno sviluppo di una nuova generazione di sistemi di rappresentazione della conoscenza.
Parole chiave: rappresentazione della conoscenza, la conoscenza di mappatura, computer di interazione umana, ontologia allineamento, superiore ontologia, la pertinenza di calcolo, il recupero delle informazioni, documenti somiglianza
1. Introduzione
Nella società, il campo di rappresentazione della conoscenza è diventata più significativo negli ultimi anni [25]. La gente ha sempre tentato di studiare e classificare la conoscenza della conoscenza. Siamo in grado di trovare i riferimenti da quanto prima Socrate nel V secolo aC [33] per la fioritura di logica e di epistemologia [28] nel Medioevo. Poiché il problema è stato considerato importante in passato, è difficile sopravvalutare il significato, durante l'epoca delle informazioni.
Le moderne tecnologie hanno dotato l'umanità con le inondazioni eccessivo dei dati che sono difficili da sistematizzare e di processo. Per una persona di diventare uno specialista in una determinata zona ci vogliono anni di apprendimento e richiede un successivo informativo corsa per stare al passo con le ultime tendenze professionali.
Si tratta di una credenza popolare tra conoscenza e data mining ingegneri specialisti che le informazioni disponibili in libero accesso è sufficiente per estrarre veritiere fatti praticamente su ogni aspetto della nostra vita e anche prevedere futuro. L'unico problema da risolvere è quello di elaborare le informazioni intelligente da molteplici fonti. [35].
Questo fattori di domanda nuova generazione di sistemi di rappresentazione della conoscenza per aiutare l'umanità sistematizzare, l'accesso e utilizzare la propria conoscenza collettiva.
Nel corso della carta che proponiamo idee per lo sviluppo di un nuovo sistema di età Knowledge Representation (KRS).
Crediamo che i recenti risultati ottenuti in alcuni settori e scienze presto portare a un enorme passo avanti nel campo di applicazione della rappresentazione della conoscenza umana e l'interazione uomo-computer. Questo ci permetterà di aprire nuovi orizzonti e di aumentare notevolmente l'efficacia del lavoro umano in molte applicazioni. L'unica cosa che deve essere fatto è quello di portare questi risultati insieme.
KRS ideale dovrebbe fornire un utente con un comodo accesso a tutte le conoscenze del genere umano. I suoi elementi sono quindi:
- un uomo che vuole accedere ad alcune pezzo di conoscenza si tratta di interesse,
- uno di memorizzazione dei dati, e
- l'intermediario del sistema di fornire una interfaccia di accesso alla conoscenza umana.
Gli ostacoli che si presentano qui sono causati da limitazioni di capacità umane e l'attuale livello tecnologico.
2. L'archiviazione dei dati
2.1 Stato di avanzamento del
Sistema di rappresentazione della conoscenza richiede la memorizzazione dei dati a meno che non sia in grado di recuperare i documenti necessari da fonti esterne in tempo reale. Siamo in grado di delineare due strategie vincenti per un ideale KRS di oggi: strutturati gestiti manualmente conoscenza globale depositi come ontologie e sistemi di indicizzazione automatica e il reperimento delle più complete e accessibili greggio raccolta documenti (World Wide Web), come ad esempio i motori di ricerca. Il problema del primo approccio è nella sua natura manuale - qualsiasi tentativo di creare e mantenere la base di conoscenza globale umano si tradurrà in compromesso tra il dettaglio, l'attualità e l'usabilità. ], UFO (Unified Framework Ontology) Nonostante ci sono più di successo superiore progetti come ontologia Cyc [23], WordNet [12], DNS, ecc SUMO discussioni teoriche in corso e fintanto che la ricerca finalizzata ad elaborare un sistema unificato a livello mondiale ontologia con il nome di SUO (Standard Upper Ontology [27]), UFO (Unified quadro Ontology) ecc
Il secondo approccio è diventato storicamente prevalenti a causa di WWW è il più grande, completo e aggiornato corpus di dati disponibili per il trattamento automatizzato oggi. Tuttavia, in contrasto al primo approccio, i problemi di reperimento di informazioni automatizzate svolgono un ruolo significativo qui. I problemi di comprensione del testo e di trattamento del linguaggio naturale sono uno dei più impegnativi in AI e tuttavia rimangono ancora senza soluzione efficace. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Accanto sono i problemi di classificazione e la pertinenza di calcolo, il cosiddetto 'web clustering' problema [1]. Il secondo approccio (l'indicizzazione automatica), quindi è importante manca l'accuratezza di recuperarli.
Ci sono in corso sforzi per portare miglioramenti alle strategie di cui sopra al fine di superare questi problemi. Ad esempio, con base unificata ontologia progetti (SUO, BULO) ci sono alcuni tentativi di sviluppare l'allineamento e l'ontologia ontologia tecniche di mappatura, al fine di portare inesistente ontologie insieme gli uni con gli altri e con altri tipi di basi di conoscenza [5, 17]. Spesso è proposto di ridurre le carenze del manuale di gestione in caso di ontologie con i mezzi di recupero delle informazioni automatico (motore di ricerca delle tecnologie). Dall 'altra parte, il miglioramento delle norme ipertestuale sono in fase di sviluppo al fine di rendere possibile specificare manualmente le informazioni per aiutare i motori di ricerca capire il significato di CommonSense WWW documenti e collegamenti ipertestuali tra di loro [24]. È necessario comprendere che queste soluzioni ibride portare le carenze tecniche dei corrispondenti lungo con vantaggi.
Una lacuna unisce questi approcci e rende impossibile la loro integrazione: non esiste uno standard di cartografia e di stabilire relazioni tra i documenti e concetti in diversi sistemi. Il problema potrebbe essere risolto nel caso in cui uno dei sistemi con la gerarchia fissata matematicamente interpretabile come ontologie supera l'attuale approccio (WWW). Tuttavia questo sembra poco probabile a causa di motivi di cui sopra. Intermediario indipendente standard è una possibile soluzione a questo problema. Ci sono diverse iniziative in direzione di collegamento e di conoscenza reciproca mappatura basi di diversi tipi, tra cui vi è uno spazio di ontologia mappatura. Le iniziative hanno un comune lacuna: nessun tipo di cartografia e di stabilire relazioni tra i documenti. Di conseguenza, nessuno di essi è suscettibile di diventare uno standard ampiamente riconosciuto a meno che una soluzione più sostenibile è stato sviluppato.
2.2 Il concetto di Global Knowledge Map (GKM)
Riteniamo che sia possibile elaborare un unico standard per la mappatura della conoscenza mediante la costruzione di uno spazio logico con l'obiettivo di proiezione del mondo reale conoscenza concetti. Tale modello (ci chiamano Global Knowledge Map) dovrebbe riflettere il livello di somiglianza dei documenti e dei concetti mappato su esso.
Scopo principale del modello è il seguente:
- Allineamento e cross-mapping dei documenti e dei concetti (WWW, ontologie, e-biblioteche, directory, ecc)
- Il recupero delle informazioni attraverso la navigazione
- Precisazioni calcolo automatico pertinenza di CommonSense
GKM richiede quindi un matematico / modello logico della conoscenza di stoccaggio con una specifica condizione: essere ottimale per il compito di rappresentazione della conoscenza umana, vale a dire l'interazione. Per l'adempimento di questa condizione deve riflettere il modello nella sua aspetti della sua struttura o la struttura della conoscenza umana.
I requisiti sono quindi:
- Dimensioni e la mappatura.
Il principale fattore per l'aspetti è il significato (o un argomento).
- Ogni concetto di conoscenza umana può essere mappato su un punto con una specifica le coordinate nel sistema locale.
- Ogni documento o testo può essere mappato su un certo numero di punti (documento è suddiviso in memi - significativi pezzi) o un punto.
- Pertinenza calcolo.
- E 'possibile calcolare matematicamente pertinenza tra due concetti calcolando la distanza tra i loro punti corrispondenti proiezione nello spazio.
- È quindi possibile calcolare 'somiglianza' tra i documenti e concetti calcolando la distanza tra le loro associazioni.
- L'omogeneità dello spazio.
- Lo spazio è uniforme (omogenea) e continua
- Coordinate riflettere sul significato e le distanze tra i punti di riflettere la differenza di significato in modo che, se il punto C si trova tra A e B, allora significa concetto C è legato ad entrambi A e B, allo stesso modo.
- E 'possibile' navigare 'trovare lo spazio della conoscenza fonti vicine al tracciato settori.
Costruire un modello matematico di tale spazio permette lo sviluppo di Global Knowledge Map. Non è utile cercare di elaborare un tale modello (GKM) in un modo manuale a causa di motivi di cui sopra di informazioni continuo cambiamento e di crescita umana comprensione del mondo. Riteniamo che sia possibile estrarre le dipendenze e le regole da corpuses a disposizione dei testi e l'utilizzo di questi processori per i nostri scopi di mappatura.
La pietra angolare della nostra ipotesi è che essa è in genere possibile la conoscenza umana mappa vari argomenti sul singolo spazio e le distanze all'interno di questi ultimi aspetti riflettono un livello di somiglianza tra soggetti dato. Questa ipotesi si basa su Johnson-Lindenstrauss Lemma affermando che una serie di n punti in alta euclidea spazio dimensionale possono essere mappati a uno spazio N dimensionale euclidea
(2,1)
tale che la distanza tra due punti qualsiasi cambiamenti solo da un fattore (1
[7]). Vector Space Model comunemente utilizzati in Information Retrieval e Text Categorization rappresenta documenti ad alto dimensionale vettori [31]. Questi vettori contengono certo livello (a seconda della funzione di un parametro scelto) di informazioni che è sufficiente per classificare l'oggetto del documento originale.
Il Tychonoff il teorema [26] stabilisce che i punti, che rappresentano le proprietà di oggetti di una classe, deve essere collocato più vicino gli uni agli altri nella proprietà spazio rispetto ai punti che rappresentano le proprietà di oggetti di altre classi. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. Nel nostro lavoro si intende l'originale spazio vettoriale di n testi possono essere proiettate su fisso N-dimensionali e l'utilizzo di uno spazio adeguato algoritmo di compressione dei dati / aspetti riduzione a causa del teorema di compattezza [22], la mappatura sarà raggiunto quando le distanze tra punti rappresentano la pertinenza dei relativi documenti.
Fattori che influenzano la precisione delle mappe:
- rappresentatività delle metriche funzione delle dimensioni e della funzione di spazio
- dimensioni, dispersità e la qualità dei documenti corpus
A condizione che la teoria è applicabile in condizioni attuali resta da trovare tecniche che devono essere utilizzati per elaborare la mappatura. Si propone di concentrarsi su strumenti automatici a causa di complicazioni che molti esperti manuale basato su cartografia inapplicabile.
2,3 GKM generazione automatica attraverso l'estrazione senza (ipotesi)
Al fine di essere utile GKM dovrebbe contenere mappature del numero significativo di una vera parola (WWW) documenti e nella sua struttura rappresentano la comune comprensione umana del mondo. Non è quindi opportuno prendere in considerazione qualsiasi manuale modalità di creazione di GKM e riempimento con mappature documento. Il data mining principi dovrebbero essere utilizzati per estrarre le dipendenze che rappresentano la conoscenza esistente dal corpus di documenti disponibili per l'elaborazione e filtrare i dati inutili.
Ci sono stati numerosi tentativi di estrazione senza dipendenze di testi, tuttavia, è ancora un dubbio se una questione tecnica è in grado di fornire una conoscenza di estrazione sostenibile attraverso l'analisi di documenti di grandi dimensioni di raccolta [10, 11, 21, 30].
Let's dividere i fattori che influiscono in generale il contenuto dei documenti in tre categorie:
- Autori fattori personali (i sentimenti e le motivazioni per creare il testo, fisica e morale stati durante il pensiero e la scrittura)
- Lingua (le regole della lingua, ecc utilizzato per scrivere il documento)
- Conoscenza (alcune parti della conoscenza umana autore trasmette direttamente o implicitamente, attraverso il documento)
Let's presume che è possibile elaborare tutti i documenti di testo di autori umani ed estrarre tutte le norme di dipendenza. In questo caso l'influenza del fattore 1 sarà minimo. L'influenza del fattore 2 non è di grande importanza a causa dei seguenti:
a) documenti in più lingue possono essere indicizzati, pertanto mutuamente ridurre l'influenza
b) il linguaggio stesso riflette la conoscenza umana [18]; così, in una certa misura il fattore 2 è un subfactor di 3 e anche l'estrazione di loro miscela rappresenta un risultato soddisfacente
E 'quindi teoricamente possibile per estrarre informazioni più corrispondente alla conoscenza umana esposta attraverso documenti disponibili. Questa info trasformato la mappatura spazio ipoteticamente ci forniscono GKM sostenibile.
2,4 attuazione (esperimento)
Nello spazio costruito ogni documento deve essere mappata a coordinare unico. La 'navigazione' di spazio o le distanze di confronto che dovrebbe rivelare situazione di documenti o loro raggruppamenti riflettono la loro pertinenza e che è possibile assegnare alcuni nomi di argomento specifico coordinate nello spazio.
I nostri esperimenti di utilizzare 2 e 3 dimensioni con un Kohonen SOM locali di raccolta di documenti rivelano che la distanza tra le proiezioni di documenti non sono stabili in tutta la serie di lanci. Questo, a nostro avviso, è la prova del fatto che le dimensioni della mappa è sufficiente che sia conforme alle Johnson-Lindenstrauss Lemma di cui sopra.
Purtroppo è impossibile effettuare l'esperimento con un adeguato aspetti. Per esempio, secondo Johnson-Lindenstrauss Lemma, mappa di 20000 documenti che permettono di 10% di errore che richiederà 58 dimensioni. Ciò richiede che i calcoli di cui sopra sono moderni computer 'capacità.
La cosa importante da ricordare è che, mentre dà un massimo Lemma aspetti della mappatura dello spazio che permette di soddisfare la condizione di proiezione unica, non è necessario il minimo valore effettivo. Lemma fornisce un valore per una serie di n punti vale a dire per il caso peggiore, che non è in grado di comparire in pratica. I metodi per l'individuazione aspetti dovrebbero essere utilizzati per calcolare un efficace aspetti di dati e quindi determinare il numero corretto di dimensioni per la mappatura di particolare serie di dati. Ci sono le tecniche per questo che provengono da background di superficie ricostruzione. Uno dei più recenti è il lavoro di S. Cheng, Y. Wang e Wu Z. [4], la cui dimensione metodo di rilevazione attraverso l'analisi delle componenti principali [8] è presentato. Così, l'intrinseca aspetti dei dati possono essere estratti. Come, in pratica, questo valore è inferiore a quella massima aspetti necessari per la proiezione di lo stesso numero di documenti in un caso peggiore caso teorico, questo dà una significativa riduzione nel calcolo del tempo. In alternativa, per lo stesso scopo si può prendere in considerazione i metodi basati su valutazioni iterativo. L'obiettivo di riduzione aspetti nel nostro caso è quello di stabilire un efficace mappatura in cui il CommonSense somiglianza tra le fonti di informazione si esprime attraverso euclidea distanza tra i punti di proiezione. Assunzione di qualsiasi dimensioni riduzione tecnica basata su una selezione casuale di impostare i dati di input (ad esempio, Principal Component Analysis, Self organizzatore Maps, Sammon ricostruzione o triangolazione), nel caso in cui la produzione è inferiore al aspetti del caso, le proiezioni sarà instabile e con ogni ricalcolo la mappatura sarà diverso e le distanze tra le proiezioni non conservare. Possiamo anche supporre che, quando l'effettiva aspetti del collettore di ingresso è utilizzato per la mappatura, le distanze si conservare con un certo grado di libertà a seconda del metodo utilizzato aspetti riduzione. Una soluzione alternativa è quindi una selezione casuale aspetti riduzione tecnica combinata con incrementali aspetti paralleli di valutazione della mappatura. 32]. Si consideri, ad esempio, la tecnica di coltivazione SOMs descritto in [19, 32]. Volti a ridurre il tempo di calcolo, il numero dei nodi è aumentata dinamicamente con i nuovi nodi di essere distribuito in modo uniforme tra i vecchi e il loro peso in fase di vettori per i mezzi di pesi limitrofi originale vettori. Stessa tecnica applicata alle dimensioni (D), darebbe la possibilità di valutare ogni D, passo dopo passo. Criteri di valutazione sarebbe di stabilizzazione delle distanze tra le proiezioni. Per questo scopo due o più auto organizzare le mappe possono essere gestite in parallelo con le distanze tra alcune coppie proiezioni sia rispetto ad ogni iterazione. Sotto iterazione qui si capisce la scena quando l'aspetti della SOM è stato aumentato e la rete è stata di conseguenza stabilizzato con i nuovi parametri.
Riassumendo i suddetti si propone il seguente modello per la valutazione sperimentale della migliore approccio per la definizione del Global Knowledge Mappa della raccolta di documenti di testo.
Il datase t: vettore spazio modello da utilizzare (ogni documento rappresentato come vettore con le caratteristiche come le dimensioni e le caratteristiche 'come coordinate in gradi corrispondenti dimensioni).
Funzione di selezione funzione: più efficaci per essere definito.
Vector dimensioni: da stabilire empiricamente.
L'elaborazione e l'archiviazione dei dati.
Una riduzione aspetti tecnica dovrebbe essere utilizzata per la mappatura. Ci sono due approcci possibili:
a) pre-calcolare l'intrinseca e valutare aspetti diversi aspetti dei metodi di riduzione delle dimensioni con una nota della mappatura;
b) 'approccio incrementale aspetti valutazione' con pochi mappature in esecuzione in parallelo - solo con metodi di selezione casuale dei dati di input possono essere utilizzati.
Ingressi: documenti 'caratteristica vettori.
Uscite: GKM coordinate.
Valutazione:
1) CommonSense valutazione iniziale di corrispondenza tra i documenti e le distanze euclidea mappatura delle loro proiezioni.
2) la stabilizzazione di queste coppie le distanze tra le proiezioni attraverso diversi lanci, in caso di selezione casuale è la tecnica utilizzata.
3. Interfaccia
3,1 Ideale rappresentazione della conoscenza interfaccia
L'interfaccia del sistema di rappresentazione della conoscenza è importante quando il sistema ideale è discusso. Entrambi i compiti di ricevere richieste da parte degli utenti e la trasmissione di conoscenze indietro a loro sono di pari importanza, con i compiti di strutturazione e di archiviazione dei dati. Nel documento si parla di corrente le vie verso la conoscenza dei sistemi di rappresentanza di una nuova generazione e quindi il problema di interazione è overviewed al fine di stabilire se è possibile fornire un idealista interfaccia con i mezzi di una moderna tecnologia.
Le interfacce che vengono utilizzate per sostenere l'interazione di un utente umano con le moderne conoscenze di rappresentanza e di sistemi di information retrieval sono principalmente di 'indicizzazione' tipo, vale a dire gli utenti devono sapere esattamente che cosa stanno cercando e hanno anche specificare che linguisticamente. Un esempio di tale interfaccia è un motore di ricerca. Come abbiamo già detto, motore di ricerca e il corpus di documenti WWW è la più completa e aggiornata del sistema di rappresentazione delle conoscenze oggi disponibili, essendo questa la ragione della loro popolarità. Allo stesso tempo è noto che la 'indicizzazione' interfaccia non è naturale per l'uomo, ma l'uso è l'unica alternativa come 'navigando' approcci sono stati stabiliti molto poco [16]. La ragione di questo è il problema della conoscenza e la mappatura di allineamento che non consente la classificazione automatica di documenti e di rappresentanza in base alla loro sudditi. Tuttavia, con il problema della conoscenza di mappatura spazio unificato essere risolto, appaiono nuove possibilità per la costruzione di una migliore, più naturale interfacce di 'navigazione' tipo.
3,2 Massime dimensioni di visualizzazione e
Dopo aver ricordato che il risultato globale è la mappatura dello spazio che possono essere n-dimensionale, dove n è elevato, è necessario per risolvere il problema della rappresentazione visiva. E 'possibile per l'uomo di immaginare uno spazio 3D, quindi, la modalità ottimale di ND-> 3D rappresentanza devono essere valutati. Aspetti molteplici tecniche di riduzione o di rappresentanza tramite interfaccia può essere utilizzato.
È importante che con l'aiuto della conoscenza unificata mappatura spazio è ridotto al minimo l'errore durante il calcolo della rilevanza tra i documenti, e, inoltre, il reperimento dei documenti rilevanti, anche da altri sistemi diventa un compito banale. Per l'utente finale questo significa una volta che il sistema ha individuato il tema egli è interessato, non darà mai l'utente a irrilevante documenti.
3,3 Richiesta Informazioni catena
Quando le funzioni di mappatura dei soggetti e l'ubicazione, la pertinenza di calcolo e di conoscenza dello spazio di navigazione sono risolti il più importante compito che resta da risolvere è il problema di una richiesta iniziale. In state-of-the-art information retrieval sistemi i seguenti processi di solito sono in corso è coinvolto, se le informazioni richieste:
Human parte: 1) Imagination -> 2) la formazione linguistica di costruzioni -> 3) l'input della tastiera manuale (inserimento vocale) -> Macchina parte: 4) linguistica decodifica -> 5) corrispondenti e la posizione -> 6) la visualizzazione dei documenti corrispondenti
La catena è lunga ed è evidente che la perdita di dati e la corruzione è significativo a causa della doppia codifica e la decodifica linguistica. In primo luogo, l'utente ha a formulare immagini cognitive in breve frase linguistica. In secondo luogo, il sistema ha per decodificare la frase al fine di capire l'oggetto di interesse per l'utente. La catena descritta richiesta iniziale cause di insoddisfazione degli utenti dei moderni motori di ricerca a causa della incapacità del sistema di 'capire' la richiesta con conseguente enorme perdita di tempo l'utente finale. Il grado di recupero di questi errori e disagi causati da interfaccia limitazione è molto significativo e ridurre al minimo l'effetto di recupero più preciso e la localizzazione dei documenti introdotti dalla mappatura unificata.
È pertanto necessario prendere in considerazione, almeno teoricamente, la possibilità della creazione di un ideale di breve catena umana <-> Sistema di Knowledge Representation interazione con unità provocando la perdita di dati di essere eliminata:
Human parte: 1) Imagination -> [richiesta di essere trasferiti attraverso cervello umano diretto-GKM coordinate convertitore] -> 2) e la posizione di corrispondenza -> 3) la visualizzazione dei documenti corrispondenti
Noi rassegna le ultime realizzazioni in materia di Brain Computer Interfaces (BCI) per questo scopo.
3,4 Brain-Computer Interfaces
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. La ricerca sulla BCI è in corso da più di 30 anni e la zona è ancora molto giovani e si sviluppa rapidamente. Fino ad un recente momento m ost significativi progressi nel settore sono stati fatti in parte artificiale, cioè di controllo automobilismo funzioni del cervello [ 3] e l'interpretazione e l'elaborazione dei segnali visivi. Questi risultati sono stati verificati nel corso di più esperimenti su animali e su soggetti umani. Ricercatori relazione con successo l'integrazione di dispositivi elettronici o meccanici, quando gli animali o per l'uomo impara a controllare il dispositivo con l'aiuto del loro cervello, altri relazione riuscita del trasferimento e la decodifica di segnali visivi [15, 20].
Brain-computer interfaces studi sono strettamente connessi al settore di neuroimaging funzionale, in cui diverse tecnologie sono state sviluppate in modo efficace a registrare gli stati di persona del cervello attraverso alcune caratteristiche fisiche. Più produttive dal punto di vista della BCI è una recente tecnica di neuroimaging funzionale chiamato risonanza magnetica ) (FMRI) [6, 13]. Questa tecnica permette di registrare la dinamica del flusso sanguigno nelle diverse aree del cervello nel corso del tempo e con una elevata precisione. Questo permette di stabilire connessioni tra i modelli di attivazione delle varie aree cerebrali e di alcune attività e dei processi cognitivi umani. E 'importante che questa tecnica, a differenza di molte alternative, non è invasiva e non comporta iniezioni. È necessario notare, tuttavia, che la fMRI hardware oggi è ancora molto costosa e cumbrous.
È significativo il fatto che gli esperimenti indicano che cervello si adatta alle nuove condizioni. Ad esempio, quando sono stati utilizzati automobilismo impulsi per il controllo di un manipolatore meccanico o il cursore del mouse di un computer, il cervello è in grado di differenziare gradualmente e imparare a controllo separatamente dal manipolatore arto artificiale. Lebedev menziona l'effetto di 'plasticità del cervello' che potenzialmente permette di integrare dispositivi artificiali nel corpo di rappresentanza. [20]
Ultime pubblicazioni in materia di neuroimaging discutere ulteriormente la possibilità di individuare la precisa cognitivo [15]. Questo prevede la messa a fuoco della nostra attenzione sulla possibilità di applicazione della BCI in interazione uomo-KRS.
E 'noto che i diversi Stati cognitivo legato con alcuni oggetti del mondo reale corrispondono a determinati modelli di aree cerebrali di attivazione. Decodifica questi modelli permette di capire che sovrapposti orientata stimoli una persona sta frequentando (dove l'attenzione è diretta) o in caso di oggetti visivi per identificare gli oggetti di classe che la persona è di imaging (cioè volti, edifici, i mobili) e anche gli oggetti 'di colore e l'orientamento. [15] Tali processi sono complessi e ben lungi dall'essere capito in questo momento. Ulteriori studi si rivelano come fine a basso e ad alto per i segnali cerebrali in correlazione con alcune funzioni cognitive, come le caratteristiche territoriali dei pattern cambiare nel tempo e nelle diverse influenze, in che misura è possibile estrapolare l'attivazione di modelli diversi soggetti; ecc Si ritiene, tuttavia, che una conoscenza precisa di 'calcoli' effettuato nel cervello umano non è di fondamentale importanza per la costruzione dei relativi BCIs. [20] comune di tecniche di data mining può essere applicato per estrarre informazioni utili da vari sensori di neuroimaging e di stabilire collegamenti con alcuni stati cognitivi.
Ci sono però importanti questioni in grado di nuocere gravemente il successo di apparecchio di BCI in materia di rappresentazione della conoscenza. Due problemi di lieve entità sono generalizzazione attraverso il tempo e il problema delle diverse istanze dello stesso stato mentale. È noto che i modelli di aree cerebrali di attivazione degli stessi stati mentali possono variare nel tempo. Istanze diverse di uno stesso stato mentale può essere modificato e immagini, a seconda delle variazioni contestuali e di altri fattori. [15] Ciò richiede flessibilità e la classificazione del territorio ricampionamento algoritmi per essere utilizzati come suggerito dal Haynes e Rees. Riteniamo che questi problemi saranno risolti su sviluppo di tecniche efficaci.
Più discutibile è il problema di estrapolazione al romanzo cognitivo membri. Haynes e Rees nota che il numero di possibili stati percettiva o cognitiva è infinito, mentre il numero di categorie di formazione è necessariamente limitato. [15] E 'fondamentale, pertanto, che decoder potrebbero essere addestrati a generalizzare l'esperienza ottenuta dalla piccola formazione completamente nuova serie di categorie. Sarebbe possibile con i mezzi di estrapolazione pattern di attivazione cerebrale, se sono effettivamente disposti in alcuni sistematica spazio parametrico. Questo deve ancora essere trovato, tuttavia, si ritiene che sia possibile, almeno per alcuni tipi di contenuto mentale [15]. Nel caso in cui la forma astratta di spazio per la classificazione dei modelli neurali effettivamente esiste ci permetterebbe di teorizzare sulle possibilità di mappatura del cervello umano stati cognitivi su Global Knowledge Mappa descritta in precedenza nel presente documento. A condizione che questa è raggiunto, il suddetto "problema della richiesta iniziale" saranno risolti e "ideale umano <-> KRS" catena sarà possibile stabilire.
3,5 Learnable Decoder
Come ormai è noto, grazie alle più recenti realizzazioni di imaging del cervello che è possibile distinguere l'attivazione di diverse aree cerebrali quando la persona è pensare diversi soggetti si può presumere che sia possibile creare un decodificatore di learnable mappa cognitiva umana iniziato sulla conoscenza precisa di una mappa del sistema di rappresentazione della conoscenza. Pertanto, un modo ideale di interazione uomo-computer potrebbe essere stabilito che consente una grande velocità e precisione di comunicazione con un sistema. Ci saranno meno la perdita di dati a causa di eliminazione della fase di interazione linguistica. La rapidità e l'efficacia delle interazioni aumenteranno di conseguenza. Questi due fattori che permettono alle persone di varie professioni di aumentare l'efficacia del loro lavoro in maniera significativa. Da [6, 15], sappiamo che vi sono alcune regolarità della posizione del cervello impulsi e gli argomenti delle conoscenze che sono comuni per tutti gli esseri umani, che possiamo chiamare queste caratteristiche antropiche. Tuttavia è noto che la maggioranza di questi link dovrebbe essere individualista. Pertanto, il decoder deve essere individualmente adattiva.
E 'anche evidente che l'efficienza del decoder dipenderà individui e la loro formazione con essa e la capacità di imparare. Si può presumere che questo gli esperimenti con le interfacce artificiali essere usato per sostituire gli arti perduti. L'uomo e gli animali sono stati in grado di concentrarsi mentalmente in modo speciale a spostare un manipolatore artificiale e persino imparare a controllare la parte reale e uno artificiale separatamente [20].
Considerato il suddetto riteniamo che una rete neurale artificiale - meccanismo è la migliore soluzione di un problema di decodifica.
Decoder del processo di apprendimento
1) Il punto con coordinate casuale in spazio pluridimensionale di GKM è selezionata.
2) Molteplici i documenti che hanno la loro mapping nella vicina zona (euclidea metrica è utilizzata) sono selezionati e visualizzati con un operatore umano.
3) Operatore concentra la sua mente di partecipare alla cognitivo dato argomento e dei relativi oggetti in memoria.
4) Il neuroimaging dati vengono raccolti da fMRI hardware in un determinato periodo di tempo.
5) I dati sono trattati attraverso un ricampionamento territoriali algoritmo di riduzione del rumore e l'obiettivo di estrarre modelli informativi che caratterizzano l'attuale iterazione della formazione.
6) Preparate i dati sono prelevati agli ingressi della rete neurale. GKM Le coordinate di un punto selezionato sono scaricati alle uscite quindi la formazione della rete neurale del cervello di associare specifici pattern di attivazione con GKM coordinate.
Figura 3.1 Il processo di formazione del decoder
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Recent Comments