Ihanteellinen Knowledge Representation System tai Global Knowledge Kartta
Kohti idealistinen Knowledge Representation System: Global Knowledge Kartta
Taras Filatov
Tiivistelmä
Yksi merkittävimmistä ongelmista, jotka estävät kehitystä aloilla Knowledge Representation ja Tekoäly on ongelma semanttisen yhteensovittaminen tai osaamisen kartoitus. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Edistymistä sen ratkaisu on suuresti hyötyä tehtävien tiedonhakua, Ontologian yhdenmukaistaminen, relevanssin laskelman tekstin ymmärtämisen jne. paperin käsitettä moniulotteinen maailmanlaajuista tietämystä kartta, kehitellään valvomattomien uuttamisen riippuvuuksien suurista asiakirjat corpus, on ehdotettu . Lisäksi ongelmaa suoraan ihmisravinnoksi - Knowledge Representation System Interface on osoitettu, ja käsite mukautuvia dekooderia ehdotetaan varten vuorovaikutustavat aiemmin kuvattu yhtenäinen kartoitus mallia. Yhdistettynä nämä kaksi lähestymistapaa ehdotetaan perustana kehitetään uuden sukupolven tiedon esitys-järjestelmiä.
Avainsanat: tiedon esitys, osaamisen kartoitus, ihmisten tietokoneen vuorovaikutusta Ontologian yhdenmukaistaminen, ylemmät ontologia, relevanssin laskelma, tiedonhakuun, asiakirja samankaltaisuus
1. Johdanto
Yhteiskunnassa, alan tiedon esitys tuli lisää merkittävästi viime vuoden aikana [25]. Ihmiset aina yrittää opiskella ja luokitella tietoa tietoa. Voimme löytää viittaukset jo Sokrates viidentenä vuosisadalla eKr. [33] ja kukoistavalle logiikkaa ja epistemologia [28] keski-ikäisille. Koska ongelma pidettiin tärkeä aikaisemmin, on vaikea yliarvioida sen merkitystä aikakaudella tietoa.
Moderni teknologia on myönnetty ihmisille, joilla on liiallinen tulvat tiedot, joita on vaikea järjestelmällisemmin ja prosessia. Henkilölle, joka tulee erikoistunut tietyn alueen kestää vuosia, oppimisen ja edellyttää myöhemmin informational rodun pysyä mukana uusimmat ammatillinen suuntauksia.
Se on suosittu vakaumukseen joukossa tietoon insinöörien ja data mining spesialistimme että tietoa avoimen pääsyn riittää otteen totuudenmukaista tietoa lähes kaikki osa elämäämme ja jopa ennustaa tulevaisuutta. Ainoa ongelma ratkaista on älykkäästi käsitellä tietoja monia lähteitä. [35].
Tämä tekijöitä kysyntä uuden sukupolven tiedon esitys-järjestelmät, joiden avulla ihmiskunnan järjestelmällisemmin, saatavuutta ja käyttöä sen tietämystä.
Nykyisissä paperi ehdotamme ideoita kehittää uuden iän Knowledge Representation System (KRS).
Uskomme, että viimeaikaiset saavutukset tietyillä aloilla ja tieteet pian johtaa valtava läpimurto soveltamisalaan ihmisten tiedon esitys-ja ihmisen ja tietokoneen vuorovaikutusta. Tämä avaa uusia näköaloja ja lisää tehokkuutta ihmisten työtä monissa sovelluksissa. Ainoa asia, joka on tehtävä on tuoda näitä saavutuksia yhdessä.
Ihanteellinen KRS olisi tarjottava käyttäjälle kätevä pääsy kaikkiin tietoa ihmiskunnalle. Sen tekijät ovat siten:
- ihmisen, joka haluaa käyttää joitakin pala tietoon hän on kiinnostunut,
- tietojen säilytykseen ja
- välittäjä, jonka tarkoituksena on antaa rajapinta ihmisen saada tietoa.
Esteet, jotka johtuvat tästä johtuvat rajoitukset ihmisen kykyjä ja nykyisen teknologian taso.
2. Tietojen säilyttäminen
2,1 State of the art
Tiedon esitys-järjestelmä edellyttää tietojen varastointiin, ellei se voi hakea tarvittavat asiakirjat ulkoisista lähteistä reaaliajassa. Voimme hahmotella kaksi voittavan lähestymistapoja ihanteellinen KRS on nykyään: rakenteellinen käsin hallinnoi maailmanlaajuisen osaamiselle varastoista kuten ontologioita ja-järjestelmät, joihin automaattisen indeksointi ja haku useimpien täynnä ja saatavilla raaka asiakirjojen kerääminen (World Wide Web) kuten hakukoneet. Ongelma ensimmäinen lähestymistapa on sen ruumiillista - kaikki yritykset luoda ja ylläpitää maailmanlaajuista ihmisten tietämysperustaa johtaa kompromissi yksityiskohtaisesti, todellisuudeksi ja käytettävyyteen. ], UFO (Unified Framework Ontology) Sen estämättä, mitä on useita onnistuneita ylemmän Ontologian hankkeita, kuten Cyc [23], WordNet [12], DNS, SUMO etc ja jatkuvaa teoreettista keskustelua niin kauan kuin tutkimus, jonka tavoitteena laatia standardoitu yhtenäinen maailmanlaajuinen Ontologian nojalla nimet SUO (Standard Upper Ontologian ) [27], UFO (Unified Framework Ontologian) jne.
Toinen lähestymistapa tuli historiallisesti yleisiä johtuu WWW on suurin, kattavaa ja ajantasaista corpus käytettävissä olevien tietojen automaattiseen käsittelyyn nykyään. Kuitenkin vastoin ensimmäistä lähestymistapaa, ongelmat automaattisen hakujärjestelmiä on merkittävä rooli tässä. Ongelmia tekstin ymmärtämisen ja luonnollisen kielen prosessointiin on yksi haastavimmista vuonna AI ja kuitenkin vielä ilman tehokasta ratkaisua. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Lähimarkkinoina ovat ongelmia luokittelu ja merkitys laskettaessa, niin sanotun Web-klustereiden "ongelma [1]. Toinen lähestymistapa (automaattiset indeksoimasta) on näin ollen merkittävä puuttuu vuonna oikeellisuudesta haku.
On olemassa jatkuva ponnisteluja tuomalla parannuksia edellä mainittuihin lähestymistapoja, jotta ratkaista näitä ongelmia. Esimerkiksi yhdessä yhtenäisen perustan Ontologian hankkeet (SUO, BULO) on olemassa tiettyjä yrityksiä kehittämään Ontologian yhdenmukaistaminen ja Ontologian kartoitusmenetelmät jotta olematon ontologioihin yhdessä toistensa kanssa ja muunlaisia tietoperusta [5, 17]. On usein ehdotettu vähennys puutteet käsikirja hallinnon osalta ontologioihin jonka avulla automaattisesti tiedon haku (hakukone teknologiat). From Toisaalta parantunut Hypertext standardeja kehitetään, jotta voidaan käsin määritellä tietoa, joka auttaa hakukoneet ymmärtävät commonsense tarkoitettu WWW-asiakirjoja ja linkkejä niiden välillä [24]. On tarpeen ymmärtää, että näitä risteytettyjen ratkaisuja kuljettaa puutteita vastaavien tekniikoiden yhdessä etuja.
Yksi puute yhdistää nämä lähestymistavat ja tekee mahdottomaksi niiden integrointi: ei ole standardin kartoitus ja kiinteistä suhteista asiakirjojen ja käsitteitä eri järjestelmissä. Ongelma voitaisiin ratkaista, jos yksi järjestelmien kanssa kiinteän matemaattisesti interpretable hierarkia kuten ontologioihin ylittää nykyisen lähestymistavan (WWW). Tämä kuitenkin vaikuttaa epätodennäköiseltä johtuu edellä mainittujen syiden perusteella. Independent välittäjä standardi on mahdollinen ratkaisu tähän ongelmaan. On olemassa useita aloitteita suuntaan yhdistää ja vastavuoroiset kartoitus tietoperusta erilaista joista on alueen Ontologian kartoitukseen. Aloitteilla on yksi yhteinen puute: ei yhtenäistä standardia kartoittamisen ja kiinteistä suhteista asiakirjoja. Sen jälkeen yksikään niistä ei todennäköisesti tullut laajalti tunnustettu standardi ellei entistä kestävämpi ratkaisu on kehitetty.
2.2 Käsite Global Knowledge Kartta (GKM)
Uskomme, että on mahdollista laatia yhteinen standardi Osaamisen kartoitus rakentamalla loogista tilaa, jonka tarkoituksena on projektio reaalimaailman tiedon käsitteitä. Tällainen malli (kutsukaamme sitä Global Knowledge Kartta) olisi heijastettava taso samankaltaisuus asiakirjat ja käsitteitä mapped onto sitä.
Pääasiallisena tarkoituksena malli on:
- Tasaus ja rajat kartoitus asiakirjat ja käsitteitä (WWW, ontologioihin, e-kirjastot, hakemistot jne.)
- Tiedonhaun kautta selailemassa
- Tarkka automaattisäätö laskettaessa commonsense kannalta merkityksellinen
GKM edellyttää matemaattisia / looginen malli tiedon varastoinnin, joilla on erityinen edellytys: on optimaalinen tehtäväksi tiedon esitys eli vuorovaikutusta ihmisen. Niiden täyttäminen tämä edellytys mallin on vastattava sen dimensionality tai sen rakenne rakenteen ihmisten tietoon.
Vaatimukset ovat siten:
- Dimensionality ja kartoitukseen.
Tärkein tekijä on dimensionality on tarkoitettu (tai aihe).
- Jokainen käsite ihmisen tietoja voidaan kartoittaa pääsisi kohta, joilla on erityinen koordinaatit järjestelmän tilaa.
- Jokaisen asiakirjan tai teksti voidaan kartoittaa kiinni useita kohtia (asiakirja on jaettu mêmes - mielekäs kpl) tai yksi piste.
- Merkityksellisyys laskentaan.
- On mahdollista, matemaattisesti laskea merkitystä kahden käsitteitä laskemalla etäisyys niiden vastaavia projektio kohtia tilaa.
- Sen vuoksi on mahdollista laskea "samankaltaisuuden" Asiakirjojen väliset yhteydet ja käsitteet laskemalla etäisyys niiden luottolaitoksen.
- Homogeenisuus tilaa.
- Tila on yhtenäinen (homogeeninen) ja jatkuvaa
- Koordinaatit heijastavat merkityksen ja etäisyydet pisteiden välillä heijastavat ero merkitys niin, että jos C kohta sijaitsee välillä A-ja B sitten se tarkoittaa käsite C liittyy sekä A että B tasan.
- On mahdollista "selata" tilaa löytää tiedon lähteet kartoitetaan sen lähialueilla.
Rakennus matemaattinen malli tällaisten tilojen mahdollistaa kehityksen Global Knowledge Map. Se ei ole kannattavaa yrittää kehittää sellainen malli (GKM) on manuaalinen tapa johtuu edellä mainittujen syiden perusteella tiedon kasvu ja jatkuva muutos ihmisten käsitys maailmasta. Uskomme, että on mahdollista irrottaa riippuvuudet ja säännöt, käytettävissä olevien corpuses tekstien ja käyttää näitä jalostajina meidän kartoitus tarkoituksiin.
Kulmakivi meidän oletuksia on, että se on yleensä mahdollista kartta eri inhimillisen tiedon aiheita kiinni yhden tilaa ja etäisyydet on dimensionality, että jälkimmäinen heijastavat tasolla samankaltaisuuden antanut aiheita. Tämä olettamus perustuu Johnson-Lindenstrauss Lemma että joukko n kohtia korkea dimensiomittauslaitteita Euclidian tilaa voidaan kartoittaa alas N dimensiomittauslaitteita Euclidian tilaa
(2,1)
sellainen, että etäisyys kahden pisteen välillä muutoksia vain tekijä (1
) [7]. Vektorihyönteisten Space malli yleisesti käytetty Information Retrieval ja teksti Categorization edustaa asiakirjat korkea dimensiomittauslaitteita vektorit [31]. Nämä vektorit sisältävät tietyn tason (riippuen metristä toiminto valittu) tiedot, jotka ovat tarpeeksi luokitella kohteena alkuperäinen asiakirja.
The Tychonoff n teoreema [26] todetaan, että seikkoja, jotka edustavat ominaisuuksia esineiden yhden luokan, olisi sijaitsevat lähempänä toisiaan omaisuuden tilaa kuin edustaa ominaisuuksien esineitä muihin luokkiin. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. Meidän tehtävämme tällä tarkoitetaan alkuperäisen vektorin tilaa n tekstejä voidaan projisoituna kiinteän N-ulottuvuudessa ja käyttäen sopivaa algoritmi tiedon pakkaus / dimensionality vähennys johtuu siitä, että teoreema ja tiiviyttä [22] kartoituskäyrä saavutetaan silloin, kun etäisyys pistettä edustavat merkitystä kyseisiin asiakirjoihin.
Tekijöistä, jotka vaikuttavat tarkkuus kartoituskäyrä:
- edustavuus metrijärjestelmän toiminnon ja koosta ominaisuus tilaa
- koko, dispersiivisyyttä ja laatu asiakirjat corpus
Edellyttäen, että teoria on sovellettavissa nykyoloissa se vielä löytyy, jotka tekniikoita on käytettävä kehittämään kartoitukseen. Ehdotamme keskittyä automaattisesti vuoksi monet komplikaatioita tehdä manuaalinen asiantuntija perustuva kartoitus soveltaa.
2.3 Automaattinen GKM sukupolven kautta valvomattomien uuttamisessa (hypoteesi)
Jotta olla hyödyllistä GKM tulisi sisältyä luottolaitoksen merkittävän määrän oikea sana (WWW) asiakirjat, ja sen rakenne edustaa yhteistä ihmisten käsitys maailmasta. Se ei ole kannattaa siis harkita kaikki käsin tapoja luoda GKM ja täyttämällä se asiakirja luottolaitoksen. The data mining periaatteita olisi käytettävä otteen riippuvuuksien edustavat osaamista olemassa olevan yhteisölainsäädännön olevia asiakirjoja voidaan käsitellä ja suodattaa pois tarpeettomia tietoja.
On ollut useita yrityksiä varten valvomattomien uuttamisen riippuvuuksien teksteissä on kuitenkin vielä epävarmaa kysymys, onko tekniikka pystyy luomaan kestävän tiedon louhinta kautta analyysi suuria asiakirjoja keruu [10, 11, 21, 30].
Let's jakaa niitä tekijöitä, jotka vaikuttavat yleensä asiakirjojen sisältöön jaetaan kolmeen ryhmään:
- Tekijät henkilökohtaiset tekijät (tunteet ja motiivit luoda tekstiä, fyysisen ja moraalisen todetaan aikana ajattelu ja kirjoittaminen)
- Kieli (sääntöjen etc siinä käytetyn kielen kirjoittaa asiakirja)
- Knowledge (tietyt osat inhimillisen tiedon laatija toimittaa suoraan tai epäsuorasti kautta asiakirja)
Let's oletettava on mahdollista käsitellä kaikkia käytettävissä olevia tekstidokumentteja ihmisten Kirjoittajat ja Pura kaikki riippuvuus sääntöjä. Tässä tapauksessa vaikuttaa tekijä 1 on pieni. Vaikutuksen tekijä 2, ei ole paljon merkitystä, koska seuraavasti:
a) asiakirjoja useilla kielillä voidaan indeksoida, joten vastavuoroisesti vähentäminen vaikuttaa
b) Kieli sinänsä heijastaa inhimillisen tiedon [18], joten jossain määrin tekijä 2 on subfactor 3. ja jopa uuttamisvaiheesta niiden seos on tyydyttävä saavutus
On teoreettisesti mahdollista sitten ote info useimmiten vastaa ihmisen tietämyksen altistuvat kautta saatavilla asiakirjoja. Tämä info muuntuu kartoituskäyrä tilassa hypothetically tarjoaa meille kestävän GKM.
2.4 Toteutustapa (kokeilu)
Olevaan tilaan rakennettu kukin asiakirja on kartoitettu yhden koordinointiin. The 'selailemassa "sitä tilaa tai etäisyydet vertailussa ilmenee, että tilanne asiakirjoja tai niiden klustereiden heijastavat niiden merkitys ja että se on mahdollista osoittaa tiettyjen aihe nimet erityisiä koordinaatit tilaa.
Meidän kokeilut käyttäen 2 ja 3 dimensiomittauslaitteita Kohosen SOM kanssa paikallisen keräämistä asiakirjoista käy ilmi, että välimatkat ennusteet asiakirjat eivät ole vakaita koko sarjan käynnistää. Tämä mielestämme on näyttöä siitä, että dimensionality että kartta on riittämätön, joka on Johnson-Lindenstrauss Lemma edellä mainittiin.
Valitettavasti se on mahdotonta suorittaa kokeilu, jolla on kunnollinen dimensionality. Esimerkiksi sen mukaan, Johnson-Lindenstrauss Lemma, karttaan 20000 asiakirjat mahdollistavat 10% virhe se edellyttää 58 ulottuvuutta. Tämä edellyttää laskelmia, jotka ovat edellä nykyaikaisia tietokoneita valmiuksia.
On tärkeää mainita tässä on se, että vaikka Lemma antaa enintään dimensionality on kartoituskäyrä tila mahdollistaa täyttää edellytys yksi projektio, se ei ole tarpeen, pienin vaikuttava arvo. Lemma antaa arvoa joukko n pistettä eli pahin tapaus, josta ei todennäköisesti näy käytännössä. Menetelmistä dimensionality havaitseminen olisi käytettävä laskea tehokkaan dimensionality tietoja ja näin ollen määrittää oikean määrän mitat kartoittamista erityisesti tietokokonaisuutta. On tiedossa tekniikoita tämän jotka tulevat taustaa pinta jälleenrakentamiseen. Yksi tuoreimmista on työn S. Cheng, Y. Wang ja Z. Wu [4], jossa ulottuvuus havaitsemismenetelmä kautta Principal Component Analysis [8] on esitetty. Näin ollen luontainen dimensionality tietoja voidaan uuttaa. Koska tämä arvo käytännössä on alhaisempi kuin maksimaalinen dimensionality varten tarvittavat projektio sama määrä asiakirjoja pahimpaan teoreettinen tapauksessa, saadaan merkittävästi vähentää laskennassa aikaa. Vaihtoehtoisesti samaa tarkoitusta varten voimme harkita menetelmät perustuvat iterointiprosessin arviointeja. Tarkoituksena dimensionality vähentäminen tässä tapauksessa on luoda tehokas kartoitus, jossa commonsense samankaltaisia informational lähteet ilmaistaan kautta Euclidian etäisyys projektio pistettä. Ryhtymästä dimensionality vähentäminen tekniikka perustuu satunnaisessa alkaen tallentamaan tietoja (kuten Principal Component Analysis, Self Organising Maps, Sammon jälleenrakennukseen tai triangulation), ja kun lähtö dimensionality on alle tarvittaessa ennusteissa on epävakaa ja jokaisen Päivitys kartoituskäyrä on erilainen ja etäisyydet ennusteet eivät säilyttää. Voimme myös olettaa, että kun tehokas dimensionality järjestelmään tallentaminen moninaiset käytetään kartoituskäyrän, etäisyydet säilyttää jonkinasteinen vapauteen riippuen dimensionality vähentämiseen käytetty menetelmä. Vaihtoehtoinen ratkaisu on siis satunnaisessa dimensionality vähentäminen tekniikka yhdistettynä incremental dimensionality rinnakkain arviointi kartoittamista. 32]. Mieti esimerkiksi tekniikan kasvava soms kuvattu [19, 32]. Tarkoituksena on vähentää laskettaessa aikaa, useita solmuja on kasvanut dynaamisesti uusia solmut ovat tasaisesti jaettu vanhoja ja niiden painot vektorit asetetaan siten viereisen alkuperäinen painot vektorit. Samaa tekniikkaa sovelletaan dimensionality (D) antaisi mahdollisuuden arvioida kunkin D askel askeleelta. Arviointiperusteet olisi vakauttaminen välimatkat ennusteet. Tätä tarkoitusta varten kaksi tai useampi itsenäinen järjestää karttoja voidaan käyttää samanaikaisesti pairwise välimatkat tiettyjen ennusteita verrataan kunkin iterointia. Alle iteroinnin täällä ymmärtää vaiheessa, kun dimensionality tehty SOM oli lisääntynyt ja verkko oli näin stabiloitujen uusia muuttujia.
Yhteenvedon edellämainitusta me ehdottaa seuraavaa mallia kokeellisen arviointi, parempi lähestymistapa vahvistamisesta Global Knowledge kartta vuodelta keräämistä tekstidokumentteja.
The datase t: vektorin tilaa malli on (kukin asiakirja edustivat vektorin kanssa ominaisuudet kuten mitat ja ominaisuudet "sijoituksen koordinaatit vastaavat mitat).
Feature valinta-toiminto: tehokkainta olisi määriteltävä.
Vector koko: on luotava empiirisesti.
Tietojen käsittely ja varastointi.
A dimensionality vähentäminen tekniikkaa tulisi käyttää kartoittamista. On olemassa kaksi mahdollista lähestymistapaa:
a) ennalta laskea luontaisia dimensionality ja arvioida eri dimensionality vähentäminen menetelmiä, joiden tiedetään dimensionality että kartoitus;
b) "incremental dimensionality Arvioinnin lähestymistapa", joilla on vain vähän luottolaitoksen on rinnakkain - vain menetelmiä satunnaisessa järjestyksessä syöttää tietoja voidaan käyttää.
Panokset: asiakirjoja "ominaisuus vektorit.
Tuotokset: GKM koordinaatit.
Arviointi:
1) Commonsense arviointi välinen kirjeenvaihto alkuperäisen asiakirjat ja Euclidian etäisyydet niiden kartoitus ennusteet.
2) Vakautus näistä pairwise välimatkat ennusteet eri käynnistää jos satunnaisessa tekniikkaa käytetään.
3. Interface
3,1 Ihanteellinen tiedon esitys-liitäntä
Käyttöliittymä osa Knowledge Representation järjestelmä on tärkeää silloin, kun ihanteellinen järjestelmä on keskusteltu. Molemmat tehtävät vastaanottaa pyyntöjä käyttäjien ja siirtämään tietoa takaisin ne ovat yhtä tärkeitä sen tehtäviä tietojen jäsentämiseen ja varastointi. Nykyisissä paperi puhumme tavoin kohti Knowledge Representation järjestelmät uuden sukupolven ja siksi kysymys vuorovaikutus on overviewed määrittääkseen, onko se mahdollista tarjota idealistinen rajapinta, jonka avulla nykyaikaista tekniikkaa.
Rajapinnat että käytetään tukemaan vuorovaikutusta ihmisen käyttäjälle nykyaikaisen tiedon esitys-ja tiedonhaun järjestelmät ovat pääasiassa "indeksointi" tyyppi, eli käyttäjien on tiedettävä tarkalleen, mitä he etsivät ja lisäksi ne on määriteltävä se kielellisesti. Hyvä esimerkki tällaisesta käyttöliittymä on hakukone. Kuten olemme edellä mainittiin, hakukoneen ja corpus WWW asiakirjat on täydellisiä ja ajan tasalla tiedon esitys järjestelmän saatavilla nykyään, että tämä on syy niiden suosio. Samalla se on tiedossa, että "indeksointi-liitäntä ei ole luonnollista käyttää ihmisille, mutta se on ainoa vaihtoehto kuin" selailemassa lähestymistapoja on vahvistettu erittäin huonosti [16]. Syynä tähän on se ongelma osaamisen kartoitus ja yhdenmukaistaminen, joka ei salli automaattisen luokituksen ja edustus asiakirjojen mukaan niiden aiheista. Kuitenkin ongelma yhtenäinen osaamisen kartoitus tila on ratkaistu, uusia mahdollisuuksia näyttää rakentamista varten parantunut, useampaa luonnollista liittymäkohtien "selaamisen" tyyppi.
3.2 High dimensionality ja havainnollistamistekniikat
Nyt, että tuloksena maailmanlaajuinen kartoitus tilaa on todennäköisesti n-ulotteinen jossa n on korkea, että on tarpeen ratkaista visuaalista esitysmuotoa. On mahdollista, ihmisille kuvitella 3D tilaa, joten optimaalinen tapoja nD-> 3D edustus on arvioitava. Dimensionality vähentämiseen tekniikoita tai useita edustus lähestymistapa käyttöliittymä voidaan käyttää.
On tärkeää, että sen avulla, kun yhtenäinen osaamisen kartoitus tilaa virhe pienenä aikana laskettaessa kannalta merkityksellinen Asiakirjojen väliset yhteydet, ja lisäksi, että haku asiakirjojen edes muista järjestelmistä tulee vähäpätöinen tehtävä. Saat loppukäyttäjälle tämä tarkoittaa, kun järjestelmä on löytänyt aihetta hän on kiinnostunut, se ei koskaan johda käyttäjää merkitystä asiakirjoja.
3.3 Tietopyynnöt ketjun
Kun tehtävät aiheiden kartoittamiseen ja sijainti, relevanssin laskemisen ja tietämyksen tila selailemassa ratkaistaan tärkein tehtävä, joka on vielä ratkaistava on se ongelma, että alkuperäisen pyynnön. Vuonna state-of-the-art information retrieval järjestelmät seuraavat prosessit ovat yleensä on mukana, kun tietoja pyydetään:
Ihmisen osa: 1) Imagination -> 2) muodostumisen kielellisen constructions -> 3) käsivälitteinen Syöttö (voice input) -> Machine osa: 4) kielellinen decoding -> 5) yhteensovitus ja sijainti -> 6) visualisoinnin vastaaviin asiakirjoihin
Ketju on pitkä, ja on selvää, että tietojen menettämisen ja korruptio on merkittävä johtuu kaksinkertainen kielellisen koodaus ja dekoodauksella. Ensinnäkin, käyttäjän on muotoilla kognitiivinen kuvat lyhyen kielellisen virke. Toiseksi järjestelmä on dekoodaamaan virke, jotta ymmärretään kohteena käyttäjän etua. Kuvattu ketjun alkuperäisen pyynnön aiheuttaa tyytymättömyyttä käyttäjien nykyaikaisen hakukoneet johtuu ettei järjestelmä "ymmärtää" pyynnön seurauksena valtavasti aikaa menetys loppukäyttäjälle. Se, miten nämä haku virheiden ja virheellisten aiheuttamat rajapinnan rajoitus on merkittävä, ja on hyvin pieni vaikutus tarkempi haku ja sijainti asiakirjojen esittämät yhtenäinen kartoitus.
Sen vuoksi on tarpeen harkita, teoriassa ainakin mahdollisuus luoda ihanteellinen lyhyen ketjun ihmisten <-> Knowledge Representation System vuorovaikutus yksiköiden aiheuttaa tietojen menettämisen on poistettu:
Ihmisen osa: 1) Imagination -> [pyyntö on läpäissyt läpi suoraan ihmisravinnoksi brain-GKM koordinaatit muunnin] -> 2) täsmäytystä ja sijainti -> 3) visualisoinnin vastaaviin asiakirjoihin
Meidän yleiskatsaus uusimmat saavutukset alalla Brain Computer Interfaces (BCI) tätä tarkoitusta varten.
3.4 Brain-Computer Interfaces
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Tutkimusta BCI on jatkunut yli 30 vuotta ja alue on edelleen hyvin nuori ja kehittyy nopeasti. Jopa äskettäin hetki m ost merkittävää edistystä alalla on tehty osaksi keinotekoista osa valvontaa eli autoilu tehtäviä aivojen [ 3] ja tulkinta ja käsittely visuaaliset signaalit. Nämä tulokset on tarkistettu aikana useita kokeiluja, joissa eläinten ja ihmisten aiheista. Tutkijat kertomus onnistunut integrointi mekaanisten tai elektronisten laitteiden, kun eläinten tai ihmisten oppia hallitsemaan laitteen avulla niiden aivot, toiset kertomus onnistuneen siirron ja dekoodauksella silmämääräisten signaaleja [15, 20].
Brain-tietokoneen käyttöliittymät tutkimukset liittyvät läheisesti alueen toiminnallinen neuroimaging, jossa eri teknologiat on kehitetty tehokkaasti tallentaa valtioiden henkilön aivojen kautta tietyt fyysiset ominaisuudet. Tuottoisimmassa näkökulmasta BCI on viime neuroimaging tekniikkaa kutsutaan Toiminnallinen magneettikuvaus ) (FMRI) [6, 13]. Tämä tekniikka mahdollistaa kirjaa dynamiikan veren virtaus eri aivojen alueilla ajan ja joilla on suuri tarkkuus. Tämä näin avulla voidaan luoda yhteyksiä mallit aktivoinnin eri aivojen alueilla ja tietyissä toiminnoissa ja kognitiiviset prosessit ihmisen. On tärkeää, että tämä tekniikka, toisin kuin monia vaihtoehtoja, ei-invasiivinen ja ei liity injektionesteisiin. On syytä huomata kuitenkin, että fMRI laitteisto nykyään on edelleen erittäin kallis ja kömpelö.
On huomattava, että kokeilut osoittavat, että aivojen sopeutuu uusiin olosuhteisiin. Esimerkiksi kun autoilu impulsseina käytettiin valvonnanalaiseksi mekaanikko manipulaattorin tai tietokoneen hiiren kohdistin, aivot pystyi vähitellen erottamaan ja oppia hallita manipulaattori erillään keinotekoinen osa. Lebedevin mainitaan vaikutus "aivojen plastisuus", jotka mahdollisesti voidaan sisällyttää keinotekoinen laitteita kehon edustus. [20]
Uusimmat julkaisut alalla neuroimaging edelleen keskustella mahdollisuus havaita kognitiivisten mukaan [15]. Tämä säädetään keskittäminen huomiomme mahdollisuutta soveltamisesta BCI inhimilliseen-KRS vuorovaikutusta.
On tunnettua, että eri kognitiiviset todetaan liittyy tiettyjä reaalimaailman esineet vastaavat tiettyjä malleja aivojen alueilla aktivointiin. Dekoodauksella nämä mallit annetaan ymmärtää, joka päälle suuntautuneiden ärsykkeiden henkilö on tällä hetkellä läsnä (jos niiden huomio on kohdistunut), tai jos Visual esineet tunnistaa missä luokassa esineiden henkilö on kuvantaminen (eli kasvot, rakennukset, huonekalut) ja jopa esineet "väri ja suunta. [15] Nämä prosessit ovat monimutkaisia ja kaukana ymmärretään tällä hetkellä. Lisäksi tutkimukset osoittavat, miten vähän järjestystä ja korkean jotta aivojen signaalien korreloi tietyt kognitiiviset toiminnot, miten paikkatietojen ominaisuudet malli muuttua ajan mittaan ja eri vaikutteita, missä se on mahdollista ekstrapoloida aktivointimaksun malleja eri aiheista; jne. On kuitenkin sitä mieltä, että tarkkaa tuntemusta "laskelmat" suoritetaan ihmisen aivoissa ei ole ratkaiseva rakentamista varten asiaa BCIs. [20] Yhteinen data mining tekniikoita voidaan soveltaa otteen hyödyllistä tietoa eri neuroimaging anturit ja luoda yhteyksiä tietyt kognitiiviset todetaan.
On kuitenkin tärkeitä kysymyksiä, jotka voivat vaikuttaa vakavasti menestys laitekohtaisesta BCI alalla tiedon esitys. Kaksi pieniä ongelmia ovat yleistys koko ajan ja ongelmaan eri yhteyksissä on sama psyykkinen. On tunnettua, että aivojen alueilla aktivoinnin malleja saman henkistä valtiot voivat vaihdella ajan mittaan. Eri yhteyksissä on sama psyykkinen voi antaa muunnettu kuvia hyvin, riippuen sisältökohdistettu vaihtelut ja muut tekijät. [15] Tämä edellyttää joustavia paikkatietokohteiden uudet ja luokittelu algoritmeja voidaan käyttää kuten Haynes ja Rees. Uskomme, nämä ongelmat voidaan ratkaista, kun kehittää tehokkaita menetelmiä.
Lisää kyseenalainen kysymys on ongelma ekstrapolaation uusiin kognitiivinen todetaan. Haynes ja Rees huomauttaa, että useita mahdollisia perseptiokyvystä tai kognitiivinen valtioissa on ääretön, kun taas joissakin koulutustoimissa luokat on väistämättä rajallinen. [15] Se on ratkaisevan tärkeää sen vuoksi, että dekooderi voitaisiin koulutettu yleistää saatu kokemus pienistä koulutus asettaa aivan uusia luokkia. Se olisi mahdollista keinot ekstrapolaation jos aivojen aktivaation mallit ovat todella järjestetään joissakin järjestelmällinen muuttujien tilaa. Tämä jää kuitenkin todennut, on luultavaa, on mahdollista, että ainakin joidenkin mielenterveyden content [15]. Jos abstrakti muoto tilaa luokitteluasteikosta neuraalilaskennan mallit todellakin olemassa, se antaa meille mahdollisuuden teoretisoida on mahdollisuuksia kartoitus ihmisen aivojen kognitiivinen todetaan onto Global Knowledge Kartta kuvattu aiemmin tässä asiakirjassa. Jos tämä tavoite saavutetaan, mainitun "ongelma alkuperäisen pyynnön" on ratkaistu ja "ihanteellinen ihmisten <-> KRS" ketjun voidaan perustaa.
3.5 Learnable Dekooderi
Koska nyt on tiedossa, kiitos uusimmat saavutukset aivojen kuvantaminen, että on mahdollista erottaa aktivoinnista eri aivojen alueilta silloin, kun henkilö on ajatellut eri aiheista voimme olettaa, että on mahdollista luoda learnable dekooderiin karttaan ihmisten aloitti kognitiivinen todetaan onto tietoon kartta osaamisyhteisön edustusto System. Siis ihanteellinen tapa ihmisen ja tietokoneen vuorovaikutus saattaa vahvistaa sallimalla valtava nopeus ja tarkkuus viestintää järjestelmää. On vähemmän tietoja johtuu poistaminen kielellisen vaiheessa vuorovaikutusta. Nopeus ja tehokkuus vuorovaikutus lisääntyy vastaavasti. Nämä kaksi tekijää ansiosta ihmiset eri ammattiryhmien tehostaa heidän työtään huomattavasti. From [6, 15] me tiedämme, että on tiettyjä säännönmukaisuuksia sijainnista aivojen impulssien ja aiheista tietoon, jotka ovat yhteisiä kaikille ihmisille, voimme kutsua näitä ominaisuuksia ihmisen. On kuitenkin tiedossa, että suurin osa näistä linkeistä olisi yksilökeskeinen. Siksi dekooderi on yksitellen sopeutuvaisia.
On myös selvää, että tehokkuuden Dekooderin riippuu yksilöiden ja heidän koulutuksen ja kyky oppia. Voimme olettaa tämän kokeilut keinotekoisilla rajapintoja käytetään korvaamaan menetetty osaan. Eläimillä ja ihmisillä oli mahdollisuus keskittyä henkisesti erityinen tapa liikkua keinotekoinen manipulaattorin ja jopa oppia hallitsemaan todellista raajojen ja keinotekoiset niistä erikseen [20].
Ottaen huomioon edellä mainitun olemme sitä mieltä, että keinotekoinen neuraalilaskennan verkkoon - perustuva järjestelmä on paras ratkaisu salauksenpurkulaitteiden ongelma.
Dekooderi n oppimisprosessi
1) Lähtökohtana satunnaisella koordinaatit moniulotteinen tila GKM on valittu.
2) Useita asiakirjoja, joiden luottolaitoksen vuonna naapurivaltioiden alueella (Euclidian metristä on käytössä) on valittu ja näytetään inhimillinen toimija.
3) Operaattori keskittyy hänen huomionsa cognitively osallistua kyseiseen aiheeseen ja siihen liittyviä esineitä muistiin.
4) The neuroimaging tiedot on kerätty fMRI laitteisto yli tietyn ajan.
5) Tietoja käsitellään kautta paikkatietokohteiden uudet ja melun vähentäminen algoritmi pyrittiin otteen informatiivinen mallit kuvaavat nykyistä iteroinnin koulutusta.
6) Valmistetut tiedot noudetaan että panokset on neuraalilaskennan verkkoon. The GKM koordinaatit valitun pisteen haettu sen tuotokset siis koulutusta neuraalilaskennan verkko yhdistää tietyn aivojen aktivaation mallien kanssa GKM koordinaatit.
Kuva 3.1 Prosessi koulutuksen Dekooderin
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Recent Comments