Idealny system reprezentacji wiedzy lub wiedzy globalnego Mapa
W kierunku idealistycznym reprezentacji wiedzy systemu: Global Knowledge Mapa
Tarasa Filatov
Streszczenie
Jednym z najbardziej istotnych problemów, które hamują rozwój w dziedzinie reprezentacji wiedzy i sztucznej inteligencji jest problemem semantycznych lub dostosowanie wiedzy mapowaniem. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Postęp w jego rozwiązanie będzie bardzo korzystne dla zadań wyszukiwanie informacji, ontologia dostosowania znaczenie obliczenia, rozumienie tekstu itp. W dokumencie pojęcie wielowymiarowej wiedzy globalnego mapie, opracowany przez niekontrolowanych wydobycia zależności od dużych dokumentów korpusu, proponuje się . Ponadto, problem bezpośredniego spożycia przez ludzi - Wiedza Reprezentacja interfejs systemu i skierowana jest koncepcja adaptacyjnej dekoderów proponowane w celu interakcji z wcześniej opisanych jednolite odwzorowanie modelu. W połączeniu te dwa podejścia są sugerowane jako podstawa do opracowania nowej generacji systemów reprezentacji wiedzy.
Słowa kluczowe: reprezentacji wiedzy, znajomość map, komputera interakcji człowieka, ontologia dostosowania górnej ontologia, trafności obliczeń, wyszukiwanie informacji, dokument podobieństwa
1. Wprowadzenie
W społeczeństwie, w zakresie reprezentacji wiedzy stał się bardziej znaczący w ciągu ostatnich lat [25]. Ludzie zawsze starali się do badań i wiedzy na temat klasyfikacji wiedzy. Możemy znaleźć odniesienia z tak wcześnie, jak Sokrates, w piątym wieku przed Chrystusem [33] do rozkwitu logiki i epistemologii [28] w średniowieczu. Ponieważ problem zostało uznane za ważne w przeszłości, to jest trudne do przecenienia znaczenie w erze informacji.
Nowoczesne technologie mają ludzie obdarzeni z nadmierną powodzi danych, które są trudne do usystematyzowanie i procesu. Dla osoby, która ma stać się specjalistą w określonej dziedzinie zajmuje się przez całe lata i wymaga kolejnych informacyjny wyścigu nadążać za najnowszymi trendami zawodowych.
Jest to popularne wśród przekonania wiedzy inżynierów i specjalistów, data mining, że informacje dostępne w otwarty dostęp wystarczy wyciąg z prawdą faktów dotyczących praktycznie każdy aspekt naszego życia, a nawet przewidzieć przyszłości. Jedynym problemem do rozwiązania jest inteligentnie przetwarza informacje z wielu źródeł. [35].
Ten czynniki popytu nowej generacji systemów reprezentacji wiedzy, aby pomóc ludziom usystematyzowanie, dostęp i korzystanie z jego wiedzy.
W dokumencie proponujemy pomysłów na stworzenie nowej ery wiedzy Reprezentacja System (KRS).
Wierzymy, że najnowsze osiągnięcia w niektórych dziedzinach nauki i wkrótce doprowadzić do ogromnego przełomu w zakresie reprezentacji wiedzy ludzkiej i interakcji człowiek-komputer. To otworzy nowe horyzonty i znacznie zwiększyć efektywność pracy ludzi w wielu aplikacjach. Jedyną rzeczą, która powinna być wykonana jest dostosowanie tych osiągnięć razem.
Idealny KRS powinny zapewnić użytkownikowi wygodny dostęp do wiedzy ludzkości. Jej elementy są zatem:
- człowieka, który chce uzyskać dostęp do niektórych kawałek wiedzy jest on zainteresowany,
- przechowywania danych, oraz
- pośrednik system dostarcza interfejs do człowieka, aby uzyskać dostęp do wiedzy.
Przeszkody, które powstają tutaj ograniczeń spowodowanych przez człowieka umiejętności i obecne poziomu technologicznego.
2. Przechowywanie danych
2,1 State of the Art
Reprezentacji wiedzy systemu wymaga danych, chyba że jest w stanie pobrać niezbędne dokumenty ze źródeł zewnętrznych w czasie rzeczywistym. Możemy zarys dwóch podejść do wygranej idealnym KRS w dzisiejszych czasach: ustrukturyzowanego ręcznie zarządzane globalnej wiedzy, takich jak magazyny i ontologii obejmujących zautomatyzowanych systemów indeksowania i wyszukiwania najbardziej pełne i dostępne surowego zbierania dokumentów (World Wide Web), takie jak wyszukiwarki. Problem pierwszego podejścia jest w podręczniku charakter - wszelkie próby stworzenia i utrzymania globalnej bazy wiedzy ludzkiej w wyniku kompromisu pomiędzy szczegółowo, aktualność i użyteczność. ], UFO (Unified Framework Ontology) Niezależnie istnieje wiele udanych górnym ontologia projektów, takich jak Cyc [23], WordNet [12], DNS, SUMO itp i teoretyczne trwają dyskusje, tak długo jak badania zmierzające do opracowania znormalizowanego jednolity globalny ontologia pod nazwami Suo (Standard Upper Ontology ) [27], UFO (Unified ramowej Ontology) itp.
Drugie podejście stało się powszechne ze względu na historycznie WWW jest największy, kompleksowe i aktualne zbiór danych do automatycznego przetwarzania dziś. Jednak w przeciwieństwie do pierwszego podejścia, problemy automatycznego pobierania informacji odgrywają znaczącą rolę. Problemy ze zrozumieniem tekstu i przetwarzania języka naturalnego jest jednym z najtrudniejszych w AI i mimo to nadal bez skutecznego rozwiązania. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Adjacent są problemy związane z klasyfikacją i trafności obliczeń, tak zwane "web grupowanie" problem [1]. Drugie podejście (automatyczna indeksacja) w związku z tym ma poważne braki w dokładności wydobycia.
Nie trwają starania w sprawie wprowadzenia usprawnień do wyżej wymienionych metod w celu przezwyciężenia tych problemów. Dla przykładu, wraz z jednolitą bazę ontologia projektów (Suo, BULO) istnieją pewne próby opracowania ontologia dostosowania i ontologia mapowanie technik w celu dostosowania istniejącej ontologii razem ze sobą oraz z innymi rodzajami wiedzy podstawy [5, 17]. Jest to często proponuje się zmniejszyć braki ręcznego podawania w przypadku ontologii poprzez zautomatyzowane pobieranie informacji (wyszukiwarki, technologie). Z drugiej strony, poprawa standardów hipertekstowe są opracowywane w celu umożliwienia ręcznie określić informacje, aby pomóc wyszukiwarkom zrozumieć CommonSense rozumieniu WWW dokumentów i hiperłącza między nimi [24]. Konieczne jest, aby zrozumieć, że te rozwiązania hybrydowe nosić braki odpowiednich technik wraz z zalet.
Wadę jednoczy tych podejść i sprawia, że niemożliwe ich integracji: nie ma standard mapowania i ustanawiające stosunki między dokumentami i koncepcji w różnych systemach. Problem byłby rozwiązany w przypadku, gdy jeden z systemów o stałym matematycznie interpretowalne hierarchii takich jak ontologii pokonuje istniejące podejście (WWW). Jednak wydaje się mało prawdopodobne ze względu na wyżej wymienionych powodów. Niezależny pośrednik norma stanowi potencjalne rozwiązania tego problemu. Istnieje wiele inicjatyw w kierunku powiązania i wzajemne odwzorowanie bazami wiedzy różnych typów, wśród których znajduje się obszar ontologia mapowaniem. Inicjatywy mają jedną wspólną wadę: nie ma jednego standardu odwzorowania i ustanawiające stosunki między dokumentami. Następnie, żaden z nich nie jest prawdopodobne, aby stać się powszechnie uznaną normą chyba bardziej trwałego rozwiązania jest rozwijany.
2.2 Pojęcie "Global Knowledge Map (GKM)
Wierzymy, że możliwe jest opracowanie jednolitego standardu wiedzy mapowanie poprzez budowanie logicznego miejsca w celu projekcji w rzeczywistym świecie wiedzy koncepcji. Taki model (daj nam nazywać Global Knowledge Map) powinna odzwierciedlać poziom podobieństwa dokumentów i koncepcji mapowany na to.
Głównym celem tego modelu jest:
- Dostosowanie i cross-mapping dokumentów i pojęć (WWW, ontologie, e-biblioteki, katalogi itp.)
- Wyszukiwanie informacji za pomocą przeglądarki
- Dokładne automatycznych obliczeń CommonSense znaczenie
GKM wymaga matematycznego / logicznego modelu wiedzy składowania w szczególny warunek: jest optymalny dla zadania reprezentacji wiedzy tj. interakcji z człowiekiem. Dla spełnienia tego warunku model musi odzwierciedlać jej dimensionality lub w jej strukturze struktury ludzkiej wiedzy.
Wymagania są zatem:
- Dimensionality i kartografia.
Głównym czynnikiem dla dimensionality jest sens (lub tematu).
- Każde pojęcie ludzkiej wiedzy może być odwzorowany na punkt ze szczególnym współrzędne miejsca w systemie.
- Każdy dokument lub tekst może być mapowany na liczbę punktów (dokument jest podzielony na mêmes - znaczącej części) lub jeden punkt.
- Trafność obliczeń.
- Możliwe jest matematyczny do obliczania znaczenie dwóch pojęć przez obliczania odległości między odpowiadającymi im projekcji punktów w przestrzeni.
- Jest zatem możliwe do obliczenia "podobieństwa" między dokumentami i koncepcji poprzez obliczenie odległości pomiędzy ich mapowania.
- Jednorodności przestrzeni.
- Przestrzeń jest jednolite (jednorodne) i ciągłym
- Współrzędne odzwierciedlają znaczenie i odległości między punktami odzwierciedlenia różnicy w znaczeniu takim, że jeżeli punkt C leży między A i B to oznacza pojęcie C związane jest zarówno A i B jednakowo.
- Możliwe jest "Ludzie" miejsca znalezienia źródeł wiedzy mapowany na sąsiednich obszarach.
Budowanie modelu matematycznego takiego miejsca umożliwia rozwój Global Knowledge Map. Nie warto staramy się wypracować taki model (GKM) w sposób ręczny z powodu wyżej wymienionych przyczyn informacji wzrostu i ciągłe zmiany w ludzkiej zrozumienia świata. Wierzymy, że możliwe jest, aby wyodrębnić zależności od dostępnych i zasady corpuses tekstów i korzystać z tych procesorów, jak dla naszych map celów.
Kamień węgielny naszych założeń jest to, że generalnie można mapę różnych dziedzin wiedzy na pojedyncze miejsca i odległości w dimensionality tego ostatniego odzwierciedlać poziom podobieństwa między podane tematy. To założenie jest oparty na Johnson-Lindenstrauss lemat że zbiór n punktów w wysokiej Euclidian wymiarowej przestrzeni można dopasować do N wymiarowej przestrzeni Euclidian
(2,1)
w taki sposób, aby odległość między dowolnymi dwoma punktami zmiany tylko przez czynnik (1
[7]). The Vector Space Model powszechnie stosowane w wyszukiwanie informacji i dokumentów Tekst Categorization reprezentuje wysokie wymiarowe wektory [31]. Wektory te zawierają pewne poziomie (w zależności od wybranej funkcji metrycznych) informacji, które są wystarczające do sklasyfikowania przedmiotem oryginalnego dokumentu.
W Tychonoff's Theorem [26] stanowi, że punkty reprezentujące właściwości obiektów jednej klasy, powinny być umieszczone bliżej siebie w nieruchomości miejsca niż do punktów reprezentujących właściwości obiektów innych klas. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. W naszym zadaniem oznacza to oryginalny wektor przestrzeni n Teksty mogą być przewidywane na stałe N-wymiarowej przestrzeni i przy użyciu odpowiedniego algorytmu kompresji danych do / dimensionality redukcja ze względu na twierdzenie zwartość [22] mapowanie zostanie osiągnięty, gdy odległości między punktów przedstawia znaczenie odpowiednich dokumentów.
Czynniki, które wpływają na precyzję odwzorowania:
- reprezentatywności charakterystyka funkcji oraz wielkości funkcja miejsca
- rozmiar, dispersity i jakości dokumentów korpus
Pod warunkiem, że teoria jest stosowane w obecnych warunkach to nadal można znaleźć technik, które stosuje się w celu opracowania map. Proponujemy, aby skoncentrować się na automatyczne powodu wiele komplikacji podejmowania podręcznika ekspertów oparte na mapowanie zastosowania.
2,3 Automatyczne GKM generacji poprzez niekontrolowanych ekstrakcji (hipoteza)
W celu okazać GKM powinien zawierać mapowania znaczącej liczby rzeczywiste słowo (WWW) i dokumenty w jej strukturze reprezentuje wspólne ludzkie rozumienie świata. Nie warto więc rozważyć wszelkie sposoby ręcznego tworzenia GKM i wypełnienie go dokument mapowań. Data mining zasady powinny być stosowane do wyodrębniania zależności reprezentujący wiedzę z existant zbiór dokumentów dostępnych do komputerowego przetwarzania i odfiltruj niepotrzebnych danych.
Miały miejsce liczne próby do niekontrolowanych wydobycia w zależności tekstów jednak nadal jest wątpliwe, czy jakiejkolwiek techniki jest zdolna do zapewnienia trwałego ekstrakcji wiedzy poprzez analizę dużych kolekcji dokumentów [10, 11, 21, 30].
Let's podzielić na czynniki, które wpływają zasadniczo na treści dokumentów na trzy kategorie:
- Autorzy osobowych czynników (uczuć i motywacji do tworzenia tekstu, fizyczne i moralne stwierdza podczas myślenia i piśmie)
- Język (zasady itp na język używany do pisania tego dokumentu)
- Wiedza (niektóre części ludzkiej wiedzy autora przekazuje bezpośrednio lub pośrednio poprzez dokument)
Let's przypuszczać, że jest to możliwe do procesu wszystkie dostępne dokumenty tekstowe ludzkich autorów i wyodrębnić wszystkie zależności zasad. W tym przypadku wpływ czynnika 1 będzie minimalny. Wpływ czynnika 2 nie jest bardzo ważne z następujących powodów:
a) dokumenty w wielu językach mogą być indeksowane, więc wzajemnie zmniejszenia wpływu
b) język odzwierciedla się ludzkiej wiedzy [18], więc w pewnym stopniu czynnik 2 jest subfactor 3, a nawet wydobycia ich mieszaniny stanowi osiągnięcie zadowalających
Teoretycznie jest możliwe, a następnie wyodrębnić info głównie odpowiadających ludzkiej wiedzy narażone poprzez dostępnych dokumentów. Niniejsza informacja przekształcona do mapowania miejsca hipotetycznie dostarcza nam zrównoważonego GKM.
2.4 Wdrażanie (eksperyment)
W miejsce budowy każdego dokumentu powinien być mapowany na jednym koordynować. W "Przeglądanie" w przestrzeni lub w odległości porównania wykazują, że sytuacja dokumentów lub ich grup odzwierciedlają ich znaczenie i że możliwe jest przypisanie niektórych temat nazw konkretnych współrzędnych w przestrzeni.
Nasze eksperymenty z wykorzystaniem 2 i 3 wymiarowe Kohonen SOM z lokalnych kolekcji dokumentów wykażą, że odległości między projekcjami dokumenty nie są stabilne w całej serii rozpoczyna. To naszym zdaniem jest dowodów na fakt, że dimensionality na mapie jest niewystarczająca, które spełnia Johnson-Lindenstrauss lemat wymienionych powyżej.
Niestety jest to niemożliwe do przeprowadzenia eksperymentu z właściwego dimensionality. Na przykład, zgodnie z Johnson-Lindenstrauss lemat do 20000 mapę dokumenty pozwalające na 10% będzie wymagało błędu 58 wymiarów. Wymaga to obliczenia, które są powyżej nowoczesne komputery zdolności.
Ważną rzeczą jest tu wspomnieć, że chociaż lemat daje maksymalną dimensionality w przestrzeni umożliwiające mapowanie do spełnienia warunku pojedynczych projekcji, nie jest konieczne minimalnej wartości skuteczne. Lemat daje wartość zbioru n punktów tj. najgorszym przypadku, który prawdopodobnie nie pojawi się w praktyce. Metody wykrywania dimensionality należy stosować do obliczania efektywnej dimensionality danych iw związku z tym ustalenie prawidłowej liczby wymiarów przyporządkowania poszczególnych danych. Nie znane są techniki, które pochodzą z tym tle powierzchni odbudowy. Jedną z najnowszych jest dziełem S. Cheng, Wang Y. i Z. Wu [4], gdzie wymiar metoda wykrywania poprzez Principal Component Analysis [8] jest. W związku z tym swoistych dimensionality danych mogą być wyodrębnione. Jak w praktyce wartość ta jest niższa od maksymalnej dimensionality niezbędne do projekcji taką samą liczbę dokumentów w najgorszy teoretycznego przypadku, daje to znaczne ograniczenia w obliczaniu czasu. Ewentualnie w tym samym celu można rozważyć metody oparte na iteracyjny ocen. Celem dimensionality redukcji w naszym przypadku jest ustanowienie skutecznego mapowanie gdzie CommonSense podobieństwa źródeł informacyjnych jest wyrażona poprzez Euclidian odległość między punktami projekcji. Podjęciem jakichkolwiek dimensionality zmniejszenie techniki oparte na losowo wyboru zestawu danych wejściowych (takich jak analiza głównych składowych, Self Organizacyjny Maps Sammon odbudowy lub triangulacji), w przypadku, gdy wyjściowa dimensionality jest mniejsza niż potrzeby, projekcje będą niestabilne i z każdym ponownym odwzorowania będą różne i odległości między projekcjami nie zachowania. Można również przypuszczać, że przy skutecznym dimensionality danych wejściowych manifold jest używane do mapowania, odległości zachowa z pewną swobodę w zależności od dimensionality zmniejszenie metody. Alternatywnym rozwiązaniem jest więc wynikiem losowego wyboru dimensionality zmniejszenie technika w połączeniu z incremental dimensionality równolegle oceny odwzorowania. 32]. Rozważmy na przykład techniki uprawy SOMs opisany w [19, 32]. Zmierzających do zmniejszenia obliczania czasu, liczby węzłów wzrasta dynamicznie nowych węzłów równomiernie rozprowadzone wśród starych wag i ich nosicieli jest ustawiony na środki sąsiednich oryginalnych wektorów wag. Samej techniki stosowane do dimensionality (D) dałoby możliwość oceny każdego D krok po kroku. Kryteria oceny będą stabilizacji odległości między projekcjami. W tym celu dwóch lub więcej samodzielnego organizowania mapy mogą być prowadzone równolegle z Pairwise odległości między niektórych prognoz, które są porównywane na każdej iteracji. Zgodnie iteracji tutaj rozumiemy etapie, kiedy dimensionality z SOM został podwyższony i sieć została ustabilizowana w związku z nowymi parametrami.
Podsumowując wyżej proponujemy następujące modelu eksperymentalnym oceny lepsze podejście do ustanowienia globalnego wiedzy Mapa ze zbiorów dokumentów tekstowych.
W datase t: wektor przestrzeni modelu, które mają być stosowane (każdy dokument reprezentowane jako wektor z funkcji jak wymiary i funkcje "zalicza się współrzędne w odpowiednich wymiarach).
Funkcja wyboru funkcję: najskuteczniejsze, które zostaną określone.
Vector wielkość: należy ustalić empirycznie.
Przetwarzania i przechowywania danych.
A dimensionality zmniejszenie powinny być stosowane techniki przyporządkowania. Istnieją dwa możliwe podejścia:
a) wstępne obliczenia rzeczywistej dimensionality i oceny różnych metod redukcji dimensionality ze znaną dimensionality z odwzorowania;
b) "incremental dimensionality oceny podejścia" z kilku mapowania są prowadzone równolegle - tylko z metody losowego doboru danych wejściowych mogą być wykorzystane.
Wejścia: dokumenty funkcji wektorów.
Wyjścia: GKM współrzędnych.
Ocena:
1) oceny CommonSense korespondencji między początkowym dokumentów i Euclidian odległości ich odwzorowania prognoz.
2) Stabilizacja tych Pairwise odległości między projekcjami poprzez różne uruchamia w przypadku losowego wyboru techniki wykorzystywane.
3. Interfejs
3,1 Doskonała znajomość reprezentacji interfejsu
Interfejs część systemu reprezentacji wiedzy jest ważne, gdy system jest idealny dyskusji. Oba zadania otrzymaniu wniosków od użytkowników oraz przekazywania wiedzy z powrotem do nich mają jednakową wagę z zadaniami ustrukturyzowaniu i przechowywania danych. W dokumencie omówiono sposoby na wiedzy Reprezentacja Systemy nowej generacji, a zatem kwestia interakcji jest overviewed w celu ustalenia, czy możliwe jest zapewnienie idealistyczne interfejs za pomocą nowoczesnych technologii.
Interfejsy, które są wykorzystywane do wspierania interakcji człowieka z nowoczesnymi użytkownika reprezentacji wiedzy i informacji pobieranie systemów głównie "indeksowanie", tzn. użytkownicy muszą wiedzieć dokładnie to, czego szukają i też trzeba go określać językowej. W typowym przykładem takiego interfejsu wyszukiwarki. Jak już wspomniano powyżej, wyszukiwarka i zbiór dokumentów WWW jest najbardziej kompletny i aktualny system reprezentacji wiedzy dostępnej dzisiaj, co jest przyczyną ich popularności. Jednocześnie wiadomym jest, że "indeksowanie" interfejs nie jest do wykorzystania naturalnych dla ludzi, ale jest jedyną alternatywą jako "przeglądania" podejścia są ustanawiane bardzo słabo [16]. Powodem tego jest problem wiedzy i dostosowanie map, które nie pozwalają na zautomatyzowanej klasyfikacji i reprezentacji dokumentów zgodnie z ich tematy. Jednakże, z problemem jednolity wiedzy mapowanie miejsce rozwiązany, pojawiają się nowe możliwości na budowę poprawie, bardziej naturalne interfejsy "przeglądania" typ.
3.2 High dimensionality i wizualizacji
Po wspomnieć, że wynikające z globalnego mapowanie przestrzeni może być n-wymiarowej, gdzie n jest wysoki jest to konieczne, aby rozwiązać problem wizualnej reprezentacji. Jest to możliwe dla człowieka, aby wyobrazić sobie przestrzeni 3D, więc optymalne sposoby ND-> 3D reprezentacji są oceniane. Dimensionality zmniejszenie lub wielu technik reprezentacji podejście poprzez interfejs może być używany.
Ważne jest, aby z pomocą jednolitego wiedzy mapowanie przestrzeni błąd jest zminimalizowane podczas obliczania adekwatności między dokumentami, a ponadto, że pobieranie odpowiednich dokumentów nawet z innych systemów staje się trywialne zadanie. Dla użytkownika oznacza to, gdy system znajduje tematem jest on zainteresowany, to nigdy nie doprowadzi użytkownika do nieodpowiednich dokumentów.
3.3 Informacje wniosek łańcucha
Gdy zadań przedmiotów i map lokalizacji, obliczanie i znaczenia wiedzy kosmicznej przeglądania zostaną rozwiązane najważniejszych zadań, które pozostają do rozwiązania jest problem wstępny wniosek. W state-of-the-art information retrieval system następujących procesów są zwykle jest zaangażowanych gdy informacje:
Ludzi części: 1) Imagination -> 2) tworzenie konstrukcji językowych -> 3) klawiatury ręczne (śpiew wejścia) -> Machine część 4) językowych dekodowania -> 5) dopasowanie i lokalizacji -> 6) wizualizacji pasujących dokumentów
Łańcuch jest długa i jest oczywiste, że utrata danych i korupcją jest znaczące ze względu na podwójne językowej kodowania i dekodowania. Po pierwsze, użytkownik ma do formułowania poznawczo obrazy językowej w krótkim zdaniu. Po drugie, system musi dekodować zdanie w celu zrozumienia przedmiotem zainteresowania użytkownika. Opisany łańcuch początkowy wniosek przyczyny niezadowolenia użytkowników nowoczesnych wyszukiwarek z powodu niezdolności systemu do "zrozumieć" wniosek powoduje ogromne straty czasu na użytkownika końcowego. Stopień tych wyszukiwanie błędów i niedogodności powodowanych przez interfejs ograniczenia jest znaczący i znacznie zminimalizować efekt bardziej precyzyjne wyszukiwanie i lokalizacji dokumentów wprowadzonych przez jednolity mapowaniem.
Konieczne jest zatem rozważyć, przynajmniej teoretycznie, możliwość utworzenia idealnym krótkim łańcuchu człowieka <-> reprezentacji wiedzy systemu interakcji z jednostki powodując utratę danych są zniesione:
Ludzi części: 1) Imagination -> [wniosek jest przekazywana przez bezpośredniego spożycia przez ludzi mózgów GKM współrzędne konwertera] -> 2) dopasowanie i lokalizacji -> 3) wizualizacji pasujących dokumentów
Mamy przegląd najnowszych osiągnięć w dziedzinie Brain Computer Interfaces (BCI) na ten cel.
3,4 Brain-Computer Interfaces
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Badania BCI został trwający od ponad 30 lat i obszar ten jest wciąż bardzo młody i rozwija się szybko. Do ostatnich chwili m ost znaczne postępy w dziedzinie zostały dokonane na sztuczne kończyny kontroli tj. automobilizm funkcji mózgu [ 3] i ich interpretacji i przetwarzania sygnałów wzrokowych. Osiągnięcia te zostały sprawdzone podczas wielu eksperymentach z udziałem zwierząt i ludzi. Naukowcy raporcie pomyślnej integracji mechanicznych lub elektronicznych urządzeń w przypadku gdy zwierzęta lub ludzi, nauczysz się kontrolować urządzenia za pomocą ich mózgu, inne sprawozdania udany transfer i dekodowania sygnałów wizualnych [15, 20].
Brain-computer interfaces studia są ściśle związane z obszarem funkcjonalnym neuroimaging, gdzie różne technologie zostały opracowane w celu skutecznego zapisu stanach osoby mózgu poprzez niektóre cechy fizyczne. Najbardziej wydajne z punktu widzenia BCI jest ostatnim neuroimaging technikę, nazwaną Functional Magnetic Resonance Imaging ) (FMRI) [6, 13]. Technika ta pozwala na zapis dynamiki przepływu krwi w różnych obszarach mózgu w czasie oraz z wysoką precyzją. To w konsekwencji pozwala na ustalenie związków między wzorce aktywacji różnych obszarów mózgu i niektórych działań i procesów poznawczych człowieka. Ważne jest, że technika ta, w odróżnieniu od wielu alternatyw, jest nieinwazyjne i nie pociąga za sobą wstrzykiwań. Należy pamiętać jednak, że dziś fMRI sprzęt jest nadal bardzo kosztowne i ciężki.
Ważnym jest, że doświadczenia wskazują, że mózg przystosowuje się do nowych warunków. Na przykład, gdy automobilizm impulsów były wykorzystywane do kontroli mechanika manipulatora lub komputera kursor myszy, mózg był w stanie rozróżnić i stopniowo uczą się oddzielnie od kontroli manipulatora sztuczne kończyny. Lebedev wspomina efekt "plastyczności mózgu", który potencjalnie umożliwia włączenie urządzenia do sztucznego organu reprezentacji. [20]
Najnowsze publikacje w dziedzinie neuroimaging jeszcze bardziej omówić możliwość wykrywania poznawcze członkowskich [15]. To stanowi skupienie naszej uwagi na możliwość stosowania BCI w KRS interakcji człowieka.
Wiadomym jest, że różne poznawcze związane z niektórych państw świata rzeczywistego obiekty odpowiadają niektóre modele obszarów mózgu aktywacji. Dekodowanie te wzorce, które pozwala zrozumieć nałożony ukierunkowane bodźce osoba jest aktualnie pracujący (gdzie ich uwagę jest skierowany) lub w przypadku obiektów w celu identyfikacji wizualnej klasy obiektów, które dana osoba jest obrazowania (np. twarzy, budynki, meble), a nawet obiekty "Kolor i orientację. [15] Te procesy są skomplikowane i dalekie od rozumie w tej chwili. Dalsze badania nie ujawniają w jaki sposób niskiej i wysokiej zamów zamów sygnały mózgu koreluje z niektórych funkcji poznawczych, jak przestrzenne charakterystyki struktury i zmian w czasie w różnych wpływów, w jakim stopniu możliwe jest ekstrapolacji aktywacji różnorodnych wzorów przedmiotów; itp. Uważa się jednak, że dokładnej znajomości "obliczeń" wykonane w ludzkim mózgu nie ma kluczowe znaczenie dla budowy odpowiednich BCIs. [20] Wspólne dane technik górniczych może być stosowana do wyciągania informacji z różnych neuroimaging czujników i ustanowienie połączenia z niektórymi państwami poznawcze.
Istnieją jednak istotne kwestie, które mogą poważnie wpłynąć na powodzenie zastosowania BCI w dziedzinie reprezentacji wiedzy. Dwie niewielkie problemy uogólnienie w czasie i problem różne instancje tego samego stanu psychicznego. Wiadomym jest, że obszary mózgu aktywacji wzorców psychicznych tego samego państwa mogą się różnić w czasie. Różne instancje tego samego stanu psychicznego może dać zmodyfikowane obrazy, jak również, w zależności od odmiany kontekstowego i innych czynników. [15] To wymaga elastycznego przestrzenne resampling i klasyfikacji algorytmów, które mają być stosowane, zgodnie z sugestią Haynes i Rees. Wierzymy, że te problemy zostaną rozwiązane na opracowanie skutecznych technik.
Więcej wątpliwych kwestii jest problem ekstrapolacji do nowej poznawcze członkowskich. Haynes i Rees pamiętać, że liczba możliwych percepcyjny lub poznawczych członkowskich jest nieskończony, natomiast liczba szkoleń kategorii jest z konieczności ograniczony. [15] Istotne jest zatem, że dekoder może być przygotowani do uogólniać doświadczenia uzyskane z małych szkolenia zestaw do całkowicie nowych kategorii. Byłoby to możliwe poprzez ekstrapolację jeśli mózg aktywacji modele są rzeczywiście ułożone w niektórych systematyczne parametrycznymi miejsca. To nadal jest jednak, uważa się, możliwe jest, przynajmniej dla niektórych rodzajów treści psychicznego [15]. W przypadku abstrakcyjnego kształtu miejsca klasyfikacji neuronowe wzorce rzeczywiście istnieje, pozwoliłoby to nam teoretyzować na temat możliwości mapowania ludzkiego mózgu poznawczych stanowi na Global Knowledge Mapa opisany wcześniej w tym dokumencie. Udostępnione zostanie to osiągnięte, wyżej "problem początkowy wniosek" zostanie rozwiązany i "idealnego człowieka <-> KRS" łańcuch będzie możliwe do ustalenia.
3,5 Learnable Dekoder
Jak teraz jest znana dzięki zastosowaniu najnowszych osiągnięć obrazowania mózgu, że możliwe jest rozróżnienie aktywacji różnych obszarów mózgu, gdy dana osoba jest myślenie o różnych przedmiotów możemy domniemywać, że możliwe jest stworzenie learnable dekoder do mapę wszczęła poznawcze człowieka stanowi wiedzy na mapie wiedzy Reprezentacja systemu. Dlatego idealnym sposobem na interakcję człowiek-komputer może zostać ustalone umożliwiające ogromną prędkość i precyzja komunikacji z systemem. Będzie mniej utraty danych z powodu zniesienia językowej etapie interakcji. Szybkość i skuteczność interakcji zwiększy konsekwencji. Te dwa czynniki pozwolą ludzi różnych zawodów, aby zwiększyć efektywność ich pracy znacząco. Od [6, 15] wiemy, że istnieją pewne prawidłowości lokalizacji mózgu impulsy i wiedzy osób, które są wspólne dla wszystkich ludzi, możemy połączyć te funkcje antropogenicznych. Jednak wiadomo jest, że większość z tych linków powinny być indywidualistyczny. Dlatego dekoder musi być indywidualnie adaptacyjne.
Jest także oczywiste, że skuteczność dekoder będzie zależało od osób fizycznych i ich szkolenia i zdolność do nauki. Możemy przypuszczać, to z doświadczeń ze sztuczną interfejsy wykorzystywane do zastąpienia utraconych kończyn. Ludzi i zwierzęta będą mogły skoncentrować się psychicznie w szczególny sposób, aby przenieść sztucznego manipulatora, a nawet nauczyć się kontrolować rzeczywiste i sztuczne kończyny osobno [20].
Biorąc pod uwagę wyżej wymienione wierzymy, że sztuczne sieci neuronowe - mechanizm oparty jest najlepszym rozwiązaniem problemu dekodera.
Dekoder jest proces uczenia się
1) Punkt z losowo współrzędne w wielowymiarowej przestrzeni GKM jest zaznaczona.
2) Wiele dokumentów posiadających mapowania w sąsiednich powierzchni (Euclidian metrycznych jest używana) są wybierane i wyświetlane na człowieka.
3) Operator koncentruje swoją uwagę na cognitively uczestnictwa danego tematu i powiązanych obiektów w pamięci.
4) W neuroimaging dane są gromadzone przez fMRI sprzętu przez określony czas.
5) Dane są przetwarzane przez przestrzenne resampling i redukcji hałasu algorytmu na celu wyodrębnić informacje wzorców charakteryzujących obecne iteracji szkolenia.
6) Przetworzone dane są pobierane do wejścia do sieci neuronowych. W GKM współrzędne wybranego punktu są pobierane do wyjścia zatem szkolenie sieci neuronowe skojarzyć konkretne wzorce aktywacji mózgu z GKM współrzędnych.
Rysunek 3.1 Proces szkolenia dekoder
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Najnowsze komentarze