Идеален знания Представителство на системата или глобални знания на сайта
Към идеалистичен знания Представителство система: Глобални знания на сайта
Taras Filatov
Резюме
Един от най-важните проблеми, които инхибират нататъшно развитие в областта на знанието и Представителството Изкуствен интелект е проблем на семантичните изравняване или знания картографиране. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Напредъкът в своето решение, ще бъде много полезно за изпълнение на задачите на извличане на информация, онтология привеждане в съответствие, изчисляване значение, текст разбиране и т.н. В доклада на концепцията за много измерения глобалните знания карта, изработена през надзор добив на зависимости от големи документи корпус, е предложена . В допълнение, проблемът на директните човека - Познаване Представителство интерфейс на системата е адресирана и концепцията за адаптивно декодер, предложени за целите на взаимодействие с предварително описани единна картографиране модел. В комбинация тези два подхода са предложени като основа за разработването на ново поколение на знания представителство системи.
Ключови думи: представяне на знания, знания картографиране, човешки компютър взаимодействие, онтология подравняване, горната онтология, приложимостта изчисление, извличане на информация, документ сходство
1. Въведение
В общество, в областта на знанието представяне стана по-голямо значение през последните години [25]. Хората винаги се опитва да направи проучване и класифициране на знания за знания. Ние можем да намерим референции от най-рано, както Сократ в пети век пр. н. е. [33] до процъфтяване на логика и епистемология [28] през Средновековието. Тъй като проблемът се смята за важно в миналото, че е трудно да се надценява значението му по време на ерата на информацията.
Модерните технологии са надарени човечеството с прекомерни наводненията от данни, които трудно могат да се систематизират и обработват. За да може човек да стане специалист в дадена област, то отнема години на обучение и изисква последваща информационни раса да се справи с най-новите професионални тенденции.
Той е популярен сред вярата знания данни минни инженери и специалисти, че наличната информация в отворен достъп е достатъчно, за да извлечете истината факти за почти всеки аспект от живота ни и дори да предскаже бъдещето. Единственият проблем за решаване е интелигентно да се обработва информацията от множество източници. [35].
Това фактори на търсенето ново поколение системи за представяне на знания, за да систематизират човечеството, достъпа и използването му за колективно знание.
В сегашната книга ще предложат идеи за развитие на нова възраст знания Представителство система (KRS).
Ние вярваме, че последните научни достижения в някои области и науки скоро ще доведе до огромен пробив в приложното поле на човешкото познание представителство и взаимодействието човек-компютър. Това ще отвори нови хоризонти и значително увеличаване на ефективността на работата на човека в много приложения. Единственото нещо, което трябва да се направи е да се въвеждат тези постижения заедно.
Идеален KRS следва да предоставят на потребителя, с удобен достъп до всички познания на човечеството. Нейните елементи следователно са:
- на човека, който иска да има достъп някои парче на знания той / тя се интересува,
- за съхранение на данни, и
- посредничеството система да предоставя интерфейс за хора с достъп до знания.
Препятствията, които възникват тук са причинени от ограничения на човешките способности и текущо технологичното ниво.
2. Данни за багаж
2,1-членка на изкуството
Знания представителство система изисква за съхранение на данни, освен ако не е в състояние да изтегляте необходимите документи от външни източници в реално време. Ние можем да очертават два часа печелившата подходи за идеална KRS от днес: структуриран ръчно управлявани глобалните знания складове като онтологии и автоматизирани системи, включващи индексиране и извличане на най-пълно и достъпно за събиране на сурово документи (World Wide Web), каквито са търсачките. Проблемът на първия подход е в неговото ръководство характер - всеки се опитва да създаде и поддържа глобалната човешка база знания, ще доведе до компромис между детайл, актуалността и използваемост. ], UFO (Unified Framework Ontology) Независимо съществуват множество успешни горна онтология проекти като Cyc [23], WordNet [12], DNS, Сумо т.н. и текущи теоретични дискусии, докато научните изследвания, насочени към разработване на стандартизирана единна глобална онтология под имената на SUO (Стандартен Горна онтология ) [27], UFO (Единна рамка онтология) др
Вторият подход стана традиционно преобладават поради WWW е най-голямата, пълна и актуална корпус на наличните данни за автоматизирана обработка днес. Въпреки това, за разлика от първия подход, проблемите на автоматизирано извличане на информация играе важна роля тук. Проблемите на текст, разбиране и обработка на естествен език са една от най-предизвикателни в Гай и въпреки това все още остават без ефективно решение. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Съседни са проблемите на класифицирането и значимостта пресмятане, така наречените "Уеб клъстеринг" проблем [1]. Вторият подход (автоматизирано индексиране) има големи липсва в точността на извличане.
Там са продължаващите усилия за привеждане подобрения на гореспоменатите подходи, за да се преодолеят тези проблеми. Така например, заедно с единна база онтология проекти (SUO, BULO) са налице някои опити за разработване на онтология подравняване и онтология картографиране техники, за да съществува онтологии, заедно с всяка друга и с други видове знания бази [5, 17]. Тя често е предложено да се намалят недостатъците на ръчно управление в случай на онтологии чрез автоматизирано извличане на информация (търсачката технологии). От друга страна, подобрената хипертекст стандарти са разработени с цел да направи възможно ръчно да посочите информация, която да подпомогне търсачки разберат commonsense смисъла на WWW документи и хипервръзки между тях [24]. Необходимо е да се разбере, че тези хибридни решения носят недостатъците на съответната техника, заедно с предимства.
Един недостатък обединява тези подходи и прави невъзможна тяхната интеграция: не съществува стандарт за картографиране и за установяване на връзки между документи и концепции в различните системи. Проблемът ще бъде решен в случай една от системите, с фиксирани математически interpretable йерархия като онтологии преодолява съществуващия подход (WWW). Това обаче изглежда малко вероятно, поради горепосочените причини. Независими посредник стандарт е потенциален решение на този проблем. Съществуват множество инициативи по посока на обвързване и взаимно картографиране на знания бази на различни видове, сред които има площ от онтология картографиране. Инициативите имат един общ недостатък: няма единен стандарт за картографиране и за установяване на връзки между документи. Впоследствие, нито една от тях е вероятно да се превърне в широко признат стандарт, освен ако не е по-трайно решение е развита.
2,2 Концепцията на Global знания на сайта (GKM)
Ние вярваме, че е възможно да се разработят единен стандарт за картографиране на знания чрез изграждане на логическо пространство с цел проекция на реалния свят знания концепции. Такъв модел (нека го наричат Global знания на сайта), трябва да отразява степента на сходство на документи и концепции картографиран върху него.
Основна цел на модела е:
- Подравняване и транс-картографиране на документи и концепции (WWW, онтологии, електронни библиотеки, директории и т.н.)
- Извличане на информация чрез браузъра
- Точна автоматизирано изчисляване на commonsense значение
GKM изисква математически / логически модел на знания за багаж с конкретни условия: бъдат оптимални за задачата на знания представителство т.е. взаимодействие с хора. За изпълнението на това условие, моделът трябва да отразява в своя размерността или в структурата на структурата на човешкото познание.
Изискванията следователно са:
- Измеренията и картографиране.
Основният фактор за размерността е смисълът (или тема).
- Всяка концепция на човешкото познание може да бъде назначено върху точката с конкретни координати в системата пространство.
- Всеки документ или текст, може да бъде назначено върху броя на точките (документ е разделен на memes - значими фигури), или една точка.
- Relevance изчисление.
- Възможно е да се изчисли математически значимост между двете понятия чрез изчисляване на разстоянието между съответните им проекция точки в пространството.
- Затова е възможно да се изчисли "сходство" между документи и концепции чрез изчисляване на разстоянието между техните mappings.
- Еднородността на пространството.
- Мястото е еднакъв (хомогенна) и непрекъснато
- Координати отразява смисъла и разстоянията между точките отразява разликата в смисъл, така че ако точка В се намира между А и Б, то това означава, концепцията C е свързано с двете А и Б еднакво.
- Възможно е да "Browse" пространството намиране на знанието източници картографиран към съседни райони.
Изграждане на математически модел на такова пространство, дава възможност за развитието на Глобалната знания на сайта. Не е полезно опитват да изработят такъв модел (GKM) в ръчен начин поради горепосочените причини, свързани с информацията за растеж и непрекъснати промени в човешкото разбиране на света. Ние вярваме, че е възможно да извлечете зависимости и правила от наличните corpuses на текстове, както и използването на тези процесори за картографиране на нашите цели.
Ъгъла камък на нашата предположения е, че той обикновено е възможно да План различни предмети върху човешкото знание единен пространството и разстояния в рамките на размерността на последните отразяват степента на сходство между дадени индивиди. Това предположение се основава на Джонсън-Lindenstrauss лема се посочва, че множеството от точки в N високи пространствени Euclidian пространство може да бъде назначено определяне на N триизмерна Euclidian пространство
(2,1)
такава, че разстоянието между две точки от промени само фактор (1
) [7]. Вектора Space Модел често използван в извличане на информация и текст Категоризация представлява документи толкова високи пространствени вектори [31]. Тези вектори съдържат определено ниво (в зависимост от избраната функция метрични) на информация, която е достатъчно, за да класифицират предмет на оригиналния документ.
В Tychonoff на теоремата [26] посочва, че точките, които представляват свойствата на обекти от един клас, трябва да се намира близо до една на друга в имота пространство, отколкото да се точките, които представляват свойства на обекти от други класове. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. В нашата задача, това означава, оригиналната векторно пространство на N текста може да се очаква към фиксирани N триизмерна пространство и използването на подходящ алгоритъм за компресиране на данни / размерността намаление се дължи на теоремата на компактност [22] картирането ще бъде постигнато, когато разстоянията между точки представляват приложимостта на съответните документи.
Факторите, които влияят върху точността на картографиране:
- представителност на метрични функция и размера на функцията пространство
- размер, dispersity и качество на документите, корпус
При условие, теорията е приложима при сегашните условия, то остава да се намери техниките, които се използват, за да разработят картирането. Ние предлагаме да се съсредоточи върху автоматични средства поради много усложнения ръчно вземане на експертно-базирани картографиране неприложим.
2,3 Автоматично GKM поколение чрез екстракция надзор (хипотеза)
За да бъде полезна GKM трябва да съдържа mappings на значителен брой реални дума (WWW) документи, и по своята структура представлява общата човешка разбиране на света. Това не е полезно да се разгледа всеки наръчник начини за създаване на GKM и попълването му с документ mappings. Данните минни принципи следва да се използва за извличане на зависимости, представляващи познание от съществуваше корпус от документи на разположение за компютърна обработка и филтрира ненужните данни.
Налице са многобройни опити за надзор добив на зависимости в текстовете, но все пак това е съмнително дали някоя техника е в състояние да осигури устойчив добив на знания чрез анализ на големи документи, събиране [10, 11, 21, 30].
Да се разделят на фактори, които обикновено се засяга съдържанието на документи в три категории:
- Автори лични фактори (чувства и мотиви за създаване на текст, физическо и морално-членки по време на мислене и писане)
- Език (правилата и т.н. на език, който се използва за да пиша тук)
- Познания (някои части на човешкото познание автор предава пряко или косвено чрез документ)
Да предполагам, че е възможно да обработим всички текстови документи на човешките автори и екстракт от всички зависимостта правила. В този случай влиянието на фактор 1, ще бъде минимален. Влиянието на 2 фактор не е от голямо значение, поради следното:
а) документи на различни езици да бъдат индексирани, поради намаляване на взаимно влияние
б) самия език отразява знанията на човека [18], така до известна степен фактор 2 е subfactor на 3 и дори добив на техните смес представлява задоволително постижение
Това е теоретично възможно след това да извлича информация най-вече, съответстваща на човешкото знание, изложени чрез наличните документи. Тази информация трансформирани в картографиране пространство ще хипотетично да ни с устойчивото GKM.
2,4 изпълнение (експеримент)
В пространството изградена всеки документ трябва да бъде съпоставена с единна координация. В "браузване" на пространството или разстояния сравнението трябва да се установи, че състоянието на документи или на техните клъстери отразява тяхната релевантност и че е възможно да се възложи на някои теми имената на конкретни координати в пространството.
Нашите опити за използване на 2 и 3 триизмерна Kohonen SOM с местните събирането на документи показват, че разстоянията между прогнозите на документи, които не са стабилни по време на серия от стартира. Това по наше мнение е доказателство за факта, че размерността на картата е недостатъчна, което отговаря на Джонсън-Lindenstrauss лема, споменати по-горе.
За съжаление това е невъзможно да се извърши експеримента с правилното размерността. Така например, според Джонсън-Lindenstrauss лема, към картата 20000 документи, позволяващи 10% грешка, тя ще изисква 58 измерения. Това изисква изчисления, които са над съвременните компютри "капацитет.
Важното тук е да се отбележи, че докато лема дава максимална размерността на пространство картографиране, позволяващи да се изпълни условието за единна проекция, че не е необходимо минимално ефективната стойност. Лема дава стойност за набор от N точки т.е. за най-лошия случай, който не е вероятно да се появят в практиката. Методите за размерността разкриването трябва да се използва за изчисляване на ефективна размерността на данните и да се определи точната брой измерения за картографиране на конкретни данни. Там са известни техники за този, който дойде на фона на повърхностните реконструкция. Една от последните е работата със С. Ченг, Й. Уан и З. Wu [4], където измерение откриване метод чрез главен компонент Анализ [8] е представена. По този начин, с присъщите размерността на данни може да бъде извлечена. Тъй като тази стойност на практика е по-ниска от максималната размерността, необходими за проектиране на Същевременно броят на документите, в най-лошия случай теоретични случай, това дава значително намаляване в изчислението време. Друга възможност за същата цел, ние можем да разглежда методите, базирани на итеративен оценки. Целта на размерността намаление в нашия случай е да се създаде ефективна картографиране където commonsense сходството между информационни източници, се изразява чрез Euclidian разстоянието между проекция точки. Като всяко размерността намаляване техника основава на принципа на случайния подбор от въвеждане на данни (като главен компонент анализ "," Автопортрет Организиране Карти, Sammon реконструкция или triangulation), в случаите, когато производството размерността е по-малко, отколкото е необходимо, тези прогнози ще бъде нестабилна и с всяко преизчисляване картирането ще бъдат различни и разстоянията между прогнозите няма да се запази. Можем също да приемем, че при ефективното размерността на входа колектор се използва за картографиране, разстоянията ще се запази, с определена степен на свобода в зависимост от използвания метод за намаляване на размерността. Едно алтернативно решение да е на принципа на случайния подбор размерността намаляване техника комбинира с размерността им паралелно оценяване на картографиране. 32]. Вземете, например, техниката на отглеждане SOMs, описани в [19, 32]. Насочени към намаляване на изчисление време, броят на възли, се увеличава динамично с нови възли са равномерно разпределени между старите и техните тегла бацилоносители се определя с помощта на съседните оригинал тегла вектори. Същата техника прилага размерността (D) ще даде възможност да се оцени всеки D стъпка по стъпка. Критериите за оценка ще бъде стабилизирането на разстоянията между прогнозите. За тази цел два или повече самостоятелно организиране на карти може да се работи в паралел с pairwise разстояния между някои прогнози, които се сравняват по всяко повторение. При повторение тук разбираме сцената, когато размерността на SOM бе увеличена и мрежата бе стабилизиран с нови параметри.
Обобщаване на гореспоменатите ще предложи следния модел за експериментална оценка на по-добър подход за създаване на Глобална знания на сайта от колекцията на текстови документи.
В datase Т: векторен модел пространство да се използва (всеки документ, представен като вектор с функции като размери и функции "се нарежда като координати в съответните размери).
Характеристиката за подбор функция: най-ефективно да бъдат дефинирани.
Векторни размер: да се установят емпирично.
Данни за обработка и съхранение.
А размерността намаляване техника трябва да се използва за картиране. Има два възможни подхода:
а) предварително изчисляване на вътрешноприсъщите размерността и оценка на различни методи за намаляване на размерността с известни размерността на картографиране;
б) "размерността им оценка подход" с няколко mappings като вървят паралелно - само методи с принципа на случайния подбор на въвеждане на данни, могат да бъдат използвани.
Входове: документи "функцията бацилоносители.
Резултати: GKM координати.
Оценка:
1) Commonsense оценка на кореспонденция между първоначалните документи и Euclidian разстояния картографиране на техните прогнози.
2) Стабилизиране на тези pairwise разстоянията между прогнозите през различни стартира при случаен подбор техника се използва.
3. Интерфейс
3,1 Идеален знания представителство интерфейс
Интерфейсът част на знанието Представителство система е от значение, когато се обсъжда идеална система. И двете задачи на получаване на исканията от страна на потребители и предаване на знания към тях са на равно значение със задачите на данни, структуриране и съхранение. В сегашната книга ще обсъдят начините за знания Представителство системи на ново поколение и по тази причина въпросът за взаимодействие е overviewed, за да се установи дали е възможно да се осигури идеалистичен интерфейс с помощта на съвременните технологии.
Връзките, които се използват за подкрепа на взаимодействие на човека потребител със съвременни познания представителство и извличане на информация системи са предимно на "индексиране" тип, т.е. потребителите трябва да знаят точно какво търсят и те също трябва да се уточни, че лингвистично. Една обща пример за такъв интерфейс е търсачка. Тъй като ние имаме, споменати по-горе, търсачката и корпус на WWW документи е най-пълна и актуална знания представителство система на разположение днес, като това е причината за тяхната популярност. В същото време е известно, че "индексиране" интерфейс не е естествено да се използва при хора, но тя е единствената алтернатива като "браузване" подходи се създават много зле [16]. Причината за това е проблем на знания картографиране и привеждане в съответствие, която не позволява автоматизирано класиране и представяне на документи, в зависимост от техните дисциплини. Въпреки това, с проблема за единна знания картографиране пространство е решен, се появяват нови възможности за изграждане на по-добри, по-естествени интерфейси на "браузване" тип.
3,2 Висока размерността и визуализация
Като спомена, че в резултат на глобалното картографиране пространство е вероятно да бъде N-математически, където N е висока, че е необходимо за разрешаването на проблема с визуалното изображение. Възможно е за хората да си 3D пространството, следователно, че оптималното начини ND-> 3D представителство следва да бъде оценена. Измеренията намаляване техники или многократни представителство подход чрез интерфейс може да се използва.
Важно е, че с помощта на единни познания картографиране пространство грешката е сведен до минимум по време на изчисляване на значимост между документи, и, освен това, за извличане на съответните документи, дори и от други системи става тривиалната задача. За крайния потребител това означава, след като системата е разположена на темата той / тя се интересува, той никога няма да доведе до потребител неподходящи документи.
3,3 Информация искане верига
Когато функциите на субектите картографиране и местоположение, приложимостта изчисляване и знания пространство браузване, са решени в най-важната задача, която остава да се разреши проблема с първоначалната молба. В състояние на най-съвременните системи за извличане на информация на следните процеси обикновено са се участват, когато информацията е поискана:
Човешки част: 1) Въображение -> 2) формиране на езиковите конструкции -> 3) ръчно клавиатурата вход (гласът вход) -> Машиностроене част: 4) езиковото декодиране -> 5) съвпадение и местоположение -> 6) визуализация на съвпадение на документи
Веригата е дълъг и е очевидно, че загуба на данни и корупцията се дължи на значително двойно езиковото кодиране и декодиране. Първо, потребителят трябва да формулира познавателните образи в краткосрочен езиковото изречение. На второ място, системата за декодиране на присъдата, за да се разбере какво е обект на потребителски интерес. Описаните верига от първоначалното искане предизвиква недоволството на потребителите на съвременните търсачки, поради невъзможността на системата да "разбере" молба води до огромна загуба на време на крайния потребител. Степента на тези извличане грешки и неудобствата, причинени от интерфейса ограничение е значителна и значително ще намали влиянието на по-точни изтегляне и мястото на документи, въведени с Единния картографиране.
Ето защо е необходимо да се обмисли, теоретично най-малко, възможността за създаването на идеална къси вериги на човека <-> знания Представителството система взаимодействие с единици причинява загуба на данни се елиминират:
Човешки част: 1) Въображение -> [искането е преминал през директна човешка мозъци GKM координати конвертор] -> 2) съвпадение и местоположение -> 3) визуализация на съвпадение на документи
Ние обзор на най-новите постижения в областта на Мозъчен компютърни интерфейси (BCI) за тази цел.
3,4 мозъци Компютърна интерфейси
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Изследването на BCI се случва в продължение на повече от 30 години и района е все още много млад и се развива бързо. До скорошна момента m Ost значими постижения в областта са били направени в изкуствени крайници контрол т.е. автомобилизъм функциите на мозъка [ 3] и тълкуването и обработване на визуални сигнали. Тези постижения са били проверени по време на многократни опити върху животински и човешки индивиди. Изследователите доклад успешната интеграция на механични или електронни устройства, когато животните или хората се научават да контролират устройство с помощта на техните мозъци, други доклад успешен трансфер и декодиране на визуалните сигнали [15, 20].
Мозъчен-компютърни интерфейси проучвания са тясно свързани с областта на функционалните neuroimaging, където различни технологии са разработени ефективно да записва-членки на лице мозъка чрез определени физически характеристики. Най-продуктивни от гледна точка на BCI е актуално neuroimaging техника нарича Функционална магнитен резонанс ) (FMRI) [6, 13]. Тази техника позволява да се записват на динамиката на притока на кръв в различни мозъчни области, с течение на времето и с висока точност. Това следователно позволява да се установят връзки между моделите на активиране на различни мозъчни области и на определени дейности и когнитивните процеси на човека. Важно е, че тази техника, за разлика от много алтернативи, е неинвазивни и не включват инжекции. Необходимо е да се отбележи обаче, че fMRI хардуер днес все още е много скъп и тежък.
Това е значителна, че опитите показват, че мозъка се адаптира към новите условия. Например, при пътуване с автомобил импулси са били използвани за контрол на монтьор манипулатор или компютърна мишка курсора, мозъка успя постепенно да се диференцират и да научат да контролират манипулатор отделно от изкуствени крайници. Лебедев споменава влиянието на "пластичността на мозъка", които потенциално позволява да се включи изкуствени устройства в тялото представителство. [20]
Последните публикации в областта на neuroimaging допълнително още обсъждат възможността за разкриване на познавателната-членки [15]. Това предвижда съсредоточаване на вниманието върху възможността за прилагане на BCI на хора-KRS взаимодействие.
Известно е, че различни държави, свързани с познавателната някои реалния свят обекти отговарят на определени модели на мозъчни области активация. Декодиране на тези модели, която позволява да се разбере superimposed ориентирани стимули лице в момента е посещаващи (когато вниманието им е насочено), или в случая с визуални обекти да определите кои клас обекти лицето е изображения (т.е. лица, сгради, мебели) и дори на обекти "Цветът и ориентация. [15] Тези процеси са сложни и далеч от това да бъдат разбрани в момента. Допълнителни изследвания показват колко ниско ред и на високо, за мозъка сигнали корелираше с определени когнитивни функции; как пространствени характеристики на моделите се променят с времето и в различни влияния, за които доколкото е възможно да се екстраполират за активиране модели на различните дисциплини; др Смята се обаче, че точно познаване на "изчисления", извършени в човешкия мозък не е от решаващо значение за изграждането на съответните BCIs. [20] Общи данни минна техника може да се приложи за да извлечете полезна информация от различни neuroimaging датчици и да създадат връзки с определени когнитивни държави.
Има все пак важни въпроси, които могат сериозно да влияят върху успеха на уреда на BCI в областта на знанието представителство. Две малки проблеми са обобщение във времето и проблема на различните инстанции на едно и също душевно състояние. Известно е, че мозъчната области активиране модели от същия умствени-членки могат да се различават във времето. Различни копия от един и същи психичното състояние може да даде модифицирани образи, както и, в зависимост от контекстното вариации и други фактори. [15] Това изисква гъвкаво пространствено resampling и класификация алгоритми, които се използват, както бе предложено от Хейнс и Rees. Ние вярваме, че тези проблеми ще бъдат решени при разработването на ефективни методи.
Още съмнителен въпрос е проблем на екстраполация на романа когнитивни държави. Хейнс и Rees, имайте предвид, че броят на възможните perceptual или когнитивно-членки е безкраен, а броят на категориите обучение е задължително ограничен. [15] Това е от изключително значение, че декодер може да бъде обучен да се обобщи опита, получен от малки обучение настроен на напълно нови категории. Тя ще бъде възможно чрез екстраполация ако мозъка активиране моделите действително са подредени в някои системни параметрични пространство. Това остава да бъде установено, обаче, смята се, че тя е възможно най-малко за някои видове умствени съдържание [15]. В случай, абстрактна форма пространство за класификация на невронни модели наистина съществува, това ще ни позволи да теоретизирам върху възможностите за картографиране на човешкия мозък когнитивни членки върху Global знания сайта описани-рано в този доклад. При условие че това се постига, горепосочените "проблем на първоначалното искане" ще бъде решен и "Идеал човека <-> KRS" веригата ще бъде възможно да се установи.
3,5 Learnable декодер
Както вече е известно, благодарение на най-новите постижения на мозъка образна, че е възможно да се направи разграничение за активиране на различни мозъчни области, когато лицето е да мисля за различните индивиди може да предположи, че е възможно да се създаде learnable декодер към картата на човека започва познавателен членки върху знанията на сайта на знания Представителство система. Следователно идеален начин на взаимодействието човек-компютър може да се установи допускане на огромна скорост и точност на комуникация със системата. Там ще бъде по-малка загуба на данни, поради премахването на езиковото етап на взаимодействие. Бързината и ефективността на взаимодействие ще се увеличи впоследствие. Тези два фактора ще позволи на хора от различни професии да се повиши ефективността на работата си значително. От [6, 15], което знаем, че съществуват определени закономерности на мястото на мозъчни импулси и темите на познанията, които са общи за всички хора, ние да се обаждате на тези функции антропогенни. Независимо от това, че е известно, че мнозинството от тези връзки трябва да бъдат индивидуалистичен. Поради това, декодер, трябва да бъде индивидуално адаптивно.
Също така е очевидно, че ефективността на декодер, ще зависи от отделните хора и тяхното обучение с него и способността за учене. Ние можем да предполагам това от опитите с изкуствено интерфейси се използва да замени загубили крайниците. Хората и животните са били в състояние да се концентрира психично по специален начин, да се движат изкуствена манипулатор и дори да се научи да контролира реалните изкуствени крайници и отделно един часа [20].
Имайки предвид горепосочените ние вярваме, че изкуствена невронна мрежа - базирани механизъм е най-доброто решение на проблема декодер.
Декодер на учебния процес
1) Точката с произволни координати в пространството на многомерен GKM е избран.
2) Множество документи, като им mappings в съседния район (Euclidian метрични се използва), са подбрани и изложени на човека оператор.
3) Оператор на концентрати неговия ум cognitively да присъстват на дадена тема и свързаните с тях обекти в паметта.
4) В neuroimaging данните се събират от fMRI хардуер през определен период от време.
5) Данните се обработват чрез пространствени resampling и намаляване на шума алгоритъм за цел да извлича информационни модели характеризиращи текущата повторение на обучението.
6) Изготвен данни се извличат до входа на невронна мрежа. В GKM координати на избрана точка се извличат за резултатите, постигнати поради обучение на невронна мрежа, за да се сдружават специфични мозъчни активиране моделите с GKM координати.
Фигура 3.1 Процесът на обучение на декодер
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Recent Comments