की ओर आदर्शवादी ज्ञान प्रतिनिधित्व प्रणाली: वैश्विक ज्ञान मानचित्र

Taras Filatov

सार

एक जो ज्ञान प्रतिनिधित्व और कृत्रिम खुफिया अर्थ संरेखण या ज्ञान मानचित्रण के एक समस्या है के क्षेत्र में आगे की घटनाओं रोकना सबसे महत्वपूर्ण समस्याओं का. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. इसके समाधान में प्रगति बहुत सूचना पुनथप्राप्ति, आंटलजी संरेखण, प्रासंगिकता गणना, अखबार में बहुआयामी वैश्विक ज्ञान का नक्षा की अवधारणा, निर्भरता के unsupervised निकासी के माध्यम से बड़े दस्तावेजों कोष से सविस्तार पाठ समझ आदि के कार्यों के लिए प्रस्ताव है फायदेमंद होगा . इसके अलावा, सीधे मानव की समस्या - ज्ञान प्रतिनिधित्व प्रणाली इंटरफ़ेस और अनुकूली कूटवाचक की अवधारणा पहले वर्णित एकीकृत मानचित्रण मॉडल के साथ बातचीत के प्रयोजन के लिए प्रस्ताव को संबोधित किया है. इन दो दृष्टिकोण के आधार के रूप में ज्ञान प्रतिनिधित्व प्रणाली की एक नई पीढ़ी के विकास के लिए सुझाव दिया है संयोजन में.

सङ्केतशब्द: ज्ञान प्रतिनिधित्व, ज्ञान मानचित्रण, मानव कम्प्यूटर संपर्क, आंटलजी संरेखण, ऊपरी आंटलजी, प्रासंगिकता गणना, सूचना पुनथप्राप्ति, दस्तावेज़ समानता

1. परिचय

समाज में, ज्ञान प्रतिनिधित्व के क्षेत्र और पिछले वर्ष से अधिक महत्वपूर्ण हो गई [25]. लोग हमेशा बना प्रयास का अध्ययन करने के लिए और ज्ञान के बारे में ज्ञान वर्गीकृत. हम के रूप में पांचवीं शताब्दी में सुकरात ई.पू. [33 के रूप में तर्क और epistemology के तंदुस्र्स्त] करने के लिए शीघ्र [28 से संदर्भ प्राप्त कर सकते हैं] मध्य युग में. चूंकि समस्या अतीत में महत्वपूर्ण माना गया था, यह सूचना के युग के दौरान इसका अर्थ overestimate करने के लिए कठिन है.

आधुनिक प्रौद्योगिकियों आँकड़ों की अत्यधिक बाढ़ के साथ जो systematise करने और प्रक्रिया को कठिन हो मानवता संपन्न है. एक व्यक्ति के लिए यह सीखने का साल लेता है और एक सूचना के बाद की दौड़ की आवश्यकता है नवीनतम पेशेवर प्रवृत्तियों के साथ रखने के लिए एक निश्चित क्षेत्र में एक विशेषज्ञ बनने के लिए.

यह ज्ञान इंजीनियरों और डाटा खनन विशेषज्ञों कि सूचना खुले उपयोग में उपलब्ध बीच एक आम धारणा है हमारे जीवन के लगभग किसी भी पहलू के बारे में सच्चा तथ्यों निकालने के लिए और पर्याप्त है भी भविष्य. हल करने के लिए सिर्फ एक ही समस्या होशियारी भीड़ स्रोतों से जानकारी पर कार्रवाई करने के लिए है. [35].

यह कारकों मानवता systematise, उपयोग और इसके सामूहिक ज्ञान का उपयोग में मदद करने के लिए ज्ञान का प्रतिनिधित्व सिस्टम की नई पीढ़ी की मांग करते हैं.

वर्तमान पेपर में हम एक नए युग ज्ञान प्रतिनिधित्व प्रणाली (KRS) के विकास के लिए विचारों का प्रस्ताव.

हम जानते हैं कि कुछ क्षेत्रों और विज्ञान में हाल उपलब्धियों जल्दी ही एक जबरदस्त सफलता के लिए मानव ज्ञान प्रतिनिधित्व और मानव कम्प्यूटर बातचीत के दायरे में ले जाएगा विश्वास करते हैं. यह और नए क्षितिज खुल जाएगा बहुत कई अनुप्रयोगों में मानवीय कार्य की प्रभावशीलता में वृद्धि. केवल एक चीज की जरूरत है कि कुछ किया जाना एक साथ इन उपलब्धियों को लाने के लिए है.

आदर्श KRS मानवता के सारे ज्ञान के लिए एक सुविधाजनक पहुँच के साथ एक उपयोगकर्ता प्रदान करना चाहिए. इसके तत्वों इसलिए कर रहे हैं:

  • एक इंसान है जो उसे में रुचि रखता है ज्ञान के कुछ टुकड़े का उपयोग करने के लिए, चाहता है
  • एक आंकड़ा भंडारण, और
  • मध्यस्थ प्रणाली एक मानव का उपयोग करने के लिए ज्ञान के लिए इंटरफेस प्रदान करने के लिए.

जो यहाँ पैदा की बाधाओं मानव क्षमताओं और मौजूदा प्रौद्योगिकी के स्तर की सीमाओं के कारण होता है.

2. डाटा भंडारण

कला के 2.1 राज्य

जब तक यह वास्तविक समय में बाहरी स्रोतों से आवश्यक दस्तावेजों को पुनः प्राप्त करने में सक्षम है ज्ञान प्रतिनिधित्व प्रणाली डाटा भंडारण की आवश्यकता है. हम आजकल की एक आदर्श KRS जीतने के लिए दो तरीकों का उल्लेख कर सकते हैं: स्वयं वैश्विक ज्ञान प्रबंधित संरचित ontologies और सिस्टम खोज इंजन जैसे स्वचालित अनुक्रमण और सबसे पूर्ण और सुलभ कच्चे दस्तावेजों संग्रह (वर्ल्ड वाइड वेब) की पुनर्प्राप्ति को शामिल जैसे भंडारण. पहले दृष्टिकोण की समस्या अपनी मैनुअल स्वभाव में है - कोई भी प्रयास बनाने के लिए और वैश्विक मानव ज्ञान के विस्तार, सत्यता और प्रयोज्य के बीच समझौते का परिणाम देगा बनाए रखें. ], UFO (Unified Framework Ontology) बात के होते हुए भी वहाँ Cyc [23], WordNet [12] जैसी कई सफल ऊपरी-आंटलजी परियोजनाओं हैं, DNS, सूमो आदि और लंबे समय के रूप में अनुसंधान स्वतः के नाम (मानक उच्च आंटलजी तहत एक मानकीकृत एकीकृत विश्व आंटलजी विस्तृत करने के लिए उद्देश्य के रूप में चल रहे सैद्धांतिक चर्चा ) [27], उफौ (एकीकृत फ्रेमवर्क आंटलजी) आदि

दूसरा दृष्टिकोण ऐतिहासिक WWW के कारण डेटा के लिए-तिथि कोष स्वचालित प्रक्रिया के लिए आजकल उपलब्ध है, और व्यापक सबसे बड़ा किया जा रहा प्रचलित हो गई. हालांकि पहले दृष्टिकोण के विपरीत, स्वचालित सूचना पुनथप्राप्ति की समस्याओं यहाँ एक महत्वपूर्ण भूमिका निभाते हैं. पाठ को समझने और प्राकृतिक भाषा संसाधन की समस्याओं को एक सबसे ऐ में और फिर भी अभी भी कुशल समाधान के बिना रह चुनौतीपूर्ण के हैं. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. निकटस्थ वर्गीकरण और प्रासंगिकता गणना, तथाकथित 'वेब क्लस्टरिंग' समस्या [1 की समस्याएं हैं]. दूसरा दृष्टिकोण (स्वचालित अनुक्रमण) इसलिए प्रमुख है पुनर्प्राप्ति की सटीकता में कमी होती है.

ऐसे में इन समस्याओं को दूर करने के लिए abovementioned दृष्टिकोण से सुधार लाने के प्रयास चल रहे हैं. ताकि एक साथ एक दूसरे को और ज्ञान अड्डों के अन्य प्रकार के साथ के साथ मौजूद ontologies लाने के लिए [5, 17 उदाहरण, साथ एकीकृत आधार आंटलजी परियोजनाओं के साथ (स्वतः, BULO) के लिए कुछ प्रयास आंटलजी संरेखण और आंटलजी मानचित्रण तकनीक को विकसित करने के लिए कर रहे हैं]. यह अक्सर स्वचालित सूचना पुनथप्राप्ति के माध्यम से (खोज इंजन प्रौद्योगिकी) ontologies के मामले में मैनुअल प्रशासन की कमियों को कम करने का प्रस्ताव है. आदेश में मैन्युअल रूप से खोज इंजन की सहायता के लिए जानकारी निर्दिष्ट करना संभव को WWW दस्तावेजों और उनके बीच hyperlinks के commonsense अर्थ [24 समझाने की दूसरी ओर से, सुधार hypertext मानकों को विकसित किया जा रहा है]. ऐसा लगता है कि इन संकर समाधान फायदों के साथ इसी तकनीकों की कमियों ले समझने के लिए आवश्यक है.

एक कमी इन दृष्टिकोणों को एक और उनकी एकता असंभव बना देता है: वहाँ मानचित्रण और विभिन्न प्रणालियों में दस्तावेजों और अवधारणाओं के बीच संबंध स्थापित करने का कोई मानक है. समस्या यह तय गणितीय interpretable पदानुक्रम के साथ सिस्टम के मामले में एक ontologies जैसे हल होगा मौजूदा दृष्टिकोण (WWW) पर काबू. हालांकि इस संभावना नहीं abovementioned कारणों से लगता है. स्वतंत्र मध्यस्थ मानक इस समस्या का एक संभावित हल है. वहाँ और विभिन्न प्रकार के ज्ञान के आधार परस्पर मानचित्रण को जोड़ने की दिशा में कई पहल कर रहे हैं जिसके बीच वहाँ आंटलजी मानचित्रण का एक क्षेत्र है. यह पहल एक आम कमी है: मानचित्रण और दस्तावेजों के बीच संबंध स्थापित करने का कोई भी मानक. बाद में, उनमें से कोई भी हो जाने की संभावना है एक व्यापक रूप से मानक जब तक एक और अधिक स्थायी समाधान विकसित की मान्यता प्राप्त है.

एक वैश्विक ज्ञान मानचित्र (GKM) के 2.2 अवधारणा

हम इसे असली दुनिया ज्ञान के सिद्धांतों का प्रक्षेपण करने के उद्देश्य से एक तार्किक अंतरिक्ष इमारत द्वारा ज्ञान मानचित्रण के लिए एक मानक विस्तृत करने के लिए संभव है. इस तरह के मॉडल (हमें यह वैश्विक ज्ञान मानचित्र कॉल) दस्तावेज़ और अवधारणाओं की समानता के स्तर पर यह प्रतिचित्रित प्रतिबिंबित करना चाहिए करते हैं.

इस मॉडल का मुख्य उद्देश्य है:

  • संरेखण और पार के दस्तावेज़ और अवधारणाओं का (WWW, ontologies मानचित्रण, ई पुस्तकालयों, निर्देशिकाओं आदि)
  • ब्राउज़िंग के माध्यम से सूचना पुनर्प्राप्ति
  • Commonsense प्रासंगिकता के स्पष्ट स्वचालित गणना

GKM इसलिए एक विशिष्ट शर्त के साथ ज्ञान का भंडारण की एक गणितीय / तार्किक मॉडल की आवश्यकता: मानव के साथ ज्ञान का प्रतिनिधित्व अर्थात् बातचीत के कार्य के लिए किया जा रहा इष्टतम. इस शर्त को पूरा के लिए इस मॉडल को अपने dimensionality में प्रतिबिंबित करना होगा या उसके संरचना मानव ज्ञान के ढांचे में.

आवश्यकताओं इसलिए कर रहे हैं:

  • Dimensionality और मानचित्रण.

इस dimensionality के लिए मुख्य कारक अर्थ (या एक विषय है).

  1. मानव ज्ञान के प्रत्येक अवधारणा एक बिंदु पर एक विशिष्ट के साथ mapped किया जा सकता है सिस्टम को अंतरिक्ष में निर्देशांक.
  2. प्रत्येक दस्तावेज़ या पाठ अंक (दस्तावेज़ memes में विभाजित है - सार्थक टुकड़े के एक नंबर पर) या एक बिंदु मैप किया जा सकता है.
  • प्रासंगिकता गणना.
  1. यह गणितीय दोनों अवधारणाओं के बीच अंतरिक्ष में अपनी इसी प्रक्षेपण अंक के बीच की दूरी की गणना की प्रासंगिकता की गणना करना संभव है.
  2. इसलिए 'उनके mappings के बीच की दूरी की गणना के द्वारा दस्तावेजों और अवधारणाओं के बीच समानता' की गणना करना संभव है.
  • एकरूपता अंतरिक्ष की.
  1. अंतरिक्ष () समरूप और लगातार एक समान है
  2. अर्थ और अंकों के बीच की दूरी को प्रतिबिंबित निर्देशांक यदि बिंदु सी ए और बी के बीच में स्थित है कि तब यह अवधारणा सी ए और बी दोनों के लिए समान रूप से संबंधित है तो इसका मतलब है अर्थ में फर्क दर्शाते हैं.
  3. यह '' अंतरिक्ष ज्ञान सूत्रों ने पड़ोसी क्षेत्रों में प्रतिचित्रित ढूँढने ब्राउज़ करने के लिए संभव है.

ऐसे अंतरिक्ष के एक गणितीय मॉडल बिल्डिंग वैश्विक ज्ञान मानचित्र के विकास को सक्षम बनाता है. यह (GKM) एक मैन्युअल तरीके से जानकारी विकास और विश्व के मानव को समझने में लगातार परिवर्तन के abovementioned कारणों की वजह से में इस तरह के एक मॉडल को विस्तृत करने की कोशिश कर उपयुक्त नहीं है. हम इसे ग्रंथों के उपलब्ध corpuses से निर्भरता और नियमों को निकालने के लिए संभव है और हमारे मानचित्रण प्रयोजनों के लिए प्रोसेसर के रूप में इन का इस्तेमाल विश्वास करते हैं.

हमारी मान्यताओं के कोने का पत्थर है कि यह आम तौर पर उत्तरार्द्ध के dimensionality के भीतर एक स्थान और दूरी पर विभिन्न मानव ज्ञान विषयों नक्शे को दी विषयों के बीच समानता के स्तर को प्रतिबिंबित संभव है. यह धारणा जॉनसन पर आधारित है Lindenstrauss लेम्मा कि उच्च आयामी Euclidian अंतरिक्ष में n अंक का एक सेट एक एन आयामी Euclidian अंतरिक्ष करने के लिए नीचे mapped किया जा सकता है प्रदाता

(2,1)

ऐसी है कि सिर्फ एक पहलू से कोई भी दो अंकों परिवर्तनों के बीच की दूरी (1 ) [7]. इस वैक्टर अंतरिक्ष मॉडल सामान्यतः सूचना पुनथप्राप्ति और पाठ वर्गीकरण में प्रयुक्त उच्च आयामी vectors [31 दस्तावेज के रूप में प्रतिनिधित्व करता है]. एक मीट्रिक समारोह चुना पर) सूचना के जो मूल दस्तावेज का विषय वर्गीकृत करने के लिए पर्याप्त है निर्भर इन vectors शामिल कुछ निश्चित स्तर (.

इस Tychonoff की प्रमेय [26] में कहा गया है कि अंक, एक वर्ग की वस्तुओं के गुणों का प्रतिनिधित्व करीब प्रत्येक संपत्ति अंतरिक्ष में दूसरे से स्थित होना चाहिए अंक अन्य वर्गों की वस्तुओं के गुणों का प्रतिनिधित्व करने के लिए की तुलना में. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. हमारे काम में इस पर तय एन पेश किया जा सकता है आयामी अंतरिक्ष और डेटा संपीड़न के लिए एक उपयुक्त एल्गोरिथ्म / dimensionality कमी compactness के प्रमेय के कारण [22] प्राप्त होगी मानचित्रण का उपयोग कर n ग्रंथों के मूल सदिश अंतरिक्ष का मतलब है, जहां दूरी के बीच अंक इसी दस्तावेजों की प्रासंगिकता का प्रतिनिधित्व करते हैं.

जो मानचित्रण का सटीक प्रभावित कारक:

  • इस मीट्रिक समारोह के representativeness और इस सुविधा का अंतरिक्ष का आकार
  • आकार, dispersity और गुणवत्ता के दस्तावेजों कोष का

सिद्धांत परंतु वर्तमान परिस्थितियों में यह तकनीक के मानचित्रण विस्तृत करने के लिए जो प्रयोग किया जाएगा पाया जा करने के लिए बना रहता है पर लागू होती है. हम स्वत: इसका मतलब है कई जटिलताओं मैनुअल विशेषज्ञ बना आधारित होने के कारण पर मानचित्रण अप्रयोज्य ध्यान केंद्रित करने का प्रस्ताव.

Unsupervised निकासी (परिकल्पना) के माध्यम से 2.3 स्वचालित GKM पीढ़ी

आदेश में करने के लिए उपयोगी हो GKM (WWW) दस्तावेजों और इसकी संरचना में दुनिया की आम इंसान को समझने का प्रतिनिधित्व असली शब्द के महत्वपूर्ण संख्या के mappings शामिल करना चाहिए. यह इसलिए GKM के निर्माण के किसी भी मैन्युअल तरीके पर विचार करने के लिए उपयुक्त नहीं है और दस्तावेज़ mappings के साथ इसे भरने. डेटा खनन सिद्धांतों निर्भरता दस्तावेजों कंप्यूटर प्रसंस्करण और अनावश्यक डेटा को फ़िल्टर के लिए उपलब्ध की विद्यमान कोष से ज्ञान का प्रतिनिधित्व निकालने के लिए इस्तेमाल किया जाना चाहिए.

वहाँ ग्रंथों में निर्भरता के unsupervised निकासी के लिए कई प्रयास किए गए हैं लेकिन यह अभी भी एक संदिग्ध सवाल यह है कि क्या किसी भी तकनीक बड़े दस्तावेजों संग्रह के विश्लेषण के माध्यम से एक सतत निकासी ज्ञान प्रदान करने के लिए सक्षम है [10, 11, 21, 30 है].

है, जो आम तौर पर तीन श्रेणियों में दस्तावेजों की सामग्री पर प्रभाव के कारकों को विभाजित करते हैं:

  1. लेखक व्यक्तिगत कारकों (भावनाओं और उद्देश्यों के दौरान पाठ, शारीरिक और नैतिक राज्यों बनाने के लिए सोच और लेखन)
  2. भाषा दस्तावेज़ को लिखने के लिए इस्तेमाल की भाषा (नियमों आदि)
  3. मानव ज्ञान लेखक का ज्ञान (कुछ भागों को सीधे या परोक्ष रूप दस्तावेज़ के माध्यम से) को स्थानांतरित

इसे मानव लेखकों के सभी पाठ उपलब्ध दस्तावेजों पर कार्रवाई करने के लिए संभव है अनुमान और सभी निर्भरता नियमों निकाल दें. इस मामले में कारक 1 का प्रभाव कम हो जाएगा. पहलू 2 का प्रभाव नहीं बहुत महत्व निम्नलिखित की वजह से है:

एक) कई भाषाओं में दस्तावेज़ों, इसलिए आपस में प्रभाव को कम करने अनुक्रमित किया जा सकता है

ख) भाषा ही मानव ज्ञान [18] के कारक 2 3 में से एक subfactor और उनके मिश्रण का भी निकालना होता है एक निश्चित सीमा तक, तो करने के लिए एक संतोषजनक उपलब्धि का प्रतिनिधित्व करता है को प्रदर्शित करता है

यह जानकारी सिद्धांततः तो अधिकतर मानव ज्ञान उपलब्ध दस्तावेजों के माध्यम से उजागर करने के लिए इसी निकालने के लिए संभव है. यह जानकारी के मानचित्रण अंतरिक्ष के लिए hypothetically स्थाई GKM के साथ हमें प्रदान करेगा बदल.

2.4 कार्यान्वयन (प्रयोग)

अंतरिक्ष में समन्वय स्थापित करने के लिए एकल प्रतिचित्रित किया जाना चाहिए प्रत्येक दस्तावेज बनाया. इस '' अंतरिक्ष या दूरी की तुलना ब्राउज़िंग दस्तावेजों के उस स्थिति या उनके समूहों प्रकट करना चाहिए और कहा कि यह विशिष्ट करने के लिए कुछ विषय के नाम आवंटित करने के लिए संभव है उनकी प्रासंगिकता प्रतिबिंबित अंतरिक्ष में निर्देशांक.

दस्तावेजों की एक स्थानीय संग्रह के साथ आयामी Kohonen सोम 2 और 3 का उपयोग करने का हमारा प्रयोगों है कि दस्तावेजों के अनुमानों के बीच की दूरी की शुरूआत की श्रृंखला में स्थिर नहीं कर रहे हैं प्रकट. यह हमारी राय में इस तथ्य यह है कि नक्शे के dimensionality जो जॉनसन को conforms-Lindenstrauss लेम्मा उपर्युक्त अपर्याप्त है का सबूत है.

दुर्भाग्य से यह एक उचित dimensionality के साथ प्रयोग करना असंभव है. उदाहरण के लिए, जॉनसन के अनुसार-Lindenstrauss लेम्मा, 20000 दस्तावेजों यह 58 आयामों की जरूरत होगी 10% त्रुटि की अनुमति नक्शा करने के लिए. यह आवश्यक है, जो आधुनिक कंप्यूटरों 'क्षमता इसके बाद के संस्करण की गणना कर रहे हैं.

महत्वपूर्ण बात है कि यहाँ का उल्लेख करने के लिए है, जबकि लेम्मा के मानचित्रण अंतरिक्ष एकल प्रक्षेपण की हालत को पूरा करने के लिए अनुमति की अधिकतम dimensionality देता है, यह आवश्यक न्यूनतम मूल्य प्रभावी नहीं है. लेम्मा अर्थात् सबसे खराब स्थिति के लिए, जो व्यवहार में प्रदर्शित होने की संभावना नहीं है n अंक का एक सेट के लिए एक मान देता है. Dimensionality पता लगाने के लिए इस तरीके और इसलिए डेटा का एक प्रभावी dimensionality की गणना करने के लिए विशेष डेटा के मानचित्रण के लिए आयामों की सही संख्या का निर्धारण सेट का प्रयोग किया जाना चाहिए. वहाँ जो सतह के पुनर्निर्माण की पृष्ठभूमि से आने के लिए इस तकनीक से जाना जाता है. एक नवीनतम के एस द्वारा काम है चेंग, वाई वैंग और Z. वू [4] जहां प्रधानाचार्य के माध्यम से आयाम पता लगाने विधि घटक विश्लेषण [8] पेश किया है. इस प्रकार, डेटा की आंतरिक dimensionality निकाला जा सकता है. व्यवहार में इस मान के रूप में अधिक से अधिक dimensionality के प्रक्षेपण के लिए आवश्यक से कम है एक बुरी-मामले सैद्धांतिक मामले में दस्तावेजों की एक ही नंबर, यह एक महत्वपूर्ण गणना में समय कम देता है. हम तरीकों चलने का मूल्यांकन के आधार पर विचार कर सकते हैं एक ही उद्देश्य के लिए वैकल्पिक रूप से. हमारे मामले में dimensionality कमी का उद्देश्य एक प्रभावी मानचित्रण जहां सूचना के स्रोत के बीच के commonsense समानता प्रक्षेपण अंक के बीच Euclidian दूरी के माध्यम से व्यक्त किया है स्थापित करने के लिए है. किसी भी dimensionality कमी तकनीक यादृच्छिक चयन पर इनपुट डेटा प्रधानाचार्य (जैसे घटक विश्लेषण, स्व आयोजन मैप्स, Sammon पुनर्निर्माण या triangulation), मामला जब निर्गम dimensionality उचित से कम है में, अनुमानों से अस्थिर हो जाएगा और प्रत्येक recalculation के साथ सेट से आधारित लेना के मानचित्रण और संरक्षित नहीं होगा अनुमानों के बीच की दूरी को अलग किया जाएगा. हम यह भी है कि जब इनपुट के प्रभावी dimensionality कई गुना के मानचित्रण के लिए, दूरियाँ स्वतंत्रता की एक निश्चित डिग्री के साथ की रक्षा करेगा dimensionality कमी तरीका इस्तेमाल के आधार पर किया जाता है की कल्पना कर सकते हैं. एक वैकल्पिक समाधान इसलिए एक यादृच्छिक चयन dimensionality कमी तकनीक के मानचित्रण के वृद्धिशील dimensionality समानांतर मूल्यांकन के साथ संयुक्त है. 32]. उदाहरण के लिए, समझो, बढ़ती SOMs [19, 32 में वर्णित की तकनीक]. गणना समय को कम करने के लिए उद्देश्य से, नोड्स की संख्या गतिशील रूप नए नोड होने के साथ समान रूप से अपना वजन vectors पड़ोसी मूल वज़न vectors का मतलब करने के लिए सेट किया जा रहा है और पुराने के बीच वितरित की वृद्धि हुई है. उसी तकनीक dimensionality (डी) पर लागू एक मौका कदम द्वारा प्रत्येक डी कदम का मूल्यांकन करने के लिए दे देंगे. मूल्यांकन मानदंडों अनुमानों के बीच दूरी की स्थिरीकरण होगा. दो या अधिक आत्म आयोजन नक्शे कुछ अनुमानों के बीच pairwise दूरी के साथ समानांतर में चलाए जा सकता है इस उद्देश्य के लिए एक यात्रा पर तुलना की जा रही. हम मंच समझ यात्रा यहाँ के तहत जब सोम के dimensionality और बढ़ गया था नेटवर्क फलस्वरूप नए मानदंडों के साथ स्थिर हो गया था.

हम पाठ दस्तावेजों के संग्रह से वैश्विक ज्ञान मानचित्र की स्थापना के लिए बेहतर दृष्टिकोण के प्रयोगात्मक मूल्यांकन के लिए निम्नलिखित मॉडल प्रस्ताव abovementioned सारांश.

इस datase t: सदिश अंतरिक्ष मॉडल (प्रत्येक दस्तावेज़ आयाम और रूप सुविधाओं 'रैंकों के रूप में सुविधाओं के साथ सदिश के रूप में प्रतिनिधित्व इसी आयाम में समन्वय) का उपयोग किया जा करने के लिए.

फ़ीचर चयन समारोह: सबसे प्रभावी रूप से परिभाषित किया जाना है.

वैक्टर आकार: empirically स्थापित किया जाना है.

डाटा प्रोसेसिंग और भंडारण.

एक dimensionality कमी तकनीक के मानचित्रण के लिए इस्तेमाल किया जाना चाहिए. वहाँ दो दृष्टिकोण हो सकता है:

एक) पूर्व के आंतरिक dimensionality गणना और मानचित्रण का एक ज्ञात dimensionality के साथ अलग dimensionality कमी तरीकों का मूल्यांकन;

ख) 'कुछ mappings साथ वृद्धिशील dimensionality मूल्यांकन दृष्टिकोण' समांतर में चलाई जा रही है - इनपुट डेटा के यादृच्छिक चयन के साथ ही विधियों का प्रयोग किया जा सकता है.

आदानों: दस्तावेज 'सुविधा vectors.

Outputs: GKM निर्देशांक.

मूल्यांकन:

प्रारंभिक दस्तावेजों और उनके मानचित्रण अनुमानों के Euclidian दूरी के बीच पत्राचार का 1) Commonsense मूल्यांकन.

अलग प्रक्षेपण के माध्यम से इन अनुमानों के बीच pairwise दूरी का 2) स्थिरीकरण मामले यादृच्छिक चयन तकनीक में प्रयोग किया जाता है.

3. इंटरफ़ेस

3,1 आदर्श ज्ञान प्रतिनिधित्व इंटरफ़ेस

ज्ञान प्रतिनिधित्व प्रणाली के अंतरफलक हिस्सा जब आदर्श प्रणाली पर चर्चा की है महत्वपूर्ण है. उपयोगकर्ताओं से अनुरोधों को प्राप्त करने के दोनों कार्यों और वापस उन्हें ज्ञान संचारण बराबर महत्व के डेटा structuring और भंडारण के साथ कार्य कर रहे हैं. वर्तमान पेपर में हम ज्ञान प्रतिनिधित्व प्रणाली एक नई पीढ़ी का है और इसलिए बातचीत के मुद्दे की ओर तरीकों से आदेश है कि क्या यह एक आधुनिक प्रौद्योगिकी के माध्यम से एक आदर्शवादी इंटरफेस प्रदान करने के लिए संभव है स्थापित करने के लिए overviewed है चर्चा.

उस प्रकार अनुक्रमण '' कर रहे हैं मुख्यतः के आधुनिक ज्ञान प्रतिनिधित्व और सूचना पुनर्प्राप्ति प्रणाली के साथ एक मानव उपयोगकर्ता की बातचीत का समर्थन करने के लिए उपयोग किया जाता है इस इंटरफेस, अर्थात् प्रयोक्ताओं के लिए वास्तव में वे क्या देख रहे हैं और वे भी भाषायी यह निर्दिष्ट करने के लिए है पता करने के लिए किया है. ऐसे इंटरफ़ेस का एक सामान्य उदाहरण एक खोज इंजन है. जैसा कि हम ऊपर उल्लेख किया है, खोज इंजन और WWW दस्तावेजों के कोष सबसे ज्यादा और पूरा हो गया है के लिए तिथि ज्ञान प्रतिनिधित्व प्रणाली उपलब्ध आजकल, उनकी लोकप्रियता का यह किया जा रहा कारण. उसी समय यह कहा गया है कि 'अनुक्रमण' अंतरफलक इंसानों के लिए इस्तेमाल करने के लिए प्राकृतिक नहीं है जाना जाता है लेकिन यह 'के रूप में ब्राउज़िंग' दृष्टिकोण बहुत खराब स्थापित किया जा रहा है कि केवल वैकल्पिक [16 है]. कि ज्ञान मानचित्रण और जो अपने विषयों के अनुसार स्वचालित वर्गीकरण और दस्तावेजों के प्रतिनिधित्व की अनुमति नहीं देता संरेखण की समस्या का कारण है. हालांकि, एकीकृत ज्ञान मानचित्रण अंतरिक्ष की समस्या से हल किया जा रहा, नई संभावनाओं के सुधार, और अधिक प्राकृतिक इंटरफेस के निर्माण के लिए प्रकार ब्राउज़िंग 'दिखाई देते हैं.

3.2 उच्च dimensionality और विजुअलाइजेशन

जिसका परिणाम यह है कि वैश्विक मानचित्रण अंतरिक्ष n-आयामी जहाँ n यह दृश्य प्रतिनिधित्व की समस्या को हल करने के लिए आवश्यक है उच्च है होने की संभावना है उल्लेख करने के बाद. मनुष्य के लिए, इसलिए 3 डी अंतरिक्ष की कल्पना करने के लिए यह, एन डी का इष्टतम तरीकों-> 3 डी प्रतिनिधित्व का मूल्यांकन किया जाना है संभव है. अंतरफलक से होकर Dimensionality कमी तकनीक या एकाधिक प्रतिनिधित्व दृष्टिकोण का उपयोग किया जा सकता है.

यह महत्वपूर्ण है कि इस त्रुटि दस्तावेजों के बीच प्रासंगिकता की गणना के दौरान, और कम होता है, इसके अलावा, अन्य प्रणालियों से भी प्रासंगिक दस्तावेज़ों की पुनर्प्राप्ति एक तुच्छ कार्य हो जाता है कि एकीकृत ज्ञान मानचित्रण अंतरिक्ष की मदद से. इस बार यह व्यवस्था उसे उपयोगकर्ता, यह कभी नहीं होगा नेतृत्व में अप्रासंगिक दस्तावेजों के लिए दिलचस्पी है इस विषय पर स्थित है इसका मतलब है अंत उपयोगकर्ता के लिए.

3.3 सूचना अनुरोध श्रृंखला

जब विषयों का कार्य मानचित्रण और स्थान, प्रासंगिकता गणना और ज्ञान अंतरिक्ष ब्राउज़िंग को हल करने के लिए बनी हुई है जो सबसे महत्वपूर्ण कार्य हल कर रहे हैं एक प्रारंभिक अनुरोध की समस्या है.-के राज्य में निम्नलिखित प्रक्रिया आमतौर पर अत्याधुनिक सूचना पुनथप्राप्ति व्यवस्था की जा रही हैं जब जानकारी का अनुरोध किया है शामिल:

मानव भाग: 1) इमेजिनेशन -> 2) भाषाई निर्माण का गठन -> 3) मैनुअल कुंजीपटल इनपुट (आवाज इनपुट) -> मशीन भाग: 4) भाषाई decoding -> 5) मेल और स्थान -> 6) दस्तावेजों से मेल खाते का दृश्य

इस श्रृंखला लंबा है और यह स्पष्ट है कि डेटा हानि और भ्रष्टाचार किया जा रहा है भाषाई कूटबन्धन और decoding डबल के कारण महत्वपूर्ण. सबसे पहले, उपयोगकर्ता छोटी भाषाई वाक्य में संज्ञानात्मक छवियाँ तैयार करने के लिए किया है. दूसरे, व्यवस्था में आदेश उपयोगकर्ता के हित के विषय को समझने के लिए सजा गूढ़वाचन करना पड़ता है. प्रारंभिक अनुरोध का वर्णन श्रृंखला आधुनिक खोज इंजन की व्यवस्था की अक्षमता '' अनुरोध अंत उपयोगकर्ता का जबरदस्त समय नुकसान जिसका परिणाम समझ के कारण के उपयोगकर्ताओं के असंतोष का कारण बनता है. इन त्रुटियों को पुनर्प्राप्ति और असुविधाओं अंतरफलक सीमा के कारण की डिग्री और बहुत महत्वपूर्ण है और अधिक सटीक पुनर्प्राप्ति और दस्तावेजों को एकीकृत मानचित्रण द्वारा शुरू की स्थिति के प्रभाव को कम कर देंगे.

इसलिए, सिद्धांततः पर विचार करने के लिए कम से कम, इकाइयों डेटा हानि होने के कारण एक आदर्श लघु मानव श्रृंखला <-> ज्ञान प्रतिनिधित्व प्रणाली बातचीत के सृजन की संभावना समाप्त आवश्यक है:

मानव भाग: 1) इमेजिनेशन -> [अनुरोध पारित किया जा रहा द्वारा सीधे मानव मस्तिष्क-GKM) मिलान कनवर्टर] -> 2 समन्वय और स्थान -> 3) दस्तावेजों से मेल खाते का दृश्य

हम इस उद्देश्य के लिए मस्तिष्क कंप्यूटर इंटरफेस (बीसीआई) के क्षेत्र में नवीनतम उपलब्धियों सिंहावलोकन.

3.4-मस्तिष्क कंप्यूटर इंटरफेस

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. बीसीआई के बारे में अनुसंधान के बारे में अधिक से अधिक 30 वर्षों के लिए है और अब भी बहुत छोटी है और तेजी से विकसित क्षेत्र रहा है. हाल के ऊपर एक पल मी क्षेत्र में ost महत्वपूर्ण अग्रिम कृत्रिम अंग नियंत्रण अर्थात् मस्तिष्क के कार्य मोटरिंग में बनाया गया है [ 3] और व्याख्या और दृश्य संकेतों के प्रसंस्करण. इन उपलब्धियों से कई प्रयोगों जानवर और मानव विषयों को शामिल दौरान सत्यापित किया गया है. शोधकर्ताओं ने जब जानवर या मनुष्य अपने दिमाग की मदद से इस उपकरण को नियंत्रित करने के लिए सीख यांत्रिक या इलेक्ट्रॉनिक उपकरणों के सफल एकीकरण रिपोर्ट, अन्य सफल स्थानान्तरण और दृश्य संकेतों के decoding [15, 20 रिपोर्ट].

मस्तिष्क-कंप्यूटर अध्ययन निकट कार्यात्मक neuroimaging है, जहां विभिन्न प्रौद्योगिकियों को प्रभावी ढंग से कुछ शारीरिक विशेषताओं के माध्यम से व्यक्ति के मस्तिष्क के राज्यों को दर्ज करने के लिए विकसित किया गया है के क्षेत्र से संबंधित हैं इंटरफेस. अधिकांश बीसीआई के दृष्टिकोण से उत्पादक एक हाल neuroimaging तकनीक कार्यात्मक मेगनेटिक अनुनाद इमेजिंग कहा जाता है ) (FMRI) [6, 13]. इस तकनीक को समय पर अलग अलग मस्तिष्क क्षेत्रों में रक्त के प्रवाह की गतिशीलता को दर्ज करने के लिए और एक उच्च परिशुद्धता के साथ की अनुमति देता है. यह फलस्वरूप विभिन्न मस्तिष्क क्षेत्रों और कुछ गतिविधियों और मानव के संज्ञानात्मक प्रक्रियाओं के सक्रियण के पैटर्न के बीच संबंध स्थापित करने की अनुमति देता है. ऐसा लगता है कि इस तकनीक, कई विकल्पों के विपरीत, गैर है, महत्वपूर्ण है और आक्रामक इंजेक्शन शामिल नहीं है. हालांकि यह है कि fMRI हार्डवेयर आजकल अभी भी बहुत महंगी है और cumbrous है ध्यान दें करने के लिए आवश्यक है.

ऐसा लगता है कि प्रयोग दिखाने उल्लेखनीय है कि मस्तिष्क adapts नए शर्तों के. उदाहरण के लिए, जब मोटरिंग आवेगों एक मैकेनिक आपरेटर या एक कंप्यूटर माउस कर्सर को नियंत्रित करने के लिए, मस्तिष्क में सक्षम था धीरे धीरे अंतर करने के लिए और अलग से कृत्रिम अंग से मैनिप्युलेटर को नियंत्रित करने के लिए सीखने का उपयोग किया गया. Lebedev जो संभवतः शरीर प्रतिनिधित्व में कृत्रिम उपकरणों को शामिल करने की अनुमति देता है दिमाग plasticity 'के प्रभाव का उल्लेख है. [20]

आगे अभी भी संज्ञानात्मक राज्यों [15 का पता लगाने के अवसर पर चर्चा neuroimaging के क्षेत्र में हाल के प्रकाशनों]. यह अनुबंध और हमारे ध्यान में मानव KRS बातचीत में बीसीआई के आवेदन की संभावनाओं पर केन्द्रित.

ऐसा लगता है कि अलग अलग राज्यों संज्ञानात्मक कुछ असली दुनिया वस्तुओं के साथ दिमाग क्षेत्रों सक्रियण के कुछ पैटर्न के अनुरूप जोड़ा जाना जाता है. इन नमूनों Decoding एक व्यक्ति वर्तमान में (जहाँ उनका ध्यान) या दृश्य वस्तुओं के मामले में निर्देश है कि व्यक्ति इमेजिंग है (यानी चेहरे, भवनों, फर्नीचर) और भी वस्तुओं वस्तुओं का जो वर्ग की पहचान करने में शामिल है जो superimposed उन्मुख stimuli समझने के लिए अनुमति देता है 'रंग और उन्मुखीकरण. [15] इन प्रक्रियाओं और दूर से इस समय समझा जा रहा जटिल हैं. आगे की पढ़ाई कैसे कम व्यवस्था और उच्च आदेश मस्तिष्क संकेत कुछ संज्ञानात्मक कार्यों के साथ सहसंबंधी प्रकट होगा, कैसे समय पर पैटर्न बदलने की भौगोलिक विशेषताओं और विभिन्न प्रभावों के तहत, यह विभिन्न विषयों के सक्रियकरण पैटर्न एक्सट्रपलेशन करना संभव है, जो हद तक; आदि हालांकि यह है कि 'का सटीक ज्ञान computations' मानव मस्तिष्क में प्रदर्शन माना जाता है प्रासंगिक BCIs के निर्माण के लिए महत्वपूर्ण नहीं है. [20] साझा डाटा खनन तकनीक विभिन्न neuroimaging सेंसरों से उपयोगी जानकारी निकालने के लिए और कुछ संज्ञानात्मक राज्यों के साथ संपर्क स्थापित लागू किया जा सकता है.

वहाँ जो गंभीरता से ज्ञान प्रतिनिधित्व के क्षेत्र में बीसीआई के उपकरण की सफलता को प्रभावित कर सकता है, हालांकि महत्वपूर्ण मुद्दे हैं. दो छोटी समस्याओं का समय पार सामान्यकरण और उसी मानसिक स्थिति के विभिन्न उदाहरणों की समस्या है. ऐसा लगता है कि एक ही मानसिक राज्यों के मस्तिष्क क्षेत्रों सक्रियण पैटर्न समय के साथ अलग हो सकता जाना जाता है. एक ही मानसिक राज्य के विभिन्न उदाहरणों के साथ, प्रासंगिक भिन्नरूपों और अन्य कारकों के आधार पर संशोधित छवियों को दे सकते हैं. [15] यह लचीली स्थानिक resampling और वर्गीकरण एल्गोरिदम्स की आवश्यकता के रूप में हेन्स और Rees ने सुझाव दिया इस्तेमाल किया जाएगा. हम इन समस्याओं के प्रभावी तकनीकों के विकास पर हल किया जाएगा विश्वास करते हैं.

अतिरिक्त संदिग्ध सवाल उपन्यास संज्ञानात्मक राज्यों को एक्सट्रपलेशन की समस्या है. हेन्स और Rees कि संभव अवधारणात्मक या संज्ञानात्मक राज्यों की संख्या, अनंत है नोट जबकि प्रशिक्षण श्रेणियों की संख्या को सीमित जरूरी है. [15] यह इसलिए कि कूटवाचक अनुभव छोटे प्रशिक्षण पूरी तरह से नई श्रेणियों को सेट से प्राप्त अस्पष्ट करने के लिए प्रशिक्षित किया जा सकता है महत्वपूर्ण है. यह एक्सट्रपलेशन का मतलब यदि मस्तिष्क सक्रियण पैटर्न वास्तव में कुछ व्यवस्थित parametric अंतरिक्ष में व्यवस्थित हो द्वारा संभव होगा. यह पाया जा करने के लिए, हालांकि, यह मानसिक सामग्री [15 के कुछ प्रकार के कम से कम करने के लिए संभव है माना जाता है] रहता है. तंत्रिका पैटर्न के वर्गीकरण के लिए मामले में सार आकार अंतरिक्ष वास्तव में यह हमारे वैश्विक ज्ञान मानचित्र पर मानव मस्तिष्क संज्ञानात्मक राज्यों के मानचित्रण की संभावनाओं पर पहले इस पत्र में वर्णित सिद्धांत करने की अनुमति होती है. इस हासिल है परंतु, प्रारंभिक अनुरोध के abovementioned "समस्या" और "आदर्श मानव <-> KRS" श्रृंखला स्थापित करने के लिए संभव होगा समाधान हो जाएगा.

3.5 Learnable कूटवाचक

जैसा कि अब मस्तिष्क इमेजिंग कि यह अलग मस्तिष्क क्षेत्रों के सक्रियकरण भेद करना संभव है की नवीनतम उपलब्धियों के लिए धन्यवाद जब व्यक्ति हम यह समझते हैं कि मानव संज्ञानात्मक शुरू नक्शा करने के लिए एक learnable कूटवाचक बनाने के लिए संभव है अनुमान मई विभिन्न विषयों के बारे में सोच रहा है जाना जाता है एक ज्ञान प्रतिनिधित्व प्रणाली के ज्ञान नक्शे पर राज्यों. मानव कंप्यूटर संपर्क का इसलिए एक आदर्श तरीका एक जबर्दस्त गति और संचार की परिशुद्धता के साथ एक प्रणाली की अनुमति स्थापित हो सकती है. वहाँ कम डेटा हानि बातचीत की भाषाई मंच के उन्मूलन के कारण होगा. इस गति और संपर्क के फलस्वरूप प्रभावशीलता में वृद्धि होगी. इन दो कारकों विभिन्न व्यवसायों के लोगों को काफी अपने काम की प्रभावशीलता को बढ़ाने के लिए अनुमति देगा. [6 से 15] हम यह है कि मस्तिष्क आवेगों के स्थान का एक निश्चित नियमितता और जो सब मनुष्यों के लिए सामान्य है ज्ञान का विषय हो, हम इन सुविधाओं anthropogenic कॉल कर सकते हैं. हालांकि यह है कि इन कड़ियों के बहुमत चाहिए व्यक्तिपरक हो जाना जाता है. इसलिए कूटवाचक व्यक्तिगत अनुकूली होगा.

यह भी कहा कि कूटवाचक की दक्षता व्यक्तियों और यह जानने के लिए और क्षमता के साथ अपने प्रशिक्षण पर निर्भर करेगा स्पष्ट है. हम कृत्रिम इंटरफेस के साथ प्रयोग से खो अंगों को बदलने के लिए प्रयोग किया जा रहा यह अनुमान कर सकते हैं. मानव और जानवरों को मानसिक रूप से एक विशेष रास्ते में एक कृत्रिम मैनिप्युलेटर और भी अलग से असली कृत्रिम अंग है और एक को नियंत्रित करने के लिए [20 सीखने को स्थानांतरित करने के लिए ध्यान केंद्रित करने में सक्षम थे].

जो हम जानते हैं कि एक कृत्रिम तंत्रिका तंत्र - आधारित तंत्र एक कूटवाचक समस्या का सबसे अच्छा उपाय है विश्वास abovementioned को ध्यान में रखते.

विकोडक है सीखने की प्रक्रिया

1) यादृच्छिक GKM के बहुआयामी अंतरिक्ष में चुना है समन्वय के साथ यह मुद्दा.

2) एकाधिक दस्तावेज़ों के पड़ोसी क्षेत्र में उनके mappings होने (मीट्रिक Euclidian) का इस्तेमाल किया जा रहा है का चयन कर रहे हैं और एक मानव ऑपरेटर के लिए प्रदर्शित की.

3) ऑपरेटर उसकी / उसके मन cognitively दिए विषय और स्मृति में संबंधित वस्तुओं में भाग लेने के लिए ध्यान केंद्रित.

4) इस neuroimaging डेटा fMRI हार्डवेयर के समय की एक विशिष्ट अवधि के दौरान एकत्र की जा रही है.

5) डेटा एक स्थानिक resampling और शोर कटौती एल्गोरिथ्म जानकारीपूर्ण पैटर्न प्रशिक्षण की वर्तमान यात्रा निस्र्पक निकालने के लिए उद्देश्य के माध्यम से कार्रवाई की है.

6) तैयार आंकड़ों के तंत्रिका तंत्र के निवेशों के लिए लाया जाता है. इस GKM एक चयनित बिंदु के outputs इसलिए GKM के साथ संबद्ध विशिष्ट मस्तिष्क सक्रियण पैटर्न के लिए तंत्रिका तंत्र के लिए प्रशिक्षण दिलवाया हैं निर्देशांक निर्देशांक.

Human brain to Knowledge Representation System bridge interface

ज्ञान प्रतिनिधित्व प्रणाली पुल इंटरफ़ेस करने के लिए मानव मस्तिष्क

चित्रा 3.1 के कूटवाचक के प्रशिक्षण की प्रक्रिया

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This