المثل الأعلى للمعرفة نظام التمثيل أو خريطة المعرفة العالمية
نحو مثالي لنظام التمثيل المعرفة : المعرفة العالمية خريطة
تاراس فيلاتوف
الموجز
واحدة من أهم المشاكل التي تحول دون مزيد من التطورات في مجالات المعرفة والذكاء الاصطناعي التمثيل هي مشكلة الدلالية الانحياز أو المعرفة ورسم الخرائط. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. التقدم في الحل لن يكون مفيدا جدا لمهام استرجاع المعلومات ، وعلم الوجود الانحياز ، أهمية الحساب ، وما إلى فهم النص في ورقة مفهوم متعدد الأبعاد خريطة المعرفة العالمية ، وضعت من خلال إشراف استخراج الوثائق التابعة لها من مجموعة كبيرة ، ويقترح . وبالإضافة إلى ذلك ، مشكلة حقوق المباشر -- العلم واجهة نظام التمثيل ، وتناول مفهوم التكيف فك المقترحة من أجل التفاعل مع سبق وصف نموذج موحد لرسم الخرائط. في الجمع بين هذين النهجين مقترحة كأساس لتطوير جيل جديد من المعرفة ونظم التمثيل.
الكلمات الرئيسية : تمثيل المعرفة ، والمعرفة ورسم الخرائط ، والتفاعل البشري الحاسوب ، علم الوجود الانحياز ، وعلم الوجود العلوي ، أهمية الحساب ، واسترجاع المعلومات ، وثيقة التشابه
1. مقدمة
في المجتمع ، ومجال المعرفة التمثيل أصبح أكثر أهمية على مدى السنوات الماضية [25]). الناس دائما محاولات لدراسة وتصنيف المعرفة عن المعرفة. يمكننا أن نجد الإشارات في وقت مبكر من سقراط في القرن الخامس قبل الميلاد (33) لازدهار والمنطق ونظرية المعرفة [28] في العصور الوسطى. لأن المشكلة هي أن من المهم النظر في الماضي ، من الصعب أن نبالغ في معناها خلال عصر المعلومات.
التكنولوجيات الحديثة قد وهبوا بشرية مفرطة الفيضانات من البيانات التي يصعب systematise والعملية. للشخص أن يصبح متخصصا في منطقة معينة يستغرق سنوات من التعلم ويحتاج لاحقة إعلامية في سباق لمواكبة احدث الاتجاهات المهنية.
ومن المعتقدات الشائعة بين المعرفة والمهندسين والمتخصصين في استخراج البيانات تلك المعلومات متاحة في الوصول المفتوح لاستخراج ما يكفي من حقائق صادقة عن أي جانب من جوانب حياتنا ، وحتى التنبؤ بها في المستقبل. المشكلة الوحيدة لحل هو ذكاء عملية المعلومات من مصادر متعددة. [35].
هذه عوامل الطلب على جيل جديد من المعرفة ونظم التمثيل systematise للمساعدة الإنسانية ، والوصول واستخدام المعارف الجماعية.
في هذه الورقة نقترح أفكار لتطوير معارف عصر جديد ونظام التمثيل (KRS).
ونحن نعتقد أن الانجازات التي تحققت مؤخرا في بعض مجالات العلوم وسيؤدي قريبا إلى طفرة هائلة في مجال المعرفة الإنسانية ، والتمثيل والتفاعل بين الإنسان والحاسوب. وهذا من شأنه فتح آفاق جديدة وزيادة كبيرة في فعالية العمل البشرية في العديد من التطبيقات. الشيء الوحيد الذي يجب القيام به هو جعل هذه الإنجازات معا.
مثالية KRS ينبغي أن تقدم للمستخدم مع سهولة الوصول إلى جميع المعارف البشرية. عناصره وبالتالي فهي :
- البشرية الذي يريد الحصول على قطعة من بعض المعارف وكان عليه أن يهتم ،
- تخزين البيانات ، و
- نظام الوسيط لتقديم واجهة لحقوق الوصول إلى المعرفة.
العقبات التي تنشأ هنا ناجمة عن محدودية القدرات البشرية والتكنولوجية على المستوى الحالي.
2. تخزين البيانات
2.1 الدولة من الفن
ويتطلب نظام التمثيل المعرفة وتخزين البيانات ، ما لم يكن قادرا على استرجاع الوثائق اللازمة من مصادر خارجية في الوقت الحقيقي. يمكننا الفوز في اثنين من الخطوط العريضة للنهج مثالي KRS من الأيام : منظم تدار يدويا مخازن المعرفة العالمية مثل ontologies الآلي والنظم التي تنطوي على فهرسة واسترجاع كامل ومعظم الوثائق متاحة الخام ال (الشبكة العالمية) مثل محركات البحث. مشكلة هو أول دليل في الطبيعة -- أي محاولة لخلق والحفاظ على قاعدة المعارف البشرية على الصعيد العالمي سوف يؤدي إلى حل وسط بين من التفصيل ، واقعية وقابلية الاستخدام. ], UFO (Unified Framework Ontology) على الرغم من وجود عدة ناجحة العليا علم الوجود مشاريع مثل مراكز الشباب الإصلاحية ([23]) ، WordNet [12]) ، DnS ، والسومو وغيرها الجارية مناقشات نظرية ما دام الهدف من البحث لوضع علم الوجود موحدة عالمية موحدة تحت أسماء سو (ستاندرد صعيد علم الوجود ([27]) ، وجسم غامض (اطار موحد علم الوجود) الخ.
النهج الثاني أصبح سائدا تاريخيا الشبكة العالمية نظرا لكونها أكبر وشاملة ومستكملة لمجموعة البيانات المتاحة للمعالجة الآلية لهذه الأيام. ولكن على عكس النهج الأول ، مشاكل الآلي استرجاع المعلومات تلعب دورا هاما هنا. مشاكل نص التفاهم ومعالجة اللغات الطبيعية هي واحدة من أكبر التحديات في منظمة العفو الدولية ورغم ذلك ما زالت من دون حل فعال. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. المتاخمة هي مشكلات ذات أهمية التصنيف وحساب ، ما يسمى ب 'الشبكة تجميع مشكلة [1]. النهج الثاني (الفهرسة الآلية) ثم الكبرى يفتقر إلى الدقة في الاسترجاع.
هناك على الجهود الجارية لتحقيق التحسينات المذكورة النهج من أجل التغلب على هذه المشاكل. على سبيل المثال ، إلى جانب قاعدة موحدة للمشاريع علم الوجود (سو ، بولو) وهناك بعض المحاولات لوضع علم الوجود وعلم الوجود الانحياز تقنيات رسم الخرائط من أجل تحقيق وجود لها ontologies مع بعضها البعض ومع الأنواع الأخرى من قواعد المعرفة (5 ، 17]. ومن المقترح في كثير من الأحيان لخفض أوجه القصور في دليل الإدارة في حالة ontologies من جانب وسائل استرجاع المعلومات آليا (تكنولوجيا محرك البحث). من الجانب الآخر ، وتحسين النص التشعبي المعايير التي يجري وضعها لجعل من الممكن يدويا تحديد المعلومات للمساعدة على فهم محركات البحث commonsense معنى المراقبة العالمية للطقس وثائق وصلات بينهما [24]). ومن الضروري ان نفهم ان هذه الحلول هجينة تحمل عيوب تقنيات المقابلة مع المزايا.
عيب واحد يوحد هذه النهج ، ويجعل من المستحيل دمجها : لا يوجد معيار ورسم الخرائط وتحديد العلاقات بين المفاهيم والوثائق في مختلف النظم. يتم حل المشكلة في حالة واحدة من نظم ثابتة رياضيا التفسير هرم مثل ontologies يتغلب النهج القائم (الشبكة العالمية). ولكن يبدو من غير المرجح أن هذا يرجع إلى أسباب المذكورة أعلاه. الوسيط المستقل معيار حل محتمل لهذه المشكلة. هناك العديد من المبادرات باتجاه ربط المتبادل ، ورسم خرائط لقواعد المعرفة من أنواع مختلفة من بينها وجود أي مجال علم الوجود ورسم الخرائط. المبادرات المشتركة عيب واحد : أي معيار واحد لرسم الخرائط وتحديد العلاقات بين الوثائق. بعد ذلك ، فإن أيا منها لا يحتمل أن تصبح موحدة على نطاق واسع ما لم يتم حل أكثر استدامة.
2.2 مفهوم المعرفة خريطة عالمية (GKM)
ونحن نعتقد أنه من الممكن وضع معيار واحد لوضع خرائط المعرفة من خلال بناء منطقي الفضاء بغرض إسقاط المفاهيم المعرفة العالم الحقيقي. هذا النموذج (دعنا نسميها خريطة المعرفة العالمية) يجب أن يعكس مستوى التماثل بين وثائق وخرائط المفاهيم على ذلك.
والغرض الرئيسي من هذا النموذج :
- الانحياز وعبر وثائق ورسم خرائط المفاهيم (المراقبة العالمية للطقس ، ontologies ، والمكتبات الإلكترونية ، والأدلة وغيرها)
- استرجاع المعلومات من خلال تصفح
- دقة حساب الآلي commonsense صلة
ولذلك يتطلب GKM رياضي / النموذج المنطقي للتخزين المعرفة مع شرط محدد : يجري الأمثل لهذه المهمة أي تمثيل للمعرفة والتفاعل مع البشر. لتنفيذ هذا الشرط يجب أن يعكس هذا النموذج في أبعاد أو في هيكلها هيكل من المعرفة الإنسانية.
ولذلك شروط هي :
- أبعاد ورسم الخرائط.
العامل الرئيسي لأبعاد هو معنى (أو الموضوع).
- كل مفهوم حقوق المعرفة قد تكون وضعت على نقطة محددة وينسق مع النظام في الفضاء.
- كل وثيقة أو النص قد تكون وضعت على عدد من النقاط (وتنقسم الوثيقة إلى mêmes -- معنى القطع) أو نقطة واحدة.
- أهمية حساب.
- ومن الممكن رياضيا لحساب صلة بين المفهومين بحساب المسافة بين ما يقابلها من نقاط الإسقاط في الفضاء.
- ومن ثم ، يمكن حساب 'تشابه' بين الوثائق التي والمفاهيم عن طريق حساب المسافة بين mappings.
- تجانس الفضاء.
- الفضاء الموحد (متجانس) ومستمرة
- وينسق تعكس معنى والمسافات بين النقاط التي تعكس الاختلاف في معنى ذلك أنه إذا كانت النقطة الثالثة هي الواقعة بين ألف وباء ، فإنه يعني مفهوم جيم يتصل كل من ألف وباء على قدم المساواة.
- فمن الممكن 'تصفح' الفضائية إيجاد مصادر عليمة لرسم المناطق المجاورة.
بناء نموذج رياضي لهذا الفضاء يمكن وضع خريطة المعرفة العالمية. فليس من المجدي محاولة لوضع هذا النموذج (GKM) في كتيب الطريق بسبب من الأسباب المشار إليها أعلاه المعلومات والنمو المستمر لإحداث تغيير في التفاهم بين البشر من العالم. ونحن نعتقد أنه من الممكن استخلاص قواعد وتوابعها من corpuses النصوص المتاحة والاستفادة من هذه المعالجات كما لأغراض رسم الخرائط.
حجر الاساس للالافتراضات هو أنه من الممكن عموما خريطة مختلف مواضيع المعرفة البشرية على مساحة واحدة والمسافات داخل أبعاد هذه الأخيرة تعبر عن مستوى معين من التشابه بين المواضيع. هذا الافتراض يستند جونسون يندنشتراوس يما أن مجموعة من النقاط في ارتفاع ن الأبعاد Euclidian يمكن رسم خرائط للفضاء الى ن الأبعاد Euclidian الفضاء
(2.1)
ذلك أن المسافة بين أي نقطتين فقط من التغيرات عاملا (1)
([7]. الناقل الفضاء النموذجي التي يشيع استخدامها في استرجاع المعلومات والوثائق ويمثل النص تصنيف ارتفاع ناقلات الأبعاد ([31]). تحتوي هذه الناقلة على مستوى معين (اعتمادا على وظيفة المختار متري) من المعلومات التي تكفي لتصنيف موضوع الوثيقة الأصلية.
فإن نظرية Tychonoff 's[26]) تنص على أنه نقطة ، تمثل خصائص الأجسام من طبقة واحدة ، ينبغي أن يكون أقرب إلى بعضهما البعض في الممتلكات الفضائية من النقاط التي تمثل خصائص الأجسام من الفئات الأخرى. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. في مهمتنا وهذا يعني الأصلي للناقل الفضاء ن النصوص المتوقعة قد تكون ثابتة لا ينطبق على الأبعاد الفضاء واستخدام خوارزمية مناسبة للضغط البيانات / أبعاد الحد يرجع إلى نظرية من الاكتناز ([22] رسم الخرائط وسوف يتحقق فيه المسافات بين نقطة تمثل أهمية المناظرة الوثائق.
العوامل التي تؤثر في دقة رسم الخرائط :
- التمثيلي للمتري وظيفة ، وحجم هذه الميزة الفضاء
- وحجم ونوعية dispersity من مجموعة وثائق
قدمت النظرية للتطبيق في ظل الظروف الحالية ، لا يزال يتعين العثور على التقنيات التي ستستخدم لوضع ورسم الخرائط. نقترح التركيز على وسائل تلقائية بسبب مضاعفات جعل العديد من الخبراء على أساس الدليل ورسم خرائط غير قابلة للتطبيق.
2.3 الجيل GKM الآلي من خلال إشراف استخراج (الفرضية)
من أجل أن تكون مفيدة وينبغي أن تتضمن GKM للmappings حقيقية لعدد كبير من كلمة (الشبكة العالمية) وثائق وهيكلها في عام تمثل التفاهم بين البشر من العالم. فإنه ليس من المفيد لذلك للنظر في أي دليل على إنشاء طرق وملء GKM مع وثيقة من وثائق mappings. البيانات التعدين المبادئ وينبغي أن تستخدم لاستخراج التابعة تمثل المعارف من وجود مجموعة من الوثائق متاحة للتجهيز الحاسوبي ، وتسرب البيانات التي لا داعي لها.
كانت هناك محاولات عديدة للإشراف التابعة في استخراج النصوص ومع ذلك فإنه ما زال الشك في مسألة ما إذا كان أي تقنية قادرة على توفير استخراج المعرفة المستدامة من خلال تحليل الوثائق وجمع كبير (10 ، 11 ، 21 ، 30].
دعونا تقسيم العوامل التي تؤثر بشكل عام محتويات الوثائق إلى ثلاث فئات :
- العوامل الشخصية المؤلفين (مشاعر ودوافع لخلق النص ، المادية والمعنوية ولايات خلال التفكير والكتابة)
- اللغة (وغيرها من قواعد اللغة المستخدمة لكتابة وثيقة)
- المعرفة (أجزاء معينة من المعرفة الإنسانية المؤلف يحيل مباشرة أو ضمنا من خلال وثيقة)
دعنا نفترض أنه من الممكن لهذه العملية كل ما هو متاح من وثائق النص حقوق المؤلفين وانتزاع كل الاعتماد على هذا النظام. في هذه الحالة تأثير عامل 1 وسيكون الحد الأدنى. تأثير عامل (2) ليست من الأهمية نظرا إلى ما يلي :
أ) وثائق في عدة لغات يمكن فهرستها ، وبالتالي الحد من تأثير متبادل
ب) اللغة في حد ذاته تعبير عن المعارف البشرية [18]) ؛ ذلك الى حد ما 2 عامل subfactor هي من 3 وحتى استخراج من خليط يمثل إنجازا مرضيا
ومن الممكن نظريا ثم لانتزاع معلومات معظمها المقابلة لمعرفة البشر المعرضين من خلال الوثائق المتاحة. حولت هذه المعلومات لرسم خرائط المساحة افتراضي يوفر لنا GKM المستدامة.
2.4 التنفيذ (تجربة)
المساحة المبنية في كل وثيقة وينبغي رسم واحد للتنسيق. 'تصفح' من الفضاء أو مسافات المقارنة يجب أن تكشف عن حالة وثائق أو مجموعات يعكس أهميتها وأنه من الممكن احالة الموضوع لأسماء معينة محددة تنسق في الفضاء.
لدينا تجارب باستخدام 2 و 3 كوهونن سوم الأبعاد المحلية مع مجموعة من الوثائق تكشف عن أن المسافات بين التوقعات وثائق ليست مستقرة طوال سلسلة من عمليات الاطلاق. هذا ، في رأينا ، هو دليل على أن أبعاد الخريطة غير كافية والتي تتفق مع جونسون ليما يندنشتراوس المذكورة أعلاه.
ومما يؤسف له أنه من المستحيل القيام بتجربة سليم أبعاد. على سبيل المثال ، وفقا لجونسون يندنشتراوس ليما ، على الوثائق التي تسمح 20000 الخريطة 10 ٪ خطأ سيتطلب 58 الأبعاد. وهذا يتطلب حسابات التي سبق الحديث الحواسيب قدرة.
المهم أن نذكر هنا أنه في حين أن الحد الأقصى ليما يعطي أبعاد رسم الخرائط الفضائية يسمح للوفاء بشرط واحد الإسقاط ، ليس من الضروري الحد الأدنى من القيمة الفعالة. المأخوذ يعطي قيمة لمجموعة من النقاط أي ن لأسوأ الحالات التي ليس من المرجح أن تظهر في الممارسة العملية. طرق لكشف أبعاد ينبغي استخدام فعال لحساب أبعاد بيانات ، وبالتالي تحديد عدد من الأبعاد الصحيحة لرسم خرائط خاصة لمجموعة البيانات. ومن المعروف أن هناك تقنيات لهذا الذي يأتي من خلفية سطح التعمير. واحدة من آخر هو عمل من قبل س. تشنغ ، Y. Z. وو وانغ (4) حيث البعد طريقة الكشف عن طريق تحليل المكونات الرئيسية (8) ويرد. وهكذا ، فإن البيانات الجوهرية أبعاد يمكن استخراجها. وحيث أن هذه القيمة هي في الواقع أقل بكثير من الحد الأقصى للأبعاد ضرورية لإسقاط نفس العدد من وثائق في أسوأ الحالات النظرية حال ، فإن هذا يعطي كبير في الحد من حساب الزمن. وكبديل للغرض ذاته ، يمكننا النظر في أساليب متكررة على أساس التقييمات. بغرض الحد من أبعاد ، في حالتنا ، لوضع نظام فعال لإعداد الخرائط حيث commonsense التشابه بين مصادر المعلومات وأعرب عن طريق الاسقاط Euclidian المسافة بين نقطة. اتخاذ أي أبعاد تقنية تقوم على الحد من العشوائية في اختيار من مدخلات مجموعة بيانات (مثل العنصر الرئيسي للتحليل ، خرائط ذاتية التنظيم ، أو إعادة البناء Sammon المثلثات) ، في حالة ما إذا الناتج أبعاد أقل من مناسبة ، والتوقعات غير مستقرة وسيكون مع كل حساب رسم الخرائط ستكون مختلفة ، والمسافات بين التوقعات لن الحفاظ. ويمكننا أيضا أن نفترض أنه عندما فعالة أبعاد متعددة المدخلات المستخدمة لرسم الخرائط ، ويحافظ على المسافات مع درجة معينة من الحرية حسب الطريقة المستخدمة للحد من أبعاد. حل بديل لذلك هو الاختيار العشوائي للحد من أبعاد تقنية مقترنة الزائدة أبعاد موازية للتقييم ورسم الخرائط. 32]. تنظر ، على سبيل المثال ، الأسلوب الذي وصفه في تزايد SOMs [19 ، 32]. تهدف إلى الحد من حساب الزمن ، وعدد من الفروع ، وتزداد بشكل ديناميكي مع العقد الجديد يتم توزيعها على نحو موحد القديمة والأوزان ناقلات يجري على وسائل المجاورة الأصلي الأوزان النواقل. وهي نفس التقنية التي تطبق على أبعاد (دال) من شأنه أن يتيح الفرصة لتقييم كل مد خطوة خطوة. معايير التقييم سيتم تثبيت المسافات بين التوقعات. لهذا الغرض اثنين أو أكثر على النفس وتنظيم الخرائط قد تكون بالتوازي مع pairwise المسافات بين بعض التوقعات مقارنة على كل تكرار. في ظل تكرار هنا نفهم أبعاد المرحلة عندما كان اجتماع كبار المسؤولين للزيادة والشبكة وبالتالي استقر مع المعايير الجديدة.
يلخص المذكور نقترح ما يلي نموذج تجريبي لتقييم أفضل نهج لوضع خريطة المعارف العالمية ، بدءا من جمع الوثائق النص.
فإن datase ر : ناقل نموذج الفضاء لاستخدامها (كما تمثل كل وثيقة مع ناقل أبعاد سمات وخصائص صفوف كما تنسق في المقابل الأبعاد).
اختيار سمة مهمة : الأكثر فعالية لتحديد.
ناقل الحجم : سينشأ تجريبية.
ومعالجة البيانات وتخزينها.
وهناك أبعاد للحد من هذه التقنية يجب أن تستخدم لرسم الخرائط. هناك نهجان محتملان :
أ) قبل حساب أبعاد جوهرية وتقييم أبعاد مختلفة للحد من أساليب معروفة أبعاد رسم الخرائط ؛
ب) نهج تدريجي أبعاد التقييم 'قليلة mappings يجري بالتوازي -- إلا أساليب الاختيار العشوائي للمدخلات بيانات يمكن استخدامها.
المدخلات : الوثائق سمة النواقل.
النتائج : GKM الإحداثيات.
التقييم :
1) Commonsense التقييم الأولي للرسائل بين وثائق والمسافات Euclidian من التوقعات ورسم الخرائط.
2) لتحقيق الاستقرار في هذه pairwise المسافات بين التوقعات المختلفة من خلال عمليات الاطلاق في حالة الاختيار العشوائي التقنية المستخدمة.
3. بينية
3،1 تمثيل المعرفة واجهة مثالية
التفاعل جزءا من نظام التمثيل المعرفة أمر مهم عندما تناقش النظام المثالي. كل من مهام تتلقى الطلبات من المستخدمين ونقل المعرفة إلى منهم على نفس الدرجة من الأهمية مع مهام وتنظيم البيانات وتخزينها. في هذه الورقة ونحن نناقش سبل المعرفة من أجل التمثيل نظم الجيل الجديد ، وبالتالي فإن مسألة التفاعل overviewed أجل إقامة ما إذا كان من الممكن أن يقدم واجهة مثالية من خلال وسائل التكنولوجيا الحديثة.
الوصل التي تستخدم لدعم التفاعل مع المستخدم من حقوق التمثيل والمعارف الحديثة ونظم استرجاع المعلومات بشكل رئيسي من 'الفهرسة' النوع ، أي أن المستخدمين ليعرف بالضبط ما يبحثون عنه ، وعليهم أيضا أن يحدد ذلك لغويا. ومن الأمثلة الشائعة لهذا التفاعل هو محرك البحث. كما ذكرنا أعلاه ، ومحرك البحث على شبكة الاتصالات العالمية في مجموعة من الوثائق هو الأكثر اكتمالا ومستكملة لنظام التمثيل المعرفة المتاحة في الوقت الحاضر ، وهذا سبب لها من شعبية. وفي الوقت ذاته فإنه من المعروف أن 'الفهرسة' ليس من الطبيعي واجهة استخدام للانسان ولكن من هو البديل الوحيد 'تصفح' النهج ويجري حاليا إنشاء رديئة للغاية ([16]). سبب ذلك يعود الى مشكلة المعرفة ورسم الخرائط والانحياز الذي لا يسمح التصنيف الآلي للوثائق والتمثيل وفقا لمواضيع. ومع ذلك ، ومشكلة توحيد المعارف الفضائية ورسم خرائط الحل ، تظهر احتمالات جديدة لبناء وتحسين وأكثر طبيعية البينية 'تصفح' نوع.
3.2 السامي وصورة عن أبعاد
وبعد الإشارة إلى أن رسم الخرائط العالمية مما أدى إلى الفضاء من المرجح أن تكون الأبعاد ن ن مرتفع حيث أنه من الضروري إيجاد حل لمشكلة التمثيل البصري. ومن الممكن للإنسان أن يتصور 3D الفضاء ، لذلك ، أفضل سبل الثانية -> 3D التمثيل يتم تقييمها. أبعاد متعددة للحد من التقنيات أو عن طريق واجهة التمثيل نهج يمكن استخدامها.
ومن المهم أن بفضل المعرفة الموحدة ورسم الخرائط الفضائية الخطأ التقليل من خلال حساب بين وثائق ذات صلة ، وعلاوة على ذلك ، استرجاع الوثائق ذات الصلة من النظم الأخرى حتى يصبح بالمهمة الهينة. بالنسبة للمستخدم النهائي وهذا يعني ، مرة واحدة هذا النظام الموجود في الموضوع له / لها مهتمة ، فإنها لن تؤدي إلى المستخدمين وثائق ذات صلة.
3.3 طلب معلومات السلسلة
عندما مواضيع مهام وضع الخرائط وتحديد المواقع ، ومعرفة أهمية حساب الفضاء تصفح حل أهم المهام التي لا تزال على حل هذه المشكلة هو وجود الطلب الأولي في الدولة من أحدث نظم استرجاع المعلومات التالية التي عادة ما تكون عمليات تشارك فيه المعلومات المطلوبة :
البشري : 1) الخيال --> 2) تشكيل البناء اللغوي --> 3) دليل مدخلات لوحة المفاتيح (صوت مدخلات) --> آلة : 4) فك رموز لغوية --> 5) المطابقة والمكان --> 6) تصورا لمطابقة الوثائق
سلسلة طويلة ، وأنه من الواضح أن فقدان البيانات ، والفساد ، ويجري كبير نظرا لضعف فك التشفير والترميز اللغوي. أولا ، المستخدم في صياغة الصور المعرفية واللغوية في الجملة القصيرة. ثانيا ، فك شفرة نظام الحكم من أجل فهم موضع اهتمام المستخدم. وقد وصفت سلسلة الطلب الأولي لأسباب الاستياء من مستخدمي محركات البحث الحديثة نظرا لعدم قدرة النظام على 'فهم' الطلب مما أدى إلى خسائر هائلة الوقت المستخدم النهائي. درجة استرجاع هذه الأخطاء والمضايقات الناجمة عن واجهة كبيرة والحد بشكل كبير تقليل أثر أكثر دقة استرجاع الوثائق ومكان عرضه الموحد لرسم الخرائط.
ولذلك فإن من الضروري النظر ، من الناحية النظرية على الأقل ، وإمكانية إنشاء مثالية قصيرة السلسلة البشرية <--> العلم والتمثيل والتفاعل مع وحدات النظام مما تسبب في فقدان البيانات يتم القضاء :
البشري : 1) الخيال --> [طلب المصادقة على من خلال المخ البشري المباشر GKM ينسق المحول] --> 2) المطابقة والمكان --> 3) تصورا لمطابقة الوثائق
نحن لمحة أحدث الإنجازات التي تحققت في مجال الحاسوب الدماغي (BCI) لهذا الغرض.
3.4 - المخ الحاسوب
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. البحث عن BCI مستمرة منذ أكثر من 30 عاما ، والمنطقة ما تزال صغيرة للغاية ويتطور بسرعة. وحتى اللحظة الأخيرة إلى معاهدة الفضاء الخارجي م تقدم كبير في المنطقة التي قدمت للأطراف الاصطناعية في مراقبة أي السيارات وظائف المخ [ 3]) ، وتفسير ومعالجة الاشارات البصرية. هذه الانجازات قد تم التحقق من خلال التجارب المتعددة التي تنطوي على الحيوانات والبشر. قال باحثون الاندماج الناجح للآلية أو الأجهزة الإلكترونية عند البشر أو الحيوانات لتعلم السيطرة على الجهاز مع مساعدة من الدماغ والبعض الآخر في تقرير النجاح في نقل وفك رموز الاشارات البصرية (15 ، 20].
دماغ الحاسوب ودراسات ذات صلة وثيقة مجال الوظيفية neuroimaging ، حيث مختلف التكنولوجيات وضعت على نحو فعال سجل ايات الشخص الدماغ عن طريق بعض الخصائص الجسدية. مثمرة للغاية من وجهة نظر BCI هي الأخيرة neuroimaging تقنية تسمى الرنين المغناطيسي الوظيفي ) (fMRI) [6 ، 13]. وتسمح هذه التقنية لتسجيل ديناميكية تدفق الدم في مختلف مناطق المخ مع مرور الوقت وعالية الدقة. هذا ويسمح بالتالي لإقامة الصلات بين أنماط مختلفة من الدماغ تفعيل مجالات وأنشطة معينة من العمليات المعرفية والبشرية. ومن المهم أن هذه التقنية ، على عكس العديد من البدائل ، ومن غير الغازية ، وأنه لا يشمل الحقن. ومن الضروري الإشارة إلى ان أجهزة fMRI الأيام لا تزال مكلفة للغاية ومتعب.
ومما له دلالته أن التجارب تبين أن الدماغ يتكيف مع الظروف الجديدة. على سبيل المثال ، عندما كانت نبضات السيارات المستخدمة لمراقبة ميكانيكي أو تضارب الكمبيوتر مؤشر الماوس ، الدماغ تمكن تدريجيا تفرق وتعلم السيطرة على المناورة بشكل منفصل عن أطراف الاصطناعية. ذكر ليبيديف تأثير العقل بلاستيكية 'والتي يمكن أن تسمح لدمج الأجهزة الاصطناعية في جسد التمثيل. [20]
المنشورات الحديثة في مجال neuroimaging كذلك مناقشة ما زالت الفرصة للكشف عن المعرفية الدول [15]). وينص هذا تركيز اهتمامنا على إمكانية تطبيق BCI في KRS التفاعل البشري.
ومن المعروف أن الدول المختلفة المعرفية المرتبطة العالم الحقيقي أشياء معينة تتناسب مع أنماط معينة من المخ مجالات التنشيط. ويسمح فك رموز هذه الأنماط لفهم المنحى الذي فرضه محفزات شخص يحضرون حاليا) حيث يتم توجيه الانتباه) ، أو في حالة الأشياء المرئية لتحديد الدرجة التي الأجسام الشخص التصوير (أي وجوه ، والمباني ، والأثاث) ، وحتى الأشياء 'لون والتوجيه. [15]) وهذه العمليات معقدة وبعيدة كل البعد عن المفهوم في الوقت الراهن. مزيد من الدراسات تكشف عن الكيفية التي تقوم من أجل المنخفضة والعالية من أجل اشارات المخ ترتبط بعض الوظائف المعرفية وكيف الخصائص المكانية أنماط تتغير بمرور الزمن ، وتحت تأثيرات مختلفة ؛ إلى أي مدى ، ومن الممكن استقراء لتفعيل أنماط متنوعة المواضيع ؛ وما ومن المعتقد ان معرفة دقيقة 'الحسابية' المنجز في الدماغ البشري ليست حاسمة لبناء BCIs ذات الصلة. [20] عام استخراج البيانات ويمكن تطبيق تقنيات استخلاص معلومات مفيدة من مختلف أجهزة الاستشعار neuroimaging وإقامة علاقات مع بعض الدول المعرفية.
هناك على الرغم من القضايا الهامة التي يمكن أن تؤثر تأثيرا خطيرا على نجاح الأجهزة من BCI في مجال المعرفة التمثيل. اثنين من المشاكل الصغيرة هي التعميم عبر الزمن ، ومشكلة مختلفة من نفس العقلية. ومن المعروف أن مناطق الدماغ تفعيل الأنماط الذهنية نفسها قد تختلف مع مرور الزمن. حالات مختلفة من نفس الحالة النفسية قد يعطي تعديل الصور كذلك ، تبعا للتغيرات المحتويات وغيرها من العوامل. [15]) وهذا يتطلب مرونة والمكاني resampling تصنيف خوارزميات لاستخدامها على النحو الذي اقترحه هاينز وريس. ونعتقد أن هذه المشاكل سوف تحل على تطوير تقنيات فعالة.
والسؤال هو أكثر مريبة مشكلة الاستقراء لرواية المعرفية. هاينيس ريس ونلاحظ أن عدد ممكن أو الإدراك الحسي والذهني للدولة بلا حدود ، في حين أن التدريب في عدد من الفئات محدودة بالضرورة. [15] ومن الأهمية بمكان أن فك بالتالي يمكن تدريب لتعميم التجربة تم الحصول عليها من مجموعة صغيرة لتدريب فئات جديدة تماما. سيكون من الممكن من خلال وسائل تنشيط الدماغ إذا الاستقراء أنماط فعلا في بعض الترتيب المنهجي بارامترية الفضاء. هذا وجدت أنه لا يزال يتعين ، مع ذلك ، فإنه يعتقد أنه من الممكن على الأقل بالنسبة لبعض أنواع المحتوى العقلية [15]). في حالة مجردة تشكل فضاء لتصنيف أنماط العصبية موجودة في الواقع انها ستسمح لنا النظريات عن إمكانيات رسم خرائط العقل البشري المعرفية الدول على خريطة المعرفة العالمية التي سبق وصفها في هذه الورقة. وقدمت يتحقق هذا ، فإن المذكور "مشكلة الطلب الأولي" سوف تحل "والمثل الأعلى لحقوق <--> KRS" سلسلة سيكون من الممكن وضع.
3.5 تعلم فك الرموز
وكما هو معروف الآن بفضل أحدث منجزات تصوير الدماغ أن من الممكن تمييز تفعيل مختلف مناطق المخ عندما يكون الشخص في التفكير في مواضيع مختلفة يمكن أن تفترض أنه من الممكن خلق لتعلم فك الخريطة الإدراكية بدأت البشرية الدول على خريطة المعرفة معارف نظام التمثيل. ولذلك على النحو الامثل للتفاعل بين الإنسان والحاسوب ويمكن إنشاء السماح هائلة السرعة والدقة للاتصال مع النظام. سوف يقل بسبب فقدان البيانات القضاء اللغوية المرحلة من التفاعل. سرعة وفعالية وبالتالي سوف يزيد من التفاعل. وهذان العاملان سوف تسمح للناس من مختلف المهن من أجل زيادة فعالية عملها إلى حد كبير. من (6 ، 15) ونحن نعرف أن هناك بعض الانتظام من موقع نبضات الدماغ والعباد من المعرفة ، وهي عناصر مشتركة بين جميع البشر ؛ يمكننا أن ندعو هذه السمات الاصطناعية. بيد أنه من المعروف أن معظم هذه الروابط يجب أن تكون فردية. ولذلك لا بد من فك منفردة على التكيف.
ومن الواضح أيضا أن كفاءة من فك سوف يعتمد على الأفراد وتدريبهم ، ومعها القدرة على التعلم. يمكننا أن نفترض هذا من تجارب مصطنعة البينية تستخدم لتحل محل فقدوا أطرافهم. البشر والحيوانات وتمكن من التركيز في عقليا بطريقة خاصة لنقل اصطناعي للمناورة ، وحتى تعلم السيطرة على أطرافه الحقيقية والمصطنعة واحدة على حدة [20]).
النظر المذكورة أننا نعتقد أن وجود شبكة العصبية الاصطناعية -- تقوم الآلية هي أفضل حل للمشكلة فك الترميز.
فك عملية التعلم
1) النقطة ينسق مع عشوائية في فضاء متعدد الأبعاد GKM اختيار.
2) وثائق متعددة لها mappings في المنطقة المجاورة لها (Euclidian تستخدم متري) ويتم اختيار وعرض لحقوق المشغل.
3) ويركز المشغل حالته الاعتبار حضور المعوقون ذهنيا لموضوع معين والأجسام ذات الصلة في الذاكرة.
4) neuroimaging فإن البيانات التي تجمعها أجهزة fMRI على مدى فترة محددة من الزمن.
5) معالجة البيانات المكانية من خلال الحد من الضوضاء وresampling خوارزمية بهدف انتزاع المعلومات الحالية التي تتسم بها أنماط تكرار التدريب.
6) أعدت البيانات يتم جلب إلى مدخلات من الشبكة العصبية. فإن GKM إحداثيات نقطة مختارة يتم جلب لمخرجات التدريب وبالتالي فإن الشبكة العصبية لربط تفعيل أنماط محددة في الدماغ وينسق مع GKM.
الرقم 3.1 وعملية التدريب من فك
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Recent Comments