Ιδανικό Γνώση Αντιπροσωπεία ή Παγκόσμιο Σύστημα Γνώσης Χάρτης
Προς ιδεαλιστικών Γνώση Αντιπροσωπεία Σύστημα: Παγκόσμια Γνώση Χάρτης
Taras FILATOV
Περίληψη
Ένα από τα πιο σημαντικά προβλήματα που παρεμποδίζουν την περαιτέρω εξελίξεις στους τομείς της γνώσης και της Αντιπροσωπείας Τεχνητή Νοημοσύνη αποτελεί ένα πρόβλημα της σημασιολογικής ευθυγράμμιση ή γνώσεις χαρτογράφησης. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Η πρόοδος στη λύση θα είναι πολύ χρήσιμο για την υλοποίηση των καθηκόντων της ανάκτησης πληροφοριών, οντολογία ευθυγράμμιση, την καταλληλότητα του υπολογισμού, κατανόηση κειμένου, κλπ. Στο χαρτί η έννοια της πολυδιάστατης γνώσης παγκόσμιο χάρτη, που εκπονήθηκε με την ανεξέλεγκτη άντληση εξαρτήσεις από μεγάλα έγγραφα corpus, προτείνεται . Επιπλέον, το πρόβλημα της άμεσης Ανθρωπίνων - Γνώση Αντιπροσωπεία System Interface απευθύνεται και μια ιδέα της προσαρμοστικής αποκωδικοποιητή που προτείνονται για το σκοπό της αλληλεπίδρασης με το παρελθόν που περιγράφονται ενοποιημένο μοντέλο χαρτογράφησης. Σε συνδυασμό αυτών των δύο προσεγγίσεων που προτείνονται ως βάση για την ανάπτυξη μιας νέας γενιάς συστημάτων αναπαράσταση της γνώσης.
Λέξεις-κλειδιά: αναπαράσταση της γνώσης, τη χαρτογράφηση της γνώσης, της ανθρώπινης αλληλεπίδρασης υπολογιστή, οντολογία ευθυγράμμιση της άνω οντολογία, την καταλληλότητα του υπολογισμού, την ανάκτηση, τον ομοιότητα
1. Εισαγωγή
Στην κοινωνία, το πεδίο των γνώσεων εκπροσώπηση έγινε πιο σημαντική πάνω τελευταία χρόνια [25]. Ο κόσμος πάντα κάνει προσπάθειες για να μελετήσει και να ταξινομούν τις γνώσεις σχετικά με τη γνώση. Μπορούμε να βρούμε αναφορές ήδη από το Σωκράτης στον πέμπτο αιώνα π.Χ. [33] για την ανάπτυξη της λογικής και της επιστημολογίας [28] στο μεσαίωνα. Δεδομένου ότι το ζήτημα αυτό θεωρείται σημαντικό στο παρελθόν, είναι δύσκολο να υπερεκτιμούν την έννοια κατά την εποχή της πληροφορίας.
Οι σύγχρονες τεχνολογίες έχουν προίκισε την ανθρωπότητα με υπερβολική πλημμύρες των δεδομένων, οι οποίες είναι δύσκολο να συστηματοποιηθούν και διαδικασία. Για ένα άτομο να γίνει ένας ειδικός σε μια συγκεκριμένη περιοχή θα λαμβάνει χρόνια της μάθησης και απαιτεί μια μεταγενέστερη πληροφοριακό αγώνα για να διατηρήσουμε επαφή με τις τελευταίες τάσεις επαγγελματικό.
Πρόκειται για μια δημοφιλή πεποίθηση, μεταξύ γνώσης και εξόρυξης δεδομένων μηχανικούς ειδικούς ότι οι πληροφορίες που διατίθενται σε δημόσια πρόσβαση είναι αρκετά για να εξαγάγετε αληθινοί γεγονότα για σχεδόν κάθε πτυχή της ζωής μας, ακόμη και την πρόβλεψη μελλοντικών. Το μόνο πρόβλημα για την επίλυση είναι έξυπνο να επεξεργάζονται τις πληροφορίες από πληθώρα πηγών. [35].
Αυτή η νέα γενιά παραγόντων ζήτηση της γνώσης αντιπροσώπευση συστημάτων, ώστε να συστηματοποιήσει την ανθρωπότητα, την πρόσβαση και χρήση της συλλογικής γνώσης.
Στο σημερινό έγγραφο που προτείνουμε ιδέες για την ανάπτυξη μιας νέας εποχής Γνώση Αντιπροσωπεία Συστήματος (KRS).
Πιστεύουμε ότι τα πρόσφατα επιτεύγματα σε ορισμένους τομείς και οι επιστήμες θα οδηγήσει σύντομα σε μια τεράστια πρόοδος στο πεδίο της ανθρώπινης γνώσης εκπροσώπηση και την αλληλεπίδραση ανθρώπου-υπολογιστή. Αυτό θα ανοίξει νέους ορίζοντες και θα αυξήσουν σημαντικά την αποτελεσματικότητα της ανθρώπινης εργασίας σε πολλές εφαρμογές. Το μόνο που χρειάζεται να γίνει είναι να φέρουμε αυτά τα επιτεύγματα μαζί.
Ιδανικό KRS θα πρέπει να παρέχει στο χρήστη, με εύκολη πρόσβαση σε όλες τις γνώσεις της ανθρωπότητας. Τα στοιχεία, επομένως, είναι:
- που θέλει τον άνθρωπο να έχουν πρόσβαση σε κάποιο κομμάτι της γνώσης έχει ενδιαφέρεται,
- αποθήκευση δεδομένων, και
- τον ενδιάμεσο σύστημα να παρέχει διασύνδεση για μια ανθρώπινη για την πρόσβαση στη γνώση.
Τα εμπόδια που τίθενται εδώ είναι που προκαλείται από τους περιορισμούς των ανθρωπίνων δυνατοτήτων και την τρέχουσα τεχνολογική επίπεδο.
2. Αποθήκευση δεδομένων
2,1 μέλος της τέχνης
Η γνώση απαιτεί εκπροσώπηση σύστημα αποθήκευσης δεδομένων αν δεν είναι σε θέση να ανακτήσουν τα απαραίτητα έγγραφα από εξωτερικές πηγές σε πραγματικό χρόνο. Μπορούμε να σκιαγραφήσει κερδίζοντας δύο προσεγγίσεις για την ιδανική του KRS σήμερα: χειροκίνητα διαρθρωμένη διαχείριση παγκόσμια γνώση αποθήκες όπως οντολογίες και όσον αφορά τα αυτόματα συστήματα ευρετηρίασης και ανάκτησης των πιο πλήρης και προσιτές ακατέργαστης συλλογή εγγράφων (World Wide Web), όπως είναι οι μηχανές αναζήτησης. Το πρόβλημα της πρώτης προσέγγισης είναι στο εγχειρίδιό χαρακτήρα - σε κάθε προσπάθεια για τη δημιουργία και τη διατήρηση της παγκόσμιας ανθρώπινης γνωστικής βάσης θα οδηγήσει σε συμβιβασμό μεταξύ της λεπτομέρειας, τη χρηστικότητα και την πραγματικότητα. ], UFO (Unified Framework Ontology) Παρά υπάρχουν πολλαπλές επιτυχείς επάνω οντολογία έργα, όπως κυκ [23], WordNet [12], DNS, sumo κ.λπ. καθώς και τις τρέχουσες θεωρητικές συζητήσεις όσο έρευνα με στόχο να εκπονηθεί ένα τυποποιημένο ενοποιημένη παγκόσμια οντολογία σύμφωνα με τα ονόματα των SUO (Standard Upper Ontology ) [27], UFO (Ενιαίο Πλαίσιο οντολογιών) κλπ.
Η δεύτερη προσέγγιση έγινε ιστορικά κυριαρχεί λόγω WWW είναι η μεγαλύτερη, ολοκληρωμένη και ενημερωμένο corpus των διαθέσιμων στοιχείων για την αυτοματοποιημένη επεξεργασία σήμερα. Ωστόσο, σε αντίθεση με την πρώτη προσέγγιση, τα προβλήματα της αυτόματης ανάκτησης πληροφοριών παίζει σημαντικό ρόλο εδώ. Το κείμενο της κατανόησης των προβλημάτων και επεξεργασίας φυσικής γλώσσας είναι μια από τις πιο προκλητικές και κατά της γρίπης των πτηνών, ωστόσο, εξακολουθούν να παραμένουν χωρίς αποτελεσματική λύση. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Δίπλα είναι τα προβλήματα της ταξινόμησης και της σημασίας του υπολογισμού, το λεγόμενο «web συσπείρωση« πρόβλημα [1]. Η δεύτερη προσέγγιση (αυτοματοποιημένη ευρετηρίαση), ως εκ τούτου, έχει σημαντική έλλειψη στην ακρίβεια της ανάκτησης.
Υπάρχουν συνεχιζόμενες προσπάθειες για τη βελτίωση της προαναφερόμενης προσεγγίσεις, ώστε να ξεπεραστούν αυτά τα προβλήματα. Για παράδειγμα, μαζί με την ενοποιημένη βάση οντολογιών σχέδια (SUO, BULO) υπάρχουν ορισμένες προσπάθειες για την ανάπτυξη οντολογιών ευθυγράμμιση οντολογιών και τεχνικές χαρτογράφησης, ώστε να υπάρχουν οντολογιών καθώς και μεταξύ τους και με άλλου είδους βάσεις γνώσης [5, 17]. Είναι συχνά προτείνεται η μείωση των ελλείψεων του εγχειριδίου διοίκησης σε περίπτωση οντολογίες από τα μέσα της αυτόματης ανάκτησης πληροφοριών (τεχνολογίες μηχανή αναζήτησης). Από την άλλη πλευρά, η βελτίωση των προτύπων υπερκειμένου είναι υπό ανάπτυξη για να καταστεί δυνατό να προσδιοριστούν χειροκίνητα πληροφορίες για να βοηθήσει τις μηχανές αναζήτησης commonsense κατανοήσουν την έννοια του WWW έγγραφα και υπερσυνδέσμων μεταξύ τους [24]. Είναι αναγκαίο να κατανοήσουμε ότι αυτές οι υβριδικές λύσεις μεταφέρει τις αδυναμίες των αντίστοιχων τεχνικών μαζί με τα πλεονεκτήματα.
Ένα μειονέκτημα αυτών των προσεγγίσεων ενώνει και καθιστά αδύνατη την ενσωμάτωσή τους: δεν υπάρχει πρότυπο για την ίδρυση και τη χαρτογράφηση των σχέσεων μεταξύ των εγγράφων και των εννοιών σε διαφορετικά συστήματα. Το πρόβλημα θα λυθεί σε περίπτωση που ένα από τα συστήματα με σταθερές μαθηματικά interpretable ιεραρχία όπως οντολογίες ξεπεράσει η υφιστάμενη προσέγγιση (WWW). Ωστόσο, αυτό φαίνεται απίθανο λόγω της ανωτέρω λόγους. Ανεξάρτητα ενδιάμεσο πρότυπο είναι μια πιθανή λύση στο πρόβλημα αυτό. Υπάρχουν πολλές πρωτοβουλίες σχετικά με την κατεύθυνση της σύνδεσης και αμοιβαία χαρτογράφηση των γνώσεων των διαφόρων τύπων, μεταξύ των οποίων υπάρχει μια περιοχή της οντολογίας χαρτογράφησης. Οι πρωτοβουλίες που έχουν ένα κοινό μειονέκτημα: δεν υπάρχει ενιαίο πρότυπο και για τη χαρτογράφηση των σχέσεων μεταξύ εγγράφων. Στη συνέχεια, κανένα από αυτά δεν είναι πιθανό να γίνει ευρέως αποδεκτό πρότυπο Αν δεν πιο βιώσιμη λύση είναι ανεπτυγμένες.
2.2 Η έννοια της Γνώσης Global Χάρτης (GKM)
Πιστεύουμε ότι είναι δυνατόν για να επεξεργαστεί ένα ενιαίο πρότυπο για τη χαρτογράφηση της γνώσης με τη δημιουργία ενός λογικού χώρου με σκοπό την προβολή του πραγματικού κόσμου γνώση εννοιών. Οι εν λόγω μοντέλο (ας το ονομάσουμε Παγκόσμια Γνώση χάρτη) πρέπει να αντανακλά το επίπεδο της ομοιότητας των εγγράφων και τις έννοιες που αντιστοιχίζεται σε αυτόν.
Κύριος σκοπός του μοντέλου είναι:
- Ευθυγράμμιση και διατομεακή χαρτογράφηση των εγγράφων και των εννοιών (WWW, οντολογίες, e-βιβλιοθήκες, καταλόγους κ.λπ.)
- Ανάκτηση πληροφοριών μέσω της περιήγησης
- Διευκρινίσεις αυτόματος υπολογισμός της commonsense ενδιαφέρον
GKM συνέπεια απαιτεί μια μαθηματική / λογικό μοντέλο αποθήκευσης της γνώσης με μια συγκεκριμένη κατάσταση: είναι η βέλτιστη για το έργο της εκπροσώπησης της γνώσης, δηλαδή με την ανθρώπινη αλληλεπίδραση. Για την εκπλήρωση του όρου αυτού του μοντέλου πρέπει να αντανακλούν στο χαρακτήρα ή στη δομή του τη δομή της ανθρώπινης γνώσης.
Οι απαιτήσεις, ως εκ τούτου, είναι:
- Χαρακτήρας και η χαρτογράφηση.
Ο κυριότερος παράγοντας για την διάσταση αυτή την έννοια (ή ένα θέμα).
- Κάθε έννοια της ανθρώπινης γνώσης μπορεί να αντιστοιχιστεί σε ένα σημείο με ένα ειδικό σύστημα συντεταγμένων στο χώρο.
- Κάθε έγγραφο ή το κείμενο μπορεί να αντιστοιχίζεται σε ένα αριθμό των σημείων (έγγραφο διαιρείται σε memes - νόημα τεμάχια) ή ένα σημείο.
- Συνάφεια υπολογισμό.
- Είναι δυνατόν να υπολογιστεί μαθηματικά συνάφεια μεταξύ των δύο εννοιών, με τον υπολογισμό της απόστασης μεταξύ των αντίστοιχων προβολή σημεία του χώρου.
- Ως εκ τούτου, είναι δυνατόν να υπολογιστεί 'ομοιότητα »μεταξύ των εγγράφων και των εννοιών από τον υπολογισμό της απόστασης μεταξύ τους αντιστοιχίσεις.
- Ομοιογένεια της χώρο.
- Ο χώρος είναι ομοιόμορφη (ομογενείς), καθώς και συνεχή
- Συντεταγμένες αντανακλά τη σημασία και τις αποστάσεις μεταξύ των σημείων αντανακλά τη διαφορά στο νόημα, έτσι ώστε, εάν το σημείο Γ βρίσκεται μεταξύ των Α και Β, τότε αυτό σημαίνει έννοια C είναι σχετικές με το Α και Β και οι δύο εξίσου.
- Είναι δυνατόν να «περιηγηθείτε 'το χώρο της γνώσης διαπίστωση πηγές αντιστοιχίζονται με τους γειτονικούς τομείς.
Η οικοδόμηση ενός μαθηματικού μοντέλου ενός τέτοιου χώρου επιτρέπει την ανάπτυξη της γνώσης Παγκόσμιο χάρτη. Δεν αξίζει τον κόπο προσπαθούμε να επεξεργαστεί ένα τέτοιο μοντέλο (GKM) σε ένα εγχειρίδιο τρόπο προαναφερθέντες λόγους, λόγω των πληροφοριών και της συνεχούς αύξησης της αλλαγής στην ανθρώπινη κατανόηση του κόσμου. Πιστεύουμε ότι είναι δυνατόν για την απομάκρυνση των εξαρτήσεων και των κανόνων από τις διαθέσιμες corpuses των κειμένων και η χρήση αυτών των μεταποιητών, για μας, όπως η χαρτογράφηση σκοπούς.
Ο ακρογωνιαίος λίθος των παραδοχών μας είναι ότι είναι γενικά την ανθρώπινη γνώση χάρτη διάφορα θέματα σε ενιαίο χώρο και τις αποστάσεις εντός της χαρακτήρας του τελευταίου αντικατοπτρίζουν ένα επίπεδο ομοιότητας μεταξύ δεδομένου θέματα. Η υπόθεση αυτή βασίζεται στις Johnson-Lindenstrauss λήμμα αναφέρεται ότι ένα σύνολο n σημείων σε υψηλό διαστασιολογημένες Euclidian χώρος μπορεί να αντιστοιχιστεί σε ένα χώρο Ν διαστάσεων Euclidian
(2,1)
έτσι ώστε η απόσταση μεταξύ δύο σημείων αλλαγές μόνο από έναν παράγοντα (1
[7]). Το Vector Space Μοντέλο που χρησιμοποιούνται ευρέως για την ανάκτηση και τη Κείμενο Χαρακτηρισμός εγγράφων που αντιπροσωπεύει υψηλό διαστάσεων φορέων [31]. Οι εν λόγω φορέων περιλαμβάνουν ορισμένα επίπεδα (ανάλογα με τη λειτουργία που έχει επιλεγεί μια μέτρηση) των πληροφοριών που είναι αρκετό για να κατατάξει το αντικείμενο του αρχικού εγγράφου.
Το θεώρημα Tychonoff [26] αναφέρει ότι τα σημεία, που αντιπροσωπεύουν τις ιδιότητες των αντικειμένων από μία τάξη, θα πρέπει να βρίσκονται πιο κοντά η μία στην άλλη στο χώρο του ακινήτου από τα σημεία που αντιπροσωπεύουν τις ιδιότητες των αντικειμένων των άλλων κλάδων. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. Στο έργο μας, αυτό σημαίνει ότι η αρχική διανυσματικό χώρο n κείμενα μπορούν να προβάλλονται σε σταθερές N-διαστάσεων χώρο και με την κατάλληλη για αλγόριθμο συμπίεσης δεδομένων / χαρακτήρας μείωση οφείλεται στο θεώρημα συμπαγές [22] η χαρτογράφηση θα επιτευχθεί όταν οι αποστάσεις μεταξύ των σημεία αντιπροσωπεύουν την καταλληλότητα των σχετικών εγγράφων.
Παράγοντες που επηρεάζουν την ακρίβεια της χαρτογράφησης:
- αντιπροσωπευτικότητα του μετρικού λειτουργία και το μέγεθος του χώρου χαρακτηριστικό
- μέγεθος, dispersity και της ποιότητας των εγγράφων corpus
Υπό την προϋπόθεση ότι η θεωρία αυτή ισχύει υπό τις τρέχουσες συνθήκες μένει να βρεθεί η οποία θα πρέπει να χρησιμοποιούνται τεχνικές για την επεξεργασία της χαρτογράφησης. Εμείς προτείνουμε να επικεντρωθεί στην αυτοματοποιημένη λόγω πολλές επιπλοκές καθιστώντας εγχειρίδιο εμπειρογνωμόνων με βάση τη χαρτογράφηση ανεφάρμοστες.
2,3 Αυτόματη GKM γενιάς μέσω ανεξέλεγκτη άντληση (υπόθεση)
Για να είναι χρήσιμη GKM θα πρέπει να περιέχει αντιστοιχίσεις των σημαντικός αριθμός πραγματική λέξη (WWW), τα έγγραφα και στη δομή αντιπροσωπεύει την κοινή ανθρώπινη κατανόηση του κόσμου. Δεν είναι, επομένως, αξίζει τον κόπο να εξετάσει κάθε χειρόγραφη τρόπους δημιουργίας και πλήρωσης GKM με τον mappings. Η εξόρυξη δεδομένων αρχές θα πρέπει να χρησιμοποιείται για την απομάκρυνση των εξαρτήσεων που εκπροσωπεί τη γνώση από το σύνολο των εγγράφων που υπάρχουν διαθέσιμα για τη μηχανογραφική επεξεργασία και φιλτράρισμα περιττά στοιχεία.
Έχουν γίνει πολλές προσπάθειες για την ανεξέλεγκτη εξαγωγή των εξαρτήσεων σε κείμενα, ωστόσο, είναι ακόμη ένα αμφίβολο κατά πόσον οποιαδήποτε τεχνική είναι σε θέση να προσφέρει μια βιώσιμη εξαγωγή γνώσης μέσα από την ανάλυση των εγγράφων μεγάλη συλλογή [10, 11, 21, 30].
Ας χωρίζουν τους παράγοντες που επηρεάζουν γενικά το περιεχόμενο των εγγράφων σε τρεις κατηγορίες:
- Συγγραφείς προσωπικά στοιχεία (τα συναισθήματα και τα κίνητρα για τη δημιουργία του κειμένου, η σωματική και ηθική αναφέρει κατά τη διάρκεια της σκέψης και της γραφής)
- Γλώσσα (οι κανόνες κτλ της γλώσσας που χρησιμοποιείται για να γράψει το έγγραφο)
- Γνώση (ορισμένα τμήματα της ανθρώπινης γνώσης συγγραφέας μεταδίδει άμεσα ή έμμεσα μέσω του εγγράφου)
Ας υποτεθεί ότι είναι δυνατόν να επεξεργάζεται όλα τα διαθέσιμα έγγραφα κειμένου των ανθρωπίνων συγγραφείς και απόσπασμα της εξάρτησης από το σύνολο των κανόνων. Στην περίπτωση αυτή, η επίδραση του παράγοντα 1 θα είναι ελάχιστες. Η επίδραση του παράγοντα 2 δεν είναι πολύ σημαντικό, για τους ακόλουθους λόγους:
α) έγγραφα σε πολλές γλώσσες μπορεί να αναπροσαρμόζονται, ως εκ τούτου, αμοιβαία μείωση της επιρροής
β) η ίδια η γλώσσα αντανακλά την ανθρώπινη γνώση [18]? ώστε σε κάποιο βαθμό τον συντελεστή 2 αποτελεί subfactor των 3 ή ακόμα και την εξόρυξη τους μείγμα αντιπροσωπεύει μια ικανοποιητική υλοποίηση
Θεωρητικά είναι δυνατό, στη συνέχεια για να εξαγάγετε το πλείστον πληροφορίες που αντιστοιχούν στην ανθρώπινη γνώση μέσω εκτίθενται τα διαθέσιμα έγγραφα. Η εν λόγω πληροφορίες για να μετατραπεί η χαρτογράφηση χώρος υποθετικά θα μας δώσει τη βιώσιμη GKM.
2,4 υλοποίησης (πείραμα)
Στο χώρο χτισμένο κάθε έγγραφο που θα πρέπει να αντιστοιχίζονται με ενιαίο συντονισμό. Η «περιήγηση» του χώρου ή αποστάσεις θα πρέπει να καταδεικνύουν ότι η σύγκριση της κατάστασης των εγγράφων ή των ομίλων αντικατοπτρίζουν τη σημασία τους και ότι είναι δυνατόν να αναθέτει ορισμένα ονόματα θέμα σε συγκεκριμένες συντεταγμένες στο χώρο.
Η δική μας πειράματα με τη χρήση των 2 και 3 διαστάσεων Kohonen SOM με μια τοπική συλλογή εγγράφων που αποκαλύπτουν ότι οι αποστάσεις μεταξύ των προβλέψεων των εγγράφων που δεν είναι σταθερό καθ 'όλη τη σειρά των εκτοξεύσεων. Αυτό κατά τη γνώμη μας είναι η απόδειξη του γεγονότος ότι ο χαρακτήρας της είναι ανεπαρκής χάρτη το οποίο συμφωνεί με την Johnson-Lindenstrauss λήμμα που αναφέρονται ανωτέρω.
Δυστυχώς, είναι αδύνατο να πραγματοποιηθεί το πείραμα με μια σωστή διάσταση. Για παράδειγμα, σύμφωνα με την Johnson-Lindenstrauss λήμμα, να χάρτη 20.000 έγγραφα που επιτρέπουν την πλάνη ότι το 10% θα απαιτεί 58 διαστάσεις. Αυτό απαιτεί υπολογισμοί που είναι πάνω από σύγχρονους υπολογιστές ικανότητας.
Το σημαντικό να αναφερθεί εδώ είναι ότι, ενώ λήμμα δίνει μια μέγιστη διάσταση της χαρτογράφησης χώρος που επιτρέπει να πληροί την προϋπόθεση της ενιαίας προβολής, δεν είναι απαραίτητο η ελάχιστη αποτελεσματική αξία. Λήμμα δίνει μια τιμή για ένα σύνολο n σημείων δηλαδή για τη χειρότερη περίπτωση που δεν είναι πιθανό να εμφανιστούν στην πράξη. Οι μέθοδοι για την ανίχνευση χαρακτήρας θα πρέπει να χρησιμοποιηθεί για τον υπολογισμό ενός αποτελεσματικού χαρακτήρα των δεδομένων και συνεπώς να προσδιορίζει το σωστό αριθμό των διαστάσεων για τη χαρτογράφηση των δεδομένων που ειδικότερα. Υπάρχουν γνωστές τεχνικές για αυτό που προέρχονται από το φόντο της επιφάνειας της ανασυγκρότησης. Ένα από τα πιο πρόσφατα είναι το έργο του Σ. Cheng, Y. Wang και Z. Wu [4], όπου διάσταση μέθοδος ανίχνευσης μέσω Principal Component Analysis [8] παρουσιάζεται. Έτσι, η εγγενής χαρακτήρας των δεδομένων που μπορεί να εξαχθεί. Καθώς η τιμή αυτή στην πράξη είναι χαμηλότερο από τη μέγιστη διάσταση που είναι αναγκαία για την προβολή των τον ίδιο αριθμό εγγράφων και στη χειρότερη περίπτωση-θεωρητική περίπτωση, αυτό δίνει μια σημαντική μείωση στον υπολογισμό του χρόνου. Εναλλακτικά, για τον ίδιο σκοπό, θα μπορέσουμε να εξετάσουμε τις μεθόδους που βασίζονται σε επαναληπτική αξιολογήσεις. Ο σκοπός της χαρακτήρας μείωση στην περίπτωσή μας είναι να δημιουργηθεί ένα αποτελεσματικό όταν η χαρτογράφηση commonsense ομοιότητα μεταξύ πληροφοριακό πηγές εκφράζεται μέσω Euclidian απόσταση μεταξύ προβολή σημεία. Λαμβάνοντας κάθε χαρακτήρας μείωση τεχνική με τυχαία επιλογή από τα στοιχεία που (όπως Principal Component Analysis, Self Διοργανώνοντας Χάρτες, Sammon ανοικοδόμηση ή τριγωνισμός), σε περίπτωση κατά την έξοδο διάσταση είναι μικρότερη από την περίπτωση, οι προβολές θα είναι ασταθής και με κάθε επανυπολογισμός η χαρτογράφηση θα είναι διαφορετική και οι αποστάσεις μεταξύ των προβλέψεων δεν θα διατηρηθεί. Επίσης, μπορούμε να υποθέσουμε ότι, όταν η πραγματική διάσταση της πολλαπλής εισόδου χρησιμοποιείται για τη χαρτογράφηση, οι αποστάσεις θα διατηρηθεί με ένα βαθμό ελευθερίας, ανάλογα με χαρακτήρας μείωση μέθοδο που χρησιμοποιείται. Μια εναλλακτική λύση, συνεπώς, είναι μια τυχαία επιλογή χαρακτήρας μείωση τεχνική σε συνδυασμό με οριακό χαρακτήρα παράλληλη αξιολόγηση της χαρτογράφησης. 32]. Σκεφτείτε, για παράδειγμα, η τεχνική της καλλιέργειας SOMs που περιγράφεται στο [19, 32]. Με στόχο να μειώσει τον υπολογισμό του χρόνου, ο αριθμός των κόμβων αυξάνεται δυναμικά με νέα κόμβων είναι ομοιόμορφα κατανεμημένη μεταξύ των παλαιών και των φορέων που τα βάρη που στα μέσα της γειτονικής αρχική βάρη φορέων. Η ίδια τεχνική που εφαρμόζεται σε διάσταση (D), θα έδινε την ευκαιρία να αξιολογούν κάθε Δ βήμα προς βήμα. Τα κριτήρια αξιολόγησης θα είναι σταθεροποίηση των αποστάσεων μεταξύ των προβλέψεων. Για το σκοπό αυτό, δύο ή περισσότερες αυτο οργάνωση χάρτες μπορούν να λειτουργούν παράλληλα με pairwise αποστάσεις ανάμεσα σε ορισμένες προβολές που συγκρίνονται, για κάθε επανάληψης. Σύμφωνα με επανάληψη εδώ καταλαβαίνουμε το στάδιο όταν η διάσταση του SOM αυξήθηκε και το δίκτυο ήταν κατά συνέπεια, που σταθεροποιήθηκαν με νέες παραμέτρους.
Συνοψίζοντας την ανωτέρω προτείνουμε την παρακάτω υπόδειγμα για την πειραματική αξιολόγηση του για την καλύτερη προσέγγιση για την ίδρυση της Παγκόσμιας Γνώσης χάρτη από τη συλλογή των εγγράφων κειμένου.
Η datase t: διανυσματικό χώρο μοντέλο που θα χρησιμοποιηθεί (κάθε έγγραφο που εκπροσωπήθηκαν ως φορέα με χαρακτηριστικά όπως οι διαστάσεις και τα χαρακτηριστικά "κατατάσσεται ως συντεταγμένες σε αντίστοιχες διαστάσεις).
Δυνατότητα επιλογής λειτουργίας: πιο αποτελεσματικό να καθοριστούν.
Vector μέγεθος: να καθοριστεί με εμπειρικό τρόπο.
Επεξεργασίας και αποθήκευσης δεδομένων.
Μια τεχνική διάσταση μείωση θα πρέπει να χρησιμοποιούνται για την χαρτογράφηση. Υπάρχουν δύο πιθανές προσεγγίσεις:
α) πριν από τον υπολογισμό του εγγενούς χαρακτήρα και την αξιολόγηση των διαφόρων μεθόδων μείωσης χαρακτήρας με γνωστή χαρακτήρας της χαρτογράφησης?
β) «οριακό χαρακτήρα αξιολόγησης προσέγγιση», με λίγες mappings να λειτουργούν παράλληλα - μόνο μεθόδους με τυχαία επιλογή των δεδομένων μπορεί να χρησιμοποιηθεί.
Είσοδοι: έγγραφα »χαρακτηριστικό φορέων.
Εκροές: GKM συντεταγμένες.
Αξιολόγηση:
1) Commonsense αξιολόγηση της αλληλογραφίας μεταξύ των αρχικών και των εγγράφων που Euclidian αποστάσεις από τους χαρτογράφηση προβλέψεις.
2) Σταθεροποίηση των εν λόγω pairwise αποστάσεις μεταξύ προβολές μέσω διαφορετικών εγκαινιάζει τυχαία επιλογή σε περίπτωση που η τεχνική που χρησιμοποιείται.
3. Interface
3,1 Ιδανική αναπαράσταση γνώσης διεπαφή
Η διασύνδεση της γνώσης μέρος Αντιπροσωπεία του συστήματος είναι σημαντική, όταν το σύστημα είναι ιδανικό συζητηθεί. Και οι δύο αποστολές από την παραλαβή των αιτήσεων από τους χρήστες και τη μετάδοση γνώσεων για την επιστροφή τους είναι εξίσου σημαντική με την αποστολή των δεδομένων διάρθρωσης και της αποθήκευσης. Στο σημερινό χαρτί θα συζητήσουν τρόπους για την Αντιπροσωπεία της Γνωσιακής Συστημάτων της νέας γενιάς και, συνεπώς, το ζήτημα της αλληλεπίδρασης είναι εποπτεύεται για να διαπιστωθεί κατά πόσον είναι δυνατόν να παρέχουν μια ιδεαλιστική διασύνδεση με τα μέσα της σύγχρονης τεχνολογίας.
Οι διεπαφές που έχουν χρησιμοποιηθεί για την υποστήριξη της αλληλεπίδρασης ενός χρήστη με τη σύγχρονη ανθρώπινη γνώση εκπροσώπηση και συστήματα ανάκτησης πληροφοριών είναι κυρίως "ευρετηρίου" τύπου, δηλαδή οι χρήστες να γνωρίζουν ακριβώς αυτό που ψάχνουν και που πρέπει επίσης να διευκρινιστεί ότι γλωσσικά. Ένα κοινό παράδειγμα μιας τέτοιας διεπαφής είναι μια μηχανή αναζήτησης. Όπως έχει αναφερθεί παραπάνω, μηχανή αναζήτησης και το σύνολο των εγγράφων WWW είναι το πιο πλήρες και ενημερωμένο σύστημα εκπροσώπησης των γνώσεων που διατίθενται σήμερα, το οποίο αποτελεί και το λόγο της δημοτικότητας τους. Ταυτόχρονα, είναι γνωστό ότι το «ευρετηρίου 'διεπαφής δεν είναι φυσικό να χρησιμοποιήσει για τον άνθρωπο, αλλά είναι η μόνη εναλλακτική ως" περιήγηση "προσεγγίσεις έχουν θεσπιστεί ελάχιστα [16]. Ο λόγος για αυτό είναι το πρόβλημα της χαρτογράφησης της γνώσης και της ευθυγράμμισης που δεν επιτρέπει αυτοματοποιημένη ταξινόμηση και εκπροσώπηση των εγγράφων που σύμφωνα με τους θέματα. Ωστόσο, με το πρόβλημα της ενοποιημένης γνώσης χαρτογράφηση χώρο που επιλυθεί, εμφανίζονται νέες δυνατότητες για την κατασκευή βελτιωμένων, πιο φυσικές διασυνδέσεις των "περιήγηση" τύπου.
3,2 υψηλού χαρακτήρα και την απεικόνιση
Αφού ανέφερε ότι η επακόλουθη παγκόσμια χαρτογράφηση χώρου είναι πιθανό να είναι n-διαστάσεων, όπου n είναι υψηλό, είναι αναγκαίο να επιλυθεί το πρόβλημα της οπτική αναπαράσταση. Είναι δυνατόν να φανταστεί κανείς για τον άνθρωπο με 3D χώρο, κατά συνέπεια, η βέλτιστη τρόπους ND-> 3D αντιπροσώπευση πρέπει να αξιολογούνται. Διάσταση τεχνικές μείωσης ή πολλαπλές εκπροσώπηση προσέγγιση μέσω διεπαφής θα μπορούσε να χρησιμοποιηθεί.
Είναι σημαντικό ότι με τη βοήθεια του ενοποιημένου χαρτογράφηση του χώρου, η γνώση ότι είναι σφάλμα κατά τον υπολογισμό της συνάφειας μεταξύ των εγγράφων, και, επιπλέον, η ανάκτηση των σχετικών εγγράφων, ακόμη και από άλλα συστήματα γίνεται ασήμαντο έργο. Για τον τελικό χρήστη, αυτό σημαίνει ότι μόλις το σύστημα που βρίσκεται το θέμα αν ο ενδιαφερόμενος έχει ενδιαφέρει, ότι ποτέ δεν θα οδηγήσει το χρήστη σε άσχετο εγγράφων.
3,3 πληροφορίες αλυσίδα
Όταν η αποστολή των θεμάτων χαρτογράφηση και την τοποθεσία, την καταλληλότητα του υπολογισμού και της γνώσης χώρο της περιήγησης είναι επιλυθεί το πιο σημαντικό έργο που απομένει να επιλυθεί είναι το πρόβλημα της αρχικής αίτησης. Σε state-of-the-art συστήματα ανάκτησης πληροφοριών τις ακόλουθες διαδικασίες που είναι συνήθως συμμετέχουν, όταν οι πληροφορίες που ζητούνται:
Ανθρώπινα μέρος: 1) Η φαντασία -> 2) διαμόρφωση της γλωσσικής κατασκευές -> 3) χειροκίνητη εισαγωγή στοιχείων από το πληκτρολόγιο (φωνή εισόδου) -> Machine μέρος: 4) γλωσσική αποκωδικοποίηση -> 5), που ταιριάζουν και σε θέση -> 6) οπτικοποίηση των εγγράφων που ταιριάζουν
Η αλυσίδα είναι μεγάλη και είναι προφανές ότι η απώλεια δεδομένων και η διαφθορά είναι σημαντική λόγω της διπλής γλωσσική κωδικοποίηση και αποκωδικοποίηση. Πρώτον, ο χρήστης οφείλει να διαμορφώσει τις γνωστικές εικόνων σε σύντομο γλωσσική φράση. Δεύτερον, το σύστημα έχει να αποκωδικοποιήσει την πρόταση προκειμένου να κατανοήσει το αντικείμενο των χρηστών. Η ονομασία της αλυσίδας του αρχικού αιτήματος προκαλεί τη δυσαρέσκεια των χρηστών των σύγχρονων μηχανών αναζήτησης λόγω της αδυναμίας του συστήματος να "κατανοήσει" το αίτημα με αποτέλεσμα τεράστια απώλεια χρόνου του τελικού χρήστη. Ο βαθμός ανάκτησης αυτών των λαθών και της αναστάτωσης που προκλήθηκε από τον περιορισμό διεπαφή είναι πολύ σημαντική και θα ελαχιστοποιηθεί η επίδραση της πιο ακριβής η ανάκτηση και η θέση των εγγράφων που εισάγονται από το ενοποιημένο χαρτογράφησης.
Ως εκ τούτου, είναι αναγκαίο να εξεταστεί, θεωρητικά τουλάχιστον, τη δυνατότητα δημιουργίας ενός ιδανικού μικρής αλυσίδας του ανθρώπου <-> Γνώση Αντιπροσωπεία σύστημα αλληλεπίδρασης με τις μονάδες που προκαλούν την απώλεια των δεδομένων που καταργούνται:
Ανθρώπινα μέρος: 1) Η φαντασία -> [ζητήσει να περάσει μέσω άμεση ανθρώπινη εγκεφάλου-GKM μετατροπέα συντεταγμένες] -> 2), που ταιριάζουν και σε θέση -> 3) οπτικοποίηση των εγγράφων που ταιριάζουν
Εμείς τα τελευταία επισκόπηση των επιτευγμάτων στον τομέα της Brain Computer Interfaces (BCI) για το σκοπό αυτό.
3,4 Brain-Computer Interfaces
ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Η έρευνα για BCI έχει εδώ και περισσότερα από 30 χρόνια και η περιοχή εξακολουθεί να είναι πολύ μικρά και αναπτύσσεται με ταχείς ρυθμούς. Μέχρι το πρόσφατο στιγμή m ost σημαντικές προόδους στον τομέα έχουν γίνει σε τεχνητή σκέλος ελέγχου δηλαδή αυτοκίνητο λειτουργίες του εγκεφάλου [ 3] και την ερμηνεία και την επεξεργασία των οπτικών σημάτων. Οι επιτυχίες αυτές έχουν επαληθευθεί κατά τη διάρκεια πολλαπλών πειράματα που αφορούν τα θέματα των ζώων και των ανθρώπων. Ερευνητές έκθεση επιτυχή ολοκλήρωση των μηχανικών ή ηλεκτρονικών συσκευών, όταν τα ζώα ή ανθρώπους να μάθουν να ελέγχουν τη συσκευή με τη βοήθεια του εγκεφάλου? Άλλοι έκθεση επιτυχή μεταφορά και αποκωδικοποίηση του οπτικού σήματος [15, 20].
Brain-υπολογιστή διεπαφές μελέτες είναι στενά συνδεδεμένη με τον τομέα των λειτουργικών neuroimaging, όπου διάφορες τεχνολογίες έχουν αναπτυχθεί για την αποτελεσματική καταγραφή των κρατών της πρόσωπο του εγκεφάλου μέσω ορισμένων φυσικών χαρακτηριστικών. Πιο παραγωγική από την άποψη της BCI είναι μια πρόσφατη τεχνική που ονομάζεται Λειτουργική neuroimaging απεικόνισης μαγνητικού ) (FMRI) [6, 13]. Η τεχνική αυτή επιτρέπει να καταγράψει τη δυναμική της ροής του αίματος σε διαφορετικές περιοχές του εγκεφάλου με το χρόνο και με υψηλή ακρίβεια. Αυτό επιτρέπει, συνεπώς, η δημιουργία διασυνδέσεων μεταξύ των μοντέλων της ενεργοποίησης των διαφόρων περιοχών του εγκεφάλου και ορισμένες δραστηριότητες και τις γνωστικές διεργασίες του ανθρώπου. Είναι σημαντικό το γεγονός ότι η τεχνική αυτή, σε αντίθεση με πολλές εναλλακτικές λύσεις, είναι μη επεμβατική και δεν συνεπάγεται ενέσεις. Είναι αναγκαίο να σημειωθεί, ωστόσο, ότι το υλικό fMRI σήμερα εξακολουθεί να είναι πολύ δαπανηρή και βαρύς.
Είναι σημαντικό το γεγονός ότι τα πειράματα δείχνουν ότι εγκέφαλος προσαρμόζεται σε νέες συνθήκες. Για παράδειγμα, όταν αυτοκίνητο ερεθίσματα χρησιμοποιήθηκαν για τον έλεγχο μιας μηχανικό βραχίονα ή σε έναν υπολογιστή ο δείκτης του ποντικιού, του εγκεφάλου ήταν σε θέση να διαφοροποιήσει σταδιακά και να μάθουν να ελέγχουν χειραγωγών χωριστά από τεχνητή σκέλος. Lebedev αναφέρει το αποτέλεσμα της «πλαστικότητας του εγκεφάλου», η οποία ενδέχεται να επιτρέψει να ενσωματωθούν σε συσκευές τεχνητού το σώμα εκπροσώπησης. [20]
Πρόσφατες δημοσιεύσεις στον τομέα της neuroimaging ακόμη συζητήσει τη δυνατότητα να ανιχνεύει τις γνωστικές μέλη [15]. Αυτό ορίζει η επικέντρωση της προσοχής μας για τη δυνατότητα εφαρμογής του στο ανθρώπινο BCI-KRS αλληλεπίδραση.
Είναι γνωστό ότι τα διάφορα γνωστικά κράτη που συνδέονται με ορισμένα αντικείμενα του πραγματικού κόσμου αντιστοιχούν σε ορισμένα μοντέλα του εγκεφάλου περιοχές ενεργοποίησης. Αποκωδικοποίηση αυτών των μοντέλων επιτρέπει να κατανοήσουν το οποίο προσανατολίζεται υπερτιθέμενους ερεθίσματα σε ένα άτομο που παρακολουθεί σήμερα (όπου την προσοχή τους στρέφεται) ή σε περίπτωση που με οπτικά αντικείμενα για να προσδιορίσει την κατηγορία των αντικειμένων είναι η απεικόνιση του προσώπου (π.χ. πρόσωπα, κτίρια, έπιπλα) και ακόμη και τα αντικείμενα "χρώμα και τον προσανατολισμό. [15] Οι διαδικασίες αυτές είναι πολύπλοκες και πολύ για να καταλάβει αυτή τη στιγμή. Περαιτέρω μελέτες δείχνουν πόσο χαμηλά ώστε και υψηλής προκειμένου εγκεφάλου σήματα συσχετίζονται με ορισμένες γνωστικές λειτουργίες? Πώς τα χωρικά χαρακτηριστικά του συνήθειες αλλάζουν με την πάροδο του χρόνου και σύμφωνα με διάφορες επιρροές? Σε ποιο βαθμό είναι δυνατόν να υπολογιστεί η ενεργοποίηση πρότυπα διαφορετικά θέματα? κ.λπ. Θεωρείται ωστόσο ότι η ακριβής γνώση της "υπολογισμοί" εκτελούνται στο ανθρώπινο εγκέφαλο δεν είναι αποφασιστικής σημασίας για την κατασκευή των σχετικών BCIs. [20] Κοινή τεχνικές εξόρυξης δεδομένων μπορούν να εφαρμοστούν για την εξαγωγή χρήσιμων πληροφοριών από διάφορες neuroimaging αισθητήρες και δημιουργία συνδέσεων με ορισμένες γνωστικές κρατών.
Υπάρχουν όμως σημαντικά θέματα που μπορούν να επηρεάσουν σοβαρά την επιτυχία της συσκευής της BCI στον τομέα της γνώσης εκπροσώπηση. Δύο μικρά προβλήματα είναι γενίκευση σε όλη την ώρα και το πρόβλημα της διαφορετικές περιπτώσεις της ίδιας ψυχική κατάσταση. Είναι γνωστό ότι οι περιοχές του εγκεφάλου μοτίβα ενεργοποίησης του ίδιου ψυχική μέλη μπορούν να διαφοροποιούνται και με το χρόνο. Οι διαφορετικές περιπτώσεις της ίδιας ψυχική κατάσταση μπορεί να τροποποιηθεί και εικόνες, ανάλογα με τα συμφραζόμενα διαφορές και άλλους παράγοντες. [15] Αυτό απαιτεί ευέλικτη και ταξινόμηση χωρικών resampling αλγόριθμοι που θα χρησιμοποιηθούν, όπως πρότεινε ο Haynes και Rees. Πιστεύουμε ότι αυτά τα προβλήματα θα λυθούν με την ανάπτυξη αποτελεσματικών τεχνικών.
Περισσότερα αμφίβολη λόγω του προβλήματος της παρεκβολή σε νέα γνωστικά κρατών. Haynes και Rees σημειωθεί ότι ο αριθμός των πιθανών αντιληπτικές ή γνωστικές κρατών είναι άπειρη, ενώ ο αριθμός των κατηγοριών εκπαίδευσης είναι αναγκαστικά περιορισμένη. [15] Είναι σημαντικό, επομένως, ότι αποκωδικοποίησης θα μπορούσε να έχει εκπαιδευτεί για να γενικευθεί η εμπειρία λαμβάνεται από μικρή εκπαίδευση που σε εντελώς νέες κατηγορίες. Αυτό θα ήταν δυνατόν, από τα μέσα της παρεκβολής αν ενεργοποίηση του εγκεφάλου είναι πραγματικά μοντέλα που παρουσιάζονται σε ορισμένες συστηματικές παραμετρικός χώρο. Αυτό απομένει να διαπιστωθεί, ωστόσο, πιστεύεται ότι είναι δυνατόν, τουλάχιστον για ορισμένες μορφές ψυχικής περιεχόμενο [15]. Σε περίπτωση αφηρημένο σχήμα χώρου για την κατάταξη των νευρικών πρότυπα όντως υπάρχει, θα μας επιτρέψει να σχηματίζω θεωρία σχετικά με τις δυνατότητες της χαρτογράφησης του ανθρώπινου εγκεφάλου γνωστικές αναφέρει στην Παγκόσμια Γνώση Χάρτης περιγράφεται παραπάνω σε αυτό το χαρτί. Εφόσον αυτό επιτευχθεί, η προαναφερθείσα "πρόβλημα της αρχικής αίτησης" θα πρέπει να επιλυθούν και "ιδανικό ανθρώπινο <-> KRS" αλυσίδα θα είναι δυνατό να εξακριβωθεί.
3,5 Learnable Αποκωδικοποιητή
Ως τώρα είναι γνωστό χάρη στην τελευταία επιτεύγματα της απεικόνισης του εγκεφάλου που είναι δυνατό να διακριθεί η ενεργοποίηση των διαφόρων περιοχών του εγκεφάλου όταν το άτομο είναι να σκεφτόμαστε διαφορετικά θέματα μπορεί να υποθέσει ότι είναι δυνατόν για να δημιουργήσετε ένα learnable αποκωδικοποιητή με το χάρτη των ανθρωπίνων κινήθηκε γνωστικές δηλώνει τη γνώση πάνω στο χάρτη της Γνώσης Αντιπροσωπεία Συστήματος. Ως εκ τούτου ένα προνομιακό μέσο για την αλληλεπίδραση ανθρώπου-υπολογιστή μπορεί να είναι που θα επιτρέπει την τρομερή ταχύτητα και ακρίβεια της επικοινωνίας με ένα σύστημα. Θα υπάρχει λιγότερη απώλεια δεδομένων, λόγω της εξάλειψης της γλωσσικής αλληλεπίδρασης στάδιο. Η ταχύτητα και η αποτελεσματικότητα της αλληλεπίδρασης θα αυξηθεί κατά συνέπεια. Οι δύο αυτοί παράγοντες θα επιτρέπουν στους ανθρώπους διαφόρων επαγγελμάτων για την αύξηση της αποτελεσματικότητας της εργασίας τους σημαντικά. Από [6, 15] γνωρίζουμε ότι υπάρχουν ορισμένες regularities της τοποθεσίας του εγκεφάλου ωθήσεις και της γνώσης των θεμάτων που είναι κοινά για όλους τους ανθρώπους? Μπορούμε κλήσης αυτών των ανθρωπογενών χαρακτηριστικών. Ωστόσο είναι γνωστό ότι η πλειοψηφία αυτών των συνδέσεων θα έπρεπε να είναι ατομικιστικών. Ως εκ τούτου, η αποκωδικοποιητή πρέπει να είναι ατομικώς προσαρμοστική.
Είναι επίσης προφανές ότι η απόδοση του αποκωδικοποιητή θα εξαρτηθεί από τα άτομα και την εκπαίδευσή τους με αυτό και η ικανότητά τους να μαθαίνουν. Μπορεί κανείς να υποθέσει αυτό από τα πειράματα με τεχνητή διεπαφές που χρησιμοποιούνται για την αντικατάσταση απολεσθέντων άκρων. Οι άνθρωποι και τα ζώα ήταν σε θέση να συγκεντρώσει διανοητικά με ειδικό τρόπο για να προχωρήσουμε ένα τεχνητό βραχίονα και ακόμη και να μάθουν να ελέγχουν την πραγματική σωματική ακεραιότητα και των τεχνητών μία χωριστά [20].
Λαμβάνοντας υπόψη την ανωτέρω πιστεύουμε ότι μια τεχνητή νευρονικών δικτύων - μηχανισμός είναι η καλύτερη λύση του προβλήματος αποκωδικοποιητή.
Αποκωδικοποιητή της μαθησιακής διαδικασίας
1) Το σημείο με συντεταγμένες τυχαία στο πολυδιάστατο χώρο των GKM είναι επιλεγμένο.
2) Πολλαπλές έγγραφα έχοντας mappings τους στη γειτονική περιοχή (Euclidian μετρικό που χρησιμοποιείται) είναι επιλεγμένο και εμφανίζεται σε ένα ανθρώπινο χειριστή.
3) Συμπυκνώματα Λειτουργίας του / της cognitively νου να παρακολουθήσουν το δεδομένο θέμα και αντικείμενα που σχετίζονται με τη μνήμη.
4) Η neuroimaging δεδομένα που συλλέγονται από fMRI υλικού για μια συγκεκριμένη χρονική περίοδο.
5) Η επεξεργασία των δεδομένων είναι μέσω ενός χωροταξικού resampling και με στόχο τη μείωση του θορύβου αλγόριθμος για την εξαγωγή ενημερωτικό μοντέλα που χαρακτηρίζουν την τρέχουσα επανάληψη της εκπαίδευσης.
6) Παρασκευασμένο δεδομένα fetched στις εισόδους των νευρωνικών δικτύων. Οι συντεταγμένες της GKM ένα επιλεγμένο σημείο είναι fetched με τα αποτελέσματα, ως εκ τούτου, η εκπαίδευση νευρωνικών δικτύων με σκοπό τη σύνδεση συγκεκριμένων μοντέλων με την ενεργοποίηση του εγκεφάλου GKM συντεταγμένες.
Εικόνα 3.1 Η διαδικασία της κατάρτισης του αποκωδικοποιητή
In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.
4. Conclusions
In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.
The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.
A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.
The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.
There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.
References
[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.
[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.
[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.
[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.
[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.
[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.
[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.
[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.
[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.
[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.
[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.
[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.
[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.
[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.
[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .
[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.
[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.
[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.
[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.
[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.
[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.
[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.
[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.
[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.
[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.
[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.
[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.
[28] Late of Clare Hall, Cambridge University , 2003.
[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.
[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.
[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.
[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .
[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.
[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.
[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and
Knowledge Management, WIT Press, Southampton , UK , 2005.
Share This



































Recent Comments