Idealistis menuju Knowledge Representation Sistem: Global Knowledge Peta

Taras Filatov

Abstrak

Salah satu masalah yang paling signifikan menghalangi perkembangan lebih lanjut dalam bidang Representasi Pengetahuan dan Artificial Intelligence merupakan masalah semantik alignment atau pengetahuan pemetaan. elaborated through unsupervised extraction of dependencies from large documents corpus , is proposed. Kemajuan dalam solusi akan sangat menguntungkan bagi tugas informasi, ontologi alignment, relevansi perhitungan, pemahaman teks dan lain-lain karya konsep multidimensi global pengetahuan peta, dijabarkan melalui unsupervised ekstraksi dari dependensi besar dari dokumen corpus, yang diusulkan . Selain itu, masalah langsung Manusia - Knowledge Representation Sistem antarmuka ditujukan dan konsep adaptif decoder diusulkan untuk tujuan interaksi dengan sebelumnya dijelaskan unified pemetaan model. Dalam kombinasi dua pendekatan yang disarankan sebagai dasar untuk pengembangan generasi baru pengetahuan sistem perwakilan.

Kata kunci: representasi pengetahuan, pengetahuan pemetaan, interaksi manusia komputer, ontologi alignment, atas ontologi, relevansi perhitungan, informasi, dokumen kesamaan

1. Pendahuluan

Masyarakat, bidang ilmu representasi menjadi lebih signifikan selama tahun terakhir [25]. Orang yang selalu dilakukan dalam upaya untuk belajar dan membagi pengetahuan tentang pengetahuan. Kita bisa menemukan referensi dari seawal Socrates di abad kelima SM [33] ke maju dari logika dan epistemologi [28] di tengah usia. Karena masalah yang dianggap penting di masa lalu, sulit terlalu maknanya selama era informasi.

Teknologi modern yang kaya manusia dengan banjir yang berlebihan data yang sulit untuk systematise dan proses. Bagi seseorang untuk menjadi spesialis dalam bidang tertentu yang diperlukan tahun belajar dan memerlukan informasi menyusul ras untuk bersaing dengan profesional tren terbaru.

Ini adalah kepercayaan antara pengetahuan teknisi ahli pertambangan dan data informasi yang tersedia dalam membuka akses yang cukup untuk mengambil benar fakta tentang hampir setiap aspek kehidupan kita dan bahkan memperkirakan masa depan. Satu-satunya masalah adalah untuk cerdas untuk memproses informasi dari banyak sumber. [35].

Faktor permintaan ini generasi baru dari sistem perwakilan pengetahuan untuk membantu systematise manusia, akses dan menggunakan pengetahuan kolektif.

Dalam karya ini kita mengusulkan gagasan untuk pengembangan baru umur Knowledge Representation System (KRS).

Kami percaya bahwa prestasi baru dalam bidang tertentu, dan ilmu akan segera membawa terobosan yang besar dalam ruang lingkup pengetahuan manusia perwakilan dan interaksi manusia-komputer. Ini baru akan terbuka dan sangat horizons meningkatkan efektivitas manusia bekerja di banyak aplikasi. Satu-satunya hal yang perlu dilakukan adalah untuk membawa prestasi ini bersama.

KRS ideal harus memberikan kenyamanan pengguna dengan akses ke semua pengetahuan manusia. Its elemen itu adalah:

  • manusia yang ingin mengakses beberapa bagian dari ilmu dia adalah tertarik,
  • penyimpan data, dan
  • perantara sistem yang menyediakan antarmuka bagi manusia untuk mengakses pengetahuan.

Hambatan yang timbul di sini disebabkan oleh keterbatasan kemampuan manusia dan tingkat teknologi saat ini.

2. Penyimpanan data

2,1 State of the art

Pengetahuan sistem perwakilan memerlukan data kecuali dapat mengambil dokumen yang diperlukan dari sumber eksternal secara real time. Kami bisa menang outline dua pendekatan yang ideal untuk KRS yang kini: disusun secara manual dikelola pengetahuan storages global seperti ontologies dan sistem otomatis melibatkan pengindeksan dan media yang paling lengkap dan dapat diakses koleksi dokumen mentah (World Wide Web), seperti mesin pencari. Masalah pertama adalah pendekatan dalam manual alam - ada upaya untuk menciptakan dan memelihara manusia global basis akan menghasilkan kompromi antara detail, actuality dan kegunaan. ], UFO (Unified Framework Ontology) Meskipun terdapat beberapa berhasil atas ontologi-proyek seperti CYC [23], WordNet [12], DNS, dll Sumo teoretis dan diskusi yang sedang berlangsung selama penelitian ini bertujuan untuk mengembangkan sebuah standar global unified ontologi di bawah nama SUO (Standard Upper ontologi ) [27], benda terbang aneh (Unified Framework ontologi) dll

Kedua pendekatan sejarah menjadi lazim karena WWW yang paling besar, komprehensif dan up-to-date corpus data tersedia untuk saat ini proses otomatis. Namun kontras ke pendekatan pertama, masalah otomatis informasi dari media memainkan peran penting di sini. Masalah pemahaman teks dan pemrosesan bahasa alami adalah salah satu yang paling menantang di AI dan bagaimanapun masih tetap tanpa solusi efisien. The second approach (automated indexing) therefore has major lacks in the accuracy of retrieval. Berdekatan adalah masalah klasifikasi dan relevansi perhitungan, yang disebut web kekelompokan 'masalah [1]. Kedua pendekatan (otomatis mengindeks) memiliki kekurangan utama dalam akurasi media.

Ada upaya-upaya yang sedang berlangsung di membawa perbaikan yang telah disebutkan diatas pendekatan untuk mengatasi masalah ini. Misalnya, bersama dengan unified dasar proyek ontologi (SUO, BULO) ada beberapa upaya untuk mengembangkan dan ontologi ontologi alignment pemetaan teknik untuk membawa ontologies wujud bersama-sama dengan satu sama lain dan dengan jenis pengetahuan dasar [5, 17]. Hal ini sering diusulkan untuk mengurangi kekurangan secara manual dalam hal administrasi ontologies dengan alat otomatis informasi (teknologi mesin pencari). Dari sisi lain, meningkatkan standar hypertext sedang dikembangkan agar dapat secara manual menentukan informasi untuk membantu mesin pencari commonsense memahami maksud WWW dokumen dan hyperlink antara mereka [24]. Sangatlah penting untuk memahami bahwa solusi hibrida membawa kekurangan yang sesuai dengan keunggulan teknik.

Salah satu kelemahan ini unites pendekatan dan membuat mereka mustahil integrasi: tidak ada standar pemetaan dan membangun hubungan antara dokumen dan konsep yang berbeda dalam sistem. Masalah akan terselesaikan jika salah satu sistem dengan tetap matematis interpretable hirarki seperti mengatasi ontologies yang ada pendekatan (WWW). Namun ini tampaknya tidak mungkin karena alasan abovementioned. Perantara independen standar adalah potensi solusi untuk masalah ini. Terdapat beberapa inisiatif pada arah dan sejalan dengan pemetaan pengetahuan dasar dari berbagai jenis yang ada di antara bidang ontologi pemetaan. Inisiatif ada satu kelemahan: tidak ada satu standar pemetaan dan membangun hubungan antara dokumen. Kemudian, tidak satupun dari mereka yang kemungkinan akan menjadi dikenal luas standar kecuali solusi yang lebih berkelanjutan dikembangkan.

2,2 Konsep Global Knowledge Peta (GKM)

Kami percaya adalah mungkin untuk mengembangkan sebuah standar untuk pengetahuan pemetaan oleh bangunan ruang logis dengan tujuan proyeksi nyata dari pengetahuan konsep. Seperti model (mari kita sebut Global Knowledge Peta) harus mencerminkan tingkat kesamaan dokumen dan dipetakan ke konsep itu.

Tujuan utama model adalah:

  • Perataan dan lintas-dokumen dan pemetaan konsep (WWW, ontologies, e-pustaka, direktori dll)
  • Informasi melalui media browsing
  • Tepat otomatis perhitungan commonsense relevansi

GKM sehingga memerlukan matematis / logis model pengetahuan penyimpanan dengan kondisi tertentu: yang optimal untuk tugas pengetahuan perwakilan yakni interaksi dengan manusia. Untuk pemenuhan kondisi ini model harus mencerminkan dalam kematraan dalam struktur atau struktur pengetahuan manusia.

Persyaratan itu adalah:

  • Kematraan dan pemetaan.

Faktor utama untuk kematraan is (atau topik).

  1. Setiap konsep manusia pengetahuan dapat dipetakan dengan menuju satu titik tertentu dalam sistem koordinat ruang.
  2. Setiap dokumen atau teks dapat dipetakan ke sejumlah poin (dokumen ini dibagi dalam memes - bermakna lembar) atau satu titik.
  • Perhitungan relevansi.
  1. Kemungkinan matematis untuk menghitung relevansi antara dua konsep oleh menghitung jarak antara mereka sesuai proyeksi poin di ruang.
  2. Oleh karena itu, mungkin untuk menghitung 'kesamaan' antara dokumen dan konsep oleh menghitung jarak antara mereka pemetaan.
  • Keserbasamaan dari ruang.
  1. Ruang yang seragam (homogen) dan kontinyu
  2. Mencerminkan arti koordinat dan jarak antara poin mencerminkan perbedaan arti sehingga jika titik C terletak antara A dan B maka berarti C adalah konsep yang berhubungan dengan kedua A dan B sama-sama.
  3. Adalah mungkin untuk 'browsing' ruang mencari sumber pengetahuan dipetakan ke daerah tetangga.

Membangun model matematis dari ruang memungkinkan pengembangan Global Pengetahuan Peta. Itu tidak berguna untuk mencoba rumit seperti model (GKM) dalam cara manual karena alasan abovementioned informasi pertumbuhan dan terus berubah dalam pemahaman manusia di dunia. Kami percaya ada kemungkinan untuk mengambil dependensi dan aturan dari corpuses teks tersedia dan digunakan sebagai prosesor untuk keperluan pemetaan kami.

Di sudut batu kami adalah asumsi bahwa umumnya peta mungkin untuk berbagai mata pelajaran pengetahuan manusia menuju satu ruang dan waktu yang jauh dari kematraan terakhir menunjukkan tingkat kesamaan antara mata pelajaran yang diberikan. Hal ini didasarkan pada asumsi-Johnson Lindenstrauss Lemma yang menyatakan bahwa satu set n poin tinggi dalam dimensi ruang Euclidian dapat dipetakan ke bawah N dimensi ruang Euclidian

(2,1)

sedemikian rupa sehingga jarak antara dua titik oleh perubahan hanya faktor (1 ) [7]. Vector Space Model yang umum digunakan dalam informasi dan mewakili Teks Kategorisasi dokumen sebagai vektor dimensi tinggi [31]. Vektor ini berisi tingkat tertentu (tergantung pada fungsi metrik dipilih) dari informasi yang cukup mengklasifikasikan subjek dari dokumen asli.

The theorem Tychonoff dari [26] menyatakan bahwa poin, yang merupakan properti obyek satu kelas, harus terletak dekat dengan satu sama lain di ruang properti daripada poin mewakili properti obyek lain kelas. of compactness [22] the mapping will be achieved where the distances between points represent the relevance of the corresponding documents. Dalam tugas kita ini adalah asli vector ruang n teks mungkin akan diproyeksikan ke tetap N-dimensi ruang dan menggunakan algoritma yang sesuai untuk data kompresi / kematraan pengurangan disebabkan kepadatan theorem dari [22] pemetaan akan dicapai di mana jarak antar poin mewakili relevansi dokumen yang sesuai.

Faktor-faktor yang mempengaruhi presisi dari pemetaan:

  • keterwakilan yang metrik fungsi dan ukuran fitur ruang
  • ukuran, dan kualitas dispersity dokumen corpus

Menyediakan teori yang berlaku dalam kondisi saat ini untuk tetap dapat ditemukan teknik yang akan digunakan untuk pemetaan rumit. Kami mengusulkan agar fokus otomatis berarti karena berbagai komplikasi membuat manual berbasis ahli pemetaan tak berguna.

2,3 Otomatis melalui GKM generasi unsupervised ekstraksi (hipotesa)

Agar dapat berguna GKM harus berisi pemetaan yang signifikan jumlah riil kata (WWW) dan dokumen dalam struktur mewakili pengertian umum manusia di dunia. Itu tidak berguna karena itu untuk mempertimbangkan segala cara manual penciptaan GKM dan mengisi dengan dokumen pemetaan. Data pertambangan prinsip harus digunakan untuk mengambil dependensi mewakili pengetahuan dari wujud corpus dokumen tersedia komputer untuk memproses dan menyaring data yang tidak perlu.

Ada berbagai upaya untuk unsupervised ekstraksi dari dependensi dalam teks tetapi masih ragu-ragu apakah pertanyaan teknik yang mampu memberikan pengetahuan yang berkelanjutan melalui analisis ekstraksi besar dokumen koleksi [10, 11, 21, 30].

Mari kita membagi umumnya faktor yang mempengaruhi isi dokumen ke dalam tiga kategori:

  1. Penulis faktor pribadi (perasaan dan motif untuk membuat teks, fisik dan moral negara selama berpikir dan menulis)
  2. Bahasa (aturan dll dari bahasa yang digunakan untuk menulis dokumen)
  3. Pengetahuan (bagian tertentu manusia pengetahuan penulis transmit langsung atau tdk langsung melalui dokumen)

Mari kita mengira mungkin memproses dokumen teks tersedia semua manusia penulis dan ekstrak semua aturan dependensi. Dalam hal ini pengaruh faktor 1 akan minimal. Pengaruh faktor 2 tidak banyak yang penting karena hal berikut:

a) dokumen dalam beberapa bahasa diindeks mungkin, karena itu saling mengurangi pengaruh

b) bahasa itu sendiri mencerminkan pengetahuan manusia [18], maka sampai tingkat tertentu faktor 2 adalah subfactor dari 3 dan bahkan mereka dari ekstraksi campuran merupakan prestasi memuaskan

Hal ini kemudian secara teoritis mungkin untuk mendapatkan info lebih banyak sesuai dengan pengetahuan manusia terkena tersedia melalui dokumen. Info ini diwujudkan dengan pemetaan ruang hypothetically akan memberikan kami berkelanjutan GKM.

Pelaksanaan 2,4 (percobaan)

Di ruang dibangun setiap dokumen harus dipetakan ke koordinat tunggal. The 'browsing' dari ruang atau perbandingan jarak yang harus mengungkapkan bahwa situasi dokumen mereka atau kelompok mereka merefleksikan relevansi dan itu mungkin untuk menetapkan beberapa nama untuk topik tertentu koordinat dalam ruang.

Percobaan kami menggunakan 2 dan 3 dimensi Kohonen Som lokal dengan koleksi dokumen mengungkapkan bahwa jarak antara proyeksi dokumen tidak stabil seluruh rangkaian peluncuran. Hal ini kami pendapat adalah bukti dari fakta bahwa dari kematraan peta yang tidak cukup untuk conforms Johnson-Lindenstrauss Lemma yang disebutkan di atas.

Sayangnya, adalah mustahil untuk melakukan percobaan dengan benar kematraan. Misalnya, menurut Johnson Lindenstrauss-Lemma, untuk membuat peta 20000 dokumen 10% kesalahan akan memerlukan 58 dimensi. Ini membutuhkan perhitungan yang modern komputer di atas kemampuan.

Satu hal penting lagi di sini adalah bahwa, sementara Lemma memberikan maksimum kematraan pemetaan ruang yang memungkinkan untuk memenuhi kondisi proyeksi tunggal, tidak diperlukan minimal nilai efektif. Lemma memberikan nilai untuk satu set n poin yakni untuk kasus terburuk yang mungkin tidak muncul dalam prakteknya. Metode untuk deteksi kematraan harus digunakan untuk menghitung yang efektif kematraan data dan karena itu benar menentukan jumlah dimensi untuk pemetaan data tertentu ditetapkan. Ada dikenal teknik untuk ini yang datang dari latar belakang permukaan rekonstruksi. Salah satu yang terbaru adalah pekerjaan oleh S. Cheng, Y. Z. Wang dan Wu [4] di mana dimensi deteksi melalui metode Analisis Komponen Utama [8] disajikan. Dengan demikian, intrinsik kematraan data Mei digali. Sebagai nilai ini dalam praktiknya lebih rendah dari maksimal kematraan diperlukan untuk proyeksi dari yang sama jumlah dokumen yang terburuk dalam kasus-kasus teori, hal ini memberikan signifikan mengurangi waktu dalam perhitungan. Atau untuk tujuan yang sama kita dapat mempertimbangkan metode evaluasi berdasarkan yg berulang. Tujuan dari pengurangan kematraan dalam kasus kami adalah untuk membuat pemetaan yang efektif di mana commonsense kesamaan antara informasi sumber dinyatakan melalui jarak Euclidian antara proyeksi poin. Mengambil apapun kematraan pengurangan teknik acak berdasarkan seleksi dari input data set (misalnya Principal Component Analysis, Cukup mengorganisir Maps, Sammon rekonstruksi atau triangulasi), dalam hal ketika output kematraan adalah kurang tepat, proyeksi yang akan tidak stabil dan dengan setiap recalculation pemetaan akan berbeda dan jarak antara tidak akan mempertahankan proyeksi. Kami juga dapat mengasumsikan bahwa ketika efektif kematraan masukan dari bermacam-macam digunakan untuk pemetaan, yang akan menjaga jarak dengan beberapa derajat kebebasan tergantung kematraan pengurangan metode yang digunakan. Alternatif solusi itu adalah pilihan acak kematraan pengurangan dikombinasikan dengan teknik incremental kematraan paralel evaluasi pemetaan. 32]. Mempertimbangkan, misalnya, teknik SOMs berkembang dijelaskan dalam [19, 32]. Bertujuan untuk mengurangi waktu perhitungan, jumlah node yang meningkat secara dinamis dengan seragam baru node yang didistribusikan di antara lama dan bobot vektor yang ditetapkan dengan cara yang asli tetangga bobot vektor. Teknik sama diterapkan ke kematraan (D) akan memberikan kesempatan untuk mengevaluasi setiap D langkah demi langkah. Kriteria evaluasi akan Stabilisasi dari jarak antara proyeksi. Untuk tujuan ini dua atau lebih mandiri mengorganisir peta dapat berjalan secara paralel dengan jarak antar pairwise tertentu yang dibandingkan proyeksi pada setiap perulangan. Perulangan di bawah di sini kita memahami ketika tahap kematraan dari Som telah meningkat dan jaringan yang stabil secara konsekuen dengan parameter baru.

Rangkuman di atas kami mengusulkan sebagai berikut untuk percobaan model evaluasi pendekatan yang lebih baik untuk mendirikan Global Knowledge Peta dari kumpulan dokumen teks.

The datase t: vektor ruang model yang akan digunakan (setiap dokumen direpresentasikan sebagai vektor dengan fitur sebagai dimensi dan fitur 'di peringkat sebagai koordinat sesuai dimensi).

Fitur pilihan fungsi: paling efektif yang akan ditetapkan.

Vector size: empirically yang akan didirikan.

Pengolahan data dan penyimpanan.

J kematraan teknik pengurangan harus digunakan untuk pemetaan. Ada dua kemungkinan pendekatan:

a) pra-menghitung kematraan intrinsik dan mengevaluasi kematraan pengurangan berbeda dengan metode yang dikenal kematraan dari pemetaan;

b) 'incremental kematraan evaluasi pendekatan' dengan beberapa pemetaan yang dijalankan secara paralel - hanya dengan metode acak pilihan input data yang dapat digunakan.

Masukan: dokumen fitur vektor.

Hasil: koordinat GKM.

Evaluasi:

1) Commonsense evaluasi baik pada awal dokumen dan jarak Euclidian mereka pemetaan proyeksi.

2) stabilisasi ini pairwise jarak antar proyeksi melalui berbagai meluncurkan jika pilihan acak teknik yang digunakan.

3. Interface

3,1 Pengetahuan ideal representasi antarmuka

Bagian dari antarmuka Knowledge Representation Sistem adalah penting apabila sistem ideal dibahas. Kedua tugas menerima permintaan dari pengguna transmisi pengetahuan dan kembali kepada mereka adalah sama pentingnya dengan tugas struktur data dan penyimpanan. Dalam karya ini kita membahas cara menuju Knowledge Representation Systems dari generasi baru dan karenanya masalah interaksi overviewed untuk menetapkan apakah mungkin untuk memberikan antarmuka idealistis oleh sarana teknologi modern.

Dengan antarmuka yang digunakan untuk mendukung interaksi antara manusia modern dengan pengguna representasi pengetahuan dan sistem informasi yang terutama dari 'indeks' jenis, yaitu pengguna harus tahu apa yang mereka cari dan mereka juga harus menentukan bahasa itu. Contoh umum dari antarmuka adalah mesin pencari. Seperti yang kita telah disebutkan di atas, mesin pencari dan corpus dari dokumen WWW adalah yang paling lengkap dan up-to-date pengetahuan sistem perwakilan yang tersedia saat ini, ini adalah karena kepopuleran mereka. Pada saat yang sama diketahui bahwa 'indeks' antarmuka alam tidak digunakan untuk manusia tetapi adalah satu-satunya alternatif sebagai' browsing 'pendekatan sedang berdiri sangat buruk [16]. Alasannya adalah bahwa masalah pengetahuan dan pemetaan alignment yang tidak membolehkan klasifikasi otomatis dan representasi dokumen sesuai dengan mata pelajaran. Namun, dengan masalah pengetahuan unified pemetaan ruang yang terselesaikan, kemungkinan baru akan muncul untuk meningkatkan pembangunan, interface yang lebih alami 'browsing' jenis.

3,2 kematraan tinggi dan visualisasi

Setelah disebutkan bahwa hasil pemetaan ruang global akan cenderung n-dimensi dimana n tinggi yang diperlukan untuk menyelesaikan masalah representasi visual. Adalah mungkin bagi manusia untuk membayangkan ruang 3D, karena itu, cara-cara yang optimal nd-> 3D perwakilan akan dievaluasi. Kematraan teknik pengurangan atau beberapa perwakilan pendekatan melalui antarmuka dapat digunakan.

Penting dengan bantuan unified pengetahuan yang pemetaan ruang kesalahan adalah diminimalkan selama perhitungan relevansi antara dokumen, dan, di media bahkan dokumen yang relevan dari sistem lain menjadi tugas sepele. Untuk pengguna akhir sekali ini berarti sistem telah terletak topik dia adalah tertarik, ia tidak akan pernah mengarahkan user untuk dokumen yang tidak relevan.

Informasi permintaan 3,3 rantai

Bila tugas-tugas mata pelajaran dan pemetaan lokasi, perhitungan relevansi dan pengetahuan ruang browsing diselesaikan dengan tugas yang paling penting tetap untuk masalah ini adalah awal dari sebuah permintaan. Dalam negara-of-the-art sistem informasi berikut ini adalah proses yang biasanya terlibat apabila informasi yang diminta:

Manusia bagian: 1) Imagination -> 2) pembentukan konstruksi linguistik -> 3) manual keyboard input (suara input) -> Mesin bagian: 4) linguistik decoding -> 5) pencocokan dan lokasi -> 6) visualisasi yang cocok dokumen

Rantai panjang dan sudah jelas bahwa data kerugian dan korupsi sedang signifikan karena dua bahasa encoding dan decoding. Pertama, pengguna harus merumuskan kognitif yang gambar ke bahasa kalimat singkat. Kedua, sistem harus membaca sandi kalimat untuk memahami subjek minat pengguna. Yang dijelaskan rantai dari awal permintaan menyebabkan ketidakpuasan pengguna mesin pencari modern karena ketidakmampuan sistem untuk 'memahami' permintaan mengakibatkan hilangnya waktu besar pengguna akhir. Sudut ini kesalahan media dan antarmuka inconveniences disebabkan oleh keterbatasan yang signifikan dan akan sangat mengurangi efek yang lebih tepat mengambilan dan lokasi dokumen diperkenalkan oleh unified pemetaan.

Oleh karena itu, perlu dipertimbangkan, setidaknya secara teoritis, kemungkinan penciptaan yang ideal pendek rantai manusia <-> Representasi Pengetahuan Sistem interaksi dengan unit menyebabkan hilangnya data yang dihapuskan:

Manusia bagian: 1) Imagination -> [permintaan yang lulus melalui langsung otak manusia-GKM koordinat converter] -> 2) dan lokasi yang cocok dengan -> 3) visualisasi yang cocok dokumen

Kami Sekilas terbaru prestasi di bidang Brain Komputer interface (BCI) untuk tujuan ini.

3,4 Brain-Computer antarmuka

ost significant advances in the area have been made into artificial limb control ie motoring functions of the brain [3] and the interpretation and processing of visual signals. Penelitian di BCI telah berlangsung selama lebih dari 30 tahun dan di wilayah ini masih sangat muda dan berkembang pesat. Hingga suatu saat baru m OST kemajuan signifikan di daerah yang telah dibuat menjadi sayap buatan kontrol mobil yakni fungsi otak [ 3] dan interpretasi dan pemrosesan sinyal visual. Prestasi ini telah diverifikasi selama beberapa percobaan yang melibatkan manusia dan hewan pelajaran. Lapor peneliti berhasil integrasi mekanis atau perangkat elektronik ketika hewan atau manusia belajar untuk mengontrol perangkat dengan bantuan otak mereka; lain lapor berhasil mentransfer dan decoding visual sinyal [15, 20].

Otak-komputer antarmuka studi yang terkait erat dengan bidang fungsional neuroimaging, dimana berbagai teknologi telah dikembangkan untuk secara efektif merekam negara orang otak melalui karakteristik fisik tertentu. Paling produktif dari sudut pandang BCI adalah neuroimaging teknik baru yang disebut Fungsional magnetik resonansi Olahgmbar ) (FMRI) [6, 13]. Teknik ini memungkinkan untuk merekam dinamika aliran darah di daerah otak yang berbeda sepanjang waktu dan dengan presisi tinggi. Akibatnya ini memungkinkan untuk membuat sambungan antara pola aktivasi otak berbagai daerah dan beberapa kegiatan dan proses kognitif manusia. Penting bahwa teknik ini, tidak seperti banyak alternatif, non-invasi dan tidak melibatkan suntikan. Sangatlah penting untuk dicatat bahwa fMRI hardware yang saat ini masih sangat mahal dan susah untuk dipakai.

Adalah penting bahawa percobaan menunjukkan bahwa otak menyesuaikan dengan kondisi baru. Misalnya, ketika mobil impulses digunakan untuk mengendalikan montir penyeleweng atau kursor mouse komputer, otak mampu membedakan secara bertahap dan belajar untuk mengendalikan dalang secara terpisah dari anggota badan buatan. Lebedev menyebut efek 'otak keliatan' potensial yang memungkinkan untuk memasukkan perangkat buatan ke dalam badan perwakilan. [20]

Recent publikasi di bidang neuroimaging lebih lanjut masih membicarakan peluang mendeteksi kognitif yang menyatakan [15]. Ini menegaskan yang kami memfokuskan perhatian pada kemungkinan aplikasi dari BCI dalam interaksi manusia-KRS.

Diketahui bahwa berbeda kognitif negara tertentu yang terhubung dengan dunia objek sesuai dengan pola tertentu dari otak daerah aktivasi. Decoding ini memungkinkan untuk memahami pola yang dilapiskan keatasnya berorientasi stimuli orang saat ini hadir (di mana perhatian mereka diarahkan) atau dalam kasus dengan visual untuk mengidentifikasi objek yang kelas obyek orang imaging (yakni muka, bangunan, perabot) dan bahkan benda 'warna dan orientasi. [15] Ini adalah proses yang rumit dan jauh dari yang dipahami saat ini. Penelitian lebih lanjut akan mengungkapkan bagaimana urutan rendah dan tinggi agar sinyal otak berkorelasi dengan fungsi kognitif tertentu; bagaimana karakteristik spasial dari pola perubahan dari waktu ke waktu dan di bawah berbagai pengaruh, yang mana adalah mungkin untuk meramalkan kemungkinan yang aktivasi pola beragam mata pelajaran; sebagainya diyakini bahwa tepat pengetahuan 'computations' yang digelar di otak manusia tidak penting untuk pembangunan yang relevan BCIs. [20] Common data teknik dapat diterapkan untuk mendapatkan informasi dari berbagai sensor neuroimaging dan membuat sambungan dengan kognitif negara tertentu.

Walaupun ada hal penting yang dapat mempengaruhi keberhasilan serius alatnya BCI di bidang ilmu perwakilan. Dua masalah kecil yang melintasi waktu dan generalisasi masalah dari berbagai kasus yang sama mental negara. Diketahui bahwa daerah otak aktivasi pola yang sama mental negara ini mungkin berbeda dari waktu ke waktu. Berbagai kasus yang sama mental negara Mei memberikan gambar diubah juga, tergantung variasi kontekstual dan faktor lainnya. [15] Hal ini memerlukan tata ruang resampling fleksibel dan klasifikasi algoritma yang akan digunakan sebagai diusulkan oleh Haynes dan Rees. Kami percaya masalah ini akan diselesaikan pada pengembangan teknik efektif.

Ragu-ragu lagi pertanyaan adalah masalah ekstrapolasi ke novel kognitif negara. Haynes dan Rees dicatat bahwa jumlah kemungkinan perceptual atau kognitif negara adalah tak terbatas, sedangkan jumlah pelatihan kategori ini tentu terbatas. [15] Sangat penting karena itu decoder yang dapat dilatih untuk menyamaratakan pengalaman yang diperoleh dari pelatihan kecil sepenuhnya untuk menetapkan kategori baru. Ia mungkin dengan cara ekstrapolasi jika pola otak aktivasi sebenarnya diatur dalam beberapa sistematis parametric ruang. Ini masih harus ditemukan, namun demikian hal tersebut diyakini sangat mungkin setidaknya untuk beberapa jenis konten mental [15]. Dalam hal bentuk abstrak ruang untuk klasifikasi pola dgn saraf memang ada ia akan memungkinkan kita untuk berteori tentang kemungkinan pemetaan otak manusia kognitif menuju negara Global Knowledge Peta dijelaskan sebelumnya dalam karya ini. Diberikan ini telah tercapai, di atas "masalah awal permintaan" akan terselesaikan dan "ideal manusia <-> KRS" rantai akan kemungkinan untuk membentuk.

3,5 Learnable Decoder

Seperti diketahui sekarang berkat terbaru prestasi otak imaging yang mungkin untuk membedakan aktivasi area otak yang berbeda ketika orang berpikir tentang berbagai mata pelajaran yang kami dapat menganggap bahwa adalah mungkin untuk membuat learnable decoder ke peta kognitif manusia dimulai negara ke pengetahuan peta yang Knowledge Representation Sistem. Karena itu yang ideal cara interaksi manusia-komputer mungkin didirikan yang besar yang memungkinkan kecepatan dan ketepatan komunikasi dengan sistem. Akan ada sedikit data kerugian akibat dari penghapusan linguistik tahap interaksi. Kecepatan dan efektivitas interaksi akan meningkat secara konsekuen. Dua faktor ini akan memungkinkan orang-orang dari berbagai profesi untuk meningkatkan efektivitas kerja mereka signifikan. Dari [6, 15] kita tahu bahwa ada beberapa regularities dari lokasi impulses otak dan mata pelajaran pengetahuan yang umum untuk semua manusia, kami dapat memanggil fitur anthropogenic. Namun diketahui bahwa mayoritas link ini patut menjadi individualistis. Karena itu decoder harus individual adaptif.

Juga jelas bahwa efisiensi dari decoder akan bergantung pada individu dan mereka dengan pelatihan dan kemampuan untuk belajar. Kita dapat menganggap ini dari percobaan buatan dengan antarmuka yang digunakan untuk menggantikan hilang limbah. Manusia dan binatang mampu berkonsentrasi dalam mental khusus untuk memindahkan buatan penyeleweng dan bahkan belajar untuk mengontrol dan nyata sayap buatan satu secara terpisah [20].

Mengingat di atas kami percaya bahwa jaringan buatan dgn saraf - berdasarkan mekanisme adalah solusi yang terbaik dari masalah decoder.

Decoder dari proses belajar

1) Acak dengan titik koordinat di ruang GKM multidimensi yang dipilih.

2) Beberapa dokumen yang mereka pemetaan di daerah tetangga (Euclidian metrik digunakan) akan dipilih dan ditampilkan kepada manusia operator.

3) Operator berkonsentrasi his / her mind cognitively untuk menghadiri diberikan dan topik terkait objek di memori.

4) Neuroimaging data yang dikumpulkan oleh perangkat keras fMRI selama jangka waktu tertentu.

5) Data yang diproses melalui spasial resampling dan kebisingan pengurangan algoritma bertujuan untuk mendapatkan pola-pola informatif characterizing yang sedang perulangan pelatihan.

6) Menyiapkan data yang diambil dengan masukan dari jaringan dgn saraf. GKM koordinat yang dipilih dari sebuah titik yang diambil ke pelatihan karena itu keluaran yang menghubungkan ke jaringan dgn saraf otak tertentu pola aktivasi GKM dengan koordinat.

Human brain to Knowledge Representation System bridge interface

Otak manusia untuk Knowledge Representation Sistem antarmuka jembatan

Gambar 3.1 Proses pelatihan dari decoder

In such way an individualistic decoder may be trained not only for human <-> KRS interaction but basically human <-> any mechanism interaction. It is known [6, 14] that, there are certain anthropogenic regularities of brain mapping, ie in our case it is possible to generalize the linkage of neuroimaging patterns with GKM coordinates over different operators. To make use of it, special ‘anthropogenically pre-trained’ neural nets may be used. These basic networks are to be prepared through massive collective learning of the same decoder involving a big number of human operators. This will significantly reduce the training time compared to randomly initiated neural network. It might likely occur that it is worthwhile to create different pre-trained decoders for people from different cultural/social/educational clusters. It also remains to be found of how much use the decoder is going to be for immediate use without individual training.

4. Conclusions

In this paper we have aimed to pursue a target-oriented approach to the problem of research and development of the next generation Knowledge Representation Systems. As a result, innovative concepts have been proposed for both data storage and interface parts of an idealistic KRS.

The concept of the Global Knowledge Map is an idea of multidimensional homogeneous mapping space as an addressing mechanism enabling easy information retrieval and relevance calculation for the information units stored in heterogeneous data warehouses such as WWW , ontologies etc. There have been multiple works on this issue trying to elaborate both visual and semantic mappings of massive documents collections as described in corresponding surveys [2, 9, 29, 34]. However no single concept has found wide application until now. The reasons we believe, along with calculation and implementation difficulties, have roots in the shortcomings of the proposed models. Most mapping models use 2D or 3D space whereas there are theoretical grounds mentioned in this paper which allow us to argue that low dimensional space mapping is not appropriate for real word application . Consequently, here we propose a concept of self-organising multidimensional Global Knowledge Map. The means for automated construction of such unified mapping space are proposed employing the principles of unsupervised extraction and dimensionality reduction techniques. A model for experimental evaluation of described system is proposed.

A possibility of direct human – KRS interface scheme have been concurrently studied. It was revealed that the current stage at which the area of Brain Computer Interfaces potentially allows the construction of such direct chain from the point of view of information request. A concept of learnable decoder applying neuroimaging hardware and neural network based converter is proposed.

The issue of psychological concerns, individual and social impact that might be caused by the technologies proposed was not examined. It is obvious that certain approaches such as brain computer interfaces might, when implemented, violate individual privacy and cause unexpected after-effects. Therefore this is a subject for careful study by researchers in corresponding fields.

There are multiple assumptions and blank spots in the model described. Undoubtedly it must be evaluated through experiments, elaborated and improved with appropriate techniques. This will demand collaborative research and development involving researchers and organisations of various fields. Moreover, there are certain technology barriers to overcome in order to build a described system. Such as: calculation complexity in the case of unsupervised knowledge mapping; a matter of low accessibility and portability of neuroimaging hardware in the case of neuroimaging – global mapping decoder. Nevertheless we believe the ideas presented would be beneficial for researchers working towards elaboration of knowledge representation systems of the next generation.

References

[1] J. Allan et al, Challenges in information retrieval and language modeling: report of a workshop held at the center for intelligent information retrieval, University of Massachusetts Amherst, September 2002, ACM SIGIR Forum 37 (1) (2003) 31-47.

[2] A. Becks , S. Sklorz , M. Jarke , Exploring the Semantic Structure of Technical Document Collections, in: Proceedings Cooperative Information Systems, 7th International Conference ( CoopIS 2000 ) , Eilat, Israel, 2000 , pp. 120-125.

[3] JM Carmena, MA Lebedev, CS Henriquez, MAL Nicolelis, Stable ensemble performance with single neuron variability during reaching movements in primates , Journal of Neuroscience 25 (46) (2005) 10712-10716.

[4] S. Cheng, Y. Wang, Z. Wu, Provable Dimension Detection using Principal Component Analysis, in: Proceedings of the twenty-first annual symposium on Computational geometry , Pisa, Italy, 2005, pp. 208-217.

[5] N. Choi, I. Song, H. Han, A Survey on Ontology Mapping, ACM SIGMOD Record, 35 (3) (2006), 34-41.

[6] D. Cox, R. Savoy, Functional magnetic resonance imaging (fMRI) “brain reading”: detecting and classifying distributed patterns of fMRI activity in human visual cortex, Neuroimage 19 (2003) 261-270.

[7] S. Dasgupta, A. Gupta, An elementary proof of a theorem of Johnson and Lindenstrauss, Random Structures and Algorithms, 22 (1) (2003) 60 – 65.

[8] C. Ding, X. He, K-means Clustering via Principal Component Analysis, in: Proceedings of International Conference in Machine Learning (ICML 2004), Banff , Canada , 2004, pp. 225-232.

[9] M. Dodge , Mapping the World-Wide Web, in: Preferred Placement: The Hit Economy, Hyperlink Diplomacy, and Web Epistemology, Symposium of the Design & Media Research Fellowship, Jan Van Eyck Akademie, Amsterdam, Netherlands, 1999, pp. 81-98.

[10] J. Dolling, Commonsense Ontology and Semantics of Natural Language, Zeitschrift für Sprachtypologie und Universalienforschung (STUF) 46 (2) (1993) 133–141.

[11] O. Etzioni, M. Cafarella, D. Downey, A. Popescu, T. Shaked, S. Soderland, D. Weld, A. Yates, Unsupervised named-entity extraction from the Web: An experimental study. Artificial Intelligence 165 (2005) 91-134.

[12] C . Fellbaum , WordNet: An Electronic Lexical Database, The MIT Press, Cambridge , MA , USA , 1998.

[13] J. Ford, F. Makedon, T. Steinberg, C. Owen, S. Johnson, A. Saykin, Stimulus tracking in Functional Magnetic Resonance Imaging (fMRI), in: Proceedings of the sixth ACM international conference on Multimedia , Bristol, UK, 1998, pp. 445-454.

[14] J. Haynes, G. Rees, Predicting the stream of consciousness from activity in human visual cortex, Current Biology, 15 (2005) 1301-1307.

[15] J. Haynes, G. Rees , Decoding mental states from brain activity in humans , Nature Reviews Neuroscience 7 (7) (2006) 523-534 .

[16] M. Hertzum , E. Frokjaer , Browsing and Querying in Online Documentation: A Study of User Interfaces and the Interaction Process , ACM Transactions on Computer-Human Interaction, 3 (2) (1996) 136-161.

[17] Y. Kalfoglou, M. Schorlemmer, Ontology mapping: the state of the art, The Knowledge Engineering Review 18 (1) (2003) 1-31.

[18] P. Kay, W. Kempton, What is the Sapir-Whorf Hypothesis? American Anthropologist 86 (1) ( 1984) 65-79.

[19] K. Lagus, S. Kaski, T. Kohonen, Mining massive document collections by the WEBSOM method, Information Sciences 163 (1-3), Special issue on Soft computing data mining (2004) 135-156.

[20] M. Lebedev, M. Nicolelis, Brain-machine interfaces: past, present and future, Trends in Neurosciences 29 (9) (2006) 536-546.

[21] X. Li, P. Morie, D. Roth, Semantic Integration in Text: From Ambiguous Names to Identifiable Entities , AI Magazine, Special Issue on Semantic Integration 26 (1) (2005) 45-68.

[22] D. Marker, Model Theory: An Introduction, Springer-Verlag, International, 2002.

[23] C. Matuszek, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah and D. Lenat . Searching for Common Sense: Populating Cyc from the Web, in: Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh , Pennsylvania , USA , 2005, pp. 1430-1435.

[24] D. Millard, M. Ross , Web 2.0: Hypertext by Any Other Name, in: Proceedings of ACM Conference on Hypertext and Hypermedia 2006, Odense , Denmark , 2006, pp. 27-30.

[25] L. Morgenstern, Knowledge Representation and commonsense reasoning: Reviews of four books. Artificial Intelligence (170) (2006) 1239-1250.

[26] J. Munkres, Topology, 2nd edition, Prentice Hall, International, 2002.

[27] I. Niles , A. Pease, Towards a Standard Upper Ontology, in: Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit , Maine , USA , 2001, pp. 17-19.

[28] L. P. Pojman, The Theory of Knowledge: Classic and Contemporary Readings , 3rd Edition, Late of Clare Hall, Cambridge University , Cambridge , 2003.

[29] F. Rossi, V isualization methods for metric studies, in: Proceedings International Workshop on Webometrics, Informetrics and Scientometrics & Seventh COLLNET Meeting , Nancy , France ( 2006 ), pp. 356-366.

[30] D. Roy, E. Reiter, Connecting language to the world, Artificial Intelligence 167 (1-2), Special volume on connecting language to the world (2005) 1-12.

[31] F. Sebastiani, M achine learning in automated text categorization, ACM Computing Surveys (CSUR), 34 (1) (2002) 1-47.

[32] U. Seiffert , B. Michaelis , Growing 3D-SOM’s with 2D-input layer as a classification tool in a motion detection system , in: Proceedings International Conference on Engineering Applications of Neural Networks (EANN ’96), Abo Akademis Tryckeri, Turku , Finland , 1996 , pp. 351-354 .

[33] J. Sowa, Knowledge Representation. Logical, Philosophical and Computational Foundations, Brooks/Cole, Pacific Grove , CA , USA , 2000.

[34] T. Villmann et al, Theory and Application of Neural Maps, in: Proceedings European Symposium on Artificial Neural Networks (ESANN’2004), Bruges , Belgium , 2004, pp. 25-38.

[35] A. Zanasi, Text Mining and its Applications to Intelligence, CRM and

Knowledge Management, WIT Press, Southampton , UK , 2005.

[?]
Share This