Mengenal Apa itu Semantic Web: Memberikan Struktur Informasi pada Web

Assalamu‘alaikum wr. wb.

Hello guys! Saat ini, setiap Website sudah membutuhkan Informasi berupa Data yang menggunakan Interoperabilitas. Bahkan, Informasi pada Semantic Web tidak hanya dipahami oleh Manusia saja, tapi juga dapat dipahami oleh Komputer. Kali ini kita akan membahas tentang Apa itu Semantic Web.

Mengenal Apa itu Semantic Web: Memberikan Struktur Informasi pada Web

Sumber Artikel Materi : Learn.Mattr.globalOntotext.comSIS.Binus.ac.id, Marketeers.com, dan Puskom.UMA.ac.id


A. Pengertian Semantic Web

Semantic Web atau Web Semantik adalah ide yang bertujuan untuk memberikan makna yang lebih dalam pada informasi yang tersedia di web. Dalam konsep ini, informasi tidak hanya tersaji dalam bentuk teks atau dokumen biasa, tetapi juga memiliki struktur yang dapat dimengerti oleh komputer.

Secara lebih teknis, Semantic Web merupakan perluasan dari web saat ini, di mana informasi disajikan dalam format yang lebih terstruktur dengan menggunakan Resource Description Framework (RDF) dan Web Ontology Language (OWL).

RDF berfungsi untuk mendefinisikan dan mengaitkan informasi, sedangkan OWL digunakan untuk menjelaskan relasi dan karakteristik dari informasi tersebut. Tujuan utama dari semantic web adalah meningkatkan kemampuan komputer dalam memahami isi dari konten web.

Semantic Web menekankan model "read-write-execute", di mana bagian "execute" menjadi prioritas utama dalam konteks semantic web. Perbedaan yang mencolok antara semantic web dan website biasa terlihat dari konsep dasar website itu sendiri yang awalnya dikenal sebagai "Web of Document" menjadi "Web of Data" dengan menerapkan ontologi pada halaman-halaman website. Semantic web menggunakan ontologi web sebagai domain dari basis pengetahuan dan membuat halaman web semantik memiliki kemampuan untuk belajar dan memahami dalam mendeskripsikan data, sehingga data tersebut dapat dengan mudah dipahami dan diproses oleh komputer.

Semantic Web adalah visi tentang perluasan dari World Wide Web (WWW) yang ada, yang menyediakan program-program perangkat lunak dengan metadata mesin-tertulis dari informasi dan data yang dipublikasikan. Dengan kata lain, kita menambahkan deskripsi data lebih lanjut ke konten dan data yang sudah ada di Web. Sebagai hasilnya, komputer dapat membuat interpretasi yang bermakna serupa dengan cara manusia memproses informasi untuk mencapai tujuan mereka.

Ambisi utama dari Semantic Web, seperti yang dilihat oleh pendirinya Tim Berners-Lee, adalah memungkinkan komputer untuk lebih baik memanipulasi informasi atas nama kita. Dia lebih lanjut menjelaskan bahwa, dalam konteks Web Semantik, kata "semantik" mengindikasikan dapat diproses oleh mesin atau apa yang dapat dilakukan oleh mesin dengan data tersebut. Sedangkan "web" menyampaikan ide dari ruang yang dapat dinavigasi dari objek yang saling terhubung dengan pemetaan dari URI ke sumber daya.

B. Tantangan dalam Semantic Web

Tantangan yang perlu diatasi dengan Web Semantik meliputi :

  • Kebesaran - Internet berisi miliaran halaman, dan teknologi yang ada belum dapat menghilangkan semua istilah yang duplikat secara semantik.
  • Ketidakjelasan - Konsep-konsep yang tidak tepat seperti 'muda' atau 'tinggi' membuat sulit untuk menggabungkan berbagai basis pengetahuan dengan konsep yang tumpang tindih tetapi sedikit berbeda.
  • Ketidakpastian - Konsep-konsep yang tepat dengan nilai yang tidak pasti bisa sulit untuk diperhitungkan, hal ini mencerminkan ketidakjelasan dan sifat probabilistik dari kehidupan sehari-hari.
  • Ketidaksesuaian - Kontradiksi logis menciptakan situasi di mana penalaran gagal.
  • Penipuan - Informasi yang menyesatkan yang disebarkan oleh pihak-pihak yang jahat, dapat dikurangi dengan kriptografi untuk menetapkan integritas informasi.


C. Data Tertaut Terbuka (Linked Open Data) pada Semantic Web

Data Terbuka pada Semantic Web ada 2, yaitu Linked Data dan Linked Open Data (LOD).

1. Linked Data

Data terhubung adalah teori di balik sebagian besar upaya web semantik. Ini menggambarkan mekanisme umum untuk mempublikasikan data terstruktur di internet menggunakan kosakata seperti schema.org yang dapat dihubungkan dan diinterpretasikan oleh mesin. Dengan menggunakan data terhubung, pernyataan yang dienkripsi dalam tiga elemen (subjek → predikat → objek) dapat tersebar di berbagai situs web dengan cara standar. Pernyataan ini membentuk dasar pengetahuan yang meluas di seluruh Internet. Kenyataannya adalah bahwa sebagian besar informasi yang berguna di internet saat ini adalah data tak terstruktur, atau data yang tidak diatur dalam cara yang membuatnya berguna bagi siapa pun selain pencipta data tersebut. Ini baik untuk kasus di mana data tetap dalam konteks tunggal sepanjang siklus hidupnya, tetapi menjadi masalah ketika mencoba untuk berbagi data di berbagai konteks sambil mempertahankan maknanya. Visi untuk data terhubung adalah agar internet menjadi semacam basis data global di mana semua data dapat direpresentasikan dan dipahami dengan cara yang serupa.

Salah satu tantangan terbesar untuk mewujudkan visi internet sebagai basis data global adalah memungkinkan kumpulan semantik dasar yang dapat digunakan oleh semua data ini. Sebuah proliferasi data menjadi jauh kurang berguna jika data tersebut redundan, tidak terorganisir, atau berantakan dan rumit. Pada akhirnya, kita perlu menggandakan penggunaan kosakata data umum dan skema data umum. Skema data umum yang dikombinasikan dengan fitur keamanan data yang dapat diverifikasi akan membuat penipuan lebih sulit, sehingga memudahkan transmisi dan konsumsi data sehingga keputusan berbasis kepercayaan dapat dibuat. Selain itu, proliferasi kosakata data umum akan membantu menjadikan portabilitas data menjadi kenyataan, memungkinkan data dipindahkan di antara konteks-konteks sambil mempertahankan semantik dari konteks aslinya.

2. Linked Open Data (LOD)

Linked Open Data (LOD) adalah data terstruktur yang dimodelkan sebagai grafik dan dipublikasikan dengan cara yang memungkinkan penginterkoneksiannya di seluruh server. Ini diformalkan oleh Tim Berners-Lee pada tahun 2006 sebagai Empat aturan data terhubung :

  • Gunakan URI sebagai nama untuk hal-hal.
  • Gunakan URI HTTP agar orang dapat mencari nama-nama tersebut.
  • Ketika seseorang mencari URI, berikan informasi yang berguna, menggunakan standar (RDF*, SPARQL).
  • Sertakan tautan ke URI lain. sehingga mereka dapat menemukan lebih banyak hal.

LOD memungkinkan baik orang maupun mesin untuk mengakses data di berbagai server dan menginterpretasikan semantiknya dengan lebih mudah. Sebagai hasilnya, Web Semantik melampaui dari ruang yang terdiri dari dokumen terhubung menjadi ruang yang terdiri dari informasi terhubung. Yang, pada gilirannya, memberdayakan penciptaan jaringan yang sangat terhubung dengan makna yang dapat diproses oleh mesin.

Linked Open Data mencakup :

  • Data factual tentang entitas dan konsep tertentu (misalnya, Varna, Perang Dunia II, atau teori pemanasan global);
  • Ontologi - skema semantik yang mendefinisikan:
  • Kelas objek (misalnya, Orang, Organisasi, Lokasi, dan Dokumen);
  • Jenis hubungan (misalnya, seorang orang tua dari atau produsen dari);
  • Atribut (misalnya, Tanggal Lahir seseorang atau populasi dari wilayah geografis).

Saat ini, ada ribuan set data yang dipublikasikan sebagai LOD di berbagai sektor seperti ensiklopedia, data geografis, data pemerintah, database dan artikel ilmiah, hiburan, perjalanan, dll. Hanya dalam Ilmu Kehidupan saja, ada lebih dari 100 basis data ilmiah yang dipublikasikan sebagai LOD.

Karena keterhubungannya, set data ini membentuk sebuah jaringan data raksasa atau grafik pengetahuan, yang menghubungkan sejumlah besar deskripsi tentang entitas dan konsep yang penting secara umum. Sebagai contoh, ada beberapa deskripsi tentang kota Varna (misalnya, satu berasal dari Wikipedia, yang lain dari GeoNames, dll.).

D. Jenis-jenis Teknologi pada Semantic Web

Pekerjaan dalam mengembangkan teknologi web semantik telah berlangsung dalam waktu yang sangat lama. Visi untuk web semantik telah sangat konsisten sepanjang evolusinya, meskipun detail seputar bagaimana mencapai ini dan pada lapisan mana telah berkembang selama bertahun-tahun. Tumpukan teknologi web semantik dari W3C menawarkan gambaran umum tentang teknologi-teknologi dasar ini dan fungsi masing-masing komponen dalam tumpukannya.

Tujuan utama dari web semantik data adalah untuk memungkinkan komputer melakukan pekerjaan yang lebih berguna dan mengembangkan sistem yang dapat mendukung interaksi yang dapat dipercaya melalui jaringan. Arsitektur bersama yang ditentukan oleh W3C mendukung kemampuan internet untuk menjadi basis data global berdasarkan data terhubung. Teknologi Web Semantik memungkinkan orang untuk membuat toko data di web, membangun kosakata, dan menulis aturan untuk menangani data. Data terhubung didukung oleh teknologi seperti RDF, SPARQL, OWL, dan SKOS.

1. Resource Description Framework (RDF)

RDF menyediakan dasar untuk mempublikasikan dan menghubungkan data Anda. Ini adalah model data standar untuk mewakili sumber daya informasi di internet dan menggambarkan hubungan antara data dan potongan informasi lainnya dalam format grafik.

2. Web Ontology Language (OWL)

OWL adalah bahasa yang digunakan untuk membangun kosakata data, atau "ontologi", yang adalah representasi formal dari suatu domain pengetahuan. OWL memungkinkan definisi yang lebih kaya dan lebih kompleks tentang hubungan antara kelas dan properti.

3. Simple Knowledge Organization System (SKOS)

SKOS adalah cara standar untuk mewakili sistem organisasi pengetahuan seperti sistem klasifikasi dalam RDF. SKOS memungkinkan representasi dan pertukaran struktur klasifikasi secara formal.

4. SPARQL Protocol and RDF Query Language

SPARQL adalah Bahasa Kueri untuk Web Semantik; ia mampu mengambil dan memanipulasi data yang disimpan dalam grafik RDF. Bahasa kueri berjalan seiring dengan database. Jika Web Semantik dilihat sebagai basis data global, maka mudah dipahami mengapa seseorang memerlukan bahasa kueri untuk data tersebut.

5. Gleaning Resource Descriptions from Dialects of Languages (GRDDL)

GRDDL adalah mekanisme untuk mengekstrak data RDF dari representasi XML. Ini memungkinkan data yang ditulis dalam berbagai format XML untuk diubah menjadi RDF.

6. Rule Interchange Format (RIF)

RIF adalah standar untuk mengekspresikan aturan yang dapat dipertukarkan antara berbagai sistem aturan dan mesin inferensi. Ini mendukung penggunaan aturan untuk deduksi logis dalam konteks data RDF dan OWL.


Dengan memperkaya data dengan konteks dan makna tambahan, lebih banyak orang (dan mesin) dapat memahami dan menggunakan data tersebut dengan lebih efektif.

E. Contoh Semantic Web

Beberapa contoh dari web semantik adalah :

  • Igoogle. Ketika pertama kali membuka igoogle, kita akan diminta untuk mengisi lokasi tempat kita berada, setelah itu baru kita menuju ke halaman beranda igoogle. Dengan demikian, bisa jadi isi dari halaman beranda igoogle akan berbeda-beda sesuai dengan lokasi yang diisikan sebelumnya, baik itu dari isi berita, suhu udara, dan yang lainnya.

  • SIOC (http://sioc-project.org/195) Adalah komunitas yang berusaha mewujudkan semantic website yang tengah berjuang membantu kita menciptakan web cerdas yang mana kelak pencarian info di internet menjadi jauh – jauh sangat mudah.
  • Yahoo’s Food Site, Spivack’s Radar Networks, dan sebuah development platform, Jena, di Hewlett-Packard.
  • Second Life merupakan dunia virtual berbasis Internet. Mungkin di masa depan kita bisa hidup di dunia virtual itu yaitu di internet karena memang kehidupan di dalam Second Life meniru apa saja yang dilakukan oleh Anda dan yang ada di dunia nyata ini, dimana kita bisa berteman, melakukan aktivitas, berbicara dengan teman Anda, bertukar opini, bahkan berbisnis dan lain-lainnya yang ada di dunia ini.
  • Google Co-Op yang beralamatkan di http://www.google.com/coop/ 140. Google Co-Op merupakan salah satu service yang disediakan Google dan mulai beroperasi sejak tahun 2006 dan merupakan fungsi search yang ditambahkan di search engine Google dengan penambahan fitur yang lebih luas dan diharapkan Google Co-Op dapat memberikan sesuatu yang tepat yang sedang dicari orang-orang.
  • Web Servies yakni teknologi web yang memungkinkan sebuah aplikasi mampu berhubungan dengan aplikasi lainnya melalui protokol HTTP dengan format pesan XML


Berikut adalah penjelasan lebih rinci tentang setiap contoh penerapan teknologi Semantic Web :

1. Mesin Pencari Semantik

A

a. Google Knowledge Graph

Google Knowledge Graph adalah sistem yang menghubungkan berbagai informasi dari web untuk memberikan jawaban yang lebih kaya dan relevan dalam hasil pencarian. Ketika pengguna mencari sesuatu, Knowledge Graph membantu memberikan konteks dengan menampilkan informasi terkait, seperti fakta tentang tokoh, tempat, dan benda yang terhubung. Hal ini memungkinkan hasil pencarian yang lebih informatif daripada hanya sekadar daftar tautan.

b. Wolfram|Alpha

Wolfram Alpha adalah mesin pencari berbasis pengetahuan yang menggunakan data terstruktur dan ontologi untuk menjawab pertanyaan pengguna secara langsung, bukan hanya memberikan tautan ke halaman web. Ini dapat menjawab pertanyaan yang kompleks dalam bidang sains, matematika, sejarah, dan banyak lagi dengan menghitung dan menginterpretasikan data yang ada.

2. E-commerce dan Rekomendasi Produk

A

a. Amazon

Amazon menggunakan teknologi semantik untuk menganalisis preferensi pengguna, riwayat pembelian, dan perilaku pencarian untuk memberikan rekomendasi produk yang relevan. Dengan memahami konteks dan hubungan antara produk, Amazon dapat menampilkan produk yang mungkin diminati oleh pengguna, meningkatkan peluang penjualan.

b. Shopzilla

Shopzilla mengintegrasikan data produk dari berbagai sumber menggunakan ontologi dan RDF. Ini memungkinkan mereka untuk memberikan rekomendasi produk yang lebih tepat dan relevan kepada pengguna berdasarkan preferensi dan riwayat pencarian mereka.

3. Kesehatan dan Kedokteran

A

a. SNOMED CT

SNOMED CT adalah sistem nomenklatur klinis yang menggunakan ontologi untuk mendukung interoperabilitas data medis. Ini memungkinkan pengumpulan, penyimpanan, dan pertukaran data klinis dengan cara yang terstandarisasi, membantu dalam pengambilan keputusan klinis dan penelitian medis.

b. Bio2RDF

Bio2RDF adalah proyek yang mengonversi berbagai data biomedis menjadi format RDF. Ini memungkinkan peneliti untuk mengintegrasikan, menganalisis, dan menyelidiki data biomedis dari berbagai sumber secara lebih efektif, mendukung penelitian yang lebih dalam dan penemuan baru.

4. Content Management & Pengetahuan

A

a. BBC

BBC menggunakan teknologi Semantic Web untuk mengelola dan menghubungkan konten berita. Ini memungkinkan mereka untuk menyajikan berita dengan cara yang lebih terstruktur, seperti menghubungkan artikel terkait, menampilkan informasi tambahan tentang subjek berita, dan meningkatkan pengalaman pengguna.

b. DBpedia

DBpedia mengekstrak informasi terstruktur dari Wikipedia dan menyajikannya dalam format RDF. Ini memungkinkan data Wikipedia digunakan dalam berbagai aplikasi, seperti visualisasi data, penjelajahan pengetahuan, dan analisis data.

5. Pendidikan dan E-learning

A

a. Linked Data for Libraries (LD4L)

LD4L menghubungkan data bibliografi dari berbagai perpustakaan menggunakan teknologi Linked Data. Ini meningkatkan kemampuan pencarian dan penemuan informasi di perpustakaan, memungkinkan pengguna menemukan sumber daya yang relevan dengan lebih mudah.

b. Europeana

Europeana mengumpulkan data budaya dari berbagai institusi di Eropa dan menyajikannya dalam format RDF. Ini memungkinkan peneliti dan pengguna untuk menjelajahi, menghubungkan, dan menganalisis data budaya secara lebih mendalam.

6. Jaringan Sosial

A

a. Facebook Open Graph

Facebook Open Graph menggunakan data terstruktur untuk menghubungkan objek dalam jaringan sosial. Ini memungkinkan integrasi yang lebih baik dengan aplikasi pihak ketiga, seperti berbagi aktivitas, musik yang didengarkan, dan artikel yang dibaca dengan cara yang lebih terstruktur dan bermakna.

b. FOAF (Friend of a Friend)

FOAF adalah ontologi yang digunakan untuk menggambarkan hubungan sosial dan membangun jaringan sosial yang terdistribusi. Ini memungkinkan pengguna untuk menghubungkan profil mereka di berbagai platform dan membangun jaringan yang lebih luas.

7. Open Data Pemerintah

A

a. Data.gov

data.gov adalah portal data terbuka milik Pemerintah AS yang menggunakan teknologi Semantic Web untuk menyediakan akses ke dataset pemerintah. Data disajikan dalam format yang dapat dimasukkan untuk analisis dan pengembangan aplikasi oleh publik.

b. European Data Portal

Portal ini mengumpulkan data terbuka dari berbagai negara di Eropa dan menyajikannya dalam format RDF. Ini memungkinkan penggunaan data untuk inovasi, penelitian, dan pengembangan aplikasi baru.

8. Industri dan Manufaktur

A

a. Siemens

Siemens menggunakan teknologi semantik untuk mengintegrasikan data di seluruh rantai pasokan dan meningkatkan efisiensi produksi. Ini memungkinkan interoperabilitas antara berbagai sistem dan analisis data yang lebih baik untuk pengambilan keputusan.

b. Internet of Things (IoT)

Teknologi semantik digunakan dalam IoT untuk mengintegrasikan dan mengelola data dari berbagai perangkat. Ini memungkinkan interoperabilitas dan analisis yang lebih baik, meningkatkan efisiensi dan fungsionalitas perangkat IoT.

9. Kepustakaan Digital

A

a. WorldCat

WorldCat menggunakan teknologi semantik untuk menghubungkan katalog perpustakaan di seluruh dunia. Ini memudahkan pencarian dan peminjaman antar perpustakaan, memungkinkan pengguna mengakses sumber daya dari berbagai perpustakaan dengan lebih mudah.

b. The British Library

The British Library menggunakan RDF dan ontologi untuk mengelola metadata koleksi digitalnya. Ini memungkinkan pencarian dan penemuan informasi yang lebih baik di koleksi digital mereka.

10. Pariwisata dan Perjalanan

A

a. Tourism Knowledge Graphs

Teknologi semantik digunakan untuk membuat knowledge graph di industri pariwisata, yang menghubungkan berbagai informasi tentang destinasi, atraksi, dan layanan. Ini memungkinkan penyediaan rekomendasi yang dipersonalisasi dan informasi yang lebih kaya kepada wisatawan.

b. Hotel Booking Systems

Sistem pemesanan hotel menggunakan data semantik untuk memberikan rekomendasi hotel yang relevan berdasarkan preferensi pengguna, ulasan, dan data lainnya. Ini meningkatkan pengalaman pengguna dalam mencari dan memesan hotel.



Pembuatan web semantik dimungkinkan oleh sekelompok standar yang disusun oleh World Wide Web Consortium (W3C). Standar-standar utama yang dibutuhkan dalam pembangunan Semantic Web meliputi XML, XML Schema, RDF, OWL, dan SPARQL.

Web 3.0 memiliki sejumlah standar operasional yang esensial untuk dapat menjalankan fungsinya dalam menyimpan metadata. Contohnya adalah Resource Description Framework (RDF) dan Web Ontology Language (OWL).

Peran RDF (Resource Description Framework) dalam teknologi web semantik adalah untuk menentukan format metadata yang terdiri dari tiga elemen, yaitu subjek, predikat, dan objek. Subjek dan objek mewakili entitas yang dijelaskan oleh teks, sedangkan predikat menjelaskan hubungan antara subjek dan objek. Yang menarik dari RDF adalah bahwa objek dapat menjadi subjek yang kemudian dijelaskan oleh objek lainnya, sehingga memungkinkan deskripsi yang lebih rinci dan detail, sesuai dengan preferensi pengguna yang memberikan masukan.

Web semantik merujuk pada kemampuan aplikasi komputer untuk memahami bahasa manusia dengan lebih baik, termasuk bahasa non-formal seperti bahasa percakapan. Hal ini memungkinkan pengguna berkomunikasi dengan mesin dengan lebih mudah. Web semantik dapat memproses bahasa dan mengenali perbedaan dalam homonim, sinonim, atau atribut dalam database.


Itulah Penjelasan tentang Apa itu Semantic Web. Nantikan Tutorial kami selanjutnya tentang Cara menggunakan Apache Jena Fuseki untuk SPARQL.

Terima Kasih 😄😘👌👍 :)

Wassalamu‘alaikum wr. wb.

Post a Comment

Previous Post Next Post