Computer Vision: Pengertian, Fungsi, dan Contohnya

Assalamu‘alaikum wr. wb.

Hello guys! Visi Komputer atau Computer Vision merupakan bagian dari Kecerdasan Buatan (AI), yaitu Komputer bisa melihat serta mengenali Objek di sekitarnya, selayaknya Manusia. Lalu, apa saja Visi Komputer (Computer Vision)? Inilah pembahasannya!

Pengertian, Fungsi, dan Contoh dari Computer Vision

Sumber Artikel Materi : Pintu.co.id (Blog)Widya.ai, dan IBM.com (Topics)

Munculnya ide penciptaan teknologi terutama diilhami oleh aktivitas manusia. Visi Komputer adalah salah satunya. Teknologi ini terinspirasi dari cara manusia menangani hal-hal visual. Apa itu Visi Komputer (Computer Vision) dan perannya dalam dunia AI? Temukan jawaban lengkapnya di sini!

A. Pengertian Visi Komputer

Visi Komputer atau Computer Vision adalah teknologi yang memungkinkan komputer memiliki kemampuan untuk melihat dan mengenali objek di sekitarnya, serupa dengan kemampuan manusia. Cara kerjanya melibatkan penggunaan kamera bersama dengan kecerdasan buatan atau AI (Artificial Intelligence). Jika AI memungkinkan komputer untuk berpikir, maka Visi Komputer memungkinkan komputer untuk memiliki kemampuan visual, pengamatan, dan pemahaman.

Seperti halnya manusia yang menggunakan sistem saraf optik, retina, dan korteks visual untuk mengamati lingkungan sekitarnya, dari situ kita dapat mengenali objek, mengukur jarak, menghitung kecepatan gerakan, dan bahkan mengidentifikasi kesalahan.

Visi Komputer juga memungkinkan mesin yang ditenagai oleh AI untuk belajar dan melakukan tugas-tugas yang serupa dengan manusia. Mesin ini menggunakan kombinasi kamera, algoritma, dan data yang tersedia.

Perbedaannya adalah, berbeda dengan manusia, komputer tidak mengalami kelelahan. Mesin yang diperkuat oleh Visi Komputer dapat menganalisis ribuan aset produksi atau produk dalam hitungan menit. Ini memungkinkan pabrik untuk secara otomatis mendeteksi kesalahan pada produk-produk yang mungkin tidak terlihat oleh mata manusia.

Namun, untuk mewujudkan teknologi ini, diperlukan database yang besar. Database ini diperlukan untuk melatih komputer agar menghasilkan hasil yang akurat sesuai dengan perintah yang diberikan.

Misalnya, jika komputer diberi tugas untuk mengenali Kucing peliharaan yang sehat, diperlukan Ribuan contoh Referensi Visual tentang Kucing, indikator kesehatan, dan objek lain yang relevan dengan konsep kucing yang sehat.

B. Sejarah Visi Komputer

Ilmuwan dan insinyur telah berusaha mengembangkan cara agar mesin dapat melihat dan memahami data visual selama sekitar 60 Tahun. Percobaan dimulai pada tahun 1959 ketika Neurofisiolog menghadapkan gambar-gambar pada kucing, berusaha menghubungkan respons dalam otaknya. Mereka menemukan bahwa kucing merespons terlebih dahulu terhadap tepi atau garis keras, dan secara ilmiah, hal ini berarti bahwa pemrosesan gambar dimulai dengan bentuk-bentuk sederhana seperti garis lurus.

Pada waktu yang hampir bersamaan, teknologi pemindaian gambar komputer pertama kali dikembangkan, memungkinkan komputer untuk mendigitalkan dan mendapatkan gambar. Capaian lain dicapai pada tahun 1963 ketika komputer mampu mengubah gambar dua dimensi menjadi bentuk tiga dimensi. Pada tahun 1960-an, kecerdasan buatan muncul sebagai bidang studi akademis, dan ini juga menandai awal pencarian kecerdasan buatan untuk memecahkan masalah penglihatan manusia.

Pada tahun 1974, diperkenalkan teknologi pengenalan karakter optik (OCR), yang dapat mengenali teks yang dicetak dalam font atau jenis huruf apa pun. Demikian pula, pengenalan karakter cerdas (ICR) dapat memecahkan teks tulisan tangan menggunakan jaringan saraf. Sejak itu, OCR dan ICR telah masuk ke dalam pemrosesan dokumen dan faktur, pengenalan pelat kendaraan, pembayaran seluler, terjemahan mesin, dan aplikasi umum lainnya.

Pada tahun 1982, ilmuwan neurologi David Marr menetapkan bahwa penglihatan bekerja secara hierarkis dan memperkenalkan algoritma bagi mesin untuk mendeteksi tepi, sudut, lengkungan, dan bentuk dasar serupa. Secara bersamaan, ilmuwan komputer Kunihiko Fukushima mengembangkan jaringan sel yang dapat mengenali pola. Jaringan tersebut, disebut Neocognitron, termasuk lapisan konvolusi dalam jaringan saraf.

Pada tahun 2000, fokus studi berada pada pengenalan objek, dan pada tahun 2001, aplikasi pengenalan wajah waktu nyata pertama kali muncul. Standarisasi tentang bagaimana set data visual diberi tag dan di-annotasi muncul pada tahun 2000-an. Pada tahun 2010, set data ImageNet menjadi tersedia. Ini berisi jutaan gambar yang diberi tag dalam seribu kelas objek dan memberikan dasar untuk model CNN dan deep learning yang digunakan saat ini. Pada tahun 2012, tim dari Universitas Toronto memasukkan CNN ke dalam kontes pengenalan gambar. Model tersebut, yang disebut AlexNet, secara signifikan mengurangi tingkat kesalahan dalam pengenalan gambar. Setelah terobosan ini, tingkat kesalahan telah turun menjadi hanya beberapa persen.

C. Fungsi Visi Komputer

Nah, sebenarnya apa saja fungsi yang dapat diemban oleh teknologi visi komputer? Berikut adalah tiga peran utamanya.

1. Sumber Informasi

Teknologi visi komputer memiliki kemampuan untuk memberikan informasi yang lebih rinci tentang objek tertentu. Ini bisa menjadi sumber data yang berharga bagi individu. Sebagai contoh, penggunaan kamera untuk mengambil gambar objek dengan kualitas tinggi.

2. Analisis Proses Berkelanjutan

Salah satu contoh penggunaan teknologi visi komputer adalah pada perangkat pemindai (scanner). Kinerja perangkat ini meliputi tahapan pertama yaitu pengambilan gambar kode batang (barcode). Namun, ini hanya merupakan langkah awal, karena ada proses yang berlanjut setelahnya.

Setelah gambar diambil, sistem akan memproses langkah selanjutnya seperti penyimpanan data. Di samping itu, dilakukan pencocokan antara kode batang dengan data yang telah tersimpan sebelumnya.

3. Meningkatkan Kualitas Gambar

Visi komputer juga memiliki manfaat dalam meningkatkan proses produksi barang, karena dapat memahami langkah-langkah yang perlu diambil. Ini terkait erat dengan teknologi kecerdasan buatan (AI), yang juga digunakan untuk meningkatkan kualitas gambar.

Gambar yang diambil melalui kamera akan memiliki kejernihan lebih tinggi berkat fitur pemrosesan gambar. Ini memungkinkan pengguna untuk memberikan instruksi pada peningkatan kualitas gambar objek tertentu, dengan tujuan mengurangi gangguan visual.

D. Cara Kerja Computer Vision

Cara Kerja Visi Komputer (Computer Vision)

Mekanisme operasi visi komputer adalah meniru operasi visual manusia. Manusia melihat objek melalui mata, dan kemudian citra yang ditangkap oleh mata diteruskan ke otak. Otak kemudian memproses dan menerjemahkan informasi tersebut untuk mengambil keputusan.

Sebagai contoh, ketika manusia melihat bahaya di depan, akan mengambil keputusan untuk menghindar. Begitu juga dalam menyapa atau tersenyum. Prinsip ini dicontohkan dalam implementasi visi komputer, seperti dalam proses pemindaian kode QR.

Ketika proses pemindaian sedang berjalan, kode diidentifikasi untuk melaksanakan instruksi tertentu. Contohnya, saat kamu login ke WhatsApp menggunakan kode batang, melakukan pembayaran melalui dompet digital, dan lain sebagainya. Secara garis besar, cara kerja visi komputer dapat dibagi menjadi 3 (Tiga) Tahap Utama, yaitu :

  • Tahap pertama adalah pengambilan citra digital setelah perolehannya.
  • Tahap berikutnya adalah pemrosesan citra untuk mengubah data.
  • Tahap terakhir adalah analisis. Analisis ini melibatkan interpretasi citra dengan hasil dari pemrosesan sebelumnya. Ini bertujuan untuk menghasilkan keputusan spesifik seperti gambar, data, pengendalian, dan sejenisnya.

E. Penerapan dan Aplikasi Computer Vision

1. Bidang AI

Bidang AI mengaplikasikan teknologi visi komputer dalam sejumlah skenario, mulai dari pemindaian robot hingga pemindaian foto serta absensi sidik jari. Ini memberikan otomatisasi yang signifikan dalam berbagai situasi, yang pada akhirnya meringankan beban tugas manusia.

Contoh yang dapat dicontohkan dalam ranah AI dengan penerapan visi komputer adalah Fitur Pengenalan Wajah (Face ID). Aplikasi ini mengunci perangkat smartphone dengan menggunakan wajah pengguna sebagai kunci pembuka.

2. Bidang Industri

Penggunaan visi komputer dalam industri dapat dilihat dalam proses produksi barang. Bahkan, banyak industri saat ini mengadopsi teknologi ini dalam proses sortir.

Contoh aplikasi dalam industri manufaktur adalah untuk mengidentifikasi cacat produksi. Teknologi ini memonitor proses kemasan hingga memastikan kualitas produk untuk mengurangi jumlah produk yang tidak memenuhi standar.

3. Bidang Otomotif

Teknologi visi komputer digunakan dalam sensor parkir otomatis, yang membantu mengidentifikasi hambatan keras di sekitar area parkir agar dapat dihindari. Ketika mobil mendekati hambatan, alarm peringatan secara otomatis akan berbunyi.

Dalam industri otomotif, visi komputer juga diterapkan dalam sistem pilot otomatis pada pesawat. Sistem navigasi pesawat juga memanfaatkan teknologi visi komputer.

Contoh penerapan visi komputer dalam otomotif adalah mobil otonom. Aplikasi ini mampu mengenali objek di jalan, termasuk rambu lalu lintas. Beberapa perusahaan seperti BMW, Volvo, dan Tesla telah mengadopsi teknologi ini.

4. Bidang Medis

Visi komputer digunakan dalam bidang medis, seperti penggunaan perangkat Sinar-X, Gambar Ultrasonik, dan Tomografi. Ini memungkinkan dokter untuk mendiagnosis penyakit dalam tubuh manusia tanpa perlu melakukan pembedahan.

F. Contoh Penggunaan Visi Komputer (Computer Vision)

Di bawah ini diberikan contoh produk dari perusahaan yang menerapkan Computer Vision, menunjukkan potensi AI untuk mendukung berbagai industri:

1. Google Translate

Input Gambar di Google Translate

Pada Tahun 2015, Google mengeluarkan layanan penerjemahan yaitu Google Translate yang memanfaatkan Computer Vision melalui kamera pada smartphone. Saat mengakses aplikasi Google Translate, kita disajikan opsi Scan Text. Prinsip kerjanya adalah ketika kamera digunakan untuk mendeteksi teks, kemudian menerjemahkannya ke bahasa pilihan kita.

2. Foto 3D Facebook

Diluncurkan pada 2018, Foto 3D Facebook mengubah foto biasa menjadi gambar tiga dimensi. Pengguna dapat memutar, memiringkan, atau memindahkannya pada perangkat cerdas mereka untuk melihat gambar dari berbagai sudut. Proses ini memanfaatkan pembelajaran mesin untuk menghasilkan gambar tiga dimensi dari objek dalam foto. Hasilnya, efek tiga dimensi yang terlihat nyata teraplikasi pada gambar.

3. FaceApp

FaceApp adalah aplikasi populer yang mengubah wajah manusia pada input visual dengan mengubah jenis kelamin, usia, dan fitur lainnya. Ini dicapai melalui penggunaan jaringan neural konvolusi dalam visi komputer. FaceApp mengumpulkan sampel data dari pengguna smartphone dan menggunakannya dalam jaringan saraf. Ini memungkinkan sistem 'mempelajari' setiap detail wajah manusia. Hasil belajar ini meningkatkan kemampuan prediksi aplikasi dan membuat perubahan realistis pada gambar wajah manusia seperti kerutan dan perubahan rambut.

4. SentioScope

SentioScope adalah sistem pelacakan kesehatan dan olahraga dari Sentio. Biasanya digunakan sebagai pelacakan pemain sepak bola, memproses data visual real-time dari permainan langsung. Data yang terkumpul diunggah ke platform analitik berbasis cloud. SentioScope menggunakan kamera 4K untuk mengambil data visual. Data ini kemudian dianalisis untuk mendeteksi pemain dan memberikan wawasan waktu nyata tentang gerakan mereka.

5. Vision Intelligence

Vision Intelligence adalah produk Computer Vision yang dikembangkan oleh PT Widya Robotics dari Indonesia. Produk ini mencakup berbagai fitur seperti Pengenalan Wajah, Sistem Kehadiran Karyawan, Pengecekan Peralatan QHSE, Penghitungan Orang & Kendaraan, Deteksi Penyakit & Hama pada Tanaman, dan Pemantauan Jumlah Kelapa. Salah satu fitur yang terkenal adalah Coconut Counter yang digunakan untuk menghitung jumlah kelapa di konveyor dengan cepat dan efisien. Ini memberikan solusi bagi industri kelapa di Indonesia. Untuk informasi lebih lanjut tentang Vision Intelligence, dapat dilihat di sini.


Itulah Penjelasan tentang Visi Komputer (Computer Vision). Mohon maaf apabila ada kesalahan sedikitpun.

Terima Kasih 😄😘👌👍 :)

Wassalamu‘alaikum wr. wb.

Post a Comment

Previous Post Next Post