Setelah Mendapatkan Hasil Survei Salient Area, Lalu Apa Lagi?

Sebuah penelitian telah merancang aplikasi yang bisa dijadikan alat bantu untuk menentukan salient area pada sebuah video. Aplikasi ini diimplementasikan dalam sebuah survei salient area. Responden akan menonton video yang diputar di dalam aplikasi. Kemudian, reponden diminta untuk menggerakkan kursor pada bagian video yang mereka anggap paling menarik. Posisi kursor pada setiap frame video akan disimpan dalam database untuk diolah lebih lanjut. Jumlah data yang hasil survei akan bergantung pada durasi video, frame rate video, dan jumlah responden.

Jumlah data = Durasi video x Frame rate video x Jumlah responden

Setelah hasil survei salient area ini didapatkan, lalu apa langkah selanjutnya?

Langkah selanjutnya adalah pengolahan data untuk mendapatkan salient area dari video tersebut. Jika ada 25 responden menonton 15 detik video dengan frame rate  30 fps, maka jumlah data yang diolah adalah 11250. Setiap frame akan memiliki 25 koordinat kursor sebagai representasi salient area menurut sudut pandang responden. Ilustrasinya ditampilkan pada Gambar 1. Titik koordinat ini tersebar pada frame video sesuai dengan posisi kursor dari setiap responden.

1

Gambar 1

Untuk mendapatkan salient area dari frame tersebut, titik koordinat diproses dengan metoda clustering. Metoda clustering digunakan untuk mengelompokkan titik-titik koordinat dari responden. Pengelompokan dilakukan berdasarkan kedekatan antar satu titik dengan titik lainnya. Salient area dinyatakan sebagai kelompok yang memiliki anggota terbanyak dari kelompok titik koordinat yang terbentuk.

Salah satu metoda clustering adalah K-Means. Sesuai dengan nama metodanya, setiap kelompok akan dibentuk berdasarkan titik K atau titik pusat cluster. Setiap titik koordinat akan diukur jaraknya dengan titik pusat cluster ini. Jarak titik koordinat dengan setiap titik pusat cluster akan dibandingkan. Dari perbandingan ini akan dipilih jarak terdekat. Titik koordinat tersebut akan dikelompokkan ke cluster yang dibentuk titik pusat cluster tersebut. Ilustrasi hasil clustering ditampilkan pada Gambar 2. Pada Gambar 2, jumlah titik pusat cluster (K) adalah 3.

1

Gambar 2

Darimana nilai K ditentukan? Sebelum menjawab pertanyaan ini mari kita coba analisa apa pengaruh nilai K. Semakin besar nilai K maka semakin banyak cluster yang terbentuk. Akibatnya, setiap titik koordinat bisa dikategorikan lebih spesifik. Repotnya, tidak ada cluster yang memiliki anggota yang lebih signifikan satu sama lain. Sehingga, penentuan salient area akan sulit dan cenderung rancu. Sebaliknya, jika nilai K terlalu kecil, titik koordinat akan “dipaksa” untuk masuk ke cluster tertentu. Padahal, jarak titik koordinat tersebut dengan titik pusat cluster tidak terlalu dekat.

Salah satu cara menentukan nilai K yang sesuai dapat dilakukan dengan perhitungan Davies–Bouldin Index (DBI). Sederhananya, DBI mengindikasikan nilai K optimal untuk sebuah set data.

Kembali ke kasus video, setiap koordinat pada video frame akan dicluster. Variasi nilai K diterapkan pada proses clustering ini. Idealnya setiap frame akan memiliki nilai K optimal yang berbeda satu sama lain. Namun, dalam sudut pandang sebagai sebuah video, tentunya bisa ditetapkan video tersebut lebih sesuai untuk diclustering dengan nilai K tertentu. Hal ini bisa dilakukan dengan menghitung jumlah K optimal yang lebih sering muncul pada setiap frame.

Hal ini juga terkait dengan berapa jumlah salient area pada video tersebut. Jika ada sebuah video yang menampilkan dua pembaca berita maka idealnya akan ada dua salient area yang fokus pada kepala pembaca berita. Sehingga, K=2 adalah K optimum yang cocok untuk video tersebut. Yang menjadi tantangannya, mana diantara kedua salient area itu yang lebih “salient”?

Seperti yang telah disebutkan dibagian awal tulisan, cluster yang memiliki anggota terbanyak merupakan salient area frame video tersebut. Bisa saja, setiap frame akan memiliki anggota terbanyak yang berbeda-beda. Namun, itulah uniknya video. Seberapa cepat mata manusia bisa mendeteksi bagian paling menarik dari sebuah gambar yang dimainkan secara cepat. Ilustrasi anggota terbanyak dari frame pada Gambar 2 ditampilkan pada Gambar 3.

1

Gambar 3

Jadi, tujuan tulisan ini dibuat adalah memberikan gambaran analisa yang bisa dilakukan setelah mendapatkan hasil survei salient area. Ringkasannya sebagai berikut:

1. Analisa K optimal untuk hasil titik koordinat pada setiap video frame

2. Simpulkan hubungan K optimal pada setiap frame dengan K optimal untuk keseluruhan video

3. Analisa hubungan K optimal untuk keseluruhan video dengan salient area pada video

4. Analisa hubungan salient area dengan konten video yang digunakan

5. Analisa kejadian-kejadian khusus/unik yang terjadi selama survei

Dan sesuai kutipan dari Albert Einstein:

“If you can’t explain it simply, you don’t understand it well enough.”

Leave a Reply

Your email address will not be published. Required fields are marked *