Hari ini saya mencoba library nodexl (nodexl.codeplex.com) sekaligus mengeksplorasi tweet para artis yang telah saya kumpulkan mulai awal Feb 2012. Tweet artis dipilih karena mereka sudah terbiasa diliput publik sehingga diasumsikan lebih menerima jika dieksplorasi datanya — semoga 🙂 . Alasan lain adalah tweet mereka banyak direspon dan sudah dikenal masyarakat.
Visualisasi social network bertujuan menggambarkan hubungan antar unit. Untuk Twitter, hubungan antar account dapat berbentuk banyak hal, mulai dari hubungan follower/friend (paling populer), retweet, favourite, mention, reply dan sebagainya. Untuk kesempatan ini saya akan menggunakan hubungan reply yang memperlihatkan adanya komunikasi atau pembicaraan antara dua account. Asumsi saya (perlu pembuktian nanti), reply dan mention adalah hubungan kuat antara dua account twitter. Retweet atau favourite bisa dilakukan dengan satu tombol dengan mudah, tapi untuk me-reply pengguna harus mengetikkan sesuatu.
Berikut adalah visualisasinya, semakin tebal garis berarti semakin banyak si-artis me-reply. Minimal ada tiga jumlah reply, kurang dari itu tidak digambarkan. Titik biru adalah artis (diambil 100 artis dengan follower terbesar), titik hitam adalah account Twitter lain. Data yang digunakan adalah tweet dari tanggal 1 Feb sampai dengan 21 Feb 2012. Klik gambar lalu zoom kalau masih tidak jelas.
Catatan yang perlu diingat sebelum dibaca lebih lanjut: (1) artis dalam artikel ini didefinisikan sebagai 100 artis dengan follower tertinggi. (2) tweet yang digunakan berada dalam periode satu bulan sehingga bisa jadi hubungan yang ada bersifat sementara. (3) tentu ada media lain yang digunakan selain melalui tweet, misalnya SMS, DM, FB, email, BBM, messenger dsb yang tentunya tidak tertangkap dalam visualiasi ini.
Beberapa hal menarik dari visualiasi di atas:
- Dua account yang paling sering menggunakan reply adalah @ti2DJ dan @erdiAN_aJI. Jumlah reply terbesar dipegang oleh @ti2DJ dengan 26 reply ke sebuah account (anaknya?). Ini menunjukkan kedua artis ini aktif menggunakan twitter sebagai media komunikasi dua arah atau lebih.
- Di sisi lain, tidak semua account menggunakan Twitter untuk komunikasi, atau kalaupun ada hanya terbatas ke beberapa orang saja. Mungkin mereka lebih memilih menggunakan DM, SMS atau messenger? Lagipula dengan jumlah follower besar, wajar kalau mereka lebih berhati-hati. Sebagai contoh @aqi_alexa hanya terhubung dengan 3 orang, dengan yang terkuat adalah @aud33y (istri).
- Dari sisi reply via tweet, hubungan antar sesama artis ternyata tidak terlalu dekat. Kecuali @ti2DJ yang terhubung dengan 8 artis, artis lain tidak terlihat atau hanya sedikit terhubung dengan sesama artis. Ada beberapa yang justru terhubung kuat dengan ‘orang biasa’ (bukan teman dan memiliki follower sedikit) yang tidak terkait dengan bidang keartisan. Informasi ini dapat digunakan untuk melihat hal yang sedang diminati oleh artis tersebut.
- Account @dahsyatnyaolga dan @jess_iskandar sepertinya artis yang paling punya hubungan yang kuat dengan penggemar fanatik. Misalnya dengan @salvia_cumaOLGA, @Icha_LoveOlga, @EmiLiaCyankOLGA dan lainnya.
Setelah mencoba-coba nodeXL dan data artis ini selama satu hari, berikut adalah beberapa hal yang saya peroleh:
- Kekuatan NodeXL adalah mudah dipelajari dan mudah digunakan karena berbasis Excel. Powerfull kalau dikombinasikan dengan SQL (jalankan query di HeidiSQL, copy paste hasilnya ke NodeXL) . Tapi masih terlalu rumit untuk diserahkan ke enduser, dan hanya jalan di Windows (non web). Gambar yang dihasilkan juga masih harus digeser-geser manual supaya lebih jelas.
- Menarik kalau ditambahkan content analysis dari komunikasi antara account. Idealnya garis yang menghubungkan dua account saat diklik dapat menampilkan rangkuman pembicaraan (keywords), sentimennya, dan juga dapat di drill down sampai ke tweet mentah.
- Perlu aspek temporal. Bagaimana kekuatan hubungan dua account dari waktu ke waktu? Mungkin ada yang menguat (menebal kalau di gambar) saat mengerjakan proyek bersama, mungkin ada juga yang tiba-tiba dari kuat lalu menghilang (putus/bertengkar). Akan bagus kalau untuk satu account dapat di-play selama 1 tahun misalnya sehingga terlihat pergerakan hubungannya dengan account lain.
- Perlu tools untuk melihat sekilas isi sebuah account. Saat ini langkah manual yang saya lakukan adalah: melihat garis yang tebal yang menandakan hubungan yang kuat. Lalu lihat siapa, copy-paste di Twitter untuk dicari, lihat deskrpsi dan tweet orang tersebut, dan googling jika diperlkukanuntuk menentukan kira-kira dia siapa. Akan lebih enak kalau ada tools yang membantu semua proses itu. Yap saya memang pemalas 🙂
Data yang dianalisis pada posting ini adalah tweet para artis. Selain data ini, saya juga mengumpulkan tweet dari orang lain yang berkaitan dengan artis (mention). Jumlahnya tentu lebih besar, mungkin lebih menarik lagi nanti hasil analisisnya.
ngumpulinnya ini pakai apa pak?
Search API-nya Twitter, lalu dimasukkan ke database.
Pak, rekomendasi tools selain node xl apa ya? yg jg mudah di mengerti untuk pemula. terimakasih
Setahu saya nodexl yang paling mudah.
sbnarnya untuk tugas pak, dan teman saya sudah memilih node xl. toolnya harus berbeda-beda dan saya bingung mau menggunakan tool apa. terimakasih bantuannya
Coba lihat ini (mulai halaman 17) http://www.slideshare.net/david.combe/a-comparative-study-of-social-network-analysis-tools
Yg lebih lengkap: http://en.wikipedia.org/wiki/Social_network_analysis_software
trmakasih banyak pak
Mau mau tanya bagamana pada nlp bahasa indonesai pada tahap pre proses dengan input opini tweet berbahasa indonesia bsa terdeteksi jg menggnakan kata2 singkatan?
Di-replace dulu kata-kata singkatannya dengan kata-kata yang ‘normal’.
mw tanya ada langkah2 pembuatannya smpai memunculkan visualisasinya gk pak?