home

Bakawan Web Design

i'm sorry we forgot easily

 

Pencurian Konten ilegal dan Masalah Duplikasi

Semenjak Masalah konten duplikat itu menjadi topik panas webmasters, sy rasa akan menjadi sesuatu yg berguna seandainya sy mencoba membahas hal tersebut lebih jauh lagi. Terlebih sy kadang sering juga membahas hal ini pada blog webmaster kami ini dalam beberapa posting terpisah.

Latar Belakang Masalah

Sebelum melanjutkan pembahasan, sebaiknya kita memahami terlebih dahulu dasar pemikiran dan latar belakang masalah yg sering dibahas : Dalam banyak kasus, webmaster tidak memiliki kuasa apapun pada third party software aggregators atau sejenisnya yg memunguti dan mendistribusi konten kita tanpa ijin webmasters. Hal ini tidak sepenuhnya kesalahan webmasters bila ternyata konten identik kepunyaannya muncul pada beberapa situs.

Ketidaksengajaan ini juga pada dasarnya bukan sebuah pelanggaran atas webmaster guidelines. Masalah ini nantinya akan diproses lebih lanjut oleh google dengan tujuan menemukan dan menentukan sumber asli konten duplikat tsb. Kebetulan sekali kalau usaha detektif ini merupakan salah satu spesialisasi google (sebagaimana juga yang google pernah buktikan dengan dikembangkannya pada sistem pencarian video youtube sehingga mampu mengenali mana saja video duplikat dari video yg asli). Dan dalam banyak sengketa keaslian atau otentitas, konten asli dapat diidentifikasi dengan benar, menyebabkan pemisahan pasti mana konten asli dan mana konten duplikat.

Jenis Konten Duplikat

Umumnya Kita bisa membedakan 2 jenis duplikat konten berdasar penyebab mengapa konten duplikat bisa terjadi

  1. Konten Duplikat pada domain serupa : Konten identik, yg mana biasanya tak disengaja, muncul pada lebih dari satu tempat pada situs kamu
  2. Konten Duplikat pada domain berbeda : Konten identik situs kamu yg mana muncul (lagi, dan biasanya juga tanpa niat sengaja) pada situs diluar situs kepnyaan kamu.

Pada jenis konten pertama, kamu dapat menyelesaikan masalah dengan menyuruh spider google untuk tidak mengindex situs kamu. Tips Google seputar penyelesaian masalah konten duplikat ini adalah dengan menjelaskan versi URL manakah yg kamu inginkan antara 2 konten identik dan meletakkan informasi tsb pada file sitemap. Andai kata, nantinya, spider berhadapan dengan halaman website berbeda dengan konten serupa, dengan cepat google index memilih versi yg paling kamu inginkan untuk dimasukkan ke dalam daftar index.

Pada tipe konten kedua, kamu mungkin mengalami masalah saat seseorang mencuri konten kamu dan meletakkannya ke dalam situs berbeda (umumnya dengan tujuan untuk menjadikannya konten mengejar uang haram). Juga merupakan praktem umum, web proxy mengindex sebagian bagian website yg telah diakses menggunakan proxy. Saat menghadapi masalah konten duplikat pada domain berbeda, google menganalisa beberapa variabel khusus dalam menentukan situs manakah yg merupakan sumber asli. Analisa ini juga bisa diartikan sebagai sinyal google bagi blogger agar mereka tidak risau atas keberadaan situs kamu seandainya ada seseorang pencuri konten mencuri atau mencomot atau mengutip atau mencontek konten kamu secara semena mena.

Feed dan Search Engine Bot

Seandainya saat kamu sindikasi konten blog. Namun juga ingin menegaskan kalau website kamu adalah sumber asli konten, maka sangat berguna bila ingin setting feed kamu itu tidak bisa diindex. Ambil contoh, Feedburner, memiliki fasilitas semacam ini dimana pemilik feed bisa melarang dan mengijinkan spider mengindex kumpulan feed artikel kita. Seandainnya ternyata third party feed kamu itu tidak memiliki fitur anti bot maka ada baiknya meletakkan link rujukan ke situs konten asli kamu. Dengan begitu spider google tetap mengetahui halaman sumber feed tsb.

Rangking Konten Curian

Sebagian webmaster yg sy kenal pernah menanyakan apakah yg menyebabkan konten curian itu bisa dirangking lebih tinggi dari situs asli. Menurut google, situasi abnormal ini cuma anomali (kasus yg jarang terjadi). Namun seandainya hal ini terjadi maka lakukan langkah penyelidikan berikut ini :

  1. Cek apakah konten kamu bisa diakses crawler google. Bisa jadi tanpa disadari akses pada beberapa konten website kamu telah diblok robot.txt
  2. Kamu dapat melihat pada file sitemap untuk melihat apakah kamu pernah mengupdate konten yg dicuri tersebut.
  3. Periksa apakah website telah sesuai dengan panduan webmaster yg baik dan benar lagi jujur dan ngak main curang hehehe

Kesimpulan

Sebagai penutup tulisan, perlu diingat kalau konten yg terduplikasi itu bukan berarti akan memiliki efek negatif pada situs kamu. Konten curian tsb nantinya juga akan difilter. Bila kita kembali mengecek beberapa tips index google barusan, kita bisa belajar memiliki kontrol atas apa yang google crawl dan index dan versi apakah yg akan tampil di hasil pencarian search engine (SERP, Search Engine Result Page).

Namun seandainya terdapat sinyal negatif yg menunjukkan kalau adanya niat jahat dan sengaja, kemunculan konten duplikat mungkin akan dianggap sebagai pelanggaran atas panduan webmaster Google. Jadi bersiaplah dengan pinalti, Seandainya hal tersebut sampai terjadi hehehe rasain lu! Mungkin sy sendiri juga sudah jadi korban pencuri internet ini.

Tags: , , ,

Related Posting

13 Responses to “Pencurian Konten ilegal dan Masalah Duplikasi”

  1. mang kumlod on November 13th, 2008 11:25 am

    Kalau post yg ini, gw sedikit ga mudeng… :P

    waduh sori atuh kang :D

  2. utchanovsky on November 14th, 2008 12:48 am

    Hell yeah!!!

    Google Rules!!!

    We love your oppression :lol:

    hehehe sebagai rakyat jelata, kami menunggu dan menanti dengan mata merah dan perut lapar :D

  3. Bayou on November 14th, 2008 6:53 am

    Jadi intinya google lagi ya…

    iya :D

  4. dani on February 6th, 2009 12:17 am

    bs jg lapor ke google sp*m-report :lol:

    iya mas. Kadang karena masalah ini kita cuma bisa tawa aja deh :D

  5. Bakawan Web Design | Scraper Sites on April 15th, 2009 12:53 pm

    [...] original. Situs yg open conten seperti wikipedia.org, ask.com, dan answers.com adalah sumber utama pencurian konten yg dilakukan situs scraper. Seiring perkembangan bisnis google dan bisnis adsense, scraper sites berkembangbiak dalam jumlah [...]

  6. Bakawan Web Design | Tutorial Network Unreachable, robots.txt, dan Duplicate Content on April 19th, 2009 7:55 pm

    [...] kriminal, dan bot sampah dunia elektronik lainnya yg mencuri konten kita secara otomatis. Read pencurian konten ilegal dan masalah duplikasi Jadi untuk sepenuhnya memblok mereka dibutuhkan lebih dari sekedar rambu tapi pentungan redirect [...]

  7. Quick SEO Tips : Hindari Duplikasi Konten | Bakawan Web Design on May 20th, 2009 7:38 pm

    [...] Pencurian Konten Ilegal dan masalah duplikasi [...]

  8. Feed Readers and Aggregators | Bakawan Web Design on May 27th, 2009 12:55 pm

    [...] sering dipakai pencuri konten yg membuat masalah duplikasi. see Pencurian Konten ilegal dan Masalah Duplikasi. Jakarta Commons adalah library komponen java yg banyak digunakan. Penjelasan mengenai feedreader [...]

  9. Korban on September 16th, 2009 2:47 pm

    Pak, sekarang keadaannya lain, tidak lagi anomali kalau soal ranking. Konten curian menempati posisi #1 di SERP Google. Coba saja lihat situs iklanbarisgratis.info yang isinya adalah hasil search semua, url yg diindex adalah iklanbarisgratis.info/search/.

    Ini secara tidak langsung mencuri konten orang dengan alasan hasil search, tapi kan tetap diindex Google.

    Perlahan-lahan situs ini mulai mengalahkan ranking dari situs yg memuat konten asli.

    Kebetulan di situs itu ditulis siapa pemiliknya. Sayang dia tinggal di daerah lain. Aku bersumpah akan mengumpulkan biaya untuk pergi membunuh pemiliknya.

Leave a Reply




Validated by HTML Validator (based on Tidy)
  1. .:.