Scraping kontenalias web scraping, web harvesting, web data mining dll.) adalah prosedur untuk menyalin data dari situs web. The "scrapers" (wiper) konten adalah orang atau perangkat lunak yang menyalin data. Mengikis web bukanlah hal yang buruk.

Faktanya, semua browser web pada dasarnya adalah pengikis konten. Ada banyak tujuan yang sah untuk melakukan scraping konten, seperti pengindeksan web untuk mesin telusur, misalnya.

Lihat artikel kami di Cara menghentikan Google mengindeks blog WordPress Anda

Perhatian sebenarnya adalah apakah pengikis konten di situs web Anda berbahaya atau tidak. Pesaing mungkin ingin mencuri konten Anda dan mempublikasikannya sebagai milik mereka. Jika Anda dapat memberi tahu pengguna yang sah dari penjahat, Anda memiliki peluang lebih baik untuk melindungi diri sendiri. Artikel ini menjelaskan dasar-dasar pengikisan web, serta beberapa metode untuk menghilangkannya (atau setidaknya mengurangi kepentingannya).

Tetapi sebelumnya, jika Anda belum pernah menginstal WordPress temukan Cara memasang blog WordPress dalam 7 langkah et Bagaimana menemukan, menginstal dan mengaktifkan tema WordPress di blog Anda 

Lalu kembali ke mengapa kita ada di sini.

Jenis pencakar konten

Ada banyak cara berbeda bagi pengikis konten untuk mengunduh data. Penting untuk mengetahui berbagai metode dan teknologi yang mereka gunakan. Metodenya berkisar dari teknologi rendah (seseorang secara manual menyalin dan menempelkan konten) ke robot canggih (perangkat lunak otomatis yang mampu mensimulasikan aktivitas manusia di browser). Berikut ini ringkasan yang harus Anda lakukan:

  • Laba-laba: Perayapan web adalah bagian besar dari cara kerja pengikis konten. Seekor laba-laba Googlebot akan mulai dengan mengambil satu halaman web, dan pergi dari tautan ke tautan untuk mengunduh laman web.
  • Shell Scripts: Anda dapat menggunakan Linux Shell untuk membuat pengikis konten dengan skrip seperti GNU Wget untuk mengunduh konten.
  • Pengeruk HTML: mereka mirip dengan skrip shell. Jenis pengikis ini sangat umum. Ia bekerja dengan mendapatkan struktur HTML situs web untuk menemukan data.
  • Layar tampilan: Penghapus layar adalah program yang menangkap data dari situs web dengan meniru perilaku pengguna manusia yang menggunakan komputer untuk menjelajahi Internet.
  • Salinan manusia: Di sinilah seseorang menyalin konten dari situs web Anda secara manual. Jika Anda pernah memposting online, Anda mungkin memperhatikan bahwa plagiarisme marak. Setelah sanjungan awal hilang, kenyataan bahwa seseorang mendapat untung dari pekerjaan Anda cocok.

Ada beberapa cara untuk melakukan hal yang sama. Kategori pencakar yang tercantum di atas bukanlah daftar yang lengkap. Selain itu, ada banyak tumpang tindih antara kategori.

Baca juga artikel kami di Bagaimana dan mengapa audit kualitatif konten Anda

Cara melindungi blog Anda

Lindungi blog dari pengikis konten

1. Batasan dan pemblokiran nilai

Anda dapat melawan banyak bot dengan mendeteksi masalahnya terlebih dahulu. Ini adalah tipikal robot otomatis untuk spam server Anda dengan jumlah permintaan yang sangat tinggi. Rate throttling, seperti namanya, membatasi permintaan server dari klien individu dengan menetapkan aturan.

Anda dapat melakukan hal-hal seperti mengukur milidetik antar permintaan. Jika interaksi dengan situs web Anda terlalu cepat, maka Anda tahu itu bot. Kemudian blokir alamat IP ini. Anda dapat memblokir alamat IP berdasarkan sejumlah kriteria, termasuk negara asalnya.

2. Pendaftaran dan koneksi

Pendaftaran dan login adalah cara populer untuk menjaga konten agar tidak dilihat orang yang mengintip. Anda dapat menghalangi kemajuan robot. Yang perlu Anda lakukan adalah membuat akses ke konten Anda bergantung pada koneksi. Dasar-dasar keamanan login berlaku di sini. Ingatlah bahwa halaman yang membutuhkan registrasi dan login tidak akan diindeks oleh mesin pencari.

3. Honeypots dan data palsu

Dalam ilmu komputer, "honeypots" adalah operasi virtual. Anda mengumpulkan penyerang potensial dengan mengatur jebakan dengan honeypot, untuk mendeteksi lalu lintas dari pencakar konten. Ada banyak cara untuk melakukan ini.

Misalnya, Anda dapat menambahkan tautan tak terlihat di halaman web Anda. Selanjutnya, buat algoritme yang memblokir alamat IP klien yang mengklik link tersebut. Honeypots yang lebih canggih bisa jadi sulit diatur dan dipelihara. Kabar baiknya adalah ada banyak proyek Honeypot open source di luar sana. Lihat ini bagus daftar honeypots mengagumkan di github.

4. Gunakan CAPTCHA

Captcha berarti " Benar-benar tes Automated Public Turing untuk memberitahu Komputer dan Manusia Selain pada dasarnya, tes untuk mengetahui perbedaan antara manusia dan robot. Captcha bisa membosankan, tetapi juga berguna. Anda dapat menggunakan a untuk memblokir area yang menurut Anda mungkin ingin ditargetkan oleh bot, seperti tombol email di formulir kontak. Ada banyak plugin Captcha bagus yang tersedia di WordPress, termasuk “ Captcha Dari Jetpack.

Temukan juga beberapa plugin WordPress premium  

Anda dapat menggunakan yang lain plugin WordPress untuk memberikan tampilan yang modern dan untuk mengoptimalkan penanganan blog atau website Anda.

Kami menawarkan kepada Anda beberapa plugin WordPress premium yang akan membantu Anda melakukannya.

1. Stripe untuk Arforms

ARForms memiliki ekstensi baru yang menerima pembayaran melalui gateway pembayaran Stripe. Ini disebut "ARForms Stripe". Yang terakhir ini mengintegrasikan input formulir dan pembayaran ke dalam satu proses.

Garis untuk arform

Vous pouvez pelanggan tagihan dengan jumlah dinamis langsung setelah pengiriman formulir ARForms.

Baca juga artikel kami di Cara menggunakan Stripe di WooCommerce dan Mudah Digital Unduh

Anda hanya perlu membuat formulir dengan ARForms, konfigurasikan dengan Stripe dan semuanya selesai! Anda dapat mengatur pembayaran dengan Stripe dalam waktu singkat.

Download | Demo | Hébergement Web

2. Aliran Sosial AXE

Jika Anda ingin tampilkan beberapa umpan media sosial di situs web Anda, lalu plugin Papan Sosial WordPress akan memungkinkan Anda melakukan ini dengan memberi Anda enam cara untuk melihat aktivitas akun Anda. Anda juga akan mendapatkan keuntungan dari dukungan untuk 17 jejaring sosial, dan beberapa tata letak yang dapat disesuaikan.

Plugin wordpress aliran sosial kapak

Fitur-fiturnya antara lain: 6 mode tampilan umpan berbeda, dukungan untuk sebagian besar jejaring sosial, tata letak responsif penuh, dukungan untuk spanduk iklan, Dukungan multibahasa, manajer tema, dokumentasi terperinci, dll ...

Download | Demo | Hébergement Web

3. Peta Dunia Interaktif

Peta Dunia Interaktif membantu Anda membuat peta geolokasi sebanyak yang Anda inginkan, benua, negara atau kawasan… dan ini dengan penanda interaktif dan berwarna.

Peta Dunia interaktif

Ini kompatibel dengan versi terbaru WordPress dan sangat cocok dengan Plugin Komposer Visual.

Temukan kami Plugin 8 WordPress untuk menyesuaikan tampilan situs web Anda

Berkat Interactive World Maps, Anda akan dapat menampilkan beberapa jenis wilayah seperti: peta seluruh dunia, benua atau anak benua, negara, dan banyak lagi.

Download Demo | Hébergement Web

Sumber daya lain yang direkomendasikan

Kami juga mengundang Anda untuk berkonsultasi dengan sumber daya di bawah ini untuk melangkah lebih jauh dalam cengkeraman dan kontrol situs web dan blog Anda.

Kesimpulan

Here! Itu saja untuk tutorial ini, saya harap ini akan membantu Anda menyiapkan daftar tugas praktis untuk melindungi Anda secara efektif blog WordPressmerasa bebas untuk bagikan tip dengan teman-teman Anda di jejaring sosial Anda.

Namun, Anda juga akan dapat berkonsultasi dengan kami ressources, jika Anda memerlukan lebih banyak elemen untuk melaksanakan proyek pembuatan situs Internet Anda, dengan membaca panduan kami di Pembuatan blog WordPress.

Namun, sementara itu, beri tahu kami tentang file komentar dan saran di bagian khusus.

...