Sebuah file robots.txt membatasi akses ke situs Anda dengan robot mesin pencari yang merangkak web. Bot ini otomatis, dan sebelum mereka mengakses halaman situs, mereka memeriksa untuk melihat apakah file robots.txt ada yang mencegah mereka mengakses halaman tertentu. ( Semua robot akan menghormati arahan dalam file robots.txt, meskipun beberapa mungkin menafsirkannya secara berbeda. Namun, robots.txt tidak berlaku, dan beberapa spammer dan pembuat onar lainnya dapat mengabaikannya. Untuk alasan ini, kami sarankan sandi melindungi informasi rahasia.)
Untuk melihat URL Google telah diblokir dari merangkak, kunjungi halaman URL yang Diblokir dari bagian Crawl dari Webmaster Tools.
Anda perlu file robots.txt hanya jika situs Anda termasuk konten yang Anda tidak ingin mesin pencari untuk mengindeks. Jika Anda ingin mesin pencari untuk mengindeks segala sesuatu di situs Anda, Anda tidak perlu file robots.txt (bahkan juga halaman kosong).
Meskipun Google tidak akan mengindeks konten halaman yang diblokir oleh robots.txt, kita mungkin masih indeks URL jika kita menemukan mereka di halaman lain di web. Akibatnya, URL halaman dan, berpotensi, informasi publik lainnya seperti jangkar teks dalam link ke situs, atau judul dari Open Directory Project (www.dmoz.org), dapat muncul dalam hasil pencarian Google.
Untuk menggunakan file robots.txt, Anda harus memiliki akses ke root domain Anda (jika Anda tidak yakin, periksa dengan hoster web Anda). Jika Anda tidak memiliki akses ke root domain, Anda dapat membatasi akses dengan menggunakan robot tag meta.
Untuk sepenuhnya mencegah isi suatu halaman dari yang tercantum dalam indeks web Google bahkan jika link ke situs lain itu, menggunakan meta tag noindex atau x-robot-tag. Selama Googlebot menjemput halaman, itu akan melihat meta tag noindex dan mencegah laman tersebut ditampilkan di indeks web. header HTTP x-robot-tag sangat berguna jika Anda ingin membatasi pengindeksan file non-HTML seperti grafis atau jenis lain dari dokumen.
Sumber
Baca Juga Cara Membuat Robot Text Untuk Blogger
Thứ Bảy, 18 tháng 1, 2014
Đăng ký:
Đăng Nhận xét (Atom)
Bài đăng phổ biến
-
Want to check your Gmail inbox without pointing and clicking? You’ll barely have to touch your mouse with these handy keyboard shortcuts a...
-
A recently updated and fresh list of top 10, top 50, and top 100+ best and free online ads posting classified ads websites around the int...
-
You’ve heard of that clothing line called “Life is Good,” right? That Jake character has it goin’ on! His glass is half-full, and the dude j...
-
Once your contacts are all loaded into your Google account, they’ll sync automatically with your Android handset, and presto! You’re all s...
-
Developing and releasing a mobile app can be an expensive and time-consuming project. But the work does not end once the programmers figure ...
-
Sometimes SEOs and site owners encounter the problem of their sites suddenly going down in the search engine results pages for no particular...
-
People who have been in the internet marketing world for years know how dynamic SEO marketing tips can be. In 2016, the keyword-stuffing hab...
-
Malvertising is a word that has been bouncing around the internet for a while now. It refers to an increasingly common type of online hack,...
-
When you turn on the Priority Inbox feature in Gmail, Google separates your email into three categories: Important and unread, Starred, an...
-
Got a PDF form you need to fill out? The new “Mountain Lion” update for the Mac comes with a clever trick up its sleeves: the ability to f...

0 nhận xét:
Đăng nhận xét