InternetBlogs

Carane mbusak situs utawa pecahan saka indeks Google

Miturut konsep indeksasi diadopsi dening Google, nyumbang kanggo nggenepi, objectivity saka informasi lan aturan kanggo query panelusuran ing ditokake saka asil. Yen indeks tumiba situs karo isi ilegal, utawa sumber kanggo spam, kaca Situs iki ora bakal ditandhani ing search engine umum database. Kanggo kita iku penting kanggo mangerteni carane mbusak situs saka ditokake saka asil saka server panelusuran.

Varian saka nul indeksasi Google

Sawise robot search - program kanggo ngumpulake informasi bab sumber - bakal mindai kaca situs dening kaca, banjur, nalika ing syarat privasi Google parsing, iku bakal indeks. Nanging kita uga nuduhake sampeyan carane mbusak situs utawa pecahan kanggo mesin liwat robots.txt - indeks lan nelusuri ing wektu sing padha mandeg.

Kanggo ngilangi saka ditokake saka sumber minangka kabèh, ing folder ROOT saka server kang dunungé, nggawe area teks tartamtu - ngandika robots.txt. zona punika dianggep karo mesin lan tumindak miturut pandhuan maca.

Tetep wonten ing pikiran sing indeks search engine Google kaca, malah yen pangguna wis akses kanggo ndeleng begalan. Nalika browser panjaluk karo 401 utawa 403 "Akses bener", iku mung dianggo kanggo pengunjung, tinimbang program sing klumpukne kanggo iki search engine.

Kanggo ngerti carane mbusak situs saka search engine indeksasi, pitunjuk teks kudu ngetik garis ngisor iki:

Agen: Google

Disallow: /

Iki nuduhake kanggo crawler kanggo indeks Larangan kabeh isi ing situs. Punika carane ngilangi situs Google, supaya terakhir ora ngakses sumber ing dhaftar saka dideteksi.

Embodiments saka maca cepet kanggo protokol beda

Yen sampeyan perlu kanggo dhaptar standar komunikasi individu, sing arep kanggo aplikasi aturan khusus kanggo indeksasi Google, contone, kapisah kanggo hypertext protokol http / https, iku uga perlu kanggo ndhaftar ing robots.txt ing cara ing ngisor iki (conto).

(Http://yourserver.com/robots.txt) - jeneng domain situs (any)

Agen: * - sembarang search engine

Allow: / - ngidini indexation lengkap

Carane mbusak situs saka Jeksa Agung bisa ngetokake rampung kanggo protokol https

(Https://yourserver.com/robots.txt):

Agen: *

Disallow: / ban lengkap ing indeksasi

Dicepetake alamat sumber aman URL- saka Google SERPs

Yen sampeyan ora pengin ngenteni re-indexation, lan situs sing pengin kanggo ndhelikake kaya, aku menehi saran kanggo nggunakake http://services.google.com/urlconsole/controller layanan sanalika bisa. robots.txt wis wis diselehake ing direktori ROOT saka server situs. Iku kudu diwènèhaké instruksi cocok.

Yen pitunjuk kanggo sawetara alesan ora bisa diowahi ing direktori ROOT, nggawe cukup ing folder ing target sing Singidaken saka mesin. Sawise sampeyan nindakake iki lan hubungi layanan kanthi otomatis njabut alamat hypertext, Google ora bakal mindai folder sing ditulis metu cacat ing robots.txt ing.

Periode niskala iki disetel kanggo 3 sasi. Sasampunipun periode, ing direktori mundur saka Jeksa Agung bisa ngetokake, bakal maneh diproses dening server Google.

H ow kanggo ngilangi situs kanggo mindhai sebagian

Nalika bot search maca isi robots.txt, sing pancasan tartamtu sing digawe ing basis saka sawijining isi. Ayo dadi ngomong sampeyan pengin ngilangi saka nuduhake kabeh direktori sing jenenge anatom. Iku cukup kanggo prescribe peraturan:

Agen: Google

Disallow: / anatom

Utawa, contone, pengin ora indeks kabeh jinis gambar .jpg. Kanggo nindakake iki, nambah dhaftar ngisor iki:

Agen: Google

Disallow: /*.gif$

Punika conto liyane. Ayo wong-wong mau bakal dibusak saka parsing informasi ing kaca kui mbosenke, nalika ngembangaken jinis entri indeks:

Agen: Google

Disallow: / *?

Sing babagan, lan disebutake metu aturan kanggo mesin. Liyane bab iku luwih trep kanggo mung nggunakake tag META iki. Lan webmasters kerep nggunakake mung standar kuwi ngatur operasi mesin. Nanging kita bakal ngrembug iki ing artikel mangsa.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 jw.atomiyme.com. Theme powered by WordPress.