Back to Question Center
0

Tha Semalt a 'toirt seachad molaidhean air mar a dhèiligeas iad ri botaichean, damhain-allaidh agus crangairean

1 answers:

A thuilleadh air a bhith a 'cruthachadh URLan càirdeil einnseanaireachd , tha am faidhle .htaccess a' leigeil le luchd-measaidh lìn bacadh air botaichean sònraichte bho bhith a 'faighinn cothrom air an làrach-lìn aca. Is e aon dòigh air na robotaichean sin a bhacadh tro fhaidhle robots.txt. Ach, tha Ross Barber, an Semalt Manaidsear Soirbheachd Luchd-cleachdaidh ag ràdh gu bheil e air cuid de luchd-crathaidh fhaicinn gun an t-iarrtas seo. Is e aon de na dòighean as fheàrr am faidhle .htaccess a chleachdadh gus stad a chur orra bho bhith a 'clàradh an susbaint agad.

Dè na botaichean a tha seo?

'S e seòrsa de bhathar bog a tha iad a' cleachdadh le einnseanan luirg gus susbaint ùr a sguabadh às an eadar-lìon airson adhbharan clàrachaidh.

Bidh iad a 'coileanadh nan gnìomhan a leanas:

  • Tadhal air duilleagan lìn a tha thu ceangailte ri
  • Thoir sùil air do chòd HTML airson mearachdan
  • Bidh iad a 'sàbhaladh na duilleagan-lìn a tha thu a' ceangal ri agus a 'coimhead dè na duilleagan-lìn a tha a' ceangal ris an t-susbaint agad
  • Bidh iad a 'clàradh do shusbaint

Ge-tà, tha cuid de bhotaichean mì-chinnteach agus lorg iad an làrach agad airson seòlaidhean puist-d agus foirmean a bhios air an cleachdadh mar as trice airson teachdaireachdan neo-thabhach no spam a chuir thugaibh. Bidh feadhainn eile a 'sireadh fasgadairean tèarainteachd sa chòd agad.

Dè a tha a dhìth gus bacadh a chur air luchd-crathaidh lìn?

Mus cleachd thu am faidhle .htaccess, feumaidh tu na rudan a leanas a sgrùdadh:

1. Feumaidh do làrach a bhith air a ruith air frithealaiche Apache. An-diugh, bidh eadhon na companaidhean aoigheachd lìn sin a tha leth-chomasach nan obair, a 'toirt cothrom dhut am faidhle riatanach

2. Bu chòir dhut inntrigeadh a dhèanamh dhut fhèin mar logaichean frithealaidh an làrach-lìn agad gus an urrainn dhut faighinn a-mach dè na bataichean a tha air a bhith a 'tadhal air na duilleagan lìn agad.

Thoir fa-near nach eil dòigh ann gun urrainn dhut botan cronail a bhacadh mur bi thu a 'bacadh iad uile, eadhon an fheadhainn a tha thu a' meas a bhith cuideachail. Bidh bots ùra a 'tighinn suas a h-uile latha, agus tha feadhainn nas sine air an atharrachadh. Is e an dòigh as èifeachdaiche do chòd a dhaingneachadh agus a dhèanamh duilich dha botaichean a spamadh thu.

A 'comharrachadh bhotagan

Faodaidh bots a bhith air an comharrachadh leis an t-seòladh IP no bhon "User Agent String," a chuireas iad a-steach na cinn-cinnidh HTTP. Mar eisimpleir, bidh Google a 'cleachdadh "Googlebot."

Dh'fhaoidte gum bi feum agad air an liosta seo le 302 bota ma tha ainm a 'bot agad mu thràth air a bheil thu airson a chumail air falbh le bhith a' cleachdadh .htaccess

Is e dòigh eile a bhith a 'luchdachadh sìos na faidhlichean log bhon fhrithealaiche agus gan fosgladh le deasaiche teacsa. Dh'fhaodadh an làrach aca air an fhrithealaiche atharrachadh a rèir suidheachadh an fhrithealaiche agad. Mura h-urrainn dhut an lorg, iarr cuideachadh bhon òstair lìn agad

Ma tha fios agad dè an duilleag a thadhail thu, no àm an turais, tha e nas fhasa tighinn le bot nach eil thu ag iarraidh. Dh'fhaodadh tu an fhaidhle log a rannsachadh leis na pàrairean sin.

Aon uair, thug thu fa-near dè na botaichean a dh'fheumas tu a bhacadh; faodaidh tu an gabhail a-steach san fhaidhle .htaccess. Thoir fa-near nach eil bacadh air a 'bot gu leòr gus stad a chur air. Faodaidh e tilleadh le IP no ainm ùr.

Mar a chuireas iad am bacadh

Luchdaich sìos lethbhreac den fhaidhle .htaccess. Dèan cùl-taic ma bhios feum air.

Modh 1: bacadh le IP

Bidh am piobid còd seo a 'blocadh an bot a' cleachdadh an IP IP 197.0.0.1

Òrdugh air a dhiùltadh, Ceadaich

Dìad bho 197.0.0.1

Tha a 'chiad loidhne a' ciallachadh gun cuir am frithealaiche bacadh air gach iarrtas a tha a 'freagairt nan pàtran a chomharraich thu agus a leigeas le daoine eile.

Tha an dàrna loidhne ag innse don fhrithealaiche a bhith a 'cur a-mach 403: duilleag toirmisgte

Modh 2: A 'bacadh le luchd-cleachdaidh

Is e an dòigh as fhasa inneal ath-sgrìobhaidh Apache a chleachdadh

Ath-sgrìobhadhDeasaich Air

RewriteCond% {HTTP_USER_AGENT} BotUserAgent

RewriteRule. - [F, L]

Bidh a 'chiad loidhne a' dèanamh cinnteach gu bheil am modal ath-sgrìobhaidh comasach. Is e loidhne dhà an suidheachadh a tha an riaghailt a 'buntainn ris. Tha an "F" ann an loidhne 4 ag innse don fhrithealaiche 403 a thilleadh: Toirmisgte fhad 'sa tha an "L" a' ciallachadh gur e seo an riaghailt mu dheireadh.

Lùdaidhidh tu an fhaidhle .htaccess ris an fhrithealaiche agad agus cuiridh thu an t-ainm a th 'ann an-dràsta. Le ùine, bidh agad ri IP bot's ùrachadh. Ma tha thu a 'dèanamh mearachd, dìreach cuir suas an cùl-taic a rinn thu.

November 29, 2017
Tha Semalt a 'toirt seachad molaidhean air mar a dhèiligeas iad ri botaichean, damhain-allaidh agus crangairean
Reply