Semalt ផ្តល់ព័ត៌មានអំពីវិធីដោះស្រាយជាមួយសត្វពីងពាងសត្វពីងពាងនិងអ្នកប្រមាញ់

ក្រៅពីការបង្កើត URLs ដែលងាយស្រួលសម្រាប់ ម៉ាស៊ីនស្វែងរក ឯកសារ .htaccess អនុញ្ញាតឱ្យអ្នកគ្រប់គ្រងគេហទំព័ររារាំងរូបយន្តជាក់លាក់ពីការចូលប្រើគេហទំព័ររបស់ពួកគេ។ វិធីមួយដើម្បីរារាំងមនុស្សយន្តទាំងនេះគឺតាមរយៈឯកសារ robots.txt ។ ទោះជាយ៉ាងណាក៏ដោយលោក Ross Barber ដែលជាអ្នកគ្រប់គ្រងជោគជ័យអតិថិជន Semalt និយាយថាគាត់បានឃើញអ្នកលូនវារខ្លះមិនអើពើនឹងសំណើនេះ។ វិធីល្អបំផុតមួយគឺប្រើឯកសារ .htaccess ដើម្បីបញ្ឈប់ពួកគេពីការធ្វើលិបិក្រមមាតិការបស់អ្នក។

តើរូបយន្តទាំងនេះជាអ្វី?

ពួកគេជាប្រភេទសូហ្វវែរដែលប្រើដោយម៉ាស៊ីនស្វែងរកដើម្បីលុបមាតិកាថ្មីចេញពីអ៊ីនធឺណិតសម្រាប់គោលបំណងធ្វើលិបិក្រម។

ពួកគេបំពេញភារកិច្ចដូចខាងក្រោមៈ

  • ទស្សនាទំព័រគេហទំព័រដែលអ្នកបានភ្ជាប់
  • ពិនិត្យកូដ HTML របស់អ្នកសម្រាប់កំហុស
  • ពួកវារក្សាទុកនូវអ្វីដែលគេហទំព័រដែលអ្នកកំពុងភ្ជាប់និងមើលអ្វីដែលគេហទំព័រភ្ជាប់ទៅនឹងមាតិការបស់អ្នក
  • ពួកគេធ្វើលិបិក្រមមាតិការបស់អ្នក

ទោះយ៉ាងណាក៏ដោយរូបយន្តមួយចំនួនមានគំនិតអាក្រក់ហើយស្វែងរកគេហទំព័ររបស់អ្នកសម្រាប់អាស័យដ្ឋានអ៊ីម៉ែលនិងទម្រង់ដែលត្រូវបានប្រើជាធម្មតាដើម្បីផ្ញើសារឬសារឥតបានការមកអ្នក។ អ្នកផ្សេងទៀតថែមទាំងស្វែងរកចន្លោះប្រហោងសុវត្ថិភាពនៅក្នុងលេខកូដរបស់អ្នក។

តើមានអ្វីដែលត្រូវការដើម្បីរារាំងអ្នកសរសេរគេហទំព័រ?

មុនពេលប្រើឯកសារ .htaccess អ្នកត្រូវពិនិត្យរឿងដូចខាងក្រោមៈ

វែបសាយត៍របស់អ្នកត្រូវតែដំណើរការលើម៉ាស៊ីនមេ Apache ។ សព្វថ្ងៃសូម្បីតែក្រុមហ៊ុនបង្ហោះគេហទំព័រទាំងនោះពាក់កណ្តាលសមរម្យនៅក្នុងការងាររបស់ពួកគេផ្តល់ឱ្យអ្នកនូវឯកសារដែលត្រូវការ។

អ្នកគួរតែមានសិទ្ធិចូលប្រើកំណត់ហេតុម៉ាស៊ីនមេឆៅវេបសាយរបស់អ្នកដូច្នេះអ្នកអាចកំណត់ទីតាំងដែលរូបយន្តបានចូលមើលគេហទំព័ររបស់អ្នក។

ចំណាំថាគ្មានវិធីណាដែលអ្នកនឹងអាចរារាំងរូបយន្តដែលមានគ្រោះថ្នាក់ទាំងអស់បានទេលុះត្រាតែអ្នករារាំងវាសូម្បីតែអ្នកដែលអ្នកគិតថាមានប្រយោជន៍។ រូបយន្តថ្មីឡើងរាល់ថ្ងៃហើយចាស់ៗត្រូវបានកែប្រែ។ វិធីដែលមានប្រសិទ្ធភាពបំផុតគឺត្រូវធានាលេខកូដរបស់អ្នកហើយធ្វើឱ្យវាពិបាកសម្រាប់រូបយន្តដើម្បីផ្ញើសារឥតបានការ។

កំណត់អត្តសញ្ញាណរូបយន្ត

រូបយន្តអាចត្រូវបានកំណត់អត្តសញ្ញាណដោយអាសយដ្ឋាន IP ឬពី "ខ្សែអក្សរភ្នាក់ងារអ្នកប្រើ" របស់ពួកគេដែលពួកគេផ្ញើនៅក្នុងបឋមកថា HTTP ។ ឧទាហរណ៍ Google ប្រើ "Googlebot ។ "

អ្នកប្រហែលជាត្រូវការបញ្ជីនេះជាមួយ ៣០២ រូបប្រសិនបើអ្នកមានឈ្មោះ bot រួចហើយដែលអ្នកចង់រក្សាទុកដោយប្រើ .htaccess

វិធីមួយទៀតគឺទាញយកឯកសារកំណត់ហេតុទាំងអស់ចេញពីម៉ាស៊ីនមេហើយបើកវាដោយប្រើកម្មវិធីនិពន្ធអត្ថបទ។ ទីតាំងរបស់ពួកគេនៅលើម៉ាស៊ីនមេអាចផ្លាស់ប្តូរអាស្រ័យលើការកំណត់រចនាសម្ព័ន្ធរបស់ម៉ាស៊ីនមេរបស់អ្នក។ ប្រសិនបើអ្នកមិនអាចរកឃើញទេសូមស្វែងរកជំនួយពីម្ចាស់គេហទំព័ររបស់អ្នក។

ប្រសិនបើអ្នកដឹងពីទំព័រដែលត្រូវបានទស្សនាឬពេលវេលានៃការមកទស្សនាវាងាយស្រួលក្នុងការមកជាមួយ bot ដែលមិនចង់បាន។ អ្នកអាចស្វែងរកឯកសារកំណត់ហេតុដែលមានប៉ារ៉ាម៉ែត្រទាំងនេះ។

នៅពេលមួយអ្នកបានកត់សម្គាល់នូវអ្វីដែលរូបយន្តអ្នកត្រូវរារាំង; បន្ទាប់មកអ្នកអាចបញ្ចូលវាទៅក្នុងឯកសារ .htaccess ។ សូមកត់សម្គាល់ថាការទប់ស្កាត់ bot មិនគ្រប់គ្រាន់ដើម្បីបញ្ឈប់វាទេ។ វាអាចត្រលប់មកវិញជាមួយអាយភីឬឈ្មោះថ្មី។

វិធីរារាំងពួកគេ

ទាញយកច្បាប់ចម្លងនៃឯកសារ .htaccess ។ ធ្វើការបម្រុងទុកប្រសិនបើចាំបាច់។

វិធីទី ១៖ រារាំងដោយអាយភី

អត្ថបទខ្លីៗកូដនេះរារាំង bot ដោយប្រើអាសយដ្ឋាន IP 197.0.0.1

បញ្ជាទិញបដិសេធ, អនុញ្ញាត

បដិសេធពីឆ្នាំ 197.0.0.1

ខ្សែទីមួយមានន័យថាម៉ាស៊ីនមេនឹងរារាំងរាល់សំណើរដែលត្រូវនឹងលំនាំដែលអ្នកបានបញ្ជាក់និងអនុញ្ញាតឱ្យមានផ្សេងទៀត។

ខ្សែទីពីរប្រាប់ឱ្យម៉ាស៊ីនមេចេញលេខ 403: ទំព័រហាមឃាត់

វិធីទី ២ ៈការបិទដោយភ្នាក់ងារអ្នកប្រើប្រាស់

មធ្យោបាយងាយស្រួលបំផុតគឺប្រើម៉ាស៊ីនសរសេរឡើងវិញរបស់ Apache

សរសេរឡើងវិញអ៊ីនធីន

សរសេរឡើងវិញCond% {HTTP_USER_AGENT} BotUserAgent

សរសេរឡើងវិញ។ - [F, L]

ខ្សែទីមួយធានាថាម៉ូឌុលសរសេរឡើងវិញត្រូវបានបើក។ ជួរទី ២ គឺជាលក្ខខណ្ឌដែលច្បាប់អនុវត្ត។ "F" នៅក្នុងជួរទី ៤ ប្រាប់ម៉ាស៊ីនមេ ឲ្យ ប្រគល់លេខ ៤០៣៖ ហាមខណៈពេលដែលអក្សរ "L" មានន័យថានេះជាច្បាប់ចុងក្រោយ។

បន្ទាប់មកអ្នកនឹងផ្ទុកឡើងឯកសារ .htaccess ទៅកាន់ម៉ាស៊ីនមេរបស់អ្នកហើយសរសេរជាន់លើឯកសារដែលមានស្រាប់។ ជាមួយនឹងពេលវេលាអ្នកនឹងត្រូវធ្វើបច្ចុប្បន្នភាព IP របស់ bot ។ ក្នុងករណីដែលអ្នកមានកំហុសអ្នកគ្រាន់តែផ្ទុកឯកសារបម្រុងទុកដែលអ្នកបានធ្វើ។