Վեբ սողիչը (նաև հայտնի է որպես վեբ spider, spider bot, web bot կամ պարզապես սողուն) համակարգչային ծրագրային ծրագիր է, որն օգտագործվում է որոնման համակարգի կողմից ինդեքսավորել վեբ էջերը և բովանդակությունը համաշխարհային ցանցում: … Որոնման ինդեքսավորումը կարելի է համեմատել գրքի ինդեքսավորման հետ:
Ի՞նչ է սողունը ՏՀՏ-ում:
Վեբ սողիչը (նաև հայտնի է որպես վեբ սարդ կամ վեբ ռոբոտ) ծրագիր կամ ավտոմատ սկրիպտ է, որը զննում է Համաշխարհային ցանցը մեթոդական, ավտոմատացված ձևով: Այս գործընթացը կոչվում է Web crawling կամ spidering: Շատ օրինական կայքեր, մասնավորապես որոնման համակարգերը, օգտագործում են spidering-ը որպես արդի տվյալների տրամադրման միջոց:
Ինչի՞ համար է օգտագործվում վեբ սողունը:
Գտեք տեղեկատվություն սողալով
Մենք օգտագործում ենք ծրագրակազմ, որը հայտնի է որպես վեբ սողիչներ հանրային հասանելի վեբէջերը հայտնաբերելու համար: Սողունները նայում են վեբ էջերին և հետևում այդ էջերի հղումներին, ճիշտ այնպես, ինչպես դուք կանեիք, եթե զննարկեիք բովանդակությունը համացանցում: Նրանք անցնում են հղումից հղում և այդ վեբէջերի մասին տվյալները հետ են բերում Google-ի սերվերներ:
Ի՞նչ տեսակի գործակալ է վեբ սողիչը:
Վեբ որոնիչը բոտի տեսակ է կամ ծրագրային գործակալ: Ընդհանուր առմամբ, այն սկսվում է այցելելու URL-ների ցանկով, որը կոչվում է սերմեր: Երբ սողունն այցելում է այս URL-ները, այն նույնացնում է էջի բոլոր հիպերհղումները և ավելացնում դրանք այցելելու համար նախատեսված URL-ների ցանկում, որը կոչվում է սողացող սահման:
Ի՞նչ է սողալը մանրամասն բացատրել:
Սողալն այն է, երբ Google-ը կամ այլ որոնման համակարգ ուղարկում ենբոտ դեպի վեբ էջ կամ վեբ գրառում և «կարդալ» էջը: … Սողալը առաջին մասն է, երբ որոնիչը ճանաչի ձեր էջը և ցուցադրի այն որոնման արդյունքներում: Ձեր էջը սուզվելը, այնուամենայնիվ, չի նշանակում, որ ձեր էջը ինդեքսավորվել է (կամ կլինի):