Краулінговий бюджет (англ. crawl budget, чи — Бюджет сканування, або ліміт на сканування) — кількість сторінок, які робот Googlebot переглядає та індексує на веб-сайті протягом певного періоду часу. Робот Googlebot налаштований таким чином, щоб під час сканування сторінок він не заважав відвідувачам сайту. Навантаження на сервер залежить від швидкості сканування, яка визначає, з якою періодичністю Googlebot отримує дані з веб-сторінок.
Швидкість сканування визначається кількістю одночасних підключень, які може встановити Googlebot при обробці сайту, а також інтервалом між підключеннями. На неї впливають такі фактори:
- Час відповіді сайту. Якщо веб-сайт надсилає відповіді без затримок протягом певного часу, швидкість сканування збільшується, тобто Googlebot може використовувати при обробці контенту більше підключень. Якщо відповіді від сайту надходять повільно або містять помилки, швидкість сканування знижується.
- Обмеження, задане у Search Console. Власники сайтів можуть самостійно обмежувати швидкість сканування.
Від яких факторів залежить ліміт на сканування
Велика кількість URL з низькою цінністю на сайті негативно позначається на його скануванні та індексуванні. Такі URL поділяються на наступні категорії (у порядку зменшення цінності):
- сторінки, на яких використовуються фасетна навігація та ідентифікатори сеансу;
- декілька сторінок із ідентичним контентом на одному сайті;
- сторінки з помилковими повідомленнями про помилки 404;
- зламані сторінки;
- нескінченні простори та проксі-сервери;
- сторінки зі спамом або вмістом низької якості.
Обробка таких сторінок забирає ресурси сервера, внаслідок чого дійсно важливі сторінки з цінним контентом можуть бути не скановані вчасно.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Kraulingovij byudzhet angl crawl budget chi Byudzhet skanuvannya abo limit na skanuvannya kilkist storinok yaki robot Googlebot pereglyadaye ta indeksuye na veb sajti protyagom pevnogo periodu chasu Robot Googlebot nalashtovanij takim chinom shob pid chas skanuvannya storinok vin ne zavazhav vidviduvacham sajtu Navantazhennya na server zalezhit vid shvidkosti skanuvannya yaka viznachaye z yakoyu periodichnistyu Googlebot otrimuye dani z veb storinok Shvidkist skanuvannya viznachayetsya kilkistyu odnochasnih pidklyuchen yaki mozhe vstanoviti Googlebot pri obrobci sajtu a takozh intervalom mizh pidklyuchennyami Na neyi vplivayut taki faktori Chas vidpovidi sajtu Yaksho veb sajt nadsilaye vidpovidi bez zatrimok protyagom pevnogo chasu shvidkist skanuvannya zbilshuyetsya tobto Googlebot mozhe vikoristovuvati pri obrobci kontentu bilshe pidklyuchen Yaksho vidpovidi vid sajtu nadhodyat povilno abo mistyat pomilki shvidkist skanuvannya znizhuyetsya Obmezhennya zadane u Search Console Vlasniki sajtiv mozhut samostijno obmezhuvati shvidkist skanuvannya Vid yakih faktoriv zalezhit limit na skanuvannyaVelika kilkist URL z nizkoyu cinnistyu na sajti negativno poznachayetsya na jogo skanuvanni ta indeksuvanni Taki URL podilyayutsya na nastupni kategoriyi u poryadku zmenshennya cinnosti storinki na yakih vikoristovuyutsya fasetna navigaciya ta identifikatori seansu dekilka storinok iz identichnim kontentom na odnomu sajti storinki z pomilkovimi povidomlennyami pro pomilki 404 zlamani storinki neskinchenni prostori ta proksi serveri storinki zi spamom abo vmistom nizkoyi yakosti Obrobka takih storinok zabiraye resursi servera vnaslidok chogo dijsno vazhlivi storinki z cinnim kontentom mozhut buti ne skanovani vchasno