Sunucu kaynaklarını sömüren botlar / crawler
Daha önce kendi sunucusunda blog yazacak arkadaşlar için önerilerde bulunmuştum, kendi sunucunda bir WordPress blogu kurarak yazmak isteyen veya yazmayı sürdürenlerin bloglarının yazı, etiket, kategori vs. çoğaldıkça ve bunun yanında ziyaretçi trafiği yükseldikçe pişmiş tavuğun başına gelmeyenler onun başına gelebiildiğini bizzat yaşamış ve yazmıştım.
Buradaki blog maceramda 3 faklı hosting firması ile çalıştım, ilki Arif beyin Tescilet.net firması idi, bu firmada doğduk diyebilirim, ikincisi Dreamhost ve şu anda Seçkin Bey'in yönettiği Hostcin ile çalışıyoruz, mutluyuz.
Tecrübelerime dayanarak web sitelerinin sunucu kaynaklarını o siteye giriş yapan insanlardan çok crawler (indeksleyici) yani arama veya her neyse o şey onlara ait bot'lar sömürüyor diyebilirim.
Burada bu botları engellememiz tabiki mümkün diyebilirsiniz, fakat diğer taraftan Google, Yahoo, Msn gibi arama motorlarının botlarının veya sadece bloglar ve rss akışı olan siteler özel olan botları engeller isek bu sefer blogunuz oradan gelen ziyaretçilerden mahrum kalabilir. Engellemezseniz blogunuzun bulunduğu sunucunun tüm kaynakları bu botlar tarafından sömürülüp diğer okurlara ve hatta size blogsuz bir hayat kalabiliyor, ya hosting firmanız size "koçum bu seni kesmez daha büyük bir sunucu kirala" diyecek veya direk sizin blogunuzu veya hesabınızı kapatacaktır, o da olmadı bir diğer ihtimal siz ve ziyaretçiler dakikalarca blog sayfanızın açılışını beklemek zorunda kalacaksınız, çok keyifsiz bir hal alacaktır blog yazmak.
Tüm bunları yazmamdaki neden benim gibi bu problemlerle karşılaşacak arkadaşlara faydalı olmak, benim tavsiyem Google, Yahoo ve Msn harici diğer tüm arama motoru crawler larını engellemeniz, sunucunuzda iyi bir araştırma yapın ve istatistiklerden blogunuza en çok bağlantı yapılan ip adreslerini kontrol edip o ip adreslerinin hangi firmaya veya hangi ülkeye ait olduklarını tespit edin. Örneğin ip adreslerini araştırdığımda bu bloga Türkiye'den çok ABD kaynaklı ip adreslerinin bağlandığını keşfedince çok şaşırmıştım, bu ip adresleri tahmin edeceğiniz gibi Feedburner, Google vb. servislere ait idi.
Ben çok fazla robot engelledim bunların arasında en berbat olanı aşağıdaki, sizde sunucunuzda bir yavaşlık hissediyorsanız hemen istatistikleri konrol edebiliyorsanız edin veya hosting hizmeti veren firmanıza bu konuda danışın;
Twiceler crawls from the following IP addresses:
38.99.13.121 38.99.44.101 64.1.215.166 208.36.144.6
38.99.13.122 38.99.44.102 64.1.215.162 208.36.144.7
38.99.13.123 38.99.44.103 64.1.215.163 208.36.144.8
38.99.13.124 38.99.44.104 64.1.215.164 208.36.144.9
38.99.13.125 38.99.44.105 64.1.215.165 208.36.144.10
38.99.13.126 38.99.44.106
Kısacası kendi sunucunuzda blog yazacaksanız eğer sunucu kaynaklarını crawler lara, botlara ve kötü niyetli makinelere yedirmeyin, dikkatli olun ve her şeyi hosting firmasına bırakmayın, çünkü onlar çalıştıkları diğer yüzlerce web sitesi gibi sizin blogunuzuda sıradan bir site gibi görecektir, pek fazla ilgilenmeyecektir, oysa sizin blogunuz size özel ve sizin için önemlidir.



kaan diyor ki:
burda bi düzeltme yapalım; "208.36.144.7" ip adresi bot değil, cuil arama motorunun örümceği diye biliyorum.
Tolga Yaşar diyor ki:
robotlar sitenize girmeden siteniz nasıl indexlenecek çok merak ediyorum.
botların yediği bandwith den ne olacak beyler gerçekçi olun biraz
ersin diyor ki:
bu engellemeleri hangi dosyadan ya da nereden yapıyoruz?
hakan diyor ki:
bunları nasıl tespit edebiliriz ?
gurcay diyor ki:
saolasın volkan
tamkarışık diyor ki:
aa bak bılmıyodum anlattıgın ıyı olmus. yenı bır sıte acmayı planlarken bunları goz onunde bulundurucam. paylasım ıcın tesekkurler;)
Seckin Candan diyor ki:
koçum bu seni kesmez daha büyük bir sunucu kirala
adamlar saldırarak zarar veremesede band ımızı sömürüyorlar geçen gün yaptıgım ayar sonucu google botları bile serverdan banlanmıştı hatta ben bile 
arkadaşlar bu gün aldıgımız saldırılar sonunda birşey dikkatimi çekti sadece saldırılar sonucu tüketilen trafik 130 gb kadar dı
şu robotlara bi güzellik yapacam ama biraz kafamı toparlamam lazım önce
y4 diyor ki:
kıyakmış, sağol
FeRHad diyor ki:
valla bu botlar gerçekten tehlikeli yazılımlar, bir de bazen sarhoş sarhoş dolaşanlar var onları anlamıyorum, bir yazıya defalarca istek gönderiyor ama ne spam yorum bırakıyor ne birşey en sonunda da barındırma şirketi kapatmıştı sitemi. aynı ddos saldırısı gibi ama bana kim saldırı yapmak istesin. bu arada benim sitemin kapanmasına sebep olan ip adresi 64.13.232.16
benim trafiğimin sadece %56’sı türkiye’den, geri kalanı amerika, arabistan, israil lübnan hepsi botlar, ama senin listendekiler ben de yok.
« Kahrolsun para/sızlık… Öğrenci yaşamak!
Tymphony »
Hakkında
BU YAZIYI BU İNSAN EVLADI YAZDI LAYN! ALOOOWWW!
VolkaN Yılmaz, 09 Mart 2008 tarihinde eklemiş olduğu okuduğunuz bu yazı ile birlikte bloga toplamda tam 2529 adet yazı eklemiş, kendisini tebrik ediyoruz, sizi de okuduğunuz için kutluyoruz. Web sitesi, e-posta.Yazar kendisini şöyle tanımlıyor: Merhaba ben Volkan 1981 istanbul doğumlu, yay burcuyum, internetteki lakabım Wolkanca. Bana iletişim sayfasındaki formu doldurarak ulaşabilirsiniz.
Sponsored by:
İlginizi çekebilecek benzer yazılar:
Blogda bugün tarihli diğer yazılar:
Blogda en son bunları yazdık: