‘Googlebot’ olarak etiketlenmiş içerik

Sunucu kaynaklarını sömüren botlar / crawler

09 Mart 2008 tarihinde, Blog kategorisinde wolkanca yazdı, 5 adet yorum yapıldı. »

Daha önce kendi sunucusunda yazacak arkadaşlar için önerilerde bulunmuştum, kendi sunucunda bir WordPress blogu kurarak yazmak isteyen veya yazmayı sürdürenlerin bloglarının yazı, etiket, kategori vs. çoğaldıkça ve bunun yanında ziyaretçi trafiği yükseldikçe pişmiş tavuğun başına gelmeyenler onun başına gelebiildiğini bizzat yaşamış ve yazmıştım.

Buradaki maceramda 3 faklı firması ile çalıştım, ilki Arif beyin Tescilet.net firması idi, bu firmada doğduk diyebilirim, ikincisi Dreamhost ve şu anda Seçkin Bey'in yönettiği Hostcin ile çalışıyoruz, mutluyuz.

Tecrübelerime dayanarak web sitelerinin sunucu kaynaklarını o siteye giriş yapan insanlardan çok (indeksleyici) yani arama veya her neyse o şey onlara ait 'lar sömürüyor diyebilirim.
Burada bu botları engellememiz tabiki mümkün diyebilirsiniz, fakat diğer taraftan , Yahoo, Msn gibi nın botlarının veya sadece bloglar ve rss akışı olan özel olan botları engeller isek bu sefer blogunuz oradan gelen ziyaretçilerden mahrum kalabilir. Engellemezseniz blogunuzun bulunduğu sunucunun tüm kaynakları bu botlar tarafından sömürülüp diğer okurlara ve hatta size blogsuz bir hayat kalabiliyor, ya firmanız size "koçum bu seni kesmez daha büyük bir sunucu kirala" diyecek veya direk sizin blogunuzu veya hesabınızı kapatacaktır, o da olmadı bir diğer ihtimal siz ve ziyaretçiler dakikalarca sayfanızın açılışını beklemek zorunda kalacaksınız, çok keyifsiz bir hal alacaktır yazmak.


Sunucu kaynaklarını sömüren botlar crawler

Tüm bunları yazmamdaki neden benim gibi bu problemlerle karşılaşacak arkadaşlara faydalı olmak, benim tavsiyem , Yahoo ve Msn harici diğer tüm larını engellemeniz, sunucunuzda iyi bir araştırma yapın ve istatistiklerden blogunuza en çok bağlantı yapılan adreslerini kontrol edip o adreslerinin hangi firmaya veya hangi ülkeye ait olduklarını tespit edin. Örneğin adreslerini araştırdığımda bu bloga Türkiye'den çok ABD kaynaklı adreslerinin bağlandığını keşfedince çok şaşırmıştım, bu adresleri tahmin edeceğiniz gibi , vb. servislere ait idi.

Ben çok fazla robot engelledim bunların arasında en berbat olanı aşağıdaki, sizde sunucunuzda bir yavaşlık hissediyorsanız hemen istatistikleri konrol edebiliyorsanız edin veya hizmeti veren firmanıza bu konuda danışın;

Twiceler crawls from the following addresses:
38.99.13.121 38.99.44.101 64.1.215.166 208.36.144.6
38.99.13.122 38.99.44.102 64.1.215.162 208.36.144.7
38.99.13.123 38.99.44.103 64.1.215.163 208.36.144.8
38.99.13.124 38.99.44.104 64.1.215.164 208.36.144.9
38.99.13.125 38.99.44.105 64.1.215.165 208.36.144.10
38.99.13.126 38.99.44.106

Kısacası kendi sunucunuzda yazacaksanız eğer sunucu kaynaklarını lara, botlara ve kötü niyetli makinelere yedirmeyin, dikkatli olun ve her şeyi firmasına bırakmayın, çünkü onlar çalıştıkları diğer yüzlerce web sitesi gibi sizin blogunuzuda sıradan bir site gibi görecektir, pek fazla ilgilenmeyecektir, oysa sizin blogunuz size özel ve sizin için önemlidir.

Tarayıcınız Googlebot olsun ücretli siteler ücretsiz olsun

01 Şubat 2008 tarihinde, internet kategorisinde wolkanca yazdı, 14 adet yorum yapıldı. »

Ücretli ya da üyelik gerektiren sitelerin bir çoğu arama motoruna ayrıcalık tanırlar ve bu sayede örümceği üye olmadan tüm siteyi tarar. Bu ücretli özel içeriği biz normalde siteye girdiğimizde göremeyiz, üye olmalı ya da parasını ödemeliyiz. Şimdi aşağıda okuyacağınız yöntemle nızı olarak tanıtıp (user agent) nasıl ücretli ve üyelik gerektiren siteleri sömürebileceğimiz öğreneceğiz.
Öncelikle her zaman tavsiye ettiğimiz gibi nın bu iş en iyi seçenek olduğunu belirteyim ve tabiki tüm larda da olabilir ama öncelik diyorum.
nedir onu da açmak gerekirse kısaca giriş yapılan siteye kimin giriş yaptığı hakkında bilgi veren bir sistem. Bizde bu değeri ile oynayıp yani değiştirip ücretli, üyelik gerektiren sitelerin ’a verdiği ayrıcalıkları, kendi değerimizi değiştirip o siteyi sömürmek için kullanacağız.
(more…)

Arama motoru robotları

11 Temmuz 2007 tarihinde, internet kategorisinde wolkanca yazdı, 3 adet yorum yapıldı. »

seonda üst sıralarda çıkmak ile ilgili çok yerde makaleler yazılır ama bu nda indexlemeyi yapan örümcekler ( web robotları) hakkında fazla yerde bilgi yok. Bir arkadaşımın bu açığı görerek yazdığı makaleden aynen buraya aktarıyorum. Ayrıca nda hedeflenen kelimelerde üst sıralarda çıkmak yani seo ile ilgili yazılarımıda blogda okuyabilirsiniz.

Web’in dinamik yapılı içeriğini otomatik olarak tekrar tekrar dolaşan ve bunları veritabanlarında tutan programlara Web robotları yada örümcekleri diyoruz. Web ları robot değillerdir. ndan bazı yerlerde Web Wanderers, Web Crawlers veya Spiders olarak da sözedilmektedir. Robotların siteleri gezerken bir virüs gibi kendilerini gezdikleri serverlara kopyalayıp zarar verdikleri düşünülmektedir. Oysa robotlar birer virüs değildir. Sadece ziyaret ettikleri sitenin bilgilerini almakla görevlidirler. Şu adres mevcut tüm robotların listesini göstermektedir.
(more…)