10 Temmuz 2007 Salı

Duplicate Content Ve Google'ın Bakış Açısı

Merhaba
Aşağıda Official Google Webmaster Central Blog adresinde Duplicate Content ile ilgili alacağı önlemleri belirten Vanessa Fox yazısını çevirdim. Anlaşılamayan çok nokta var ancak elimden geldiği kadar açık olmaya çalıştım.
Google yetkilileri SMX Advanced adı ile Seatle'da düzenlenen Arama Motoru pazarlama konferanslarında bazı konulara tartışmaya açtı.
Bunlardan biri de Duplicate Content.Bildiğiniz gibi Duplicate Content Sitenizdeki yazanın özgünlüğü. Başka sitelerin sizin yazılarınızı çalması.. Peki Bunu Google nasıl ayırt etmeyi planlıyor?.

Google için duplicate content nedir?
* Google kullanıcılarına unique içerik sunmak ister ve içeriğinizin kopya olup olmadığını versionuna(sanırım burada yayınlanma zamanını kastediyor) bakarak belirler .
* kopya içerik için siteniz cezalandırılmaz. Eğer kopya içerik belirlenirse, Çeşitli kullanıcıları garantilemek için belirli içerikleri öne alır.
* Kopya içerik sitenizin geriye atılarak tamamlayıcı index olarak belirlemesini direkt olarak sağlamaz. Kopya içerik indirekt olarak etkileyebilir ancak,Sitenize gelen linkler çeşitli yayınlanma zamanlarına (versionlarına) aitse düşük pagerank alırsınız
İşte Bunun için Google'ın Çözüm Planları
Sitemap Dosyasındaki URL yayınlanma zamanını(versionunu) tespit etmek
Tartıştığımız bir konu Sitemap'lerdeki URL yayınlanma zamnını(versionununu) belirleyebilmek. Eğer aynı içeriğie sahip URL'leri bulursak, Bu sayfaya olan linkleri gözden geçirir ve ona göre indekslenir belirtilen paramatreye göre indeksleme sırasında URL'yi değerlendirebiliriz.
Bir robots.txt için bir webmaster aracı yapmayı tartıştık. Örneğin URL session id içeriyorsa webmaster bu sessiona değişken ekleyerek tam versionunu (yayınlanma tarihini) belirleyebilir.

İçeriğin sahibinin belirtilebileceği bir yol bulmakBu arama motorlarına extra bilgi ile içeriğin kopya, çalıntı olmadığnı, orjinal olduğunu belirlemesine yardımcı olacaktr. Bu konuda şuanda elimizden geleni yapıyoruz ve çok fazla seyirci bunu ana sorun olarak görmüyor. Bununla beraber ilgili kişiler ekstra bir koruma getirilmesi konusuna ilgi duyuyorlar. . Bazıları en erken oluşturulan sayfaların önde çıkmasını teklif ettiler ama yaratılma tarihleri her zaman gerçekçi olmuyor. Bazıları da içeriğin içeriği kaydetmesi önerisinde bulundular. Ancak bazı site sahiplerinin bunu idrak edemeyebileceği, ve kötü niyetli kişilerin içeriği orjinal sahibinden önce kaydetmesinden korkuldu.

Şuan için site önceliğini ve siteye verilen linklere güveniyoruz.İçeriğin senkronizasyonu için içeriğinizi kullanan siteye robots.txt dosyasında verisonunu(yayınlanma tarihini) bloke etmesini rica edebilir böylece içeriğinizin yerinin korunmasını sağlanabilir.
Site Sahipleri için kopya içerik şikayeti bildirme
kopya içerik şikayet bildirme önerisi büyük destek aldı. Ek olarak bir uyarı sistemi yerleştirilerek email ya da RSS yardımıyla kopya içerik konusunda uyarılabilir.
Blog ve CMS yazılımlarıyla Kopya içerik adresleme konusunda çalışmak
Bazı kopya içerik konuları yazılımların(scriptler) URL yapıları yardımıyla engellenebilir. Örneğin Ana sayfalarında , Kalıcı bağlantılarında, Kategori sayfalarında, ve arşiv sayfaları. İçerik sahipleri için yazılım sahipleri ile görüşmeyi düşünebiliriz.