Bu SEO blog yazısında

Bu bölümü gizle

2021'de Robots TXT Dosyasının Web Siteniz İçin Önemi Nedir?

Ne zaman yeni bir yeri keşfetmeye çıksak, kolaylık sağlamak ve zamandan tasarruf etmek için rehberliğe ihtiyaç duyarız! Aynı şekilde web robotları böyle . Herhangi bir arama motoru, belirli bir web sitesinin sayfalarını nasıl tarayacağı hakkında bir fikir edinmek için Robots.txt dosyasından yardım alır.

Bu arada, bu tür tarayıcıların davranışları tüm internetİçeriğe erişmek, dizine eklemek ve hedeflenen kullanıcılara sunmak vardır REP veya Robots dışlama protokolü olarak bilinen ve robots.txt'yi de içeren bir grup web standardına dayanmaktadır.

Robots txt nedir?

İçinde Basit bir şekilde, robots.txt'yi Robot ve Txt terimlerinin bir karışımı olarak anlayabilir ve hatırlayabiliriz. Yani, arama motorlarının olası web Robotları tarafından kullanılması amaçlanan bir txt veya metin dosyasıdır.

Ayrıca, web sitesinin bir kullanıcı aracısının tarama davranışını kontrol etmesi durumunda web yöneticilerine yardımcı olabilir, ancak önemli veya tüm tarayıcılara izin verilmemesi nedeniyle dikkatli bir şekilde yapılmalıdır. sayfalar Google gibi bir arama motorundan sitenizin görüntülenmesi son derece tehlikeli olabilir.

Bir web sitesinin yöneticileri robots.txt dosyasını kullanarak web tarama yazılımlarına veya kullanıcı aracılarına şu talimatları verebilir ne sitenin taranacak ve taranmayacak tüm bölümleri. Bu, robots.txt dosyası içinde bazı veya tüm tarayıcı kullanıcı aracıları için "izin ver" veya "izin verme" talimatları kullanılarak yapılabilir

Robots txt Dosyası Nedir?

Bir arama motoru, işini yapmak için temel olarak iki ana işten sorumludur. Birincisi, her yeri tarayarak ve güncellemeleri indeksleyerek web'deki içeriği keşfetmektir. Bir sonraki iş, ilgili bilgileri arama motorunda aramaktır. endeksli Bir arama sorgusuna göre doğru içeriği sunmak için dizin.

Peki, Robots txt nedir?

Arama motorları bağlantılar ve bir web sitesinden diğerine gitmekBu işlem "örümcekleme" olarak da adlandırılır. Bot veya web tarayıcısı yeni bir web sitesine ulaştığında, örümceklemeye başlamadan önce ilk olarak robots.txt dosyasını arar. Eğer bir tane bulursa, web sitesini nasıl tarayacağı, özellikle neye erişip neye erişemeyeceği hakkında bilgi edinmek için onu okuyacaktır! Robots.txt dosyasının olmaması durumunda, kullanıcı-ajanlar web sitesinde bulunan diğer bilgileri taramaya başlayabilir.

Robots txt Dosyasında Neler Olmalıdır?

Dosya en az aşağıdaki iki unsurdan oluşmalıdır;

Kullanıcı aracısı: (Kullanıcı aracısının adı)

İzin verme: (Taranmaması gereken URL dizesi)

Yukarıdaki iki satır birlikte ayrı bir kullanıcı aracısı yönergeleri kümesi olarak düşünülebilir ve bir satır sonu (/) kullanılarak diğer kümelerden ayrılır.

Dosyada birden fazla kullanıcı-ajan için tek bir kural belirtilmişse, tarayıcı öncelikle ayrı bir talimat grubunda belirtilen yönergeleri okuyacak ve izleyecektir.

Robots txt'ye nasıl erişilir?

Herkes, sadece tarayıcı yöntemini kullanarak bir web sitesinde bulunan robots.txt'nin içeriğine bakabilir.

Robots txt nasıl alınır?

Ana sayfadan sonra robots.txt eklemeniz gerekir URL https gibi://demo.com/robots.txt veya https://shop.demo.com/robots.txt gibi alt alan adı.

Bir Web Sitesinin Robots txt'si nasıl bulunur?

Robots.txt dosyasının kök alan adından sonra bulunması zorunludur. Böylece, tarayıcıda da aynı şeyi belirtebilirsiniz.

Web Sitesi için Robot txt nasıl kontrol edilir?

Çıktıda herhangi bir .txt sayfası bulamazsanız, bu, web sitesinde şu anda mevcut (canlı) bir robots.txt sayfası olmadığı anlamına gelir.

Robots txt Dosyanızı Nasıl Bulursunuz?

Kök alan adı (demo.com/robots.txt) ve her alt alan adı için ayrı robots.txt dosyaları olmalıdır (blog.demo.com/robots.txt).

Robots txt nasıl okunur?

Dosyada bulunan tüm talimatlar bir insan veya herhangi bir yazılım botu tarafından yukarıdan aşağıya doğru okunmalıdır! Bir robotun veya bir kullanıcı aracısının bir web sitesinin robots.txt dosyasını okumaması mümkün olabilir. Bu genellikle e-posta adresi kazıyıcıları veya kötü amaçlı yazılım robotları türü kötü niyetli tarayıcılar ile mümkündür.

Robots txt ne işe yarar?

Bir web sitesinde robots.txt kullanmanın birçok avantajı vardır. Örneğin;

- Sormak için arama motorları yap Web sitenizdeki PDF'ler, resimler vb. gibi belirli dosyaları dizine eklememek. Meta yönergeleri, sayfaların indekslenmesini önlemek için robots.txt'ye alternatif olarak da kullanılabilir, ancak kaynak dosyaları için çalışmaz.

- Bir web yöneticisi, yararlı bilgiler sağlayarak bir web sitesinin verimli bir şekilde taranmasını sağlayabilir İpuçları botlarına.

- Arama motorlarının herhangi bir dahili aramayı göstermesini önlemek için genel SERP'teki sonuçlar sayfası.

- Web sitesinin bazı önemsiz veya gereksiz sayfalarını engelleyerek, tarama bütçenizi gerekli sayfalarda en üst düzeye çıkarabilirsiniz.

- Yinelenen içeriğin SERP'lerde görüntülenmesini önlemek için meta robotlar gibi kullanılmak üzere.

- Web sitenizin dahili arama sonuçlarını veya bozuk web sayfalarını dizine eklememek için yardım alabilirsiniz.

- Tarayıcıların web sunucularına aşırı yüklenmesini önlemek için Yük Bir miktar tarama gecikmesi ekleyerek aynı anda birden fazla içerik.

- İnsanların, özellikle bir web sitesini ilk kez ziyaret eden bir kişinin izlenimini etkileyebilecek olan hazırlık sürümündeki herhangi bir sayfaya girmesini istemiyorsanız.

- Kullanıcı aracılarının aşağıdakilerin konumuna kolayca erişmesine yardımcı olmak için site haritası(s).

Bir web yöneticisi, bir web sitesinin belirli bir bölümünü (özellikle yapım aşamasında veya tamamlanmamış olanları) tarama botlarından tamamen gizli tutabilir.

İndekslenen URL sayısı beklentilerin üzerine çıkarsa robots.txt dosyasını oluşturmak gerekir.

Robots txt nasıl uygulanır?

Bu en iyi robots.txt oluşturmak için kurallarla uyumlu basit bir metin dosyası oluşturmak için not defteri veya wordpad gibi herhangi bir kelime editörü kullanmak.

Robots txt nasıl yapılır?

Sadece "User agent:" ve "Disallow" gibi temel yönergeleri ekleyin: /" gibi temel yönergeleri ekleyerek web sitesi için temel bir dosya oluşturun.

Robots txt dosyasını nasıl oluşturabilirim?

Herkes robots.txt dosyası içinde uyumlu sözdizimini takip ederek kuralları ekleyebilir.

Sitem için Robots txt Dosyası Nasıl Yapılır?

En iyi yol, öncelikle web sitenizin site haritalarını oluşturmak ve daha etkili hale getirmek için URL'lerini en alta eklemektir.

Robots txt Dosyası Nasıl Oluşturulur?

Bir robots.txt dosyası içinde kullanılan yaygın terimler şunlardır:

Sürünme gecikmesi - Belirli bir tarayıcının bir sayfanın içeriğine erişmeden önce ne kadar süre beklemesi gerektiğini gösterir. Komut Googlebot için çalışmayacaktır, ancak crawl oran aynı işi yapmak için Google Search Console'dan ayarlanabilir.

- User-agent - Bir web yöneticisinin tarama talimatları vermek istediği belirli bir web tarayıcısından veya kullanıcı aracısından (genellikle bir arama motoru) bahseder. Şunlar vardır TEKNİK Google için Googlebot ve benzeri arama motorları için isimler.

- İzin Ver (Google tarafından kullanılır) - Googlebot'a herhangi bir üst alt klasörün veya izin verilmemiş olabilecek bir sayfanın içinde bulunan bir alt klasörü veya sayfayı taraması talimatını vermek için kullanışlı bir sözdizimidir.

- Disallow - Bir web botuna belirli bir URL'ye erişmemesi için talimat vermektir. Bu komuta herhangi bir URL için iki kez izin verilmemelidir.

-Site Haritası - Yahoo, Ask, Bing veya Google gibi herhangi bir uyumlu kullanıcı aracısı, bir URL'ye dayalı olarak söz konusu XML site haritalarının konumunu bulmak için bu komuta erişebilir.

Not: Dolar işareti ($) ve yıldız işareti (*) gibi düzenli ifadeler SEO Bing ve Google'ın kullanıcı aracılarının alt klasörleri veya sayfaları tanımlamasına yardımcı olmak için. Burada * olası tüm URL sonlandırma seçeneklerini kapsayan kalıp eşleştirme sözdizimidir ve * basit bir joker karakter olarak çalışan farklı bir karakter dizisini temsil eder.

Botların Sitenizi Taraması Nasıl Engellenir?

Bir web sitesinin bir sayfasına veya alt klasörüne erişmemek için her biri veya tümü için yönergeler belirleyerek web botlarını engelleyerek veya izin vermeyerek yapılabilir.

Botların Sitemi Taramasını Nasıl Durdurabilirim?

İşte robots.txt dosyasında kullanıcı-ajanlarına veya web tarayıcılarına talimat vermek için yaygın olarak kullanılan bazı direktifler;

Robots txt'ye nasıl izin verilir?

1) Her web tarayıcısının tüm içeriği bulmasına izin vermek

Sözdizimi: Kullanıcı aracısı: * Disallow:

Web Tarayıcıları nasıl önlenir?

2) Belirli bir web tarayıcısının bir klasöre erişmesine izin vermeme

Sözdizimi: Kullanıcı aracısı: Googlebot Disallow: /extra-subfolder/

(Yukarıdaki talimat, Google'ın tarayıcısından www.site-name.com/extra-subfolder/ konumunun hiçbir sayfasına erişmemesini istemektedir)

Robots txt'de tümünü nasıl devre dışı bırakabilirim?

3) Tüm web tarayıcılarının herhangi bir içeriğe erişmesine izin vermemek

Sözdizimi: Kullanıcı aracısı: * Disallow: /

(Basit talimatı Robots txt botları nasıl engellenir sorusuna çözüm olarak kullanabilirsiniz)

Tarayıcılar Nasıl Engellenir?

4) Belirli bir web tarayıcısının belirli bir web sayfasına erişmesine izin vermemek

Sözdizimi: Kullanıcı aracısı: Googlebot Disallow: /extra-subfolder/useless-page.html

Google Robotları Nedir?

Popüler arama motoru birçok örümcek Web üzerinde dolaşan ve web sitelerini tarayan yazılım. Bunlardan öne çıkanlar Googlebot, Googlebot-images (resimler için kullanılır) ve Googlebot-news (haberlerle ilgili bilgileri indekslemek ve kullanıcılara sunmak için).

Web sitem için Robots txt nasıl oluşturulur?

Standart UTF-8 metin dosyası oluşturabilen bir metin düzenleyici kullanın. Dosyayı bir kelime işlemci kullanarak oluşturmak, kıvırcık tırnak işaretleri gibi beklenmedik karakterler ekleyebilir ve tarayıcıların talimatları anlaması için sorun yaratabilecek herhangi bir özel formatta kaydedebilir. # karakteri veya işareti belirtildikten sonra yorumlar eklenebilir.

Bir SEO Danışmanı İşe Alın

Londra'da yaşayan ve Zoopla, uSwitch, Mashable, Thomson Reuters ve diğerleri gibi şirketlerle çalışan #1 SEO Danışmanını işe alın. Lukasz Zelezny'i (MCIM, F IDM) işe alın.

    Google için Robots txt Dosyası Nasıl Oluşturulur?

    Burada, özellikle Google kullanıcı aracıları için dosya oluşturma konusunda bazı öneriler bulunmaktadır;

    1) Dosya, Robotları Dışlama Standardına uygun olmalıdır.

    2) Belirtilen tarayıcının bir sitenin belirli bir yoluna erişimine izin vermek veya engellemek için bir veya daha fazla kural içerebilir.

    3) Bir web yöneticisi, her bir sözdiziminin ince davranışını anlamak için robots.txt dosyasının neredeyse tüm sözdizimine aşina olmalıdır.

    4) Site birden fazla robots.txt dosyasına sahip olamaz.

    5) Dosya hem alt alan adlarını (http://website.demo.com/robots.txt gibi veya (http://demo:8181/robots.txt) gibi standart olmayan herhangi bir bağlantı noktasını) destekler.

    6) Web sitenizin kök klasörünü bilmiyorsanız veya bu klasöre erişiminiz yoksa, robots.txt dosyasını aynı klasörün içinde tutmak için web barındırma hizmeti sağlayıcısına ulaşmak en iyisidir. Web sitesi kök dizinine erişemiyorsanız, alternatif engelleme yöntemi olarak meta etiketleri kullanın.

    7) Robots.txt dosyasına birden fazla grup yönergesi veya kuralı (her satırda bir tane olmak üzere) dahil edilebilir.

    8) Yalnızca ASCII karakterlerini destekler.

    9) Bir grup, kime uygulandığı (kullanıcı aracısı) ve bir aracının erişemediği/erişebildiği tüm dosya veya dizinlerin ne olduğu hakkında bilgi sağlar. Yönergeler yukarıdan aşağıya doğru işlenir. Bir web botu kendisini ayrı olarak belirtilebilen veya önce gelen yalnızca bir kural kümesiyle ilişkilendirir.

    10) Varsayılan varsayıma göre, bir bot "Disallow:" sözdizimi ile herhangi bir dizini veya sayfayı tarayabilir.

    11) Dosyada kullanılan yönergeler Disallow gibi büyük/küçük harf duyarlıdır: /one.xml ONE.xml için geçerli değildir.

    12) Tamamı için geçerlidir aşağıdakilerden oluşan bir web sitesinin alan adı https veya http protokolü.

    Genellikle, Bing ve Google'ın kullanıcı aracıları belirli bir yönerge grubunu kullanır, ancak varsayılan olarak, farklı arama motoru web botları yönergeleri farklı bir şekilde yorumladığından, ilk olarak eşleşen kurallar tercih edilir.

    Ayrıca web yöneticilerine, arama motoru botlarının toplam tarama süresini azaltmak için robots.txt dosyalarında mümkün olduğunca crawl-delay sözdizimini kullanmaktan kaçınmaları önerilir.

    Robots txt nasıl kontrol edilir?

    Robots.txt Tester aracından yardım alabilirsiniz. Google'ın web yöneticisi konsolu Google'ın botlarının, Arama'dan zaten engellediğiniz URL'yi tarayıp tarayamadığını kontrol etmek için. Ayrıca robots.txt dosyanızda varsa mantık hatalarını ve sözdizimi uyarısını da gösterebilir. Orada düzenleme yapabilir ve yeniden test edebilirsiniz.

    Her şey yolunda gittiğinde, değişikliklerle başa çıkabilir ve web sitesi sunucunuzda bulunan ana dosyanızı güncelleyebilirsiniz. Benzer şekilde, web sitenizin robots.txt dosyasını okuduktan sonra arama motorunun tarama davranışını önceden kontrol etmek için farklı araçlar kullanabilirsiniz.

    Robots txt'nin çalışıp çalışmadığını nasıl kontrol edebilirim?

    Ayrıca, web sitenizdeki robots.txt'nin nasıl performans gösterdiğini, web sitenizin sol bölümünde bulunan 'Tarama' bölümündeki 'Engellenen URL'ler; özelliğini kullanarak da kontrol edebilirsiniz. Google Web Yöneticisi Araçları. Bununla birlikte, robots.txt'nin güncel veya güncellenmiş sürümünü göstermeyebilir, ancak test amacıyla kullanılabilir.

    Bir Web Sitesindeki Robot txt Dosyası Nasıl Kontrol Edilir?

    Robots.txt dosyanızdaki her şeyin geçerli olup olmadığını ve dosyanın beklendiği gibi doğru şekilde çalışıp çalışmadığını herhangi bir araç kullanarak düzenli olarak kontrol etmeye çalışın! Bu arada, bir arama motorunun izin verilmeyen bir URL'yi robots.txt'den okuyarak tanımlaması ve dizinlemesini kaldırması günler hatta birkaç hafta sürebilir.

    HTML'de Robots txt nasıl eklenir?

    Tüm kural setlerini dosyaya dahil ettikten ve robots.txt ile adlandırdıktan sonra, sunucudaki web sitesinin ana veya kök klasörüne kaydedilmesi gerekir. Kök düzeyindeki bir klasör, robots.txt'nin alan adınızın yanında görünmesine yardımcı olan bir "www" veya "htdocs" olabilir.

    Robots txt Dosyası nasıl kurulur?

    İstenmeyen yönergelerin dosyada belirtilmesinden kaçınarak robots.txt'nin makul bir boyutta tutulması her zaman önerilir. Bunun nedeni, Google'dan John Mueller'in yıllar önce Googlebot'un bir robot.txt dosyasının yalnızca ilk 500kB'lık kısmına erişeceği gerçeğini açıklamış olmasıdır. Devasa bir dosya, eksik bir kural olarak yorumlanabilecek bir satır oluşturmak için istenmeyen bir şekilde kesilebilir.

    Robots txt Dosyası ne için kullanılır?

    Web siteleri tarafından web robotları veya tarayıcıları ile iletişim kurmak için kullanılan Robots dışlama protokolü veya robots dışlama standardı olarak da bilinir. Arama motorları web sitelerini kategorize etmek için robotlarını kullanır.

    Web yöneticileri robots.txt dosyalarını, web sitelerinin daha iyi indekslenmesi için bu tür robotlara talimat vermek veya onları yönlendirmek için kullanırlar. Web sitenizin herhangi bir alanına kullanıcı aracısı erişimini kontrol etmek istemiyorsanız robots.txt dosyasına ihtiyacınız yoktur. Robots.txt hakkında daha fazla bilgiyi Arama Motoru Botu Nasıl Oluşturulur?

    SEO için Robots txt nasıl kullanılır?

    Daha iyi arama motoru sıralamaları için, tarayıcılarının sitenize kolaylıkla ulaşmasına ve erişmesine izin vermek en iyi SEO uygulamasıdır. Web sitemiz genellikle beklentilerimizden çok daha fazla istenmeyen sayfadan oluşur ve arama motoru botları sitenizin her sayfasını taradığında kesinlikle daha fazla zaman tüketecek ve bu kesinlikle sitenizi olumsuz yönde etkileyecektir. sıralaması.

    Google, taramak istediği veya tarayabileceği URL sayısına karar vermek için her web sitesinin tarama bütçesini (tarama hızı sınırı ve tarama talebi olmak üzere iki bölüme ayrılır) kullanır. Bu nedenle, bu tür botların veya kullanıcı aracılarının web sitenizin yalnızca en değerli içeriğine erişmesine ve dizine eklemesine yardımcı oluyorsanız robots.txt bir zorunluluktur!

    Bir SEO, bir web sitesinde taranması gereken herhangi bir bölümün veya içeriğin engellenmesini asla istemez.

    - Google gibi bir arama motorunun Googlebot-Image (görselleri aramak için) gibi birden fazla kullanıcı ajanı olabilir ve Googlebot (organik arama için). Aynı arama motoruna ait birçok kullanıcı aracı aynı kuralları takip edebilir, bu nedenle birçok web yöneticisi bu tarayıcıların her biri için yönergeler belirlemeyi atlar. Bir SEO, tarama davranışlarını daha iyi kontrol etmek için tek bir arama motoruna bağlı olsalar bile her bir tarayıcıya farklı talimatlardan bahsederek bundan yararlanabilir.

    - Daha iyi bir SEO için, izin verilmeyen bağlantıların veya sayfaların takip edilmesi gereken başka bağlantılar içermemesi gerekir. Bu nedenle, engellenen sayfa bağlantı hedefine bağlantı eşitliği aktarmamalıdır veya başka bir engelleme mekanizması kullanmak daha iyidir. Ayrıca, arama motorları tarafından erişilebilen diğer sayfalarla, yani meta robotlar, robots.txt veya başka bir şekilde izin verilmeyen web sayfalarıyla bağlantılı olmamalıdırlar. Aksi takdirde, önemli bağlantılı kaynaklar arama motorları tarafından erişilemez ve dizine eklenemez.

    - Hedeflenen kullanıcı aracısı tarafından hızlı bir şekilde erişilmesini sağlamak için dosyada yapılan herhangi bir güncellemeden sonra robots.url URL'sini doğrudan Google'a göndermek en iyisidir. Genellikle, bir arama motoru önbelleğe alınmış robots.txt içeriğini günde en az bir kez günceller.

    Robot txt SEO için nasıl etkili hale getirilir?

    Tümünün veya herhangi birinin yerini belirtmek iyidir site haritaları robots.txt dosyasının alt kısmındaki web sitesinin etki alanına göre. Bu arada, site haritaları, bir web sitesinin sayfaları hakkında URL'leri gibi ayrıntılı bilgileri, önemi, güncelleme aralığı ve son güncelleme gibi ilgili meta verilerle birlikte içeren XML dosyalarıdır.

    Tüm bu bilgiler arama motoru botları tarafından bir web sitesini akıllıca taramak için kullanılabilir. Bu şekilde web yöneticileri, Site Haritalarını destekleyen kullanıcı aracılarının site haritasındaki tüm URL'leri bilmesine ve bunlara erişmesine yardımcı olabilir ve bir bağlantıdan diğerine veya başka bir siteden sayfaları keşfetme sürecinde onlar hakkında daha fazla bilgi sahibi olabilir.

    Örneğin;

    Tarayıcı adresi: https://www.demo.com/robots.txt

    Çıktı:

    Kullanıcı aracısı: *

    İzin verme: *.dl.html

    İzin ver: /*.html$

    Site Haritası: https://www.demo.com/en-au/sitemap.xml

    Site Haritası: https://www.demo.com/en-se/sitemap.xml

    Site Haritası: https://www.demo.com/en-us/sitemap.xml

    (Yukarıdaki yönergeler robots.txt dosyası aracılığıyla birden fazla site haritasını çağırmak içindir).

    Robots txt'den nasıl kaçınılır?

    Robots.txt ile ilişkili güvenlik riskleri vardır, çünkü birçok kötü niyetli bot bunu takip edemez ve biri izin verilmeyen tüm bağlantıları bilmek ve bunlara doğrudan erişmek için kullanabilir. Bu nedenle, çözüm olarak, web sitenizin özel içerik içeren alanını parola ile koruyabilirsiniz, böylece bir davetsiz misafir konumunu öğrendikten sonra bile erişemez.

    Hassas verileri indekslemeden sunmak veya SERP'lerde görünmek için (doğrudan veya dolaylı olarak, yani beğenilen sayfalar aracılığıyla), sayfayı engellemek için robots.txt'den aynı şeye izin vermemekten başka bir yöntem kullanmak en iyisidir. Bu, dizin meta yönergesi yok veya parola koruma yöntemleri olabilir.

    Robots txt Dosyası Web Sitesinden Nasıl Kaldırılır?

    WordPress genellikle dizinde görülemeyen web siteleri için doğrudan kökte sanal bir varsayılan robots.txt dosyası oluşturur. Bu nedenle, özellikle bir arama motoru için önemli olmayan giriş veya kayıt sayfasına izin vermemek için varsayılan ayarlarla örtüşen yeni bir dosya oluşturmak her zaman en iyisidir!

    Birçok kişinin kafası genellikle WordPress veya diğer platformlarda Robots txt'nin nasıl kaldırılacağı konusunda karışıktır. Ancak süreç herkes için aynıdır! Robots.txt dosyasının web sitesinin en üst düzey dizinine, yani kök etki alanına veya ana dizine kaydedilmesi gerekir, böylece botların onu kolaylıkla bulmasına yardımcı olur. Dolayısıyla, tek yapmanız gereken dosyayı doğrudan söz konusu klasörden veya konumdan silmektir.

    Son düşünceler

    Gizli kullanıcı bilgilerini gizleme talimatlarını robots.txt dosyasının içine eklememeye çalışın. Çünkü bu dosya herkesin erişimine açık bir dosyadır ve kök alan adının sonuna /robots.txt eklenerek yönergeleri görülebilir.

    Bu şekilde, herkes sitenin web yöneticisi tarafından tüm sayfaların tüm veya belirli web botları tarafından taranmasına veya taranmamasına izin verildiğini öğrenebilir. Dosya yalnızca "robots.txt" adıyla kaydedilmelidir, çünkü büyük/küçük harfe duyarlıdır, dolayısıyla başka hiçbir kombinasyon herhangi bir kullanıcı aracısı tarafından kabul edilmeyecektir!

    Son olarak, benzer terimler gibi görünen x-robots, meta robots ve robots.txt arasında kafanız karışmış olabilir. Bunlardan x-robots ve meta meta yönergeleridir ancak robots.txt bir metin dosyasıdır ve farklı işlevleri uygulamak için kullanılırlar.

    Daha açık olmak gerekirse, x-robots ve meta, sayfa öğesi (veya tek tek sayfa) düzeyinde dizin oluşturma davranışını belirlerken, robots.txt, yönetici veya site tarafı tarama davranışı hakkında bilgi sağlar.

    Arama motoru botlarının aynı siteyi tararken tarama bütçesini iyi harcayarak web sitenizin içeriğini SERP'lerde daha iyi bir şekilde indeksleme ve görüntüleme ve daha görünür hale getirme şansı daha yüksektir. Robots.txt kullanarak otomatik oluşturulan WordPress etiket sayfalarının taranmasını da engelleyebilir ve daha fazla yinelenen içeriği önleyebilirsiniz.

    Genel olarak, robots.txt dosyasına neleri dahil edeceğinizle ilgilenirken çok dikkatli olmanız gerekir. Sonuçta, robots.txt dosyasındaki küçük bir hata tüm web sitenizin deindexed edilmesine neden olabilir.

    SEO için Robots txt Nasıl Kullanılır?

    Son Güncelleme 2021-03-26T12:46:24+00:00 tarafından Lukasz Zelezny