Analýza indexace – Sběr URL adres ze sitemapy
V minulých článcích jste se dozvěděli, jak získat seznam stránek, které jsou indexované na Googlu a seznam stránek, které jsou indexované na Seznamu. Ještě, než začneme analyzovat, kde máme v indexaci mezery, je třeba získat sadu URL stránek, se kterou indexované stránky budeme porovnávat. Tato URL pro naše účely budeme čerpat ze dvou zdrojů: ze souboru sitemap a z „crawlu“. V tomto článku se dozvíte, jak lokalizovat soubor sitemap.xml a jak z něj jednoduše vytáhnout všechna URL stránek.