Analýza indexace – Scrape SERPu Googlu

  • Adam Telička

Zajímalo Vás někdy, co všechno na Vaší stránce vyhledávače indexují? Rychlou kontrolu indexace jedné stránky popsal na svém blogu kolega Filip Bartoš. A jasně, pokud máte sadu URL adres (ať už ze sitemapy nebo crawlu), tak je můžete celkem snadno prohnat nějakým nástrojem pro kontrolu indexace. Měl by to umět jak Collabim, tak Marketing Miner. Nicméně po ne tak dávném updatu Googlu, kdy už nefunguje vyhledávání pomocí operátoru „info:“ netuším s jakou úspěšností a přesností.

No a jak postupovat, když potřebuji zjistit, co se reálně indexuje a jestli přeci jenom v SERPu není nějaký ošklivý a zlý... nepěkná věc?

 

Google Search Console

Použití Search Console je nejspíš nejjednodušší a nejrychlejší způsob, jak zkontrolovat, co se na webu zaindexovalo, a co ne.  Po otevření Search Console se prokliknete na záložku „Pokrytí“ a už si můžete procházet, co Vám Google „nevzal“.

TIP: Pokud Search Console hlásí, že platných stránek v indexu je 0, tak se ujistěte, že jste na správné verzi stránky.
Je totiž rozdíl mezi https://weboo.blog & http://weboo.blog & https://www.weboo.blog & http://www.weboo.blog.

Tento způsob je skvělý, pokud analyzujeme indexaci v SERPu Google pro stránky, které spravujeme a máme je tak v Search Console. Pokud nemáme přístup do Search Console (což bychom u našich stránek mít měli), analyzujeme konkurenci nebo potřebujeme z nějakého důvodu zjistit, kdo se zobrazuje na dané klíčové slovo, tak musíme zvolit jinou taktiku – Scrape Indexu.

 

Scrape Indexu

Kreativitě se v marketingu meze nekladou (tedy v rámci mezí) a to samé platí i o použitých postupech. Často totiž dochází ke stejným výsledkům. U scrapingu můžeme použít několik nástrojů, které jsou (asi, moc neozkoušeno) dobré. Pro dva postupy, které jsem používal já, je potřeba jednoduchá příprava. Kdyby někomu vadily mé obrázkové návody ála grafik má dovču, tak jsou doprovázeny i textem.

Vyhledejte si na Google požadovanou frázi nebo web ve formě site:stránka.cz (nebo kombinaci obojího)  –> Klikněte na „Nastavení“ –> „Nastavení vyhledávání“

scrape serpu google

Tady si počet výsledků na stránku nastavte na 100 a uložte.

100 výsledků v SERPu

Pro jistotu ještě skočte na poslední stránku, a pokud se tam zobrazí následující hláška, tak odklikněte „zopakovat vyhledávání…“.

A jdeme na to.

 

Postup číslo 1 aneb jak to fakt nedělat

Rozhodně nikomu nedoporučuji kopírovat si zdrojový kód stránky SERPu z Google. Tedy tak, že kliknete pravým tlačítkem do volné plochy a kliknete na „Zobrazit zdrojový kód stránky“. (Pro fajnšmekry Ctrl + U)

Pak nedoporučuji použít kombinaci klávesových zkratek Ctrl + A & Ctrl + C ke zkopírování zdrojového kódu SERPu stránky. A vložit ho do Wordu. A to samé nedoporučuji zopakovat pro všechny další stránky SERPu.

A v dalším kroku ve Wordu také  nedoporučuji použití klávesových Alt + F11 a na daný soubor používat toto makro, které „vycucne“ všechny odkazy. (makro jsem dal do červeného rámečku, jakože ho FAKT NEDOPORUČUJI)

Sub HyperlinksExtract()

Dim oLink As Hyperlink
Dim docCurrent As Document 'current document
Dim docNew As Document 'new document
Dim rngStory As StoryRanges
Set docCurrent = ActiveDocument
Set docNew = Documents.Add
For Each oLink In docCurrent.Hyperlinks
oLink.Range.Copy
docNew.Activate
Selection.Paste
Selection.TypeParagraph
Next

Set docNew = Nothing
Set docCurrent = Nothing
End Sub

 A pak ve Wordu zase zopakovat Ctrl + A & Ctrl + C a všechno to vkopírovat do Excelu, kde už se URL adresy pomocí filtru jednoduše upraví :‘)

 

Postup číslo 2 což už by šlo

Už do žádného zdrojového kódu nemusíme manuálně chodit. Tento postup je fakt jednoduchý, slibuji =D Označte si následující text (skript) a přetáhněte jej mezi záložky ve Vašem prohlížeči.

javascript:var a = document.getElementsByTagName('a'), arr = '';for(var i=0; i<a.length; i++) if (a[i].ping && !a[i].href.includes('google'))arr +=('<p>' + a[i].href + '</p>'); var newWindow = window.open();newWindow.document.write(arr);//Weboo_G_Indexace newWindow.document.close();

Od teď kdykoliv, kdy budete v SERPu Googlu, tak během jednoho kliku na nově vytvořenou záložku získáte URL adresy všech výsledků na stránce (tedy maximálně 100). Problém vzniká, pokud potřebujete desítky tisíc URL, to už je ale jiný příběh.

Co teď s tím? Všechno možné.

Spoooooustu věcí, prvně si ještě ale doporučuji přečíst článek o tom, jak stáhnout URL ze SERPu Seznamu a o tom, jak vytáhnout URL ze sitemapy.

profilovky adam
Autor

Bc. ADAM TELIČKA

SEO mág Adam je kromě optimalizace pro vyhledávače šikovný textař, e-mail markeťák, linkbuilder a specialista na gramatické oříšky.

Email: Tato e-mailová adresa je chráněna před spamboty. Pro její zobrazení musíte mít povolen Javascript.

No Internet Connection
Notification