• 27.12.2018
  • Ing. Jan Zedníček - Data Engineer & Controlling
  • 0

Nedávno jsem si pořídil do svého portfolia jeden anglicky psaný web – Health Encyclopedia. Stránka byla velmi stará a obsahuje zhruba 1400 článků o různých nemocech, léčbě a podobně. Rozhodl jsem se, že ji celou předělám do redakčního systému WordPress kvůli jednodušší správě do budoucna. V rámci migrace jsem narazil na jeden zajímavý problém. Problém jsem si dost možná způsobil sám svou neznalostí vhodného nástroje. Třeba něco podobného někdo z vás řeší také.

Migrace webu na jiný redakční systém a změna permalinks

V rámci migrace jsem chtěl změnit permalinky (adresy na jednotlivé stránky webu), aby obsahovaly klíčová slova na které jsem chtěl cílit. To je ovšem vcelku významný zásah z několika důvodů.

  • Na web vedou desítky tisíc zpětných odkazů a tyto odkazy jsou nasměrovány na staré adresy. Tyto zpětné odkazy zvedají SEO hodnotu webu a pokud bych situaci neřešil, tak by vyhledávače nebraly tyto odkazy časem do úvahy při scoringu webu a výrazně bych se poškodil z hlediska SEO.
  • Vyhledávače mají zaindexovány staré adresy a pokud by někdo přišel z vyhledávače na starou adresu, tak dostane chybu 404 – stránka nebyla nalezena. Takový návštěvník pravděpodobně z webu odejde.

Tato situace se řeší pomocí 301 trvalého redirectu z nějaké url na novou url. Tím vyhledávači řekneme, že původní adresa webu je trvale zrušena a obsah stránky je přesunut na novou adresu. V momentě, kdy vyhledávač takové přesměrování zaregistruje, tak přesune autoritu stránky ze staré url na novou.

Jak přesměrovat url ze staré adresy na novou?

Ve WordPressu existuje fajn plugin – Redirection. Tento plugin umožní zadat obě adresy a přesměrování provede automaticky – pokud někdo příjde na starou URL, tak dojde k přesměrování na novou url (ukázka viz screen). Vzhledem k tomu, že web má asi 1400 článků, tak bych se z toho asi zmláznil.

Wordpress redirection plugin

Naštěstí plugin umí automatický import. Problém je ale jiný – mám 2 seznamy z nichž každý obsahuje 1400 adres (nové x staré) a potřebuju tyto dva seznamy nějak spárovat a následně je do pluginu nahrát.

seznam url pro redirecty

Porovnání 2 seznamů url pomocí fuzzy lookup

Naštěstí jsem si vzpomněl na fuzzy lookup (článek kde jsem psal o tom jak FL funguje). Fuzzy lookup je addin do excelu, který umí seznamy spárovat na základě podobnosti (similarity). No a to je přesně to, co jsem potřeboval – prohnat oba seznamy nějakým strojkem, který mi je sám spáruje (viz screen).

Výsledek jsem potom jen proletěl okem a výsledek byl super. Z celkem 1400 adres se spárovalo 1370 a zbytek jsem doplnil ručně – úspora práce výrazná. Z excelu jsem vygeneroval textový soubor a následně nahrál do redirection pluginu. Kdokoliv teď příjde na nějakou starší adresu webu, tak je přesměrován na správnou stránku.

fuzzy lookup a porovnani dvou seznamu

 

5/5 - (3 votes)

Ing. Jan Zedníček - Data Engineer & Controlling

Jmenuji se Honza Zedníček a působím jako freelancer. Pracoval jsem dříve také jako BI developer, finanční controller a analytik. Vše pro společnosti z oblasti IT, bankovnictví, consultingu a výroby. Po práci si rád zahraju tenis, volejbal, šachy, zajdu do posilovny a občas neúspěšně odpálím pár balónků v golfu 🏌️

Již cca 10 let zapisuji na tento web různé návody určené zejména odborné veřejnosti, studentům a zájemcům o informace z oblastí Business intelligence, korporátních financí a reportingu.

🔥 Přihlašte se do naší Excel facebook skupiny (2.4k+ členů), kde si pomáháme Excel CZ/SK diskuse »

Leave a Reply

Your email address will not be published. Required fields are marked *