I dag taler vi om et fil, der er kendt for alle: Sitemap. En fil, som de fleste projekter bruger på Internettet, og meget få bruger dem korrekt.
Jeg har allerede ønsket at tale om dette, og tiden er kommet, da denne fil for det meste går ubemærket hen og genereres automatisk med et plugin eller modul og bliver aldrig rørt igen. Og sandheden er, at den har mange anvendelser, som jeg vil fortælle dig om gennem denne artikel.
I denne artikel vil jeg afsløre nogle aspekter, som vi finder i vores daglige med Sitemaps og de løsninger, vi vælger, afhængigt af projektet, volumen og status.
Hvad er sitemap?
Sitemap er en fil, der bruges til at indtaste webadresserne til et webprojekt til alle søgemaskiner (i dette tilfælde Google), så robotter kan spore projektet mere effektivt. Derudover sikrer sitemap også, at robotterne indsamler disse oplysninger før, brugen af dem, afhænger allerede af andre faktorer, som jeg vil fortælle dig gennem denne artikel.
Formater, hvor vi kan generere et sitemap:
- XML: Dette er den mest anvendte, og den, jeg anbefaler, du bruger. De fleste plugins, moduler og udvidelser, der bruges af indholdsadministratorer som WordPress, Prestashop eller Magento bruger dette format.
- RSS: Hvis du har et genereret feed, der automatiserer udgivelse af nyt indhold, kan du medtage det som et sitemap, men vær forsigtig med dette, fordi de fleste feeds glemmer mange gamle sider, der ikke genereres automatisk.
- Tekstdokument: Du kan også inkludere .txt-filer til generering af dit sitemap. I denne tilfælde, skal du medtage en URL pr. Linje.
- Google Sites: En anden måde at oprette et sitemap på, som jeg ikke anbefaler, men som Google tillader brug, her giver jeg dig alle oplysninger: https://support.google.com/webmasters/answer/183668?hl=da&ref_topic=4581190#sitemapformat
Det skal bemærkes, at du også kan oprette sitemaps til Billeder, videoer eller mobil.
VIGTIGT: Husk, at du ikke kan generere sitemaps på mere end 50.000 webadresser, selvom jeg anbefaler, at du ikke overstiger 40.000 fra min erfaring. Når du har mange tusinder af webadresser, er det praktisk at oprette et indeks over sitemaps. Noget du skal også huske på, at det i de fleste tilfælde ikke er tilgængeligt er følgende aspekter:
- Inkluder ikke Sitemaps med Noindex
- Medtag ikke Sitemaps i Sitemap, der ikke matcher en 200-kode
- Inkluder ikke IKKE-kanoniske webadresser i sitemapet
For resten, Sitemaps bruges ikke til at indeksere URL’er, det er rigtigt, at generering af Sitemaps hjælper tilstrækkeligt med at gennemgå, men de bruges ikke til at indeksere, meget mindre en obligatorisk fil. Ethvert lille medium websted har ikke brug for et sitemap for Google til at indeksere URL’erne, bare et godt internt link er tilstrækkeligt.
Her giver jeg dig et tilfælde af succes, så du kan bruge oplysninger og se, hvordan en god brug af Sitemaps tjener til at forbedre gennemsøgning, indeksering og øge trafikken: https://moz.com/blog/multiple-xml-sitemaps-increased-indexation-and-traffic

Fejl ved generering af sitemaps
I de senere år, når jeg har revideret hjemmesider og arbejdet på forskellige projekter, har jeg stødt på alt med emnet Sitemaps, men det der fremhæver mest frem for alt er følgende:
- Inkluder webadresser svarende til 301 tags.
- Inkluder webadresser, der matcher 404.
- Inkluder webadresser, der kanonisk peger på en anden webadresse.
- Inkluder webadresser, der er blokeret af Robots.txt (dette er den bedste xD).
For at kontrollere, at intet af dette sker for dig i et projekt, er meget simpelt, skal du bare bruge projektets sitemap og en værktøj som Screaming frog, f.eks., for at matche URL’erne. Når du har identificer fejl kan du generer et korrekt sitemap. Med dette får du en vigtig sporingsforbedring. Afhængigt af tilstanden på dit sitemap kan denne sporingsforbedring få dit projekt til at begynde at forbedre dets placering.
Hvornår skal du udføre denne kontrol?
Generelt vil jeg gerne liste nogle situationer, hvor denne kontrol er meget vigtig, samt generering af et nyt sitemap, der får Google-robotten til at bevæge sig mere intelligent gennem dit websted:
- Hvis du har implementeret den berømte HTTPS på dit websted, er det et vigtigt øjeblik at tjekke dit sitemap, og du vil se, hvor meget 3xx du finder.
- Hvis du for nylig har foretaget en migrering eller ændring af webadresser. Du finder overraskelser som: 301 og 404 xD.
- Hvis du virkelig kan lide at lege med Noindex eller bruge et plugin til at generere dit Sitemap, vil du helt sikkert finde URL’er med noindex, som du inkluderer i Sitemap.
- Hvis du virkelig kan lide brugen af ”canonical”, vil du helt sikkert finde ubehagelige overraskelser på dit sitemap.
Avanceret brug af sitemap
Sitemaps har forskellige anvendelser. Her vil jeg forklare dig i hvilke situationer jeg bruger dem, og hvorfor hver af disse handlinger jeg udfører:
Fremskynde de-indekseringen af et stort antal webadresser takket være sitemap
Vi starter med det første almindelige scenario! Vi har en række unødvendige webadresser, som vi vil de-indeksere af en eller anden grund (jeg vil ikke gå i detaljer, men dette vil være for evigt, i efterfølgende indlæg vil vi overveje, hvorfor vi ofte har brug for at de-indeksere webadresser). Forestil dig, at der er hundreder eller tusinder. Du kan ikke vente på, at Google gennemgår hver enkelt baseret på gennemsøgningshastigheden.
- For at fremskynde denne proces med de-indeksering af et stort antal webadresser, skal vi bare generere et sitemap med alle de webadresser, vi allerede har uden noget indeks, og uploade dem til Search Console.
- Efter lang tid tager vi simpelthen alle disse webadresser og kontrollerer, at de er de-indekseret med URL-profil (Jeg vil forklare dette værktøj senere). Indtast bare alle webadresser, og vælg indstillingen “Google Indeksering”.
- Når vi ikke er indekseret, fjerner vi sitemap fra Search Console.
Opret et sitemap for at fjerne webadresser hurtigere
Dette scenario vises i mange e-handel! Forestil dig, at du har en e-handel, og at du arbejder med produktsæsoner, og pludselig skal du fjerne forskellige kategorier og produkter af forskellige årsager. Vær forsigtig, når dette sker, der er flere muligheder:
- Sørg for, at ingen URL har eksterne links, der giver autoritet.
- Kontroller den organiske trafik til disse webadresser, for hvis jeg har nogen webadresser med trafik, vil jeg ikke slette dem.
- Kontroller, at der ikke er nogen lignende produkter, for hvis der var og vi havde trafik til disse webadresser, kunne vi køre en 301.
BEMÆRK: Noget meget almindeligt inden for e-handel er omdirigeringer til andre dele af internettet. I de tidligere punkter har jeg allerede kommenteret, hvad jeg skal kontrollere, før jeg træffer beslutninger. Problemet med at foretage omdirigeringer uden sund fornuft og uden at analysere er, at der genereres 404 soft tags, og når du fortsætter med denne praksis, vil Search Console blive oversvømmet med dem.
- Hvis du allerede har besluttet, at du har brug for at fjerne disse URL’er, fordi de ikke har trafik eller eksterne links, der giver autoritet, og også disse URL’er ikke længere eksisterer. Du skal bare få disse URL’er til at returnere en 410-kode.
- Opret et sitemap med alle de URL’er, der svarer til 410.
- Efter lang tid tager vi simpelthen alle disse URL’er og kontrollerer, at de er blevet indekseret ved hjælp af URL Profiler. Indtast bare alle webadresser, og vælg indstillingen “Google Indeksering”.
- Når vi ikke er indekseret, fjerner vi sitemap fra Search Console.
Sitemap, opsummering
Som du har set igennem artiklen, Sitemap har flere anvendelser og du kan få meget ud af det. Den dag i dag er jeg overbevist om, at det ikke får mest ud af det, og det var derfor, jeg ville vise, at jeg bruger det sammen med mine kolleger i det daglige liv.
Hvis du kontrollerer sitemap fra tid til anden, tager det i betragtning og bruger de avancerede aspekter, som jeg har vist dig, vil det helt sikkert være et meget produktivt værktøj for dig, og afhængigt af tilfældet hjælper det dig med at forbedre gennemsøgningen af dit websted.
Nu vil jeg vide det den brug, du giver til sitemap og dermed kunne få flere ideer til at kunne bruge denne fil mere effektivt og få mere ud af den. Vover du at kommentere din brug og dine indtryk?