Robots.txt

Robots.txt er en simpel tekstfil i roden af din hjemmeside, som giver instruktioner til webcrawlere og søgemaskinerobotter om adgang til dit indhold. Filen fortæller, hvilke sider og mapper robotter må eller ikke må crawle og indeksere. Du placerer den altid på domænets rotniveau, for eksempel https://eksempel.dk/robots.txt. Robots.txt følger Robot Exclusion Protocol, som udgør en de-facto standard for, hvordan søgemaskiner læser og respekterer disse instruktioner, selvom de teknisk set kan vælge at ignorere dem.

This is a test
Jeg har 10 års erfaring med SEO og en bachelor i retorik i bagagen. Jeg har bred viden om teknisk og semantisk SEO samt indholdsautomatisering – og et solidt fundament inden for tracking og digital markedsføring generelt. Jeg er drevet af en ukuelig nysgerrighed efter ny viden og evnen til at omsætte den til konkrete tiltag, der styrker mine kunders forretning. Jeg har desuden en forkærlighed for sprog og kommunikation, hvilket i sin tid tid også var min indgangsbillet til branchen.

Hvad er robots.txt?

Robots.txt er en tekstfil, du placerer i roden af dit website for at fortælle søgemaskiner, hvilke sider de må og ikke må crawle. Når eksempelvis Googlebot besøger din side, tjekker den automatisk filen på https://ditdomæne.dk/robots.txt, før den begynder at indeksere dit indhold. Det sker, fordi filen fungerer som et sæt instruktioner – ikke som en teknisk spærring. Søgemaskinen vælger frivilligt at respektere anvisningerne ud fra den fælles såkaldte Robot Exclusion Protocol.

Filen er en de-facto standard i søgemaskineoptimering, og den spiller en central rolle i, hvordan du kontrollerer, hvilke sider der får opmærksomhed i søgeresultaterne. I praksis kan du bruge den til at undgå, at irrelevante sider – som interne ressourcer, testmiljøer eller dubleret indhold – sluger crawlbudget. Det handler med andre ord om at styre, hvordan søgemaskiner interagerer med din digitale infrastruktur.

Hvordan bruger du robots.txt?

Når du arbejder med SEO eller teknisk optimering, udnytter du robots.txt til at styre adgangen for forskellige bots. Du kan give generelle instruktioner til alle crawlere eller tilpasse reglerne til specifikke user-agents. Direktivet User-agent definerer hvilken robot reglen gælder for, Disallow fortæller hvilke stier den ikke må tilgå, og Allow kan tilsidesætte en blokering for bestemte mapper eller filer. Du kan også tilføje et Sitemap-direktiv, der guider søgemaskiner direkte til dit XML-sitemap, så indekseringen bliver mere effektiv.

Eksempel på en simpel struktur:

User-agent: *
Disallow: /admin/
Allow: /public/
Sitemap: https://eksempel.dk/sitemap.xml

Søgemaskiner som Google følger den nyeste standard (RFC 9309), og derfor er det vigtigt, at du formaterer filen korrekt. Hvis du laver fejl i strukturen, kan robotterne misforstå dine regler og potentielt udelukke hele sitet fra indeksering. Derfor bør du altid teste din fil, før du uploader den.

Derfor skal du bruge robots.txt

Ved at styre, hvor søgemaskiner crawler, hjælper du både din server og din synlighed. Når du blokerer uvedkommende eller teknisk indhold, sparer du crawlressourcer, så robotterne bruger deres tid på de sider, der faktisk har værdi for søgninger. Det har betydning for din SEO-strategi, fordi søgemaskiner arbejder med begrænset crawlbudget. Hvis du lader bots spilde tid på ligegyldige undersider, risikerer du, at de vigtigste sider ikke bliver opdateret lige så ofte.

I nogle tilfælde handler det også om sikkerhed og performance. Du kan for eksempel forhindre, at filsider i /backup/ eller scriptmapper bliver gennemsøgt. Robots.txt beskytter dog ikke mod adgange fra ondsindede aktører, da enhver kan se og ignorere filen. Den fungerer udelukkende som en retningslinje, ikke som et teknisk værn. Derfor bør du kombinere den med andre løsninger som korrekt brug af noindex-tags, loginbeskyttelse eller adgangsbegrænsning via din webserver.

What types and varieties are available?

Robots.txt arbejder med nogle få, men vigtige direktiver. De mest almindelige er:

  • User-agent: Angiver hvilken bot en instruks gælder for, fx * for alle eller Googlebot for Googles crawler.
  • Disallow: Forhindrer adgang til en sti eller fil.
  • Allow: Tillader adgang, selvom et overordnet Disallow gælder.
  • Sitemap: Henviser til dit sitemap, som hjælper søgemaskiner med bedre dækning af dit indhold.

Når du arbejder på tværs af underdomæner eller protokoller (http/https), kræver hver version sin egen robots.txt-fil. Hvis du ikke har nogen fil, betragter søgemaskiner det som fuld adgangstilladelse. Det er derfor bedre at have en eksplicit konfiguration, også selvom du giver fri adgang – så undgår du misforståelser.

Hvordan bruger du robots.txt i praksis?

Du opretter filen i en teksteditor og gemmer den som “robots.txt” i din rodramme. Placer den, så den er tilgængelig direkte på domæneroden, ikke i en undermappe. Upload den herefter via FTP eller dit CMS’ filhåndtering. Mange vælger at kombinere arbejdet med robots.txt med struktureret data og sitemapoptimering, fordi det tilsammen styrker helheden i søgemaskinernes forståelse af dit site.

For at sikre, at filen fungerer som forventet, kan du teste den i Google Search Console under robots.txt-værktøjet. Her ser du, hvilke linjer Google følger, og om nogle regler konflikter. Hvis du arbejder med kampagnesites, subdomæner eller internationale versioner, kan du tilpasse dine direktiver per land eller sprogversion. Det sikrer sammenhæng mellem SEO-opsætningen, de betalte kampagner i Google Ads og den overordnede digitale strategi.

What should you keep in mind?

Robots.txt er et simpelt værktøj, men du kan skabe store problemer med små fejl. Et enkelt ekstra skråstreg eller forkert case kan ændre betydningen fuldstændigt, fordi sproget i filen er case-sensitive. Sørg derfor for, at du altid afprøver dine regler i testmiljø, før du publicerer dem. Og husk, at ændringer kan tage tid, før søgemaskinerne opdager dem igen.

Du skal også huske, at robots.txt kun styrer crawling – ikke indeksering. Hvis du vil forhindre sider i at dukke op i søgeresultater, skal du bruge et noindex-tag i HTML’en eller HTTP-headeren. Kombinerer du de to strategisk, får du langt bedre kontrol over, hvordan dit indhold fremstår i søgninger. Med andre ord hænger robots.txt tæt sammen med både SEO, webstruktur og serveradministration, når du vil skabe et sikkert, effektivt og velindekseret website.

Robots.txt
in practice?

Are you unsure how to turn your knowledge of marketing concepts into tangible value for your business? Don’t worry—we’ve got you covered. Amplify is a full-service digital marketing agency, and we specialize in applying our expertise in strategy, branding, and digital marketing to our clients’ businesses. Fill out the form below to learn how we can deliver strategic insights and performance that drive results for your business.

Contact us

Are you unsure how to turn your knowledge of marketing concepts into tangible value for your business? Don’t worry—we’ve got you covered. Amplify is a full-service digital marketing agency, and we specialize in applying our expertise in strategy, branding, and digital marketing to our clients’ businesses. Fill out the form below to learn how we can deliver strategic insights and performance that drive results for your business.

Gain deeper insights

Whether you're a generalist or a marketing specialist, our specialists have put together some great advice for you on our blog.