URLs sind ein elementarer Bestandteil für jede Website, denn sie sind Adressen zu jedem Inhalt im Internet. Dieser Beitrag soll Hintergrundwissen zu den Eigenheiten und dem Aufbau von URLs vermitteln und Euch am Ende helfen, perfekte URLs für Eure Projekte zu gestalten.
Was ist eine URL?
Alle Inhalte im Internet sind auf Servern gespeichert. Endgeräte und Server kommunizieren im Prinzip nur über IP Adressen. Damit das Internet für Menschen nicht nur aus komplexen Zahlenkombinationen besteht, an die man sich nur schwer erinnern kann, wurden URLs ins Leben gerufen. URLs übersetzen genau diese IP Adressen in für uns lesbaren Text. Die Abkürzung URL steht für Uniform Resource Locator und beinhaltet die Adresse einer Webseite.
Nach folgendem Schema sind URLs aufgebaut:

Das Übertagungsprotokoll gibt an, mit welcher Methode die Ressource angesprochen wird. Webadressen nutzen in der Regel das HTTP Protokoll. Weiterhin werden HTTPS oder auch FTP Protokolle genutzt. Eine Domain besteht aus mehreren Teilen: Sub-, First-Level- und Top-Level-Domain.
Als Top-Level wird die Endung der Domain bezeichnet. Der First-Level ist der eigentliche Name der Domain. Dieser kann um beliebig viele Subdomains erweitert werden.
Die „www“ Subdomain ist für eine Domain nicht notwendig. Das „www“(world wide web) hat sich im Lauf der Zeit als Merkmal einer Internetadresse etabliert und wird daher oft benutzt.
Der Verzeichnispfad gibt den Ordner, bzw. die Ordnerstruktur bei mehreren Ebenen an, in dem das Dokument liegt. In einer dynamischen URL Architektur müssen die Verzeichnisse nicht tatsächlich existieren, hier wird der Verzeichnispfad zur Orientierung für Besucher und Suchmaschinen-Crawler genutzt. Parameter werden eingesetzt, um die Inhaltsstruktur auf einer HTML Seite zu bestimmen. Zum Beispiel, werden in Online Shops oft Produktseiten nach Preis, Alphabetisch oder nach Name sortiert. Der Inhalt der Seite bleibt dabei oft gleich, nur die Struktur bzw. Ansicht ändert sich. Parameter steuern in diesem Fall aus, welche Sortierung aktuell gewählt wurde.
Der richtige Weg zu guten URLs
URLs sind ein relevantes Kriterium um gute Rankings zu erzielen, aber es gibt einiges zu beachten auf dem Weg zur perfekten URL-Struktur. Die wichtigsten Punkte sehen wir uns gemeinsam in den nächsten Schritten an.
Sonderzeichen in URLs
Grundsätzlich sollten URLs nur aus den Buchstaben “a” bis “z” und aus den Zahlen “0” bis “9” bestehen. Weiterhin sind „-“ und „_“ zulässig. Im Prinzip können auch weitere Zeichen aus dem ASCII Zeichensatz genutzt werden. Dabei stößt man aber auf das Problem, dass genau diese Zeichen von Servern falsch interpretiert werden können.
Groß- und Kleinschreibung in der URL
Generell können sowohl Groß- als auch Kleinbuchstaben in URLs verwendet werden. Es wird allerdings empfohlen, sich auf die „Klein“ Schreibweise festzulegen. Der Grund dafür ist, dass bestimmte Server Betriebssysteme eine Unterscheidung nach Groß- und Kleinschreibung treffen. Im ersten Schritt klingt das nicht weiter bedenklich, nur kommt es schon mit dem ersten externen Link in abweichender Schreibweise zu einem doppelten Inhalt im Index.
Um dieses Problem in den Griff zu bekommen ist kein großer Aufwand nötig. Die Serverkonfiguration muss angepasst werden, so dass eine fehlerhafte Schreibweise immer auf die eigentliche URL zurückgeführt wird. Alternativ können auch 301 Weiterleitungen oder Canonicals eingesetzt werden.
Trennzeichen in der URL
Im Prinzip können verschiedene Trennzeichen(„-“, „_“, „ “, „+“,..) benutzt werden, um Wörter zu trennen. Es empfiehlt sich jedoch, Wörter generell nur mit einem Bindestrich „-“ zu trennen. Dieser wird von allen Suchmaschinen gleichermaßen erkannt und bietet keinerlei Interpretationsspielraum. Ein Leerzeichen kann zum Beispiel problematisch werden, denn dieses impliziert auch das Ende der URL. Somit kann es zu unnötigen 404 Fehlern kommen.
Füllwörter
Wie in vielen anderen Disziplinen gilt auch bei der Länge der URL: so lang wie nötig und so kurz wie möglich. Im besten Fall kann man anhand der URL erkennen, was der Inhalt der Seite zu bieten hat. Füllwörter wie der, die, das, in, um,.. verlängern die URL unnötig und geben keine relevante Information ab. Daher sind Füllwörter zu vermeiden. Kurze URLs bieten den positiven Nebeneffekt, dass sie in den SERPs vollständig angezeigt werden.
Subdomains
Subdomains sind vereinfacht gesagt Erweiterungen der eigentlichen Domain. Man kann eine Subdomain mit der Erweiterung einer Postadresse vergleichen. Die Domain wäre in dem Fall die Hauptstraße 1, eine Subdomain der Hauptstraße 1 wäre in dem Fall die Hausnummer 1A. Technisch gesehen, entsteht eine Subdomain sobald eine Zeichenkombination mit einem „.“ von der First-Level Domain getrennt wird (siehe Grafik). Subdomains werden genutzt, um die zur Domain thematisch nicht unmittelbar passenden Inhalte auszulagern. Oft genutzte Beispiele hierfür sind „blog.domain.de“ oder „forum.domain.de“.
Trailing Slash
Der Trailing Slash ist der abschließende Zeichen („/“) von Verzeichnissen in einer URL.:
http://beispiel.de/ordner/ (mit trailing slash) http://beispiel.de/ordner (ohne trailing slash)
Beide URLs aus dem Beispiel zeigen auf denselben Inhalt. Dies ist ein klassisches Beispiel für Duplicate Content. Um genau diesen zu verhindern, muss man sich entscheiden: „to slash or not to slash“? Generell sollte für Ordner immer ein Trailing Slash gesetzt werden. So wissen User und Crawler gleichermaßen, ob es sich um ein Verzeichnis oder um eine Datei handelt. In der „.htaccess“ kann die Einstellung vorgenommen werden.
Dateiendungen (PHP,HTML,..)
Ähnlich wie beim Trailing Slash verhält es sich bei Dateiendungen. Es gibt ebenso zwei Möglichkeiten, entweder die Anzeige von Dateiendungen oder nicht:
http://beispiel.de/ordner/datei.html
http://beispiel.de/ordner/datei
Sind beide Varianten erlaubt, besteht die Gefahr von Duplicate Content. Eindeutige Anzeigedefinitionen können ebenfalls in der „.htaccess“ vorgenommen werden.
Umlaut-Domains
Seit dem Jahr 2003 können neben den 26 Buchstaben (a bis z), 10 Zahlen (0 bis 9) und dem Bindestrich (-) auch Umlaute in Domainnamen verwendet werden. Entsprechend können nun Sonderzeichen und Umlaute in Dommainnamen verwendet werden. Mit dem Verfahren „idn-convert“(Punycode) werden die Sonderzeichen entschlüsselt.
Beispiel:
www.müller.de
www.xn--mller-kva.de
Umlaut-Domains beginnen immer mit der Zeichenfolge „xn--“. Diese signalisiert, dass es eine Umlaut-Domain folgt. Darauf werden alle Zeichen exklusive der Umlaute angestellt und mit einem Bindestrich abgeschlossen. Auf diesen folgt ein „Code“ der die Position und den Inhalt des Umlauts bestimmt.
Statische und dynamische URLs
Es gibt zwei Arten von URLs. Statische URLs bestehen seit Beginn des Internet. Die Haupteigenschaft einer statischen URL besteht darin, dass sie immer gleich bleibt.
www.beispiel.de/statische-url.html
Dynamische URLs enthalten Parameter und sind demzufolge veränderbar. Parameter können verschiedene Funktionen darstellen. In der Regel stellen Parameter („?“) den Bezug zur Datenbank her, in der Inhalte abgespeichert sind. Jede ID steht dabei für den Inhalt einer Unterseite. Der Vorteil dabei ist, dass mit einem Template gearbeitet werden kann, in das die Inhalte dynamisch übergeben werden. So muss nicht für jede Unterseite eine separate HTML-Seite erstellt werden.
Beispiel für eine dynamische URL www.beispiel.de/dynamische-url?id=1
Um Suchmaschinen- und Nutzerfreundlicher zu werden, können diese dynamischen URLs mithilfe von Webserver-Applikationen in statisch aussehende URLs umgewandelt werden.
Parameter können noch weitere Eigenschaften abbilden. So können diese auch eingesetzt werden, um Inhalte auf einer Seite neu anzuordnen. Zum Beispiel in einem Shop, um alle Artikel nach Preis, Größe oder Farbe zu sortieren.
www.beispiel.de/dynamische-url?id=1?preis=low?groesse=44?farbe=blue
Die Kombinationen der Parameter können in „x“ Varianten verknüpft werden. So bleibt der Inhalt der Seite gleich, ist aber unter „x“ URLs erreichbar. Hier ist die Gefahr groß, dass doppelte Inhalte entstehen und indexiert werden.
Leider bringen Parameter in dynamischen URLs auch automatisch ein Problem mit: Duplicate Content. Es wird daher empfohlen, sich auf möglichst wenig (1-2) Parameter zu beschränken. Zusätzlich bietet Google in seinen Webmaster Tools an, bestimmte Parameter vom Crawlvorgang auszuschließen.
FAZIT
Auf dem Weg zur optimalen URL gibt es einiges zu beachten. Die wichtigsten Punkte möchte ich noch einmal kurz zusammenfassen. Technisch muss der Server so konfiguriert werden, dass alle Seiten unter genauer einer URL erreichbar sind. Doppelte Inhalte können durch falsche Konfiguration für den Trailing Slash, die Subdomain oder Groß- und Kleinschreibung im URL-Text entstehen. Ist technisch alles sauber, gilt es den Focus auf eine gute URL-Struktur zu setzen. Dabei sind „sprechende“ Verzeichnisse und URL-Namen von übergeordneter Wichtigkeit. Relevante Keywords gehören in den URL Text, Füllwörter sollten vermieden werden.
Wer sich an alle Tipps hält und ein sauberes URL-Konzept auf die Beine stellt, wird davon langfristig profitieren.