Mit Sphider suchen und analysieren

11. April 2010 um 14:52 (Aktualisiert am 11. April 2010 um 15:34)

Mit Sphider kann man eine Suchfunktion auf der eigenen Website realisieren, so dass Besucher die Inhalte der Website nach Stichworten durchsuchen können. Die Software eignet sich aber auch, um den eigenen Internetauftritt aus Sicht einer Suchmaschine zu sehen und so eventuelle Probleme im Hinblick auf die Indexierung durch Google & Co zu erkennen. Sphider läuft unter PHP/MySQL und steht als Open Source kostenfrei zur Verfügung.

Installation & Konfiguration

Die Installation ist schnell erledigt. Nach dem Entpacken sind die MySQL-Zugangsdaten in der Datei “settings/database.php” einzufügen. Bei Aufruf der Seite “admin/install.php” im Browser wird dann die Datenbankstruktur angelegt. Alternativ kann man die Datenbankstruktur mit der Datei “sql/tables.sql” auch manuell anlegen. Danach sollte man sich einloggen können. Benutzername und Kennwort lauten admin.
http://www.domain.de/pfad/sphider/admin/admin.php

Es ist zu empfehlen, die Zugangsdaten für den Adminbereich umgehend in der Datei “admin/auth.php” anzupassen. Eventuell müssen noch die Zugriffsrechte der Datei “settings/conf.php” angepaßt werden, damit die im Adminbereich durchgeführten Änderungen gespeichert werden können.

Die Arbeitsweise von Sphider lässt sich im Adminbereich einstellen. Der rechts abgebildete Screenshot der Konfigurationsseite lässt sich per Klick vergrößern, so dass man die möglichen Einstellungen sehen kann.

Indexierung der Website

Vor der Indexierung sollte man die Datei “include/common.txt” anpassen. Dort werden Stoppwörter aufgelistet. Dies sind Wörter wie “und,oder”, die nicht in den Index aufgenommen werden sollen. In der Datei “admin/ext.txt” sind außerdem die Endungen von Dateien eingetragen, die nicht indexiert werden. Dazu gehören zum Beispiel Bilddateien wie jpg oder gif.

Nachdem man im Adminbereich eine Website angelegt hat, kann man die Indexierung manuell starten. Sphider durchsucht daraufhin den Internetauftritt anhand der gefundenen Links und indexiert die Website auf Basis der vorhandenen Einstellungen. Der Indexierungsvorgang dauert je nach Umfang der Website einige Minuten und lässt sich verfolgen. Sofern sich die Inhalte der Website ändern, ist die Indexierung erneut auszuführen. Dieser Schritt lässt sich per Cronjob automatisieren.

Im Konfigurationsbereich lässt sich unter “Settings” – “Logging settings” das Aufzeichnen des Indexierungsvorgangs aktivieren, so dass man die durchgeführte Indexierung nachträglich auswerten kann.

Suchen & Finden

Das Suchformular kann unter folgender URL erreicht werden:
http://www.domain.de/pfad/sphider/search.php

Die Dateien für das Layout des Suchformulars und der Suchergebnisse finden sich unterhalb des Verzeichnisses “templates”. Die Suchergebnisse werden standardmäßig wie folgt angezeigt.

Analyse & SEO-Auswertung

Im Hinblick auf die Suchfunktion werden folgende Werte aufgezeichnet:

  • Top keywords
    Die indexierten Wörter der Website nach Häufigkeit
  • Largest pages
    Die indexierten Seiten nach Dateigröße sortiert
  • Most popular searches
    Die am häufigsten durchgeführten Suchanfragen
  • Search log
    Die chronologisch aufgelisteten Suchanfragen
  • Spidering logs
    Die chronologisch aufgelisteten Indexierungsvorgänge

Die Analyse der Indexierungsvorgänge und Statistiken könnten im Blick auf “Optimierung für Suchmaschinen” unter anderem bei folgenden Fragen helfen:

  • Werden alle Seiten des Internetauftritts gefunden?
  • Werden alle Seiten indexiert oder gibt es Sperren (z.B. per robots.txt oder Meta-Tags)?
  • Beeinhalten die einzelnen Seiten ausreichend Texte?
  • Finden sich in der Auflistung der indexierten Wörter alle für die Website sinnvollen Keywords?
  • Gibt die Häufigkeit der indexierten Wörter den Themenschwerpunkt der Website wieder?
  • Erhält man bei der Durchführung von Suchanfragen die passenden Seiten angezeigt?
  • Sind fehlerhafte Links vorhanden?

Selbstverständlich gibt es Unterschiede zwischen Sphider und einer Suchmaschine wie Google. Dennoch bietet Sphider neben der eigentlichen Suchfunktionalität die Möglichkeit, den eigenen Internetauftritt besser verstehen zu lernen und für Google & Co zu optimieren. So macht der Einsatz von Sphider auch dann Sinn, wenn bereits eine einfache Suchfunktion auf der eigenen Website vorhanden ist.

Sphider kann man sich hier herunterladen: www.sphider.eu

Dieser Artikel wurde am 11. April 2010 um 14:52 von Stefan Kanitz geschrieben (aktualisiert am 11. April 2010 um 15:34) und unter der Kategorie Open-Source archiviert. Du kannst diesen Artikel kommentieren oder einen Trackback auf Deinen Blog setzen. Die Kommentare lassen sich per RSS Feed oder per Mailbenachrichtigung verfolgen.

4 Kommentare/Trackbacks/Tweetbacks

  1. Hab ein Problem. Bei mir kommt immer die Meldung

    [Back to admin]
    Spidering http://www.irgendeinewebsite.de/

    1. Retrieving: http://www.irgendeinewebsite.de/ at 21:43:30.
    NOHOST
    Links found: 0. New links: 0

    Completed at 21:43:30.

    Und das bei jeder Website (20 schon ausprobiert). Woran könnte das liegen…?

  2. Harrygrey
    01.01.11 um 20:37

    Das Programm funktioniert in keiner Weise. Beim Indexieren kommt immer die Meldung, daß ich keine Berechtigung auf dem Server habe. Aber Login und der Zugang zur DB funktioniert.
    Es ist alles sehr dürftig dokumentiert.
    Lieber die Zeit nicht damit verplempern.
    Harry

    • Hi Harry

      bei mir läuft Sphider auf verschiedenen Websites ohne Probleme. Berechtigungsfehler kann verschiedene Ursachen haben. Im Supportforum bekommt man Hilfe.

Hinterlasse einen Kommentar

 
 
 

Du kannst diese HTML-Tags verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="" highlight="">

Bitte die Kommentar-Regeln beachten. Hinweise zum Datenschutz.