Gnu York

IT-Dienstleistungen Dresden

gnuCrawl&Map - mehr als ein Sitemap Generator

gnuCrawl&Map ist eine kostenlose Software, die sich vor Allem an Webentwickler und Webseitenbetreiber richtet. Sie können das Programm benutzen, um XML Sitemaps für Ihre Homepage zu erstellen. Es ruft dabei alle Seiten Ihrer Internetseite auf und durchsucht diese nach Links.

Die Software kann auf Grund der eingebauten Filterfunktionen auch genutzt werden um ganze Webseiten in Echtzeit nach bestimmten Inhalten oder toten Links (404 Fehlerseiten) zu durchsuchen. Darüber hinaus bietet das Programm auch die Möglichkeit eine Datei mit den wichtigsten Meta Informationen Ihrer Webseite (Titel, Meta Description, Meta Keywords, Index-/Follow- Attribute, uvm.) zu erstellen.

Kernfunktionalitäten

  • Erstellen von XML Sitemaps für Suchmaschinen
  • Erstellen einer .csv Datei, die für jede URL Ihrer Webseite die wichtigsten Meta Informationen enthält (die Datei kann z.B. in Excel oder LibreOffice weiterverarbeitet werden)
  • die Anwendung ist auf allen Systemen lauffähig, für die eine Java Laufzeitumgebung verfügbar ist (Windows, Linux, Mac OS, ...)
    (Falls Java auf Ihrem System noch nicht installiert ist, können Sie es hier herunterladen)

Optionen und Parameter

Sie können ...
  • verschiedene (optionale) Sitemap Parameter selbst konfigurieren (lastmod, changefreq, priority)
  • einen Proxy Server (HTTP oder SOCKS, mit oder ohne Authentifikation) nutzen.
  • einstellen ob die indizierten Seiten mit dem Präfix "www." beginnen sollen oder nicht (Duplikate werden entfernt).
  • einstellen ob sich die Software an noindex- und nofollow- Attribute sowie die Vorgaben von robots.txt Dateien halten soll oder nicht.
  • selbst definieren, als welcher Browser, bzw. Crawler (User Agent) sich die Software ausgeben soll
  • eine maximale Anzahl an zu sammelnden Links festlegen
  • selbst angeben welche Dateitypen heruntergeladen und gecrawlt werden sollen und ob Downloads (Dateien) zur Sitemap hinzufügen werden sollen
  • umfangreiche URL- und Inhaltsfilter definieren, um nur URLs und/oder Inhalte zu indizieren, die bestimmte Begriffe beinhalten oder nicht beinhalten

Download

Hier können Sie das Programm als ausführbare Java Datei (.jar) herunterladen:

gnuCrawl&Map 0.9 Beta herunterladen


Allgemeine Hinweise

Bitte beachten Sie folgendes:
  • Um das Programm auszuführen benötigen Sie eine Java Laufzeit Umgebung. Diese ist für nahezu alle Betriebssysteme kostenlos verfügbar. Hier können Sie die Java Installation herunterladen.
  • Das Programm ist zur Zeit nur in englischer Sprache verfügbar. Eine deutsche Version ist vorerst nicht geplant. (Sollte eine Nachfrage danach entstehen werden wir die Anwendung übersetzen.)
  • gnuCrawl&Map arbeitet zwar recht zuverlässig, dennoch handelt es sich noch um eine Beta-Version. Das Programm kann also noch einige Fehler enthalten. Falls Sie Fehler finden oder uns Feedback zur Software übermitteln möchten, nutzen Sie bitte unser Kontaktformular oder sprechen Sie uns in unserem IRC Channel an.