Inhalte von Webseite per Script auslesen und in Textfile exportieren

Diskutiere Inhalte von Webseite per Script auslesen und in Textfile exportieren im Programmierung Forum im Bereich Programmierung; Guten Abend Ich schaue mir gerade die Offline-Wikipedia Kiwix etwas genauer an. Die Geschichte funktioniert eigentlich problemlos, aber die Suche...
#1
F

Forelli

Threadstarter
Dabei seit
26.11.2017
Beiträge
1
Guten Abend

Ich schaue mir gerade die Offline-Wikipedia Kiwix etwas genauer an. Die Geschichte funktioniert eigentlich problemlos, aber die Suche ist nicht wirklich schön. Ich habe nun mit AutoIT von einer kleinen Library (ZIM-File, 8'000 Artikel) jeweils die ersten 200 Zeichen in ein Textfile exportiert, in einer kleinen MySQL-Datenbank abgelegt und eine einfache, aber gute Suche erstellt. Das Herauslesen dauerte mit dem AutoIT-Script etwas 48 Stunden.

Jetzt möchte ich das bei der grössten Library (5 Millionen Artikel) auch tun, aber da reicht ein AutoIT-Script nicht. Es würde 3.6 Jahre dauern.. Leider habe ich keine grossen Erfahrungen mit dem herauslesen von bestimmten Daten von einer Webseite. Könnte mir jemand helfen? Eventuell per PowerShell-Script oder ähnlichem? Die Webadressen sind bekannt, die Webseiten laufen lokal bei mir im Netzwerk.

So sieht der Programmcode einer Beispielwebseite aus:

script.JPG

Vielen lieben Dank!
Forelli
 
Thema:

Inhalte von Webseite per Script auslesen und in Textfile exportieren

Sucheingaben

autoit webseiten inhalt

,

autoit webseite auslesen

Inhalte von Webseite per Script auslesen und in Textfile exportieren - Ähnliche Themen

  • Ordner mit Inhalten in Windows\Inf

    Ordner mit Inhalten in Windows\Inf: Guten Tag, was ich schon immer mal wissen wollte, welche Funktion verbergen diese Ordner, welche nach Neu-Install wieder da auftauchen? Wie...
  • Outlook 2016 - Mail-Inhalte verschwinden beim Versand

    Outlook 2016 - Mail-Inhalte verschwinden beim Versand: Hallo allerseits Seit ca. 2 Wochen (war da ein Update?) werden über Outlook versendete Mails: - entweder ohne den eingegebenen Text versendet...
  • Der Inhalt fehlt oder wir können nicht auf ihn zugreifen. 0x80070002 bei gekauftem Film

    Der Inhalt fehlt oder wir können nicht auf ihn zugreifen. 0x80070002 bei gekauftem Film: Ich habe diese Woche Staffel 1-7 von Game of Thrones gekauft und alle Folgen (67) heruntergeladen. Die letzten beiden Staffeln konnte ich...
  • Steam Inhalte mit Gewalt oder Erotik blockieren - So kann man nicht jugendfreie Inhalte ausblenden

    Steam Inhalte mit Gewalt oder Erotik blockieren - So kann man nicht jugendfreie Inhalte ausblenden: Aktuell steht Steam ja wieder einmal in der Kritik leichtfertig das Anbieten von Spielen zu erlauben und so gab es Games in denen Amokläufe an...
  • Webseite zu Prototype mit neuem Inhalt

    Webseite zu Prototype mit neuem Inhalt: Hallo Mit einer Warnmeldung vor einem gefährlichen Virus hat Publisher Vivendi Games heute auf die offizielle Webseite des kommenden...
  • Ähnliche Themen

    Oben