Inhalte von Webseite per Script auslesen und in Textfile exportieren

Diskutiere Inhalte von Webseite per Script auslesen und in Textfile exportieren im Programmierung Forum im Bereich Programmierung; Guten Abend Ich schaue mir gerade die Offline-Wikipedia Kiwix etwas genauer an. Die Geschichte funktioniert eigentlich problemlos, aber die Suche...
#1
F

Forelli

Threadstarter
Dabei seit
26.11.2017
Beiträge
1
Guten Abend

Ich schaue mir gerade die Offline-Wikipedia Kiwix etwas genauer an. Die Geschichte funktioniert eigentlich problemlos, aber die Suche ist nicht wirklich schön. Ich habe nun mit AutoIT von einer kleinen Library (ZIM-File, 8'000 Artikel) jeweils die ersten 200 Zeichen in ein Textfile exportiert, in einer kleinen MySQL-Datenbank abgelegt und eine einfache, aber gute Suche erstellt. Das Herauslesen dauerte mit dem AutoIT-Script etwas 48 Stunden.

Jetzt möchte ich das bei der grössten Library (5 Millionen Artikel) auch tun, aber da reicht ein AutoIT-Script nicht. Es würde 3.6 Jahre dauern.. Leider habe ich keine grossen Erfahrungen mit dem herauslesen von bestimmten Daten von einer Webseite. Könnte mir jemand helfen? Eventuell per PowerShell-Script oder ähnlichem? Die Webadressen sind bekannt, die Webseiten laufen lokal bei mir im Netzwerk.

So sieht der Programmcode einer Beispielwebseite aus:

script.JPG

Vielen lieben Dank!
Forelli
 
Thema:

Inhalte von Webseite per Script auslesen und in Textfile exportieren

Sucheingaben

autoit webseiten inhalt

,

autoit webseite auslesen

Inhalte von Webseite per Script auslesen und in Textfile exportieren - Ähnliche Themen

  • Windows Explorer schließt sich und ich habe keinen Zugang zu seinem Inhalt

    Windows Explorer schließt sich und ich habe keinen Zugang zu seinem Inhalt: Hallo, ich bin gestern nach einem 7-wöchigen Krankenhaus- und Reha-Aufenthalt nachhause gekehrt. Als erstes erkannte ich, dass wichtige Updates...
  • Welche Auswirkungen hat die Änderung der Einstellung "Speicherort für neuen Inhalt ändern"?

    Welche Auswirkungen hat die Änderung der Einstellung "Speicherort für neuen Inhalt ändern"?: Hallo, ich bin gerade dabei die Daten von Systemlaufwerk c zu trennen, indem ich sie auf die weitere Festplatte e schiebe. Demzufolge möchte...
  • Wurzelvereichnis Order "arc_111118163513307" mit 197 GB kryptischen Inhalt

    Wurzelvereichnis Order "arc_111118163513307" mit 197 GB kryptischen Inhalt: Hallo, ich hoffe, ich bin hier richtig. Mein Windows 10 Pro liegt auf einer Samsung SSD 850 Pro, LW C (512 GB). Die meisten Programme habe ich...
  • Wie geblockten Inhalt in Forza Horizon 4 dank Microsoft Familieneinstellungen zugänglich machen?

    Wie geblockten Inhalt in Forza Horizon 4 dank Microsoft Familieneinstellungen zugänglich machen?: Hi ich bin volljähriger Besitzer von Windows 10, Forza Horizon 4 und meinem PC. Ich melde mich auf meinem PC als Admin (NICHT Microsoft-Konto)...
  • Webseite zu Prototype mit neuem Inhalt

    Webseite zu Prototype mit neuem Inhalt: Hallo Mit einer Warnmeldung vor einem gefährlichen Virus hat Publisher Vivendi Games heute auf die offizielle Webseite des kommenden...
  • Ähnliche Themen

    Oben