Inhalte von Webseite per Script auslesen und in Textfile exportieren

Diskutiere Inhalte von Webseite per Script auslesen und in Textfile exportieren im Programmierung Forum im Bereich Programmierung; Guten Abend Ich schaue mir gerade die Offline-Wikipedia Kiwix etwas genauer an. Die Geschichte funktioniert eigentlich problemlos, aber die Suche...
#1
F

Forelli

Threadstarter
Dabei seit
26.11.2017
Beiträge
1
Guten Abend

Ich schaue mir gerade die Offline-Wikipedia Kiwix etwas genauer an. Die Geschichte funktioniert eigentlich problemlos, aber die Suche ist nicht wirklich schön. Ich habe nun mit AutoIT von einer kleinen Library (ZIM-File, 8'000 Artikel) jeweils die ersten 200 Zeichen in ein Textfile exportiert, in einer kleinen MySQL-Datenbank abgelegt und eine einfache, aber gute Suche erstellt. Das Herauslesen dauerte mit dem AutoIT-Script etwas 48 Stunden.

Jetzt möchte ich das bei der grössten Library (5 Millionen Artikel) auch tun, aber da reicht ein AutoIT-Script nicht. Es würde 3.6 Jahre dauern.. Leider habe ich keine grossen Erfahrungen mit dem herauslesen von bestimmten Daten von einer Webseite. Könnte mir jemand helfen? Eventuell per PowerShell-Script oder ähnlichem? Die Webadressen sind bekannt, die Webseiten laufen lokal bei mir im Netzwerk.

So sieht der Programmcode einer Beispielwebseite aus:

script.JPG

Vielen lieben Dank!
Forelli
 
Thema:

Inhalte von Webseite per Script auslesen und in Textfile exportieren

Sucheingaben

autoit webseiten inhalt

,

autoit webseite auslesen

Inhalte von Webseite per Script auslesen und in Textfile exportieren - Ähnliche Themen

  • inhalte von handy auf pc-gerät handy mit bluetooth senden

    inhalte von handy auf pc-gerät handy mit bluetooth senden: möchte meine kontakte vom Handy auf mein Laptop mit Bluetooth senden. Handy als gerät installiert aber wie?
  • Per Chrome Browser Desktop, YouTube Videos oder andere Inhalte auf kompatible Geräte streamen

    Per Chrome Browser Desktop, YouTube Videos oder andere Inhalte auf kompatible Geräte streamen: Der Chrome Browser hat so manche nützliche Option integriert und erlaubt ganz leicht das Spiegeln verschiedener Inhalte auf Smart TVs, Amazon Fire...
  • Inhalt von zwei Ordnet verschwunden

    Inhalt von zwei Ordnet verschwunden: Der umfangreiche Inhalt von 2 Ordner ist verschwunden. Ich habe sie nicht gelöscht. Im Ordner "gelöschte Elemente" nicht gefunden. Wie kann das...
  • HDCP geschützte Inhalte von Windows 10 per Miracast bzw. Microsoft Wireless Display Adapter V1 auf den TV streamen

    HDCP geschützte Inhalte von Windows 10 per Miracast bzw. Microsoft Wireless Display Adapter V1 auf den TV streamen: Hallo, ich möchte HDCP geschützte Inhalte von Windows 10, welche ich im Microsoft Store gekauft habe und per Film & TV App abspiele, per...
  • Webseite zu Prototype mit neuem Inhalt

    Webseite zu Prototype mit neuem Inhalt: Hallo Mit einer Warnmeldung vor einem gefährlichen Virus hat Publisher Vivendi Games heute auf die offizielle Webseite des kommenden...
  • Ähnliche Themen

    Oben