WORD-Seite ordnen (abgebrochen)

Diskutiere WORD-Seite ordnen (abgebrochen) im Software Allgemein Forum im Bereich Software Forum; Hallo, bin dabei mein Archiv, welches in schriftlicher Form vorliegt, einzuscannen u. dabei alphabetisch zu ordnen. Jedoch beim Einscannen werden...

TBS-47-AUDIOCLUB

Threadstarter
Dabei seit
30.05.2007
Beiträge
488
Ort
Berlin
Hallo,

bin dabei mein Archiv, welches in schriftlicher Form vorliegt, einzuscannen u. dabei alphabetisch zu ordnen. Jedoch beim Einscannen werden die vorher klar gesetzten Spalten aufgelöst u. "durcheinander gebracht", wie man hier sieht:



Teilweise verschwinden Zahlen/Buchstaben sogar am rechten Rand. - Alle Versuche die vorherige Ordnung (Spalten) zurück zu bekommen, sind gescheitert. Was mache ich faslch?

Oder liegt es gar am Scannprogramm?

Für Euer Hilfe wäre ich dankbar. Gruß, Euer Gunther
 
Zuletzt bearbeitet:

imaetz70

Dabei seit
07.12.2005
Beiträge
9.256
Alter
50
Ort
Hamburg
beim einscannen im textformat, so das du es bearbeiten kannst, erkennt dein scanprog die zeielenformatierung nicht und wirft alles durch einander. schau mal nach ob du im scanprog etwas einstellen kannst, sodass es das dokument 1:1 einscannt ohne eine eigene formatvorlage zu nutzen... denn als bild einscannen bringt dir ja nicht so viel...
 

Ronny

SPONSOREN
Dabei seit
07.08.2004
Beiträge
12.311
Ort
Rheinland
Wenn ich das richtig verstehe, liegt das Archiv nur noch in gedruckter Form vor? Dies scannst Du jetzt und versuchst, mit einer OCR-Software, die Spalteneinteilung korrekt zu erhalten?

Hat die OCR-Software Einstellungen, die Spalten erkennen kann? Evtl. musst Du vor dem Scannen in der OCR-Software die einzelnen Spalten markieren und die jeweils gescannten Ergebnisse der einzelnen Spalten in ein neues Tabellenformular (Excel oder Word) einfügen.
 

Mike

i7-6700HQ
Dabei seit
21.09.2006
Beiträge
24.384
Ort
Outdoor oder vorm Rechner
Das schöne an deinem Beitrag ist, dass du NICHT SCHREIBST, welches OCR-Programm du verwendest.

Eines ist (für mich) klar. Die mitgelieferten OCR-Pakete bei den Scannern - also die im Preis inbegriffenen - sind alle für den Müll.

Das beste Programm aber auch sehr teuer im Vergleich ist
Omnipage 15

Aber auch die Einstellungen für den Vorgang sind entscheident.

Mindestauflösung für die OCR-Erkennung von Tabellen ist 600dpi, sonst kann es passieren, das feine Striche nicht erkannt werden und die Tabelle keine mehr ist. etc. etc.

mfg
 

TBS-47-AUDIOCLUB

Threadstarter
Dabei seit
30.05.2007
Beiträge
488
Ort
Berlin
Hallo,

zunächst vielen Dank für Eure Anregungen u. Tipps!

Klar, ich vergaß zu erwähnen, welches Scannprogramm ich verwende. Ich hatte auch gedacht, das Problem mit WORD zu lösen u. nicht das Scannprogramm dafür verantwortlich zu machen.

Ich benutze OmniPageSE2.0 . - Leider kann ich dort zwar perfekt die Seiten (auch mit Spalten) scannen, jedoch beim Kopieren auf eine WORD-Seite kommt dann das oben zu sehende Chaos zustande.

Inzwischen habe ich mich auch 1 Std. lang durch die HILFE-Seite von OmniPageSE2.0 gequält u. bin genauso schlau wie vorher - höchstens noch verwirrter...:mad

Also: Egal was ich versuche, das Endergebnis ist Chaos auf der WORD-Seite.

Gruß, Euer Gunther
 

APFEL 2c

Dabei seit
22.05.2007
Beiträge
565
Hallo,

bin dabei mein Archiv, welches in schriftlicher Form vorliegt, einzuscannen u. dabei alphabetisch zu ordnen. Jedoch beim Einscannen werden die vorher klar gesetzten Spalten aufgelöst u. "durcheinander gebracht", wie man hier sieht:



Teilweise verschwinden Zahlen/Buchstaben sogar am rechten Rand. - Alle Versuche die vorherige Ordnung (Spalten) zurück zu bekommen, sind gescheitert. Was mache ich faslch?

Oder liegt es gar am Scannprogramm?

Für Euer Hilfe wäre ich dankbar. Gruß, Euer Gunther


Das bei dir Buchstaben sogar aus dem Seitenrand heraus wandern, kann eigentlich nur ein Zeichen dafür sein das die eingescannte Textseite mit ihren Zeichen nicht vollständig als einzelne ASCII Zeichen (TTF Font/PS Font) mit oder ohne Zwischenraum und Satzzeichen von deiner OCR Software erkannt, umgewandelt und auch als solche an deine Textverarbeitung beim importieren/exportieren weitergegeben werden, sondern das deine OCR "nicht" erkannte Zeichen als grafischen Block weitergibt, der dann logischerweise auch aus den Seitenbegrenzungen deines Office Dokuments herauswandern kann!

Dein Problem konnte ich zwar mit meinen OCR Tools (AGFA Scanner, AGFA FotoLook 3.6 (S/W Dokument gescannt mit 400dpi), COREL Suite 7 OCR Trace (Export des OCR als RTF-Dokument), Import des RTF-Dokuments in StarOffice) nicht nachvollziehen, weil jeder Buchstabe auch ein ASCII Zeichen ist und daher unmöglich aus der Zeilenbegrenzung den Textdokumentes herauswandern kann! (Bilder im Anhang: OCR nicht Nachbearbeit oder auf 2 spaltige Seite importiert!)

Von der logischen Struktur (Seitenränder, Formatierung, Absätze, Spalten u.a.) einer jeden Textverarbeitung kann es nur sein das deine OCR Software einige Textblöcke als grafische Blöcke (Bilder) an dein Office überträgt, die dann selbstverständlich auch aus dem Dokument herauswandern können!

Oder aber das deine Seitenbegrenzungen für neue Word Dokumente außerhalb der maximalen Blatt-Parameter liegen, das heißt, das deine neu geöffnete A4-Seite in den Seiten- und Zeilenbegrenzungen bei A3 oder größer liegt!

Dann müsste dies allerdings ein BUG im Office sein, denn wenn A4 (210x297mm) eingestellt ist, dann können die Seiten- und Zeilenbegrenzungen nicht irgendwo zwischen A4 und A0 liegen!

MfG

PS: Sieh mal in den bekannten E-Shops nach einer nicht ganz aktuellen aber preiswerteren COREL Suite mit DRAW, PAINT, OCR Trace, COLOR Manager u.a.)!
 

Anhänge

  • COREL Trace.jpg
    COREL Trace.jpg
    294,8 KB · Aufrufe: 292
  • OCR.jpg
    OCR.jpg
    490,7 KB · Aufrufe: 242
Zuletzt bearbeitet:

Ronny

SPONSOREN
Dabei seit
07.08.2004
Beiträge
12.311
Ort
Rheinland
Egal was ich versuche, das Endergebnis ist Chaos auf der WORD-Seite.
Hast Du mal - wie in Beitrag #3 bereits empfohlen - versucht, beim Scannen immer nur eine Spalte zu nehmen (im Scanprogramm markieren) und den erkannten Text dann in eine Tabellenspalte einzufügen?
 

TBS-47-AUDIOCLUB

Threadstarter
Dabei seit
30.05.2007
Beiträge
488
Ort
Berlin
Hi,

@"APFEL 2c"
Die "herausgewanderten" Zeichen/Buchstaben sind ja nach dem Kopieren nicht völlig verschwunden. Man kann sie auf der WORD-Seite wieder Zeile für Zeile zurück holen. - Doch das ist logischerweise überaus mühsam u. ergibt auch kein "sauberes" Aussehen, da beim Versuch eine Spalte herzustellen, die ersten Buchstaben nicht sauber in einer Linie stehen.

@"Ronny2"
Eine Übertragung einzelner Spalten ist mit diesem Programm nicht möglich.

Ich komme noch einmal auf die einkopierten Texte auf der WORD-Seite zurück: Gibt es hier keine Möglichkeit, saubere, bündige Spalten zu erzeugen? (Mit TAB-Stops funktioniert es nur Zeile für Zeile).

Gruß, Euer Gunther
 

Ronny

SPONSOREN
Dabei seit
07.08.2004
Beiträge
12.311
Ort
Rheinland
@"Ronny2"
Eine Übertragung einzelner Spalten ist mit diesem Programm nicht möglich.

Ich komme noch einmal auf die einkopierten Texte auf der WORD-Seite zurück: Gibt es hier keine Möglichkeit, saubere, bündige Spalten zu erzeugen? (Mit TAB-Stops funktioniert es nur Zeile für Zeile).
Jetzt muss ich aber sicherheitshalber mal "ganz blöd" fragen: Verwendest Du in Word denn auch eine "richtige" Tabelle oder lediglich normalen Text, bei dem Du mit der <Tab>-Taste zur nächsten (unechten!) Spalte springst? Wenn Du diese Frage nämlich bejahen solltest, kann das so natürlich auch nicht klappen.

Nachtrag:

Eine "richtige" Tabelle erzeugt man in Word, indem man den gesamten Text markiert und dann im Menü Tabelle -> Umwandeln -> Text in Tabelle... (Word 2002) oder natürlich von vornherein Tabelle -> Tabelle zeichnen wählt.
 

TBS-47-AUDIOCLUB

Threadstarter
Dabei seit
30.05.2007
Beiträge
488
Ort
Berlin
Hhmm...


Verwendest Du in Word denn auch eine "richtige" Tabelle oder lediglich normalen Text, bei dem Du mit der <Tab>-Taste zur nächsten (unechten!) Spalte springst? Wenn Du diese Frage nämlich bejahen solltest, kann das so natürlich auch nicht klappen.

NEIN, keine Tabelle. - Es soll der Text ja nur in 4 Spalten stehen, ohne Linien oder Rahmen o.ä. (siehe auch mein Bild im 1. Eintrag).

Gruß, Euer Gunther
 

Ronny

SPONSOREN
Dabei seit
07.08.2004
Beiträge
12.311
Ort
Rheinland
NEIN, keine Tabelle. - Es soll der Text ja nur in 4 Spalten stehen, ohne Linien oder Rahmen o.ä. (siehe auch mein Bild im 1. Eintrag).
Na dann ist klar, dass das so nicht klappen kann, denn Du hast gar keine wirkliche Tabelle!

Eine solche wäre allerdings für dein Vorhaben höchst nützlich, wenn nicht gar unbedingt notwendig - wie Du jetzt ja schon gemerkt haben dürftest. Du kannst selbstverständlich in einer echten Tabelle auch Trennlinien und Rahmen ausblenden. Du hast allerdings u. a. den Vorteil, dass Du den Text nur spaltenweise kopieren und dann weiterverarbeiten kannst. Bei deiner "Tabstop-Tabelle" hängt es ganz nebenbei von der verwendeten Schriftart ab, ob das Dokument halbwegs tabellenartig aussieht oder eben so wie auf deinem Screenshot. In einem solchen Fall dürftest Du eigentlich nur mit einer sogen. Nicht-proportionalschrift arbeiten, da bei dieser Schriftart jedes Zeichen die selbe Breite hat (incl. Leerraum). Allerdings sieht das Schriftbild dann natürlich mehr als dürftig aus.

Ich würde dir tatsächlich raten, deinen Text nochmals neu zu schreiben und diesmal eine echte Tabelle - am besten Excel - zu nehmen. Dann hast Du später z. B. auch die Möglichkeit, dein Musikverzeichnis sowohl einmal nach Interpret und dann auch nach Titel sortieren zu lassen. Die Möglichkeiten sind einfach vielfältiger. Habe mir schon vor Jahren eine Excel-Tabelle mit zig-tausend meiner MP3- und Audio-CD-Titeln angelegt. :blush

Hier mal zur Ansicht Screenshots von der Excel-Tabelle und dem davon gemachten Ausdruck.
 

Anhänge

  • Tabelle 1.png
    Tabelle 1.png
    9,1 KB · Aufrufe: 347
  • Tabelle 2.png
    Tabelle 2.png
    6,3 KB · Aufrufe: 360
Zuletzt bearbeitet:

TBS-47-AUDIOCLUB

Threadstarter
Dabei seit
30.05.2007
Beiträge
488
Ort
Berlin
Tja, lieber "Ronny2",

hier noch mal das Ergebnis nach dem Scannen:



Wie man sieht ist eine korrekte Tabelle antstanden, die jedoch sofort nach dem Kopieren u. Einfügen in eine WORD-Seite, das von mir beschriebene Chaos auslöst.

Das (Ab-) Schreiben des gesamten Textes von rd. 180 eng beschriebenen DIN A-4-Seiten war doch wohl nicht ernsthaft von Dir als Alternative vorgeschlagen, oder?

Ich werde mich jetzt nicht weiter ärgern, oder von WORD/OmniPageSE2.0, ärgern lassen u. werde mein Vorhaben aufgeben.

Danke nochmals f. Eure Mühe! Gruß, Euer Gunther
 

Ronny

SPONSOREN
Dabei seit
07.08.2004
Beiträge
12.311
Ort
Rheinland
Wie man sieht ist eine korrekte Tabelle antstanden, die jedoch sofort nach dem Kopieren u. Einfügen in eine WORD-Seite, das von mir beschriebene Chaos auslöst.
Hast Du denn nach dem Einfügen in Word den Text in eine Tabelle umgewandelt, oder zeigt Word bereits eine fertige Tabelle? Hier solltest Du vor dem Einfügen auch einmal mehrere Optionen ausprobieren. Welche ist jetzt von hier aus schlecht zu sagen.

Ich sehe auf deinem Screenshot z. B. schon mal zwei "echte" Spalten (getrennt durch einen senkrechten Strich), wobei es allerdings eigentlich schonmal wenigstens 3 sein müssten. All das, was da so unter "DAT" steht, soll doch wohl auch eine Spalte sein, oder? Und die wird vom Programm offensichtlich nicht erkannt, vermischt sich aber in Word vermutlich mit einer der beiden anderen Spalten.
 

TBS-47-AUDIOCLUB

Threadstarter
Dabei seit
30.05.2007
Beiträge
488
Ort
Berlin
Hhmmm...

Hast Du denn nach dem Einfügen in Word den Text in eine Tabelle umgewandelt, oder zeigt Word bereits eine fertige Tabelle? Hier solltest Du vor dem Einfügen auch einmal mehrere Optionen ausprobieren.

WORD zeigt in jedem Fall Chaos, egal wie ich das Programm einstelle.

Ich sehe auf deinem Screenshot z. B. schon mal zwei "echte" Spalten (getrennt durch einen senkrechten Strich), wobei es allerdings eigentlich schonmal wenigstens 3 sein müssten.

So, wie es dieser Scann, dieses Bild zeigt, ist es gewollt (bei DAT-Aufnahmen nur 2 Spalten, bei allen anderen 3 ).

Ich habe hier nochmals geantwortet, weil ich meine, das gebietet die Höflichkeit. Ansonsten möchte ich nochmals darauf hinweisen, daß dieses "Thema" nun für mich erledigt ist.

Gruß, Euer Gunther
 

Mike

i7-6700HQ
Dabei seit
21.09.2006
Beiträge
24.384
Ort
Outdoor oder vorm Rechner
Tja, lieber "Ronny2",

hier noch mal das Ergebnis nach dem Scannen:

Wie man sieht ist eine korrekte Tabelle antstanden, die jedoch sofort nach dem Kopieren u. Einfügen in eine WORD-Seite, das von mir beschriebene Chaos auslöst.

Das (Ab-) Schreiben des gesamten Textes von rd. 180 eng beschriebenen DIN A-4-Seiten war doch wohl nicht ernsthaft von Dir als Alternative vorgeschlagen, oder?

Ich werde mich jetzt nicht weiter ärgern, oder von WORD/OmniPageSE2.0, ärgern lassen u. werde mein Vorhaben aufgeben.

Danke nochmals f. Eure Mühe! Gruß, Euer Gunther


Genau, darfst du aber nicht machen (rot markiert)

Die Tabelle ist bereits fix und fertig. Du musst nur mehr mit den Omnipage_Befehlen die Tabellen berichtigen (DAT z.B.) und dann das Dokument ABSPEICHERN (nicht kopieren und einfügen).
 

TBS-47-AUDIOCLUB

Threadstarter
Dabei seit
30.05.2007
Beiträge
488
Ort
Berlin
Hey, lieber "Mike"!

Auch Dir noch die letzte Antwort: Natürlich gehe ich erst auf den Button Speichern unter... dann öffnet sich der Ordner Eigene Dateien u. ich kopiere die letzte gescannte Seite zu den anderen (im betr. Unterordner). Oder direkt auf eine leere WORD-Seite.

Nochmals DANKE an alle! Gruß, Euer Gunther
 

APFEL 2c

Dabei seit
22.05.2007
Beiträge
565
Hi,

@"APFEL 2c"
Die "herausgewanderten" Zeichen/Buchstaben sind ja nach dem Kopieren nicht völlig verschwunden. Man kann sie auf der WORD-Seite wieder Zeile für Zeile zurück holen. - Doch das ist logischerweise überaus mühsam u. ergibt auch kein "sauberes" Aussehen, da beim Versuch eine Spalte herzustellen, die ersten Buchstaben nicht sauber in einer Linie stehen.

.....

Gruß, Euer Gunther


Wenn dein OCR Dokument oder das was du aus der OCR Software in dein Office hinein kopiert hast in einem derartige großen Rahmen auf dem Dokument "klebt", dann ist dies ein freier Textrahmen und die OCR Textdatei (RTF Format o.a.) ist nicht direkt in dein WORD Dokument kopiert, denn sonst gäbe es diese am Rand verschwindenden Wörter nicht!

Was auffällt ist das du in dem übertragenen OCR sehr große Lücken durch mehrere SPACE hintereinander oder mehrere TAB hast, was bei einem sauberen Scan und sauberer Umsetzung durch die OCR Software eigentlich nicht sein sollte!

Wenn dazu noch die vom OCR erkannten Buchstaben in der horizontalen Grundhöhe auf der Basislinie (Textzeile) differieren, dass heißt das diese nach schräg unten oder oben in einem kleinem stufigen Winkel abwandern, dann solltest du vielleicht einmal die Einstellungen deiner OCR Software prüfen, ob es darin nicht vielleicht besondere Optionen für eine nahezu freie aber dem gescannten Dokument identische schiefe graphische Anordnung für den Text gibt, wie zum Beispiel eine Option:"Text als graphische Anordnung oder als Standard ASCII für Office-Dokumente scannen"!

Ein normales OCR Textdokument kann als übertragener ASCII-Zeichensatz (RTF-, TXT-Datei u.a.) in der Höhen-Ausrichtung der einzelnen Buchstaben auf den einzelnen Zeilen nicht differieren!

Mein altes COREL OCR Trace 7 (von 1998, läuft unter W2K SP4) kann auch noch ein um etwa 5° deutlich schief liegendes Dokument noch gut scannen und umsetzen (erkennt auch Absätze die dann auch einzeln exportiert werden können)! (siehe Bild!))

Und ein um 1 bis 2° normal im Scanner schief liegendes Textdokument sollte für eine OCR Software kein Problem sein!

Wenn dieses Problem nicht einstellbar ist, würde ich die OCR-Software (wenn es nur ein Beipack zum Scanner war) wegwerfen, denn die Nachbearbeitung dürfte bei mehreren größeren OCR Dokumenten böse in die Zeit gehen!
 

Anhänge

  • OCR 2.jpg
    OCR 2.jpg
    397,7 KB · Aufrufe: 271

APFEL 2c

Dabei seit
22.05.2007
Beiträge
565
Hhmmm...


WORD zeigt in jedem Fall Chaos, egal wie ich das Programm einstelle.

So, wie es dieser Scann, dieses Bild zeigt, ist es gewollt (bei DAT-Aufnahmen nur 2 Spalten, bei allen anderen 3 ).

Ich habe hier nochmals geantwortet, weil ich meine, das gebietet die Höflichkeit. Ansonsten möchte ich nochmals darauf hinweisen, daß dieses "Thema" nun für mich erledigt ist.

Gruß, Euer Gunther


Große Tabellen kann man ohne immense Nachbearbeitung mit "SUCHEN & Ersetzen" Funktionen und ein paar kleinen Tricks in einem guten Texteditor nur Spaltenweise und dies der Reihe nach, Spalte für Spalte und Blatt für Blatt einscannen und diese dann jeweils in Reihenfolge ins fortlaufende Tabellen-Dokument und den entsprechenden Spalten deines Office einfügen!

Ein kompletter Scan einer Seite wird nicht funktionieren, da durch die nicht korrekt erkannten TAB (oder mehrfach TAB) und/oder SPACE (Text- und Spalten-Trenner) in der Tabelle nämlich ein heilloses Durcheinander der Daten entsteht!

Ohne ein wenig Mühe wird es nicht gehen .... aber es ist ja auch bald Wochenende und ca. 12 Stunden dürfen wohl genügen um die Tabelle zu übertragen! :sing
 
Thema:

WORD-Seite ordnen (abgebrochen)

Oben