User login

Donate

Donate for server costs [more]

Target:
$ 3000
Achieved:
$ 186.3
Fees:
$ 13.36
6.2 %
Donate
SourceForge.net Logo

OCR Format mit PDFCreator

13 replies [Last post]
pedalustig
Offline
Joined: 10/20/2009

Hallo zusammen,

gibt es die Möglichkeit OCR per PDFCreator zu erstellen?

Wir haben ein PDF-A Dokument welches bereits die OCR Fähigkeit besitzt, wenn ich hier nun z.b. eine Seite entfernen und das ganze nochmals über den PDFCreator drucken ist das OCR leider weg.

Hast jemand eine Idee wo hier etwas umgestellt werden muss?

OS: WinXP Sp2

PDF Ver. 0.9.8

 

Mit freundlichen Grüßen

Peter

Frank
Frank's picture
Offline
DeveloperTranslator
Joined: 03/22/2009

Jetzt stehe ich auf dem Schlauch.

>Wir haben ein PDF-A Dokument welches bereits die OCR Fähigkeit besitzt, ...

Was meinst du damit? Steht hier OCR für Optical Character Recognition?

__________________

Frank
Team pdfforge

pedalustig
Offline
Joined: 10/20/2009

Mit der OCR Fähigkeit meine ich das, dass Dokument durchsuchbar ist.

Sprich wir scannen einen Rechnung ein, diese ist anschließend im PDF-A Format und durchsuchbar.

Nun ist hier ausversehen eine Seite dazwischen welche nicht rein sollte, also nehmen wir den PDFCreator und "scheiden" die Seite aus.

Danach ist das Dokumente aber nicht mehr durchsuchbar.

Frank
Frank's picture
Offline
DeveloperTranslator
Joined: 03/22/2009

 Sende bitte Beispieldateien an support@pdfforge.org.

__________________

Frank
Team pdfforge

pedalustig
Offline
Joined: 10/20/2009

Mail ist mit zwei Beispieldokumenten raus!

pedalustig
Offline
Joined: 10/20/2009

Konnte das Problem bereits nachgestellt werden?

Frank
Frank's picture
Offline
DeveloperTranslator
Joined: 03/22/2009

Antwort ist raus zu Dir.

__________________

Frank
Team pdfforge

Zuckerfrei
Offline
Joined: 12/28/2009

Hallo, ich habe genau das selbe Problem beim zusammenstellen mehrerer PDF Dateien. Gibt es eine Lösung zu diesem Fall?

Grüße aus Bonn

 

EDIT:

Vielleicht liegt es nicht an PDFCreator. Habe es mit einer anderen Software getestet. Selber Effekt.

Scoubi
Offline
Joined: 08/01/2010

Gibt es bis heute eine Lösung für das Problem?

In Dokumenten, welche PDFCreator generiert wurden kann man weder etwas suchen, noch kann man dessen Inhalt kopieren.

Wer es nachvollziehen möchte, öffnet ein Word-Dokument und druckt es mit dem PDFCreator aus. Dann kopiert er den Inhalt zurück in ein Word-Dokument.

Eigentlich möchte ich mit dem PDFCreator mehrere PDF-Dokumente (welche korrekt sind) verbinden. Doch nach dem Verbinden habe ich keine Texterkennung mehr drin. SCHADE

bsonic
Offline
Joined: 10/16/2010

Hallo,

ich habe das Problem auch, was sehr nervig ist, da ich mehrere PDFs eigentlich zusammenführe, um die Informationen danach gebündelt zu haben. Stattdessen steht funktioniert die Suchfunktion danach nicht mehr (Version 1.0.2).

Ist dieses Verhalten denn gewünscht? Ich habe gerade gemerkt, dass es mit der Version 0.9.7 noch funktioniert hat. In der aktuellen Version ist der PDFCreator für mich so gut wie nicht mehr einsetzbar, da bei dessen Benutzung der einfache Zugriff auf die Informationen verloren geht. Und das ist für mich einer der Hauptvorteile von PDFs.

Ist hier ein Bugfix geplant?

schlundz
Offline
Joined: 11/13/2010

Ich muß diesen Thread nochmal auffrischen.

Ich bin vor einiger Zeit zu PDFCreator  gewechselt und habe schon einiges gedruckt. Nun stellte ich (auch) fest, das die mit PDFCreator erstellten Dokumente nicht durchsuchbar sind. Bei mir handelt es sich um pdf die nochmal mit veränderten Einstellungen "gedruckt" werden, um Dateigröße zu minimieren.

Hängt das damit zusammen? Dir ursprünglichen pdf sind durchsuchbar, die neu erstellten hingegen nicht.

ich nutze Vers. 1.02, mit Ghostscript 8.70, Win 7 pro)

Frank
Frank's picture
Offline
DeveloperTranslator
Joined: 03/22/2009

Das hat was mit der eingebetteten Schriftarten zu tun. Ich würde da unbedingt den PDFCreator 1.1.0 testen, der in den nächsten Tagen veröffentlicht wird.

__________________

Frank
Team pdfforge

schlundz
Offline
Joined: 11/13/2010

Werde ich dann mal testen.

Um es etwas genauer auszuführen:

die pdf, die ich verkleinern möchte, wurden eingescannt und per OCR-Software in durchsuchbare pdf umgewandelt. (ich glaube, mit Abby fine reader o.ä.)

Allerdings war für ordentliche ERgebnisse wohl eine Auflösung von 600dpi nötig. Es sind so Dateien von  > 30 MB entstanden. Die wollte ich halt etwas verleinern - aber danach waren sie eben nicht mehr durchsuchbar. Also warte ich mal auf Vers. 1.1   ;-)

bsonic
Offline
Joined: 10/16/2010

Ich habe gerade versucht, mit der Version 1.2.0 zusammengeführte Dokumente zu durchsuchen.

Ergebnis:

Funktioniert immer noch nicht!

© pdfforge.org :: Contact us :: Sitemap