Bücher abfotografieren bzw. Repro.

Der chaotische Hauptfaden

Moderatoren: Heaterman, Finger, Sven, TDI, Marsupilami72, duese

Antworten
Benutzeravatar
Lötfahne
Beiträge: 2832
Registriert: Sa 9. Nov 2013, 10:43
Wohnort: KBS 669 bzw. 9401

Bücher abfotografieren bzw. Repro.

Beitrag von Lötfahne »

Moin.
Angeregt durch den Beitrag mit dem "Radiobuch" hätte ich da mal ne Frage:
Ich hab mehrere Werke aus den 20er Jahren, auch Maschinenbau etc.
Sehr schwere, großvolumige Wälzer.
Beim Rechtsnachfolger des Verlages http://www.hotel-und-gast.de/der-verlag.html (die machen inzwischen ganz anderes Zeug) hab ich schon angefragt, wegen diverser Auszüge ins Internet etc. zu stellen.
Man hat dort mangels Interesse keinerlei Bedenken, sinngemäß "..machen Sie ruhig. Das gehört nicht mehr zu unserem Geschäftsfeld."
Nun stellt sich aber, abgesehen davon, eine eher technische Frage.

Ich möchte diese Wälzer ungern Seite für Seite auf den Scanner wuchten, das tut weder dem Gerät noch den Büchern gut, von meinem Rücken ganz zu schweigen. ;)

Wie fotografiert man sowas am geschicktesten ab?
Das ginge wohl am schnellsten.
Ein Holzgestell für die Kamera drüberbasteln ?
Die Seiten müssen ja immer plan liegen?
Welche Auflösung sollte ich an der Knipse einstellen, bzw. bringt eine Umwandlung in ein anderes Dateiformat was?
Es sind auch viele Schwarzweißbilder und Zeichnungen drin, teilweise als Lithographie.
Hat jemand sowas schonmal gemacht?
Benutzeravatar
Marsupilami72
Beiträge: 2858
Registriert: Mo 4. Nov 2013, 23:48
Wohnort: mittendrin

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Marsupilami72 »

Mal gerade aus einem anderen Faden rüber kopiert:

https://www.golem.de/news/open-source-b ... 95718.html

Ich würde mir da was "halbmanuelles" bauen - eine Glasscheibe, auf die man die aufgeschlagene Buchhälfte drauflegen kann (damit die Seite plan ist), unten drunter eine angepasste Kamerahalterung und entsprechende Beleuchtung.

Als Auflösung würde ich um die 5MP einstellen, Format ganz normal JPG. Und wenn möglich, die Kamera auf manuell stellen und einmal Belichtung und Fokus einstellen.
Benutzeravatar
Später Gast
Beiträge: 1680
Registriert: Di 5. Apr 2016, 22:03
Wohnort: Karlsruhe
Kontaktdaten:

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Später Gast »

Hier in der badischen Landesbibliothek stehen so Auflichtscanner rum, damit kann man recht komfortabel Auszüge (oder auch ganze Bücher ;) ) einscannen und direkt auf USB speichern. Manuell umblättern und auf "scannen" drücken muss man noch, der Rest geht automatisch. Vllt gibts in deiner Umgebung ja auch ne Bib mit entsprechendem Equipment?
bastelheini
Beiträge: 1663
Registriert: So 11. Aug 2013, 13:55

Re: Bücher abfotografieren bzw. Repro.

Beitrag von bastelheini »

Ich hab das immer so gemacht: Android Handy, Camera CV-5 (kann Fotos in festgelegten Intervallen und Scharfstellen vor jedem Foto), Lego/Holz/Bücherstapel mit Handy drauf, Licht.

Dann Handy ausrichten, ein Foto aller 5 Sekunden auf die aufgeschlagene Doppelseite gerichtet -> umblättern per Hand. Rechts und links hat man zwar jeweils eine Fingerspitze mit auf dem Bild, aber das war mit egal.

So ist man recht schnell durch, hat im wesentlichen auch konstante Seitenränder.

Man kann das Ganze dann auch noch mit Abby Finereader weiterverarbeiten.
sysconsol
Beiträge: 4059
Registriert: Fr 8. Jul 2016, 17:22

Re: Bücher abfotografieren bzw. Repro.

Beitrag von sysconsol »

Wie viel Aufwand man treiben muss, hängt stark davon ab, was man mit den Fotokopien anfangen möchte.

Für Texterkennung (OCR) und damit einer durchsuchbaren Digitalisierung OCR benötigt es viel Aufwand.
Da muss die Seite gerade und plan liegen.
Es darf nichts spiegeln.
Die Ausleuchtung muss sehr gleichmäßig erfolgen (die Augen sind da weitaus toleranter als eine Kamera).
Schatten dürfen nicht entstehen.
Der Kontrast muss hoch sein.

Sollen die Seiten lediglich als Bilder gespeichert werden, um sie dann als PDF zusammenzufügen,
sind die Anforderungen wesentlich geringer.
Man muss es gut lesen können bzw. die Zeichnungen erkennen können.

Eine Glasplatte hält zwar die Seiten plan, aber man muss wegen der Reflexionen / Spiegelungen aufpassen.

Die Auflösung sollte so hoch ein, dass man einem Ausdruck in Originalgröße die Digitalisierung nicht ansieht.
Beim Scanner sind das je nach Feinheit der Strukturen 200 ... 300dpi.
Für Texterkennung wirst du das mindestens benötigen.

Probier es am besten an einigen Seiten manuell aus, damit du ein Gefühl bekommst.
Idealerweise musst du das Foto nicht nachbearbeiten.
Wenn doch - probier auch das aus. Ungleichmäßige Belichtung fällt dann besonders auf...
Nach dem Probieren kannst du entscheiden, ob sich der Aufwand lohnt.

Neben einem Gestell für die Kamera brauchst du auch noch ordentliche Lichtquellen.
Bedenke, dass das Umgebungslicht beim Abfotografieren eine nicht unwesentliche Rolle spielt.
Ich habe das mal mit zwei Leuchtststoffröhren parallel zu den langen Seiten des Originals (bei mir A3) versucht.

Eventuell sollte man die Buchbindung lösen und einen vernünftigen Einzugscanner benutzen.
Den Einzugmechanismus dann regelmäßig reinigen.
chico
Beiträge: 238
Registriert: Do 26. Mai 2016, 17:46
Wohnort: Hessen

Re: Bücher abfotografieren bzw. Repro.

Beitrag von chico »

'CT make' hatte mal ein Projekt : Buchscanner zum selberbauen...

https://shop.heise.de/katalog/buchscann ... menklappen - kann man jetzt wohl kostenlos downloaden.

und wurde dann in den folgenden Jahren verfeinert. 'CT make' ist ein Magazin für Bastler von Heise.
sysconsol
Beiträge: 4059
Registriert: Fr 8. Jul 2016, 17:22

Re: Bücher abfotografieren bzw. Repro.

Beitrag von sysconsol »

Ich erinnere (oder irre?) mich noch schwach, dass wer hier im Forum mal mit einer automatischen "Seitenumblätterung" zu tu hatte.
Eben zum Zweck der Digitalisierung.

War es shaun?

Ich möchte keine dicken Wälzer von Hand blättern...
sysconsol
Beiträge: 4059
Registriert: Fr 8. Jul 2016, 17:22

Re: Bücher abfotografieren bzw. Repro.

Beitrag von sysconsol »

Daffid
Beiträge: 676
Registriert: Mi 9. Nov 2016, 14:35
Wohnort: Nordbaden

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Daffid »

Wenn die Buchseiten fotografiert sind und nicht ganz gerade liegen habe ich mal ein nettes Tool gefunden.

Nennt sich Scan Tailor, ist freeware und erkennt automatisch die Seiten und zieht sie auf das passende Format auf und man kann verschiedene Bearbeitungsschritte auf alle Seiten anwenden.

Man braucht ein wenig bis man sich daran gewöhnt hat aber wenn's läuft dann läuft's.

Gruß
David
Benutzeravatar
Bastelbruder
Beiträge: 11483
Registriert: Mi 14. Aug 2013, 18:28

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Bastelbruder »

Eine Knipskiste wie abgebildet, blau = Glasscheibe, braun = Holz, rot = Optik/Foto, sonst innen komplett schwarz, ausgenommen die (hier schräg von vorn und hinten zur Glasplatte strahlende) Beleuchtung.
knipskiste.jpg
da drüber wird die Schwarte gehängt.
Benutzeravatar
Gobi
Beiträge: 4405
Registriert: Fr 29. Mai 2015, 08:12
Wohnort: Kreuzberg
Kontaktdaten:

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Gobi »

Die Idee mit der Kiste ist gar nicht mal schlecht.
Ansonsten habe ich irgendwo noch ein einstellbares Stativ zu liegen, ich habe das nämlich auch schon ein paar mal gemacht... das kann schon in ziemlich schlimmer Arbeit ausarten, es kommt ja noch die ganze Dateiverwaltung und Bearbeitung dazu....
Ist OCR heute überhaupt mit einem Foto möglich, früher war es undenkbar, aber die Auflösungen sind ja heutzutage so hoch?

Allerdings war das zumindest früher noch viel mehr die Hölle, 10000 Fehler im Text, "Word" lässt alles durcheinander purzeln, wenn man nicht aufpasst und Fraktur ist eh nicht drin... :evil:
Benutzeravatar
Marsupilami72
Beiträge: 2858
Registriert: Mo 4. Nov 2013, 23:48
Wohnort: mittendrin

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Marsupilami72 »

Gobi hat geschrieben:Ist OCR heute überhaupt mit einem Foto möglich, früher war es undenkbar, aber die Auflösungen sind ja heutzutage so hoch?
Man kann heute die Handykamera auf einen fremdsprachigen Text richten und Bingoogle legt Dir im Bild die deutsche Übersetzung drüber...

Also: ja, das geht.
Klemmstein
Beiträge: 57
Registriert: Mo 21. Mär 2016, 19:18

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Klemmstein »

Das ist dieses Make Projekt,aber schon Aufwand ....

https://www.heise.de/make/meldung/Autom ... 02644.html
Censer
Beiträge: 610
Registriert: Di 18. Feb 2014, 03:36

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Censer »

Die örtliche TU hier hat in ihrer Bibliothek einen eigenen Raum mit mehreren professionellen Buchscangeräten zum Selbstbedienen, die Bibliothek im Deutschen Museum macht das soweit ich weiß gegen Entgelt. Frag' doch einfach mal bei Unis in deiner Nähe an oder google danach, ob die sowas haben.
Benutzeravatar
xoexlepox
Beiträge: 4814
Registriert: So 11. Aug 2013, 19:28
Wohnort: So etwa in der Mitte

Re: Bücher abfotografieren bzw. Repro.

Beitrag von xoexlepox »

Sollen die Seiten lediglich als Bilder gespeichert werden, um sie dann als PDF zusammenzufügen, sind die Anforderungen wesentlich geringer.
Die resultierende Datei wird bei diesem Verfahren recht schnell "unhandlich groß". Bei "noch gerade lesbar" (-> Auflösung) und einem Artikel von 5-10 Seiten geht das vielleicht noch, bei einem "dicken Wälzer" wohl weniger ;)
Benutzeravatar
ESDKittel
Beiträge: 3121
Registriert: Fr 23. Aug 2013, 13:18

Re: Bücher abfotografieren bzw. Repro.

Beitrag von ESDKittel »

Wie schon angeschnitten wurde, ist eine riesige Pixel-Auflösung viel weniger wichtig als eine gescheite Einrichtung des Photosetups.
Dunkelgrau auf etwas weniger dunkelgrau in Full HD nutzt niemanden, wenn man selbst schon mit dem biologischen OCR massiv Schwierigkeiten hat das ganze zu entziffern. Hab leider schon oft gescannte Schaltpläne, Zeitschriften und Bücher im Netz gefunden die schlicht unbrauchbar waren.
Aufwand in richtige Beleuchtung, Kontrasteinstellungen, Weißabgleich, Fokusierung, glatte Blattlage... etc. zu stecken ist zielführender.
Scanne selber meist eher einzelne Schaltpläne mit einem Flachbettscanner mit etwas Aufwand bei der Parametereinstellung wird auch schwarzer Text auf gelbbraungrauem Papier wieder zu Graustufen auf weiß.
Benutzeravatar
RMK
Beiträge: 5360
Registriert: Di 20. Jan 2015, 14:59
Wohnort: östlich von Stuttgart

Re: Bücher abfotografieren bzw. Repro.

Beitrag von RMK »

kurz meinen Senf dazu, ich habe mal ein älteres Buch folgendermassen "gescannt":

- Buch bei bewölktem Himmel raus auf einen Tisch (wegen schattenfreiem Licht) - es sollte halt nicht regnen :twisted:

- Kamera (bei mir ists eine relativ gute digitale Spiegelreflex..) mit einem Stativ von oben, Objektiv nach unten gerichtet, mittig
über das Buch montiert

- der Abstand war relativ gross, 80 cm oder so - bedingt ein entsprechendes Objektiv bzw. Zoom, verringert aber die Verzerrung

- (elektrischen) Drahtauslöser an die Kamera gehängt.

Testaufnahmen gemacht (manuell eingestellt, damit sich nicht die Belichtung je nach Schriftdichte der Seite(n) ändert), und dann
Feuer frei - umgeblättert, mit je einer Fingerspitze die Buchseiten unten gehalten und mit dem Daumen den Fernauslöser gedrückt.

das geht ruckzuck - spätestens alle 5 Sekunden ein Bild, eher alle 2... nach gut 20 min wars erledigt und alle 500 Seiten "im Kasten".

Dann in einer Bildbearbeitungssoftware eine Aktion gestartet mit "Ausschnitt des relevanten Teils ohne Fingerspitzen" - "Tonwertkorrektur"
- "nachschärfen" - "speichern"

das hat dann der Rechner für mich erledigt, nochmal ne gute halbe Stunde.

Die Verzerrung durch die gebogenen Seiten ist minimal, man kann alles prima lesen, und es war zeitmäßig sehr im Rahmen.

Wenn Du erst noch Repro-Licht aufbauen musst (auch LS-Röhren spiegeln wenns dumm läuft bzw. das Papier glänzend ist) und jedesmal
das Buch von einer Glasplatte runternehmen, umblättern, wieder auf der Glasplatte ausrichten... dann kannst auch gleich scannen.
Benutzeravatar
zauberkopf
Beiträge: 9481
Registriert: So 11. Aug 2013, 15:33
Wohnort: gefährliches Halbwissen

Re: Bücher abfotografieren bzw. Repro.

Beitrag von zauberkopf »

Wegen OCR : Also das geht wirklich gut, auch bei schlechter qualität.
Allerdings muss man für die Software ein wenig Geld hinlegen.
Ich hatte vor ein paar Jahren verschiedene Lösungen mal ausprobiert um aus nicht durchsuchbaren Patentschriften, von Anno dazumal, dazu noch schlecht eingescannt in niedriger auflösung, durchsuchbare PDF's zu machen.
Mit den Opensourcelösungen hatte ich damals keinen Erfolg gehabt.
Ich weis nicht mehr ob das von Adobe war oder von Abbyy ? Jedenfalls lief die Software auf der einzigen Windowskiste.. und hat alles was es im Ordner gefunden hat, automatisch durchgewurschtelt.
Benutzeravatar
Bastelbruder
Beiträge: 11483
Registriert: Mi 14. Aug 2013, 18:28

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Bastelbruder »

Schwarzweiß grundsätzlich mit 7620 Linien/cm (300 dpi) scannen / aufnehmen und zweifarbig im Format Tif-CCITT-Fax4 oder png speichern. Das gibt die kleinsten Dateien und kann problemlos weiterverarbeitet werden.

Hände weg von jpg und gif.dithering, nicht im Traum daran denken!

Durchsuchbare pdf erzeugt der adobe acrobat, aber das lohnt nicht für den Privatgebrauch.
MiataMuc
Beiträge: 53
Registriert: Fr 13. Mär 2015, 20:11

Re: Bücher abfotografieren bzw. Repro.

Beitrag von MiataMuc »

Für durchsuchbare PDFs mit recht guter Qualität nutze ich die Freeware https://ocrmypdf.readthedocs.io/en/latest/ (läuft bei mir auch einem kleinen virtuellen Debian, und wird dann aufs Scanverzeichniss mit der Tagespost losgelassen). Professionell nutzte mein früherer Arbeitgeber Software von Abby; da wurden dann aber Lizenzpreise pro Seite fällig; zusätzlich zu den aufwendigen Einrichtungsarbeiten für neue Formulare.
Benutzeravatar
Schneewittchen
Beiträge: 1200
Registriert: Di 18. Jul 2017, 10:16

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Schneewittchen »

Benutzeravatar
Lukas_P
Beiträge: 1709
Registriert: Mo 12. Aug 2013, 21:21

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Lukas_P »

Schneewittchen hat geschrieben:Hier die Lösung deines Problems: https://www.ebay-kleinanzeigen.de/s-anz ... 0-242-6326
Naja die Leitz is zum Foto Abfotographieren ... Fotos haben den vorteil das sie nicht verbogen / Vergilbt sind.

Wir haben bei uns im Vereinsarchiv so ein Ding wie du brauchst stehen. Da kannste dein Buch Drunterschmeißen Scannen drücken und danach alles noch ordentlich hinbiegen. Mit dem Ding ist man extrem schnell (ich hab 300 Seiten in vll 1 1/2 h gescannt und in nochmal einer Stunde fertig bearbeitet gehabt) DIe Fertig bearbeiteten Seiten schauen dann etwa so aus :
1020 Fahrm_abdr.pdf
(385.18 KiB) 153-mal heruntergeladen
(Original war die Seite gewellert geknickt und sehr stark vergilbt) Wie der Scanner und die Zugehörige Software heißt kann ich in erfahrung bringen, allerdings kostet das Gerät neu etwa 600€ (vll kann ich auch nur die Software "weitergeben" wenn sie sich überreden lässt normale bilder zu bearbeiten.)

Oder wenn du garkeinen Weg findest... Steck die Bücher in ein Packet und ich Digitalisier sie dir ;)
Benutzeravatar
Schneewittchen
Beiträge: 1200
Registriert: Di 18. Jul 2017, 10:16

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Schneewittchen »

Lukas_P hat geschrieben:
Schneewittchen hat geschrieben:Hier die Lösung deines Problems: https://www.ebay-kleinanzeigen.de/s-anz ... 0-242-6326
Naja die Leitz is zum Foto Abfotographieren ... Fotos haben den vorteil das sie nicht verbogen / Vergilbt sind.

Originaltext Inserat: "Mit dabei ist ein praktischer Original-Bucheinspannkasten, der die Seiten von unten plan gegen eine Glasplatte drückt"
Benutzeravatar
Bastelbruder
Beiträge: 11483
Registriert: Mi 14. Aug 2013, 18:28

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Bastelbruder »

Zu der Zeit als dieses Gerät "in" war, waren "Reprobuden" noch Grafische Kunstanstalten. Und zwei Druckseiten farbig ein Tagesprogramm.
Benutzeravatar
Lukas_P
Beiträge: 1709
Registriert: Mo 12. Aug 2013, 21:21

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Lukas_P »

Schneewittchen hat geschrieben: Originaltext Inserat: "Mit dabei ist ein praktischer Original-Bucheinspannkasten, der die Seiten von unten plan gegen eine Glasplatte drückt"
Nagut .. habich nicht gesehen ... is aber trotzdem blöd.. wenn du alte Bücher so platt drückst das du sie abfotografieren kannst fallen sie dir nach der 3. Seite auseinander weil der Pfalz bricht ... (ja ich habs schon ein paar mal gesehen) :|
Benutzeravatar
tschäikäi
Beiträge: 2054
Registriert: Mi 14. Aug 2013, 14:01
Wohnort: Saarland

Re: Bücher abfotografieren bzw. Repro.

Beitrag von tschäikäi »

Moin, hat jemand denn eine OCR-Software, die unter Windows funzt und kostenlos ist?
Ich habe einige Freewares und Testversionen probiert.
Bisher alle Programme haben entweder Seitenbegrenzungen oder unzulängliche Entzifferungsfähigkeiten.

Hier ne PDF zum Testen, die auch ich genommen habe.
Wenns mit OCR nicht klappen sollte... kennt jemand eine SW, die automatisch Seitenränder beschneiden kann?
Beispielsweise im verlinkten Dokument, da hat man das Problem, dass die Hälfte der PDF- Seiten eigentlich weiß sind und die eingescannte Buchseite
nur einen Bruchteil der Fläche ausmacht.


Gruß Julian
sysconsol
Beiträge: 4059
Registriert: Fr 8. Jul 2016, 17:22

Re: Bücher abfotografieren bzw. Repro.

Beitrag von sysconsol »

Ich nutze für OCR eine alte Version des Abbyy Fine Readers (6.0 Sprint). Die war zu einem Scanner dazu.
Zur Vorbereitung nutze ich Scan Tailor.
Die Umwandlung von TIF zu JPG erledige ich mit IrfanView.

Die OCR-ten Seiten drucke ich per FineReader weder als PDF und lege den Inhalt als TXT-Datei daneben.
Das PDF ist durchsuchbar und die TXT-Datei für die Schlagwort-Suche auf dem PC.

PDF-Dokumente sollte man vorher seitenweise als Bild (jpg oder wasauchimmer) exportieren.
Auf die DPI achten, min 600 sind sinnvoll.

Dafür gibt es Onlinekonverter.
Unter Linux gibt es da wohl Werkzeuge, zu deren Einrichtung ich aus zeitlichen Gründen noch nicht gekommen bin.

Ich bastel mal mit der Testdatei und melde mich wieder.
sysconsol
Beiträge: 4059
Registriert: Fr 8. Jul 2016, 17:22

Re: Bücher abfotografieren bzw. Repro.

Beitrag von sysconsol »

Ohne urteilen zu wollen, ob das mit OCR immer sinnvoll ist (zum automatisierten Durchsuchen ja, mehr aber auch nicht),
hier meine Vorgehensweise:

- PDF-Datei zu jpg - eine Bilddatei pro Seite

- JPG-Datei nummerieren 01, 02, 03, ... - zur Not mit Irfanview
(Stapelverarbeitung, schon beim Erstellen des Stapels auf die korrekte Reihenfolge achten)

- Einlesen mit Scan Tailor. Damit werden die Seiten getrennt (wenn Doppelseite), Beschnittel, gedreht und entzerrt (dewarping).

Es entsteht pro zukünftiger Seite eine TIFF-Datei.
Diese TIFF-Datei mit Irfanview wieder zu jpg umwandeln, damit der AbbyFineReader damit klarkommt.
Eventuell dabei noch nachbearbeiten.

OCR durchführen.
Da kommen wir zum Hauptproblem: Der Layouterkennung und Blockerkennung.
Woher soll die Software wissen, was Bild und was Text ist?
Gerade bei Linien / Grafiken wird viel falsch erkannt bzw. gar nich erfasst.
Will man die eingelesene erkannte Schrift nutzen, dann muss man manuell nacharbeiten (braucht viel Zeit).
Ich kümmere mich kaum um die korrekte Erkennung.
Alles was Schrift ist, wird mit in die Felder für Texterkennung gezogen.
Dann wird das Endergebnis als PDF gedruckt.
Dabei wird die Quelldatei (jpg) auf die erkannte Schrift gelegt.
Damit sieht das PDF-Dokument aus wie das Original - ist jedoch durchsuchbar (denn die erkannte Schrift liegt hinter der Grafik).
Für Programme, die keine PDF-Datei durchsuchen können, lege ich den Text in einer Textdatei mit dem selben Namen
neben die PDF-Datei.

Natürlich hat man etwas Schwund - nicht alle Zeichen werden erkannt und damit wird später nie alles gefunden.
Damit kann ich persönlich leben.

So - nun wollte ich die ge-ocr-te PDF-Datei und die Textdatei hier hochladen - aber es gibt nur einen internen Serverfehler.
Versuchen wir es später.
Benutzeravatar
Bastelbruder
Beiträge: 11483
Registriert: Mi 14. Aug 2013, 18:28

Re: Bücher abfotografieren bzw. Repro.

Beitrag von Bastelbruder »

Die Begriffe .jpg und TIFF bedürfen einer Erläuterung.
jpg ist einzig und allein zur komprimierten Aufbewahrung wertarmer Fotos geschaffen, die ursprünglichen guten Gedanken (Anzeige des kompletten Bilds in entsprechend geringer Auflösung aus einem nahezu beliebigen Datenbruchteil) wurden schnell verdrängt. Jede Veränderung einer jpg.Datei bewirkt eine Verschlechterung, das will man nicht. Zudem braucht schlecht lesbarer Text in jpg-Schwamm mehr Speicherplatz als scharf eingescannte Daten mit der vierfachen Auflösung und CCITT Faxkompression Klasse 4. Einmal jpg und alles ist mit Doppelkanten und Falschfarben versaut!
TIFF ist ein Container in dem alle bekannten verlustlosen und verlustbehafteten, komprimierten und unkomprimierten Bilddaten eingepackt werden können, hintendran steht überall .tif

Ich verwende "Some PDF Image Extract" von somepdf.com zur Wandlung von pdf-Bildinhalt in die ursprünglichen Bilder. Jpg bleibt jpg und alles andere wird verlustfrei in png gewandelt. Das Programm legt einen Ordner mit dem Namen der Originaldatei an und darin die einzelnen Seiten (Bilder) mit Namen -000.png, -001.jpg, -002.png ... Was an der Version 1.5 fehlt ist die Übernahme der Abtastauflösung "dpi", die aber bei der Weiterverarbeitung meist eh' geändert wird.

Leider habe ich (als ich es gebraucht hätte) kein besonders brauchbares OCR gefunden, Kadmos im IrfanView ist mit geschätzten 10% Fehlern gerade so geeignet um einen Absatz in Vorschautext zu wandeln...

Wenn eine Datei zickt weil irgendein Arschloch die "Verschlüsselung" aktiviert hat, dann öffne ich das pdf mit pdfsam (v2.2.4) [Visuelle Seitenbearbeitung] und warte auf den Hinweis daß man von mir zur Bearbeitung eine Legitimation benötige. Das will ich aber garnicht und bestätige mit [abbrechen] worauf die thumbnails erzeugt werden. Und dann wird mit [Ausführen] diese Datei unverändert an ihren Platz zurückgelegt wobei wohl elementarer Müll verloren geht... :lol:
sysconsol
Beiträge: 4059
Registriert: Fr 8. Jul 2016, 17:22

Re: Bücher abfotografieren bzw. Repro.

Beitrag von sysconsol »

Dass die Wandlung von TIFF (was auch immer nun genau da drinnen ist) zu jpg suboptimal ist,
ist mir durchaus bewusst.
Leider kann der Abbyy FineReader nicht mit den vom ScanTailor erstellten TIFF umgehen.

Und diverse OCR-Software für Linux hatte mir zu viele Fehler in der Texterkennung.
Vom Layout - was mir manchmal auch wichtig ist - rede ich noch gar nicht.

Da ist der alte FineReader um Welten besser.
shaun
Beiträge: 2399
Registriert: Mo 12. Aug 2013, 20:37

Re: Bücher abfotografieren bzw. Repro.

Beitrag von shaun »

Ui, ich wurde hier im September erwähnt :) Ja in der Tat habe ich mal einige dutzend Stunden und diverses Material in so ein Projekt versenkt, aber lange vor fertig wurde Lebenszeit wertvoller und der Wert von Datenbüchern als Buch sank gleichzeitig, vielmehr brauchte ich die Daten wo ich gerade bin. Daher habe ich bisher schon einige 100 Bücher beim Buchbinder sauber aufschneiden lassen und scanne die immer mal so weg.
Anfangs mit einem HP-Flachbett mit mech. Duplex-Einzug (Seite wurde gewendet), der hat es nicht sehr lange gemacht, und seitdem mit einem Duplex-Einzuscanner.
sysconsol
Beiträge: 4059
Registriert: Fr 8. Jul 2016, 17:22

Re: Bücher abfotografieren bzw. Repro.

Beitrag von sysconsol »

Und wie erledigst du die Texterkennung?

Das Durchsuchen dauert ja auch beim gescannten Buch immernoch lange.
Antworten