Export do JPG a následně OCR.
Navazuje na předchozí postup. Posunuje ho však dále a odstraňuje některé jeho nedostatky. Dokonce
se jedná o jediný způsob jak zachránit text, pokud byl v PDF souboru uložen v křivkách. První část
postupu je stejná. Export z PDF do bitmapy s vyšším rozlišením. Zde však nemusíme jít do extrému a
pro OCR mnohdy stačí 100 dpi. Jakmile máte k dispozici jednotlivé bitmapy stránek, můžete použít
některý z programů na rozpoznávání písma (OCR). Velmi dobré výsledky v češně má např. FineREA‐
DER. Ten najdete na internetu.
Po převedení písma do formátu
TXT nebo DOC opravíte chyby a
máte velmi dobrý základ pro tvor‐
bu nové stránkové montáže.
Ostatní komponenty (bitmapy a
obrázky) z původního PDF buď
přenesete pomocí CTRL+C, CTR‐
L+V nebo přes export do bitmapy
s potřebným rozlišením. Novější
verze FineREADERU umí pracovat
přímo s PDF souborem a tak
nemusíte PDF konverovat do
bitmapy. To má tu výhodu, že Fine‐
READER si export vnitřně opma‐
lizuje a pro OCR tak má ty nejlepší
možné podmínky.
Uvedli jsme řadu „náhradních“ postupů, jak vyzrát na PDF.Bohužel neexistuje jedna uni‐
verzální rada. Je třeba si uvědomit, co potřebujete a co máte k dispozici. Nejzákladněj‐
ším předpokladem pro další práci je to, aby se PDF objevovalo správně na obrazovce.
Není‐li tomu tak, je pravděpodobné, že PDF počítá s nějakými vnějšími soubory, které
nemáte k dispozici (zpravidla se jedná o nezapouzdřená písma). Dále je třeba si uvědo‐
mit, že PDF soubory nikdy nebyly určeny pro další editaci a dokonce v nich je celá řada
nástrojů, které to nejen neumožňují, ale přímo zakazují. Proto nejlepší radou je vždy
požádat dodavatele PDF souborů o matečný soubor v editovatelné podobě a s m pak
pracovat.
AUTOŘI LEKCE: Ing. Jan Pánek, Štefan Kratochvíl
55
54
PDF@DTPSTUDIO.CZ |
ACADEMY
ACADEMY | WWW.DTPSTUDIO.CZ