eKsiążki
https://forum.eksiazki.org/

Konwersja PDF - trudny przypadek
https://forum.eksiazki.org/ogolnie-o-eczytnikach-f155/konwersja-pdf-trudny-przypadek-t9989.html
Strona 1 z 1

Autor:  mvagner [ 03 cze 2011 13:01:47 ]
Tytuł:  Konwersja PDF - trudny przypadek

Witam, mam nadzieję, że w dobrym miejscu umieszczam ten post i że wystarczająco gorliwie przeszukałem forum ;)
Do rzeczy:
mam kilka eksiążek w PDF, które są, że tak powiem "dwuwarstwowe", tzn. zawierają zarówno skan (obrazek) strony jak i tekst (można zaznaczać i kopiować). Mój problem polega na tym, że konwertując je jakimkolwiek sposobem (celibre, pdftoepub, openoffice) zapisuje mi książkę składającą się z obrazków, podczas gdy ja wolałbym z tekstu ;)
Jest jakiś sposób by to obejść?

Autor:  frytek [ 26 paź 2011 21:46:01 ]
Tytuł:  Re: Konwersja PDF - trudny przypadek

mvagner, Podeślij, chętnie toto obejrzę.

Autor:  Koniol [ 26 paź 2011 23:27:54 ]
Tytuł:  Re: Konwersja PDF - trudny przypadek

Mam dość podobny przypadek - tekst, pod nim obraz z kolorowym tłem, i to takim, że ocr się gubi. Do tego rozdziały rozdzielane kolejną grafika...masakra trochę. Jest jakiś program, który wyciągnie ten tekst bez dodatków? Foxit niestety dodaje znaczniki kolejnych stron, a nie chce "na paue" instalować setki aplikacji.

Autor:  Buber [ 27 paź 2011 18:02:00 ]
Tytuł:  Re: Konwersja PDF - trudny przypadek

Jak to mawiała babcia - "bez pracy nie ma kołaczy" :) Trzeba PDFa otworzyć w finereaderze, ręcznie pooznaczać co jest grafiką a co tekstem (w większości program dobrze to widzi, ale czasem trzeba pomóc), zapisać do HTML, edytować HTMLa (np w wordzie) i uporządkować, i mobireadrem przerobić na PRC. I gotowe.
Nie znalazłem jeszcze książki której bym tak nie przerobił. Nawet jak jest jakiś podły pdf gdzie każda strona to skan a nie tekst, OCR tekst rozpozna.

P.S. Chociażby po to żeby Ci pokazać że się da, podeślij to na 100% skonwertuję. Najwięcej roboty jest z odnośnikami, na ogół ich nie robię, tylko spis treści mi się chce :) .

Autor:  Koniol [ 27 paź 2011 22:52:03 ]
Tytuł:  Re: Konwersja PDF - trudny przypadek

Jasne, tez potrafię fineraderem zmieniać typ pola, ale tu tekst jest NA obrazie ;) Zazwyczaj sobie radze, finerader, potem edycja htmla, korekta tekstu i wychodzi dobrze. Tutaj wychodzi taki bajzel ze musiałbym chyba ręcznie tekst przepisać, byłoby szybciej niż korygować kwiatki po OCR w rodzaju "Ko#^l_am g0" ;)

Ale poradziłem sobie inaczej - konwersja pdfa mobipocketem, który ładnie utworzył htmla, wystarczyło wypruć z niego odwołania do grafiki i został sam tekst, czyli to, o co chodziło. Uciekły co prawda akapity w kilku miejscach, w kilku zniknęła przerwa miedzy akapitami, ale to już nic strasznego.

Autor:  Buber [ 28 paź 2011 8:01:21 ]
Tytuł:  Re: Konwersja PDF - trudny przypadek

Where is a will, there is a... relative :)

I tak trzymać :)

Strona 1 z 1 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/