Teraz jest 24 lis 2024 8:37:06




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 6 ] 
Konwersja PDF - trudny przypadek 
Autor Wiadomość
Użytkownik

Dołączył(a): 03 cze 2011 11:58:30
Posty: 6
eCzytnik: Kindle 3W
Post Konwersja PDF - trudny przypadek
Witam, mam nadzieję, że w dobrym miejscu umieszczam ten post i że wystarczająco gorliwie przeszukałem forum ;)
Do rzeczy:
mam kilka eksiążek w PDF, które są, że tak powiem "dwuwarstwowe", tzn. zawierają zarówno skan (obrazek) strony jak i tekst (można zaznaczać i kopiować). Mój problem polega na tym, że konwertując je jakimkolwiek sposobem (celibre, pdftoepub, openoffice) zapisuje mi książkę składającą się z obrazków, podczas gdy ja wolałbym z tekstu ;)
Jest jakiś sposób by to obejść?


03 cze 2011 13:01:47
Zobacz profil
Użytkownik

Dołączył(a): 02 cze 2009 11:19:12
Posty: 8
Lokalizacja: Polska
eCzytnik: Prestigio Libretto 5162
Post Re: Konwersja PDF - trudny przypadek
mvagner, Podeślij, chętnie toto obejrzę.


26 paź 2011 21:46:01
Zobacz profil
Użytkownik

Dołączył(a): 22 sty 2011 0:38:12
Posty: 64
Lokalizacja: Ruda Śląska
eCzytnik: Kindle 3 Wi-Fi
Post Re: Konwersja PDF - trudny przypadek
Mam dość podobny przypadek - tekst, pod nim obraz z kolorowym tłem, i to takim, że ocr się gubi. Do tego rozdziały rozdzielane kolejną grafika...masakra trochę. Jest jakiś program, który wyciągnie ten tekst bez dodatków? Foxit niestety dodaje znaczniki kolejnych stron, a nie chce "na paue" instalować setki aplikacji.


26 paź 2011 23:27:54
Zobacz profil
Użytkownik

Dołączył(a): 22 sie 2011 13:26:51
Posty: 46
eCzytnik: Kobo Aura HD
Post Re: Konwersja PDF - trudny przypadek
Jak to mawiała babcia - "bez pracy nie ma kołaczy" :) Trzeba PDFa otworzyć w finereaderze, ręcznie pooznaczać co jest grafiką a co tekstem (w większości program dobrze to widzi, ale czasem trzeba pomóc), zapisać do HTML, edytować HTMLa (np w wordzie) i uporządkować, i mobireadrem przerobić na PRC. I gotowe.
Nie znalazłem jeszcze książki której bym tak nie przerobił. Nawet jak jest jakiś podły pdf gdzie każda strona to skan a nie tekst, OCR tekst rozpozna.

P.S. Chociażby po to żeby Ci pokazać że się da, podeślij to na 100% skonwertuję. Najwięcej roboty jest z odnośnikami, na ogół ich nie robię, tylko spis treści mi się chce :) .

_________________
Zapraszam w Karkonosze! Cisza i spokój... Domki w górach


27 paź 2011 18:02:00
Zobacz profil WWW
Użytkownik

Dołączył(a): 22 sty 2011 0:38:12
Posty: 64
Lokalizacja: Ruda Śląska
eCzytnik: Kindle 3 Wi-Fi
Post Re: Konwersja PDF - trudny przypadek
Jasne, tez potrafię fineraderem zmieniać typ pola, ale tu tekst jest NA obrazie ;) Zazwyczaj sobie radze, finerader, potem edycja htmla, korekta tekstu i wychodzi dobrze. Tutaj wychodzi taki bajzel ze musiałbym chyba ręcznie tekst przepisać, byłoby szybciej niż korygować kwiatki po OCR w rodzaju "Ko#^l_am g0" ;)

Ale poradziłem sobie inaczej - konwersja pdfa mobipocketem, który ładnie utworzył htmla, wystarczyło wypruć z niego odwołania do grafiki i został sam tekst, czyli to, o co chodziło. Uciekły co prawda akapity w kilku miejscach, w kilku zniknęła przerwa miedzy akapitami, ale to już nic strasznego.


27 paź 2011 22:52:03
Zobacz profil
Użytkownik

Dołączył(a): 22 sie 2011 13:26:51
Posty: 46
eCzytnik: Kobo Aura HD
Post Re: Konwersja PDF - trudny przypadek
Where is a will, there is a... relative :)

I tak trzymać :)

_________________
Zapraszam w Karkonosze! Cisza i spokój... Domki w górach


28 paź 2011 8:01:21
Zobacz profil WWW
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 6 ] 


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron