Problem z polskimi literami przy konwersji z pdf do epub
Na pewno temat był poruszany ale jakoś nie mogę nigdzie znaleźć pomocy,natomiast po przerobieniu książki pdf na epub, przez program pdf to epub w wyrazach są nieraz puste miejsca a jak przerabiam programem calibre to zjada mi literę ż,ś. Czy ktoś łopatologicznie mógłby udzielić podpowiedzi jak poprawnie przerobić format pdf na epub żeby na czytniku Onyx 60 dobrze wyświetlało tekst.Ewentualnie podać stronę www z jakimś poradnikiem,bo szukam na google ale nie mogę nic konkretnego znaleźć.Proszę o pomoc.
Czasami program pdftoepub błędnie konwertuje niektóre polskie litery. Należy wtedy podczas konwersji pdf na epub sprawdzić w kroku 3 i porównać kolumnę "glyph in pdf" (takie litery widzi program) z kolumną "extracted character" (na takie litery konwertuje do epubu). Np. literka "ą" kolumny "extracted character" powinna odpowiadać "ą" z "glyph in pdf" - jeśli tak nie jest to trzeba zmienić w "extracted character" na to co jest w "glyph in pdf" - wystarczy zaznaczyć kursorem literkę w kolumnie i zmienić na właściwą. Jeśli jednak pdfy, które chcesz skonwertować są zwykłymi skanami, to konwersji w ogóle nie przeprowadzisz. Najpierw trzeba je potraktować programem do OCR.
Program fajny,udało mi się przerobić kilka książek,ale nie wszystkie się udało.Przy niektórych jak zmieniałem literki w kolumnie "extracted character" gdy dochodziłem do końca to literki zmienione wcześniej z powrotem wyrzucało te niepoprawne.Proszę jeszcze rozwinąć temat OCR.Jakim programem najlepiej otworzyć taki dokument scan i jak to zrobić?No i jeszcze kwestia zdjęcia z niektórych pdf-ów DRM.Też mam kłopot,nie mogę znaleźć konkretnej odpowiedzi jak to zdjać. Jeszcze raz proszę o podpowiedź.Jestem początkujący w tych sprawach i być może proste rzeczy mnie przerastają.
Program fajny,udało mi się przerobić kilka książek,ale nie wszystkie się udało.Przy niektórych jak zmieniałem literki w kolumnie "extracted character" gdy dochodziłem do końca to literki zmienione wcześniej z powrotem wyrzucało te niepoprawne.
Pliki pdf różnią się między sobą i to powoduje, że czasami niektóre sprawiają trudności podczas konwersji. Nie ma tu złotego środka i niestety czasami trzeba próbować różnych sposobów obejścia problemu.
ewanilson napisał(a):
Proszę jeszcze rozwinąć temat OCR.
Program do OCR konwertuje obraz (zeskanowane pdfy - zwykle są to duże pliki) na tekst. Onyxy radzą sobie z czytaniem zeskanowanych pdfów chociaż wielkość takich plików (zwykle kilkadziesiąt MB) powoduje, że strony wolno się otwierają i zmiana strony również trwa dość długo. Nie da się także zmienić i powiększyć czcionki.
Dzięki za poświęcenie uwagi,te informacje w jakimś stopniu na pewno pomogą.Myślę że nie ma złotych środków żeby idealnie przerobić tekst pdf do formatu epub.Ale zawsze jest możliwość znalezienia danej książki w formacie rtf co znacznie ułatwia sprawę.Wielkie dzięki za pomoc.Pozdrawiam.
Ale zawsze jest możliwość znalezienia danej książki w formacie rtf co znacznie ułatwia sprawę.
Zgadza się. Czytniki Onyx czytają także m.in formaty txt, html, doc, docx, rtf, epub, mobi, prc, chm, pdb, fb2. Możliwości znalezienia danego pliku w jakimś innym formacie niż pdf są w więc całkiem spore.