Teraz jest 19 kwi 2024 3:33:14




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 7 ] 
Problem z polskimi literami przy konwersji z pdf do epub 
Autor Wiadomość
Użytkownik

Dołączył(a): 17 sie 2011 13:33:39
Posty: 23
eCzytnik: Onyx boox 60
Post Problem z polskimi literami przy konwersji z pdf do epub
Na pewno temat był poruszany ale jakoś nie mogę nigdzie znaleźć pomocy,natomiast po przerobieniu książki pdf na epub,
przez program pdf to epub w wyrazach są nieraz puste miejsca a jak przerabiam programem calibre to zjada mi literę ż,ś.
Czy ktoś łopatologicznie mógłby udzielić podpowiedzi jak poprawnie przerobić format pdf na epub żeby na czytniku Onyx 60
dobrze wyświetlało tekst.Ewentualnie podać stronę www z jakimś poradnikiem,bo szukam na google ale nie mogę nic konkretnego znaleźć.Proszę o pomoc.


31 sie 2011 12:11:33
Zobacz profil
Użytkownik

Dołączył(a): 21 lut 2010 17:21:18
Posty: 320
eCzytnik: Onyx Boox 60S
Post Re: Problem z polską czcionką w epub
Czasami program pdftoepub błędnie konwertuje niektóre polskie litery. Należy wtedy podczas konwersji pdf na epub sprawdzić w kroku 3 i porównać kolumnę "glyph in pdf" (takie litery widzi program) z kolumną "extracted character" (na takie litery konwertuje do epubu). Np. literka "ą" kolumny "extracted character" powinna odpowiadać "ą" z "glyph in pdf" - jeśli tak nie jest to trzeba zmienić w "extracted character" na to co jest w "glyph in pdf" - wystarczy zaznaczyć kursorem literkę w kolumnie i zmienić na właściwą. Jeśli jednak pdfy, które chcesz skonwertować są zwykłymi skanami, to konwersji w ogóle nie przeprowadzisz. Najpierw trzeba je potraktować programem do OCR.

Tu znajdziesz więcej informacji na ten temat.
amazon-com-kindle-f146/narzedzie-do-konwersji-pdf-epub-mobi-pdftoepub-t9447.html

Tu masz link gdzie znajduje się m.in ta tabela z kolumnami "glyph in pdf" i "extracted character" w kroku 3 konwersji.

http://swiatczytnikow.pl/pdf-to-epub-i- ... -za-darmo/


31 sie 2011 14:54:13
Zobacz profil
Użytkownik

Dołączył(a): 17 sie 2011 13:33:39
Posty: 23
eCzytnik: Onyx boox 60
Post Re: Problem z polską czcionką w epub
Dziękuję za użyteczne informacje,mam nadzieję że sobie poradzę.Zaraz zabieram się za konwertowanie i zobaczę co z tego wyjdzie.Wielkie dzięki. :D


31 sie 2011 15:05:11
Zobacz profil
Użytkownik

Dołączył(a): 17 sie 2011 13:33:39
Posty: 23
eCzytnik: Onyx boox 60
Post Re: Problem z polską czcionką w epub
Program fajny,udało mi się przerobić kilka książek,ale nie wszystkie się udało.Przy niektórych jak zmieniałem literki w kolumnie "extracted character" gdy dochodziłem do końca to literki zmienione wcześniej z powrotem wyrzucało te niepoprawne.Proszę jeszcze rozwinąć temat OCR.Jakim programem najlepiej otworzyć taki dokument scan i jak to zrobić?No i jeszcze kwestia zdjęcia z niektórych pdf-ów DRM.Też mam kłopot,nie mogę znaleźć konkretnej odpowiedzi jak to zdjać.
Jeszcze raz proszę o podpowiedź.Jestem początkujący w tych sprawach i być może proste rzeczy mnie przerastają.


01 wrz 2011 8:05:48
Zobacz profil
Użytkownik

Dołączył(a): 21 lut 2010 17:21:18
Posty: 320
eCzytnik: Onyx Boox 60S
Post Re: Problem z polską czcionką w epub
ewanilson napisał(a):
Program fajny,udało mi się przerobić kilka książek,ale nie wszystkie się udało.Przy niektórych jak zmieniałem literki w kolumnie "extracted character" gdy dochodziłem do końca to literki zmienione wcześniej z powrotem wyrzucało te niepoprawne.


Pliki pdf różnią się między sobą i to powoduje, że czasami niektóre sprawiają trudności podczas konwersji. Nie ma tu złotego środka i niestety czasami trzeba próbować różnych sposobów obejścia problemu.


ewanilson napisał(a):
Proszę jeszcze rozwinąć temat OCR.

Program do OCR konwertuje obraz (zeskanowane pdfy - zwykle są to duże pliki) na tekst. Onyxy radzą sobie z czytaniem zeskanowanych pdfów chociaż wielkość takich plików (zwykle kilkadziesiąt MB) powoduje, że strony wolno się otwierają i zmiana strony również trwa dość długo. Nie da się także zmienić i powiększyć czcionki.

ogolnie-o-eczytnikach-f155/czy-da-sie-czytac-zeskanowane-ksiazki-t9911-30.html
software-i-hardware-f24/jaki-program-do-ocr-t13.html


ewanilson napisał(a):
No i jeszcze kwestia zdjęcia z niektórych pdf-ów DRM.


Niektóre pdfy kupowane w księgarniach internetowych są zabezpieczone przed kopiowaniem przy pomocy systemu DRM.
http://www.eksiazki.org/2010/06/22/syst ... -przeglad/

Dużo istotnych informacji można znaleźć na forum Onyxa:
http://www.onyx-ereader.pl/forum/9-pomoc

PS. Jaką czcionkę masz ustawioną w czytniku i jaki rodzaj strony kodowej?


01 wrz 2011 10:38:28
Zobacz profil
Użytkownik

Dołączył(a): 17 sie 2011 13:33:39
Posty: 23
eCzytnik: Onyx boox 60
Post Re: Problem z polską czcionką w epub
Dzięki za poświęcenie uwagi,te informacje w jakimś stopniu na pewno pomogą.Myślę że nie ma złotych środków
żeby idealnie przerobić tekst pdf do formatu epub.Ale zawsze jest możliwość znalezienia danej książki w formacie rtf co znacznie ułatwia sprawę.Wielkie dzięki za pomoc.Pozdrawiam. :D :D


01 wrz 2011 12:12:03
Zobacz profil
Użytkownik

Dołączył(a): 21 lut 2010 17:21:18
Posty: 320
eCzytnik: Onyx Boox 60S
Post Re: Problem z polską czcionką w epub
ewanilson napisał(a):
Ale zawsze jest możliwość znalezienia danej książki w formacie rtf co znacznie ułatwia sprawę.


Zgadza się. Czytniki Onyx czytają także m.in formaty txt, html, doc, docx, rtf, epub, mobi, prc, chm, pdb, fb2. Możliwości znalezienia danego pliku w jakimś innym formacie niż pdf są w więc całkiem spore. :)


01 wrz 2011 13:14:31
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 7 ] 


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 2 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron