eKsiążki
https://forum.eksiazki.org/

Problem z pomieszanym tekstem w PDF ze skanów
https://forum.eksiazki.org/software-i-hardware-f24/problem-z-pomieszanym-tekstem-w-pdf-ze-skanow-t13844.html
Strona 1 z 1

Autor:  Czepard [ 05 paź 2013 18:10:15 ]
Tytuł:  Problem z pomieszanym tekstem w PDF ze skanów

Witam wszystkich forumowiczów, niedawno kupiłem sobie ebook readera Kindle 5 Classic, ściągnąłem program calibre, lecz napotkałem pewien problem.
Otóż chcę aby calibre skonwertował plik pdf zrobiony ze skanów, gdzie układ stron wygląda tak, że mamy tekst w 2 kolumnach na jednej stronie, gdzie każda kolumna to kolejna strona (bardzo często spotykane przy skanach skryptów uczelnianych, gdy skanowana jest otwarta książka przykładana odrazu, a nie skanowane pojedyńcze strony).
Niestety po konwersji, cały tekst jest pomieszany, zdania nie mają sensu, nie widać nawet żadnej zależności, jak np. jedna linijka z lewej kolumny, i jedna z prawej, tylko robi się jeden wielki sajgon. Proszę o pomoc, i mam nadzieję że tego za bardzo nie zagmatwałem :)
Pozdrawiam

Autor:  saker2 [ 05 paź 2013 22:33:55 ]
Tytuł:  Re: Problem z pomieszanym tekstem w PDF ze skanów

Witam,

jeżeli faktycznie jest to plik pdf zrobiony ze skanów - to nie da się przekonwertować CALIBRE, ponieważ potrzebujesz programu który rozpozna tekst, obrazki, jak ze zdjęcia (np AbbyFine Reader) i dopiero zapisze do wybranego formatu. Calibre nie umie tego zrobić;)
pozdr saker2

Autor:  Czepard [ 05 paź 2013 22:40:26 ]
Tytuł:  Re: Problem z pomieszanym tekstem w PDF ze skanów

Rozumiem, a miałbyś może polecić jakiś tutorial jak to zrobić krok po kroku?
Niestety jestem zupełnie zielony w te klocki, w kindla zacząłem się bawić tydzień temu :)
Pozdrawiam

Autor:  BOOTanick [ 06 paź 2013 14:30:25 ]
Tytuł:  Re: Problem z pomieszanym tekstem w PDF ze skanów

mała podpowiedź...programy OCR :> nie są idealne ale mogą być pomocne

Autor:  covo [ 15 lut 2014 18:04:25 ]
Tytuł:  Re: Problem z pomieszanym tekstem w PDF ze skanów

Czepard napisał(a):
Rozumiem, a miałbyś może polecić jakiś tutorial jak to zrobić krok po kroku?
Niestety jestem zupełnie zielony w te klocki, w kindla zacząłem się bawić tydzień temu :)
Pozdrawiam

pewnie juz malo przydatne, ale...:
na pierwszy rzut sprobuj konwersji w adobe finereader - tam jest mozliwosc "pdf to/do ebook". Da wynikowego ebooka w formacie epub, a to juz swobodnie przekonwertujesz w calibre do mobi.

nawiasem mowiac:
nie jest powiedziane, ze konwersja jakiegokolwiek pdf->epub w finereaderze to mistrzostwo swiata, ale to najszybsze dotarcie do ebooka w przypadku pdf-ow "graficznych"
Sa dwa rodzaje pdf-ow: jeden to prosty wynik "drukuj do pdf/zapisz w pdf" tekstu z jakiegos edytora tekstowego (np. word) i wowczas wszelkie programy konwertujace do ebookow "widza" zawarte w takim pdf-ie czcionki, a drugi typ - to wlasnie taki pdf o jakim piszesz, czyli skanowanie na maszynie/skanerze i wowczas jest to pdf, ale jako zbior plikow graficznych i czcionki sa niejako przezroczyste dla konwerterow, nie ma ich, trzeba je wytworzyc w zabiegu odczytania OCR.
finereader z adobe jest NAJLEPSZYM (platnym ) programem OCR.

Autor:  saker2 [ 16 mar 2014 21:03:00 ]
Tytuł:  Re: Problem z pomieszanym tekstem w PDF ze skanów

Ostatecznie jak nie masz możliwości tego zrobienia z powodu braku programu etc, możesz spróbować tutaj:
https://cloudconvert.org/pdf-to-epub

wbrew pozorom niektóre pdfy bardzo ładnie przerabia.

pzdr saker2

Strona 1 z 1 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/