eKsiążki
https://forum.eksiazki.org/

Konwersja .PDF do formatów edytowalnych
https://forum.eksiazki.org/software-i-hardware-f24/konwersja-pdf-do-formatow-edytowalnych-t287-15.html
Strona 2 z 6

Autor:  vanderbook [ 14 mar 2008 20:20:56 ]
Tytuł: 

podałem sposób z zamianą jednego myślnika na dwa z uwagi na prostotę tego rozwiązania - nie wszyscy potrafią używać macr - i na dodatek je tworzyć, a tu proste ctrl+h
u góry
-
na dole
--
i zamień wszystko
I po bólu :D)))

Autor:  Konto usuniete [ 21 kwi 2008 13:34:48 ]
Tytuł: 

Ja już używam Adobe Reobated i przekonwertuje ten text na doc i jest już wszystko ok. Dziękuje wszystkim za pomoc.

Autor:  vipdavid [ 29 lip 2010 15:37:48 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

solid converter i nie ma bata.

Szybko i sprawnie konwetuje pdfy. To dzieki niemu przeczytałem juz kila ksiązek.

Autor:  rufik [ 28 paź 2010 14:36:44 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

vipdavid napisał(a):
solid converter i nie ma bata.


Ale Solid Converter nie jest darmowy, prawda?

Autor:  karabara845 [ 13 sty 2011 13:55:10 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Witam,
męczę się ostatnio nad przerobieniem pdf do rtf i html (coby później dodać spis i wio na calbre)
Ale pojawiają się problemy.
1. jak robię PDFtoEPUB to jest prawie, ale czasami podzieli bez sensu linię w środku zdania (tzn. mamy znak enter w środku zdania) co szpetnie wygląda.
2. jak robię ABBY FR10 to jest prawie idealnie, prawie... nie dzieli już zdań idiotycznie w środku (automatycznie poprawia kodowanie - w pdf w których Ż pojawia się jako Ś (w PDFtoEPUB trzeba to robić ręcznie na tablicy kodowej))
Ale robi jedną dziwną rzecz: wstawia spację do niektórych słów które w pdf-ie są w całości np. ze słowa "pojawiających" robi się "pojawiaj ących". Nie ma tego dużo ale wkurza.

Czy ma ktoś na to lekarstwo?, albo propozycję innego programu.
Myślałem jeszcze w wordzie o makrze które usuwało by znak końca linii jeżeli następny po nim znak nie jest znakiem dużej litery (lub myślnikiem zaczynającym dialog). Ale pisanie makr wykracza poza moje zdolności.

p.s. próbowałem też solid Converter PDF ale zupełnie nie zdaje egzaminu.

Autor:  Kell [ 13 sty 2011 14:03:48 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Cytuj:
Czy ma ktoś na to lekarstwo?, albo propozycję innego programu.

Myślałem jeszcze w wordzie o makrze które usuwało by znak końca linii jeżeli następny po nim znak nie jest znakiem dużej litery (lub myślnikiem zaczynającym dialog). Ale pisanie makr wykracza poza moje zdolności.


A co w wypadku nazw własnych pisanych wielką literą?

Podejrzewam, że te spacje to tzw. spacje nierozdzielająca - pozbędziesz się ich zwykłym znajdź i zamień w Wordzie.

Autor:  karabara845 [ 13 sty 2011 14:36:50 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Kell napisał(a):
Podejrzewam, że te spacje to tzw. spacje nierozdzielająca - pozbędziesz się ich zwykłym znajdź i zamień w Wordzie.


niestety nie - pojawia się czarna mała kropeczka (taka jak inne spacje), w przypadku nierozdzielającej powinno być chyba kółeczko.
Co dziwniejsze te same słowo pojawia się kilka razy w książce i czasami jest w całości, czasami ze spacją (w pdf jest wszystko jak być powinno)

Autor:  Kell [ 13 sty 2011 14:59:31 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Hm może prześlij mi 1 stronę tego tekstu albo fragment z problematycznym znakiem na kell@eksiazki.org

Autor:  karabara845 [ 13 sty 2011 17:11:29 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

przesłanie nic nie da bo jest to normalna spacja, po prostu ABBYFR10 tak ma że czasami dzieli słowa (moje podejrzenie pada na słownik - może to wynikać z tego że może nie ma odmiany i przyjmuje tylko podstawową wersję słowa a koncówkę odmiany traktuje jako osobne słowo???)
Znowu w wersji ABBYFR8 problem raczej nie występuje (ale nie dzieli zdań tak dobrze jak v10), natomiast zamiast części "ż" pojawia się S z daszkiem (to problemem nie jest) natomiast zamiast pozostałej części "ż" pojawia się "ś" i tu już jest ciężej zamienić wszystkie za pomocą "zamień wszystkie"
plikiem z którym się męczę jest "Don Wollheim 1986.pdf" łatwo do znalezienia u wujka Googla.
Jak ktoś chce spróbować sił to zapraszam.

Autor:  gregvip [ 13 sty 2011 17:36:00 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Ściągnąłem sobie ten plik i tam jest chyba coś nie tak z kodowaniem bo po przepuszczeniu przez FineReadera 10 faktycznie wyskakują spacje ale jak zauważyłem u siebie to tylko przez literkami ą i ę ale tych błędów jest na tyle mało, że 10 min z Wordem i po ptakach.

Autor:  chesuli [ 13 sty 2011 17:51:51 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Witam,

FR9 działa na tym pliku całkiem dobrze. Raportuję :D brak opisanych przez Ciebie efektów.

A BTW, "wujek" pozwala znaleźć ten plik również w formatach doc i rtf :D

Autor:  karabara845 [ 13 sty 2011 20:34:53 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

testuje 9 i dam znać

Autor:  Vroo [ 13 sty 2011 21:42:14 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Pamiętaj tylko że Finereader ma dwa tryby rozpoznawania PDF - wyciąganie tekstu i rozpoznawanie wyłącznie jako obrazek. Warto obu spróbować (przy pierwszym nie będzie się za bardzo jednak efekt różnił od calibre)

Autor:  karabara845 [ 14 sty 2011 15:35:52 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

z 9 muszę zrezygnować bo nie wdając się w dłuższą polemikę zawsze woła że brakuje mu pliku polish.amt
w 10 nie mogę znaleźć okna wyboru trybu ("wyciąganie" vs. "ocr obrazka" w 8 rzeczywiście są 2 tryby)

Autor:  Mayka [ 14 sty 2011 21:03:55 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

karabara845 napisał(a):
Witam,
...
1. jak robię PDFtoEPUB to jest prawie, ale czasami podzieli bez sensu linię w środku zdania (tzn. mamy znak enter w środku zdania) co szpetnie wygląda.
...


W znajdz:
^13([a-ząśżźćęółń])
w zamien:
spacja \1
trzeba zaznaczyc "uzyj symboli wieloznacznych"

Strona 2 z 6 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/