eKsiążki
https://forum.eksiazki.org/

Konwersja .PDF do formatów edytowalnych
https://forum.eksiazki.org/software-i-hardware-f24/konwersja-pdf-do-formatow-edytowalnych-t287-30.html
Strona 3 z 6

Autor:  karabara845 [ 14 sty 2011 23:21:07 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

wielkie dzięki Mayka konkretna odpowiedź.
można jeszcze dodać w sekwencji szukania spację jeżeli występuje "enter" i spacja (ale z przeanalizowanych plików to raczej rzadkość)

Autor:  Mayka [ 15 sty 2011 0:05:57 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

nieraz przydaje sie jeszcze przeszukanie z "," ";" lub "-" przed enterem; oraz wystapienia z duzymi literami po akapicie bez kropki, jak np rozlacza akapit z imieniem lub nazwiskiem [wtedy wystarczy w znajdz zamienic te male litery na duze]

Autor:  karabara845 [ 15 sty 2011 10:20:24 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Mayka a jakiej aplikacji używasz do przerabiania pdf na edytowalne oraz w jakim trybie (odczyt, zapis)?
masz jeszcze jakieś ciekawe sztuczki w późniejszej edycji?
pozdrawiam

Autor:  Mayka [ 15 sty 2011 13:30:19 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

karabara845 bardzo roznie, czesto Cailbre zapisuje jako rtf; ostatnio [do konca 2010 byl darmowy] - PDFtoEPUB, a przy jakims wybitnie skopanym pdfie czasami trzeba sieganac po FineReadera.
Ja ze wzgledu na prace mam cale kombajny makr i pod worda i pod indesigna [ale tez w domu mam swojego prywatnego informatyka, ktory pisze mi takie rzeczy na miejscu do tego co aktualnie potrzebuje :D], do tego typu prostych zamian wystarczy [nawet mnie] w helpie worda wyczytac o wyrazeniach regularnych, teraz z pamieci nie powiem Ci jakie jeszcze zamiany robie, bo dawno pdfow nie przerabialm, a zwykle na biezaco wyszukuje i zamieniam to co akurat zauwaze ze posypalo sie przy konwersji:)

Edit
wlasnie sprawdzilam, ze nie trzeba w znajdz wpisywac "^13([a-ząśżźćęółń])" wystarczy ^13([a-ż]), i ta czynnosc mozna zrobic pelnym automatem, pozniej ale to juz ostroznie [najlepiej pojedynczo] mozna zadac w znajdz:
([a-ż,;])^13([A-Ża-ż0-9]) ([a-ż,;]) ^13([A-Ża-ż0-9]) i w zamien dac odpowiednio: \1spacja\2 \1\2
jeszcze mi przyszedl do glowy taki blad konwersji:
^13([-–—] [a-ż]) zamien spacja\1
a szuka np takich bledow:
"- To w czwartek o tej samej porze musielibyśmy go wypuścić
- skonstatował Hammar."

Autor:  karabara845 [ 15 sty 2011 14:15:21 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Mayka napisał(a):
mozna zadac w znajdz:
([a-ż,;])^13([A-Ża-ż0-9]) ([a-ż,;]) ^13([A-Ża-ż0-9]) i w zamien dac odpowiednio: \1spacja\2 \1\2

można prosić o rozjaśnienie ;)
co wyszukuje te wyrażenie?

Autor:  Mayka [ 15 sty 2011 14:29:30 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

([a-ż,;])^13([A-Ża-ż0-9]) lub
([a-ż,;]) ^13([A-Ża-ż0-9])
i w znadz odpowiednio:
\1spacja\2 lub
\1\2
szuka przerwanych akapitow bez niczego z "," lub ";" gdy nastepny zaczyna sie od duzej litery, malej litery [to mozna wyrzucic, bo poszlo w 1 kroku] i cyfr,
druga wersja to samo tylko ze spacja, bo w przeciwienstwie do kroku 1, gdzie znak entera byl wyznacznikiem konca akapitu i przed nim znajdowal wszystko, tu chodzi tylko o przypadki bez kropki, inaczej zaznaczalby kazdy akapit:D

Autor:  Koniol [ 10 lut 2011 7:14:53 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Pozwolę sobie dopiąć się do tematu. Próbuje skonwertować książkę z rtf do mobi, ale za każdym razem część wyrazów jest dzielona na dwie części, rozdziela je jakiś symbol, tzn. tekst :
Kod:
ruch przechodzącego. WIEL¬KI BRAT PATRZY, głosił napis u dołu plakatu.


Po konwersji wygląda tak:

Cytuj:
ruch przechodzącego. WIEL-KI BRAT PATRZY, głosił napis u dołu plakatu.


Symbol ¬ zamienia się po prostu w myślnik.

Jest 6 rano, spałem wszystkiego muzę z 4h, i nie ogarniam jak się tego pozbyć, Find and replace Worda nie pomaga.

Autor:  Vroo [ 10 lut 2011 8:57:19 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Koniol napisał(a):
Find and replace Worda nie pomaga.


Spróbuj w polu Find wstawić: ^-

Autor:  chesuli [ 10 lut 2011 11:05:24 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Witam,
@Koniol - ten "znaczek" to jest łącznik opcjonalny i jest dostępny w polu "Specjalny" po uruchomieniu pola "Więcej" (oczywiście mowa o narzędziu "Zamień" Worda). W dolnym polu narzędzia zostawisz "nic" - tzn pole jest całkowicie puste. Potem klik na "zamień wszystko" i voila :D
oczywiście możesz wstawić go z palca, tak jak napisał to Vroo, bo "^-" to jest właśnie wyrażenie, która odpowiada za tenże łącznik opcjonalny.

Autor:  Koniol [ 10 lut 2011 19:16:54 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Rano byłem pewien, że sprawdziłem wszystkie "Specjalne"...ale jak widać zaspany człowiek nie potrafi obsłużyć komputera ;P

Dziękuje za pomoc :)

Autor:  vipdavid [ 19 mar 2011 22:13:41 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

odswieżam temat bo odkryłem ABBY pdf Transformer 3.0


Sprawdzcie sobie- konwertuje nawet te teksty które mają w sobie specjalne kodowanie znaków,mozliwosc wyciaganioa grafiki z dokumentu i zdjec.


Polecam cała swoją dusza i sercem.


Ps.Przypomniało mi się że Adobe reader Professional ( nie pamietam wersji posiada mozliwowśc zapisywania pliku pdf do formatu txt)

Autor:  Vroo [ 19 mar 2011 23:08:57 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Szkoda tylko, że demo, które waży 200MB jest w stanie ledwie 2 strony przekonwertować. Fail zupełny.

Patrząc jednak na recenzję http://www.zdnet.co.uk/reviews/content- ... -39759224/ i na funkcje (np. brak możliwości wycięcia nagłówków/stopki), wątpię, czy warto kupić. Mam FineReadera, z PDF-ami sobie jakoś radzi i w sumie ma te same funkcje.

Autor:  Rahim [ 13 cze 2011 9:56:41 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Próbuje przerobić programem pdf to epub.
Zarejestrowałem wersje swoją, wpisałem klucz, wybieram pdf-a po czym wybieram jakikolwiek format i kilkam next i w tym momencie nic się nie dzieje. Jakieś pomysły?

Autor:  grzechur [ 30 sie 2011 22:10:49 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Mam problem z konwersją książki.

Stosowałem się do porad z tego tematu, ale napotkałem na nowy problem.

Konwersję przeprowadziłem najpierw programem ABBYY PDF Transformer 3.0 (PDF -> RTF). Następnie poprawiłem załamania wierszy i pisownię. Zmieniłem wypunktowania na myślniki oraz odstęp tabulaturowy na spacje.

Po skonwertowaniu RTF -> EPUB w Calibre wcięcia akapitów różnią się między sobą.
Zauważyłem, że jest to wina ustawień wcięć.

Czy może mi ktoś poradzić co mogę zrobić w tej sytuacji?

Plik RTF po konwersji w ABBYY PDF Transformer 3.0 oraz poprawkach:
Obrazek
PLIK EPUB po konwersji w Calibre:
Obrazek
Ustawienia akapitu 1:
Obrazek
Ustawienia akapitu 2:
Obrazek

Autor:  Vroo [ 30 sie 2011 22:33:27 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Spróbowałbym tego RTF zapisać z poziomu edytora jako HTML, potem zobaczyć w przeglądarce (a Transformer nie eksportuje do HTML?)

Calibre i tak musi z RTF zrobić najpierw HTML, więc pewnie na tym etapie są problemy.

Strona 3 z 6 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/