eKsiążki
https://forum.eksiazki.org/

Konwersja .PDF do formatów edytowalnych
https://forum.eksiazki.org/software-i-hardware-f24/konwersja-pdf-do-formatow-edytowalnych-t287-60.html
Strona 5 z 6

Autor:  Buber [ 06 paź 2011 10:09:26 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Finereader ma taką opcję. Po konwersji w wordzie to najszybciej chyba przez "zamień" i wstawianie wildcardów w wyszukiwanym ciągu....

Autor:  vipdavid [ 04 lis 2011 21:07:29 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Taki mały trick

Plik .pdf po konwersji do .doc zapisujesz lub eksportujesz do zwykłego pliku .txt.

Dopiero ten plik wczytujesz do Worda i grupowo usuwasz wszystko co ci jest niepotrzebne.

Wszystkie elementy stałe - nie zmieniające się co stronę (nagłówki, stopki, inne) usuwasz w następujący sposób:

Zaznaczasz element do usunięcia i zapamiętujesz w schowku (Ctl+C), potem uruchamiasz zamień Ctrl+H i w okienku szukaj wstawiasz zawartość schowka Ctrl+V; okienko "zamień na" pozostawiasz puste - uruchamiasz Zamień wszystko - dotąd klikasz na tą opcję, aż wynik zamian będzie 0.

Przechodzisz do następnego obiektu.

Następnie po usunięciu wszystkich niepotrzebnych elementów usuwasz nadmiarowe puste akapity: zamień wszystko ^p^p^p na ^p^p - klikasz aż do skutku (liczba zamian = 0).

Plik posiada już tylko tekst bez zbędnych elementów - niestety gubisz formatowanie, które czasami zwiększa czytelność lub w ogóle umożliwia prawidłowe zrozumienie tekstu.


Mi się przydało.Usunąłem wszystkie niepotrzebne nagłówki.Plik wyeksportowany do worda,zapisujesz jako txt.Potem jeszcze raz otwierasz wordem i wyżej wymieniona metodą usuwasz grupowo wszystko co niepotrzebne.Jesli program spyta jakie chcesz kodowanie by rozpoznało piki dajesz UTC-8.

Mam nadzieję ,iż komuś się przyda ten post.Własnie z myslą o tym go pisałem.

Autor:  Mori [ 04 lis 2011 22:06:02 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

UTF-8, nie UTC-8, bo to nie strefa czasowa ;)

Natomiast przejście przez TXT ma jeden poważny minus - pożegnaj się z pogrubieniami, kursywami i tego typu wyróżnieniami w tekście.

Autor:  vipdavid [ 05 lis 2011 13:59:27 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Tak Mori ,ale pamiętaj że jesteśmy na forum o ksiązkach w formie elktronicznej.

Większośc programów do robienia książek na komórkę nie rozpoznaje formatowania.


Mój Read maniac przynajmnie nie

Autor:  t3d [ 05 lis 2011 23:28:20 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

vipdavid napisał(a):
Tak Mori ,ale pamiętaj że jesteśmy na forum o ksiązkach w formie elktronicznej.

Większośc programów do robienia książek na komórkę nie rozpoznaje formatowania.


Mój Read maniac przynajmnie nie

Jakiś słaby ten Twój program. Co to za platforma? Nie ma na nią coolreadera albo FBReadera?

Autor:  Mori [ 06 lis 2011 1:17:34 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

vipdavid napisał(a):
Tak Mori ,ale pamiętaj że jesteśmy na forum o ksiązkach w formie elktronicznej.

Ależ pamiętam. I dlatego właśnie czytam na eCzytnikach, które całkiem sobie radzą z tego typu wyróżnieniami. Książka elektroniczna nie oznacza rezygnacji z jakości.

Jeśli zaś czytasz na starym sprzęcie, na którym musisz uciekać się do programów takich jak ReadManiac - to możliwe, że Tobie brak formatowania nie przeszkadza, ale ciężko twierdzić, iż jest to standard, stąd wspomniałem o utracie istotnych elementów książki (przykładowo: wyobraź sobie książkę, w której masz zwykłe dialogi i prowadzone mentalnie. Te drugie wyróżniane są kursywą. Jeśli ją odejmiesz, utracisz istotną informację, co może utrudnić Ci zrozumienie tekstu).

Autor:  vipdavid [ 15 lis 2011 14:27:50 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Jesli już checie wiedzieć czytam na telefonie Samsung c3050.Próbowałem tequilla book readera ale nie chodziły mi midlety java od niego .Ani Ml 1.0 ani ML 2.0 (patrz temat o ksiązkach w formie elektronicznej0 .

Również kiedy próbowałem ustawiać podowbne modele nic z tego nie było.

Dopiero poradziłem sobie używając Read Maniaca.Przy wyborze modelu wpisuję Samsung E400 i jakoś mi chodzą midlety.

Może kiedyś się jeszcze pobawię Tequilllą.

Autor:  pomurz [ 31 lip 2012 12:46:45 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Witam,
Mam podobny problem, który już wcześniej był poruszony
karabara845 napisał(a):
męczę się ostatnio nad przerobieniem pdf do rtf i html (coby później dodać spis i wio na calbre)
Ale pojawiają się problemy.
1. jak robię PDFtoEPUB to jest prawie, ale czasami podzieli bez sensu linię w środku zdania (tzn. mamy znak enter w środku zdania) co szpetnie wygląda.[...]


I zdaje się, że nawet jest podane rozwiązanie tego problemu, ale nie mam pojęcia jak je zastosować.

Mayka napisał(a):
W znajdz:
^13([a-ząśżźćęółń])
w zamien:
spacja \1
trzeba zaznaczyc "uzyj symboli wieloznacznych"


Mayka napisał(a):
[...]
wlasnie sprawdzilam, ze nie trzeba w znajdz wpisywac "^13([a-ząśżźćęółń])" wystarczy ^13([a-ż]), i ta czynnosc mozna zrobic pelnym automatem, pozniej ale to juz ostroznie [najlepiej pojedynczo] mozna zadac w znajdz:
([a-ż,;])^13([A-Ża-ż0-9]) ([a-ż,;]) ^13([A-Ża-ż0-9]) i w zamien dac odpowiednio: \1spacja\2 \1\2
jeszcze mi przyszedl do glowy taki blad konwersji:
^13([-–—] [a-ż]) zamien spacja\1
a szuka np takich bledow:
"- To w czwartek o tej samej porze musielibyśmy go wypuścić
- skonstatował Hammar."


Pierwszy raz próbuję grzebać w ebooku i nie wiem jak się do tego zabrać. Skonwertowałem pfd programem pdfToEpub i mam go edytować sigilem? Tak próbowałem ale jak dałem "znajdź i zamień" to mi nic nie znalazło wpisując "^13([a-ż])" :::?
Jest jakiś poradnik do edytowania epubow gdzieś tu na forum?

Autor:  RobertP [ 31 lip 2012 14:43:05 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

pomurz napisał(a):
Skonwertowałem pfd programem pdfToEpub i mam go edytować sigilem? Tak próbowałem ale jak dałem "znajdź i zamień" to mi nic nie znalazło wpisując "^13([a-ż])" :::?


W Sigilu w okienku znajdź/zamień trzeba wybrać nie tryb normalny a regex (to skrót od http://www.regular-expressions.info/ ) możesz też robić to w oknie konwersji Calibre (Konwertuj książki a tam po lewej lornetka i wyszukaj zamień)

Autor:  Ackbar [ 04 lis 2012 12:58:28 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Może gdzieś to było, ale trudno się połapać w tym gąszczu tekstu.

1 .Po konwersji tekstu w ABBYY Fine Reader w dialogach zamiast myślnika i spacji tworzy się myślinik i strzałka.
I nie da się tego niestety zamienić automatycznie pod Ctrl+H za pomocą znaku tabulacji ^t. WOrd nie rozpoznaje tego znaku ze strzałką.

2. Czasem też po konwersji o przerabia się na 0, a I na 1. Było to na forum, ale nie mogę znależć.

Jak zaradzić tym kwestiom?

Autor:  Khouri [ 04 lis 2012 19:02:17 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Ackbar napisał(a):
1 .Po konwersji tesktu w ABBY Fine Reader w dialogach zamiast myślnika i spacji tworzy się myślinik i strzałka.
I nie da się tego niestety zamienić automatycznie pod Ctrl+H za pomocą znaku tabulacji ^t. WOrd nie rozpoznaje tego znaku ze strzałką.


Ta strzałka to właśnie znak tabulacji. Ja robię tak:
w polu znajdź wpisujesz -^t
w polu zamień - to co chcesz żeby było

Czasem jednak jest tak, że zamiast myślnika pojawia się znak punktacji (ang. bullet)w formie myślnika. Poznasz to po tym, że nie możesz go zaznaczyć kursorem i np. skopiować. Wtedy skopiuj cały tekst do schowka i wklej go do notatnika. Znaki punktacji zamienią się w myślniki i tabulatory.
Następnie używasz CTRL H i zamieniasz na co chcesz.

Autor:  Ackbar [ 04 lis 2012 20:52:48 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Właśnie napisałem, wyżej, że Ctrl+H za pomocą znaku tabulacji ^t nie pomaga, a kolei wklejanie do notatnika usuwa format tekstu, czy przypisy.
Do tej pory kombinowałem z zapisem w html, a potem znów w Wordzie, ale dalej są niestety problemy z przypisami.

Gdzieś kiedyś wyczytałem, może nawet na tym forum, że wszystko to ustawia się w samym ABBYY Fine Readerze.

Autor:  Khouri [ 04 lis 2012 21:54:24 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Racja, jeśli są przypisy to klapa. Ja generalnie używam indesigna do obróbki tekstu, wtedy w takim przypadku jak opisujesz daje opcję zmiany punktorów na tekst. Nie wiem gdzie to się robi w wordzie, ale myślę że musi być coś takiego.


ps. No i jest:

http://www.wordbanter.com/showthread.php?t=135864

Ta metoda jest z użyciem visualbasica, ale bardzo prosto się to robi, u mnie działa. Z poziomu samego worda to trzeba by chyba grzebać w ustawieniach styli i pewnie głównego szablonu dokumentu.
Bez użerania się, zamienił mi punktory na text plain i teraz działa metoda szukaj/zamień.

Autor:  Fafrocel [ 31 sty 2018 20:52:07 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Odświeżę trochę wątek. Po przeinstalowaniu systemu zorientowałem się, że mój ulubiony konwenter już nie działa (pdf2epub - wymagał rejestracji, a strona zdechła). Odkurzyłem jakąś starą płytkę z FineReaderem i próbuję go opanować do konwersji pdf->html.
Niby wszystko fajnie robi, ale mam problem z obcymi literami, w tekście mam np. "ö, ë itp.", po konwersji zamienia to na zwykłe "o, e".
Język dokumentu mam ustawiony na automatyczny czyli: Angielski; Francuski; Niemiecki; Polski; Hiszpański. Jak go zmusić by poprawnie to zamieniał? Ktoś wie?

Autor:  Fafrocel [ 31 sty 2018 21:00:53 ]
Tytuł:  Re: Konwersja .PDF do formatów edytowalnych

Ponieważ wiernie konwertował i pytał o każdą literę/znak. Wynik był dobrą bazą do dalszej obróbki i nie miałem takich problemów jak wyżej z FineReaderem.

Strona 5 z 6 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/