Teraz jest 14 lis 2024 9:09:24




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 78 ]  Przejdź na stronę Poprzednia strona  1, 2, 3, 4, 5, 6  Następna strona
Konwersja .PDF do formatów edytowalnych 
Autor Wiadomość
Użytkownik

Dołączył(a): 22 sie 2011 13:26:51
Posty: 46
eCzytnik: Kobo Aura HD
Post Re: Konwersja .PDF do formatów edytowalnych
Finereader ma taką opcję. Po konwersji w wordzie to najszybciej chyba przez "zamień" i wstawianie wildcardów w wyszukiwanym ciągu....

_________________
Zapraszam w Karkonosze! Cisza i spokój... Domki w górach


06 paź 2011 10:09:26
Zobacz profil WWW
Użytkownik

Dołączył(a): 12 cze 2010 20:03:43
Posty: 14
eCzytnik: pdf
Post Re: Konwersja .PDF do formatów edytowalnych
Taki mały trick

Plik .pdf po konwersji do .doc zapisujesz lub eksportujesz do zwykłego pliku .txt.

Dopiero ten plik wczytujesz do Worda i grupowo usuwasz wszystko co ci jest niepotrzebne.

Wszystkie elementy stałe - nie zmieniające się co stronę (nagłówki, stopki, inne) usuwasz w następujący sposób:

Zaznaczasz element do usunięcia i zapamiętujesz w schowku (Ctl+C), potem uruchamiasz zamień Ctrl+H i w okienku szukaj wstawiasz zawartość schowka Ctrl+V; okienko "zamień na" pozostawiasz puste - uruchamiasz Zamień wszystko - dotąd klikasz na tą opcję, aż wynik zamian będzie 0.

Przechodzisz do następnego obiektu.

Następnie po usunięciu wszystkich niepotrzebnych elementów usuwasz nadmiarowe puste akapity: zamień wszystko ^p^p^p na ^p^p - klikasz aż do skutku (liczba zamian = 0).

Plik posiada już tylko tekst bez zbędnych elementów - niestety gubisz formatowanie, które czasami zwiększa czytelność lub w ogóle umożliwia prawidłowe zrozumienie tekstu.


Mi się przydało.Usunąłem wszystkie niepotrzebne nagłówki.Plik wyeksportowany do worda,zapisujesz jako txt.Potem jeszcze raz otwierasz wordem i wyżej wymieniona metodą usuwasz grupowo wszystko co niepotrzebne.Jesli program spyta jakie chcesz kodowanie by rozpoznało piki dajesz UTC-8.

Mam nadzieję ,iż komuś się przyda ten post.Własnie z myslą o tym go pisałem.


04 lis 2011 21:07:29
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Konwersja .PDF do formatów edytowalnych
UTF-8, nie UTC-8, bo to nie strefa czasowa ;)

Natomiast przejście przez TXT ma jeden poważny minus - pożegnaj się z pogrubieniami, kursywami i tego typu wyróżnieniami w tekście.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


04 lis 2011 22:06:02
Zobacz profil WWW
Użytkownik

Dołączył(a): 12 cze 2010 20:03:43
Posty: 14
eCzytnik: pdf
Post Re: Konwersja .PDF do formatów edytowalnych
Tak Mori ,ale pamiętaj że jesteśmy na forum o ksiązkach w formie elktronicznej.

Większośc programów do robienia książek na komórkę nie rozpoznaje formatowania.


Mój Read maniac przynajmnie nie


05 lis 2011 13:59:27
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2836
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Konwersja .PDF do formatów edytowalnych
vipdavid napisał(a):
Tak Mori ,ale pamiętaj że jesteśmy na forum o ksiązkach w formie elktronicznej.

Większośc programów do robienia książek na komórkę nie rozpoznaje formatowania.


Mój Read maniac przynajmnie nie

Jakiś słaby ten Twój program. Co to za platforma? Nie ma na nią coolreadera albo FBReadera?

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


05 lis 2011 23:28:20
Zobacz profil WWW
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Konwersja .PDF do formatów edytowalnych
vipdavid napisał(a):
Tak Mori ,ale pamiętaj że jesteśmy na forum o ksiązkach w formie elktronicznej.

Ależ pamiętam. I dlatego właśnie czytam na eCzytnikach, które całkiem sobie radzą z tego typu wyróżnieniami. Książka elektroniczna nie oznacza rezygnacji z jakości.

Jeśli zaś czytasz na starym sprzęcie, na którym musisz uciekać się do programów takich jak ReadManiac - to możliwe, że Tobie brak formatowania nie przeszkadza, ale ciężko twierdzić, iż jest to standard, stąd wspomniałem o utracie istotnych elementów książki (przykładowo: wyobraź sobie książkę, w której masz zwykłe dialogi i prowadzone mentalnie. Te drugie wyróżniane są kursywą. Jeśli ją odejmiesz, utracisz istotną informację, co może utrudnić Ci zrozumienie tekstu).

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


06 lis 2011 1:17:34
Zobacz profil WWW
Użytkownik

Dołączył(a): 12 cze 2010 20:03:43
Posty: 14
eCzytnik: pdf
Post Re: Konwersja .PDF do formatów edytowalnych
Jesli już checie wiedzieć czytam na telefonie Samsung c3050.Próbowałem tequilla book readera ale nie chodziły mi midlety java od niego .Ani Ml 1.0 ani ML 2.0 (patrz temat o ksiązkach w formie elektronicznej0 .

Również kiedy próbowałem ustawiać podowbne modele nic z tego nie było.

Dopiero poradziłem sobie używając Read Maniaca.Przy wyborze modelu wpisuję Samsung E400 i jakoś mi chodzą midlety.

Może kiedyś się jeszcze pobawię Tequilllą.


15 lis 2011 14:27:50
Zobacz profil
Użytkownik

Dołączył(a): 07 lis 2009 18:31:26
Posty: 2
Post Re: Konwersja .PDF do formatów edytowalnych
Witam,
Mam podobny problem, który już wcześniej był poruszony
karabara845 napisał(a):
męczę się ostatnio nad przerobieniem pdf do rtf i html (coby później dodać spis i wio na calbre)
Ale pojawiają się problemy.
1. jak robię PDFtoEPUB to jest prawie, ale czasami podzieli bez sensu linię w środku zdania (tzn. mamy znak enter w środku zdania) co szpetnie wygląda.[...]


I zdaje się, że nawet jest podane rozwiązanie tego problemu, ale nie mam pojęcia jak je zastosować.

Mayka napisał(a):
W znajdz:
^13([a-ząśżźćęółń])
w zamien:
spacja \1
trzeba zaznaczyc "uzyj symboli wieloznacznych"


Mayka napisał(a):
[...]
wlasnie sprawdzilam, ze nie trzeba w znajdz wpisywac "^13([a-ząśżźćęółń])" wystarczy ^13([a-ż]), i ta czynnosc mozna zrobic pelnym automatem, pozniej ale to juz ostroznie [najlepiej pojedynczo] mozna zadac w znajdz:
([a-ż,;])^13([A-Ża-ż0-9]) ([a-ż,;]) ^13([A-Ża-ż0-9]) i w zamien dac odpowiednio: \1spacja\2 \1\2
jeszcze mi przyszedl do glowy taki blad konwersji:
^13([-–—] [a-ż]) zamien spacja\1
a szuka np takich bledow:
"- To w czwartek o tej samej porze musielibyśmy go wypuścić
- skonstatował Hammar."


Pierwszy raz próbuję grzebać w ebooku i nie wiem jak się do tego zabrać. Skonwertowałem pfd programem pdfToEpub i mam go edytować sigilem? Tak próbowałem ale jak dałem "znajdź i zamień" to mi nic nie znalazło wpisując "^13([a-ż])" :::?
Jest jakiś poradnik do edytowania epubow gdzieś tu na forum?


31 lip 2012 12:46:45
Zobacz profil
Użytkownik

Dołączył(a): 13 sty 2011 15:50:22
Posty: 294
Lokalizacja: Warszawa
eCzytnik: Kindle Keyboard i PaperWhite
Post Re: Konwersja .PDF do formatów edytowalnych
pomurz napisał(a):
Skonwertowałem pfd programem pdfToEpub i mam go edytować sigilem? Tak próbowałem ale jak dałem "znajdź i zamień" to mi nic nie znalazło wpisując "^13([a-ż])" :::?


W Sigilu w okienku znajdź/zamień trzeba wybrać nie tryb normalny a regex (to skrót od http://www.regular-expressions.info/ ) możesz też robić to w oknie konwersji Calibre (Konwertuj książki a tam po lewej lornetka i wyszukaj zamień)


31 lip 2012 14:43:05
Zobacz profil
Użytkownik

Dołączył(a): 27 cze 2011 10:27:50
Posty: 76
eCzytnik: Kindle 3
Post Re: Konwersja .PDF do formatów edytowalnych
Może gdzieś to było, ale trudno się połapać w tym gąszczu tekstu.

1 .Po konwersji tekstu w ABBYY Fine Reader w dialogach zamiast myślnika i spacji tworzy się myślinik i strzałka.
I nie da się tego niestety zamienić automatycznie pod Ctrl+H za pomocą znaku tabulacji ^t. WOrd nie rozpoznaje tego znaku ze strzałką.

2. Czasem też po konwersji o przerabia się na 0, a I na 1. Było to na forum, ale nie mogę znależć.

Jak zaradzić tym kwestiom?


Ostatnio edytowano 04 lis 2012 20:15:31 przez Ackbar, łącznie edytowano 2 razy



04 lis 2012 12:58:28
Zobacz profil
Post Re: Konwersja .PDF do formatów edytowalnych
Ackbar napisał(a):
1 .Po konwersji tesktu w ABBY Fine Reader w dialogach zamiast myślnika i spacji tworzy się myślinik i strzałka.
I nie da się tego niestety zamienić automatycznie pod Ctrl+H za pomocą znaku tabulacji ^t. WOrd nie rozpoznaje tego znaku ze strzałką.


Ta strzałka to właśnie znak tabulacji. Ja robię tak:
w polu znajdź wpisujesz -^t
w polu zamień - to co chcesz żeby było

Czasem jednak jest tak, że zamiast myślnika pojawia się znak punktacji (ang. bullet)w formie myślnika. Poznasz to po tym, że nie możesz go zaznaczyć kursorem i np. skopiować. Wtedy skopiuj cały tekst do schowka i wklej go do notatnika. Znaki punktacji zamienią się w myślniki i tabulatory.
Następnie używasz CTRL H i zamieniasz na co chcesz.


04 lis 2012 19:02:17
Użytkownik

Dołączył(a): 27 cze 2011 10:27:50
Posty: 76
eCzytnik: Kindle 3
Post Re: Konwersja .PDF do formatów edytowalnych
Właśnie napisałem, wyżej, że Ctrl+H za pomocą znaku tabulacji ^t nie pomaga, a kolei wklejanie do notatnika usuwa format tekstu, czy przypisy.
Do tej pory kombinowałem z zapisem w html, a potem znów w Wordzie, ale dalej są niestety problemy z przypisami.

Gdzieś kiedyś wyczytałem, może nawet na tym forum, że wszystko to ustawia się w samym ABBYY Fine Readerze.


04 lis 2012 20:52:48
Zobacz profil
Post Re: Konwersja .PDF do formatów edytowalnych
Racja, jeśli są przypisy to klapa. Ja generalnie używam indesigna do obróbki tekstu, wtedy w takim przypadku jak opisujesz daje opcję zmiany punktorów na tekst. Nie wiem gdzie to się robi w wordzie, ale myślę że musi być coś takiego.


ps. No i jest:

http://www.wordbanter.com/showthread.php?t=135864

Ta metoda jest z użyciem visualbasica, ale bardzo prosto się to robi, u mnie działa. Z poziomu samego worda to trzeba by chyba grzebać w ustawieniach styli i pewnie głównego szablonu dokumentu.
Bez użerania się, zamienił mi punktory na text plain i teraz działa metoda szukaj/zamień.


04 lis 2012 21:54:24
Użytkownik
Avatar użytkownika

Dołączył(a): 10 mar 2013 21:42:40
Posty: 62
eCzytnik: Onyx c65 Storia
Post Re: Konwersja .PDF do formatów edytowalnych
Odświeżę trochę wątek. Po przeinstalowaniu systemu zorientowałem się, że mój ulubiony konwenter już nie działa (pdf2epub - wymagał rejestracji, a strona zdechła). Odkurzyłem jakąś starą płytkę z FineReaderem i próbuję go opanować do konwersji pdf->html.
Niby wszystko fajnie robi, ale mam problem z obcymi literami, w tekście mam np. "ö, ë itp.", po konwersji zamienia to na zwykłe "o, e".
Język dokumentu mam ustawiony na automatyczny czyli: Angielski; Francuski; Niemiecki; Polski; Hiszpański. Jak go zmusić by poprawnie to zamieniał? Ktoś wie?


31 sty 2018 20:52:07
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 10 mar 2013 21:42:40
Posty: 62
eCzytnik: Onyx c65 Storia
Post Re: Konwersja .PDF do formatów edytowalnych
Ponieważ wiernie konwertował i pytał o każdą literę/znak. Wynik był dobrą bazą do dalszej obróbki i nie miałem takich problemów jak wyżej z FineReaderem.


31 sty 2018 21:00:53
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 78 ]  Przejdź na stronę Poprzednia strona  1, 2, 3, 4, 5, 6  Następna strona


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron