eKsiążki
https://forum.eksiazki.org/

problem z konwersją tekstu .rtf
https://forum.eksiazki.org/calibre-f164/problem-z-konwersja-tekstu-rtf-t13878.html
Strona 1 z 2

Autor:  Jerzy [ 19 paź 2013 15:06:30 ]
Tytuł:  problem z konwersją tekstu .rtf

Witam.
Przy konwersji tekstu zapisanego w rtf na epuba programem calibre pojawił się problem jego zniekształcania.
Tak wygląda fragment tekstu w pliku rtf:
Być może właśnie Andersen jako jeden z ostatnich rozpowszechniał historię, która miała na dobre zakorzenić się w rozrastającym się mieście nazywanym w owych czasach Kristianią. Otóż pewien woźnica z Grünerløkka poślubił kuzynkę z Värmland i razem przeprowadzili się na Seilduksgata, do pokoju z kuchnią w jednej z kamienic, w których budowie uczestniczył Andersen.

A tak ten tekst wygląda po konwersji do epuba:
Byă moýe wůaúnie Andersen jako jeden z ostatnich rozpowszechniaů historić, która miaůa na dobre zakorzeniă sić w rozrastajŕcym sić mieúcie nazywanym w owych czasach Kristianiŕ. Otóý pewien woęnica z Grünerl¸kka poúlubiů kuzynkę z Värmland i razem przeprowadzili się na Seilduksgata, do pokoju z kuchnią w jednej z kamienic, w których budowie uczestniczył Andersen.

Generalnie cały tekst został przekonwertowany normalnie. Tego typu zniekształcenia występują w sporadycznie w kilku miejscach.
Co może być tego przyczyną. Używam calibre od ok. 2. lat i nigdy się z czymś takim nie spotkałem.
Ps. Tego typu usterki występują również przy konwersji tego tekstu do mobi czy do pdf.

Autor:  Jerzy [ 20 paź 2013 9:47:51 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

Obszedłem problem. Zapisałem tekst w rtf jako strona sieci WEB przefiltrowana i z takiego formatu wykonałem konwersję do epub.
Konwersja przebiegła bez błędów. Dalej jednak nie rozumiem dlaczego opisane błędy powstały przy konwersji z rtf.

Autor:  t3d [ 20 paź 2013 19:56:01 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

Pewnie to z powodu kodowania znaków. W tym tekście były zarówno polskie znaki diakrytyczne jak i obcojęzyczne. To musiało zmylić calibre.

Autor:  emindflow [ 21 lis 2013 22:25:56 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

Podłączę się pod ten temat, bo nie chcę zakładać nowego wątku, a mój problem również dotyczy konwersji tekstu z .rtf.
Przygotowałem sobie e-booka w formacie .rtf do konwersji na .AZW3 w Calibre (rtf zrobiłem wcześniej w Fine Readerze z PDF).
Tekst w rtf wygląda dokładnie tak jak chciałem i po konwersji w AZW3 wygląda tak samo dobrze, tylko wszystkie litery ma podkreślone.
Wygląda to tak:

Podłączę się pod ten temat, bo nie chcę zakładać nowego wątku, a mój problem również dotyczy konwersji tekstu z .rtf.
Przygotowałem sobie e-booka w formacie .rtf do konwersji na .AZW3 w Calibre (rtf zrobiłem wcześniej w Fine Readerze z PDF).
Tekst w rtf wygląda dokładnie tak jak chciałem i po konwersji w AZW3 wygląda tak samo dobrze, tylko wszystkie litery ma podkreślone.


Nigdy nic podobnego mi się nie zdarzyło, a z Calibre korzystam nie od dziś i nic nie zmieniałem w ustawieniach.
Co może być przyczyną i jak sobie z tym poradzić?
Pomoże ktoś?

Autor:  pieluchowaty [ 22 lis 2013 8:05:21 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

wyszyść formatowanie teksty w rtf-ie i sformatuj go na nowo
lepsze efekty daje konwertowanie w calibre plików docx
jeszcze jedno - zrób najpier upub-a - zobacz czy nie ma podkreśleń o potem przekonwertuj epub-a na azw3

Autor:  emindflow [ 22 lis 2013 10:21:56 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

Tekst w epub jest idealny, sprawdzałem to już wcześniej. Problem w tym, że w podczas konwersji z pdf do epub w Fine Readerze gdzieś giną numery oznaczające kolejne rozdziały i nie wiadomo, w którym miejscu kończy się jeden i zaczyna następny.
Spróbuję jeszcze pobawić się tym docxem.

Autor:  SwFr [ 22 lis 2013 13:29:59 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

emindflow napisał(a):
giną numery oznaczające kolejne rozdziały i nie wiadomo, w którym miejscu kończy się jeden i zaczyna następny.


Być może - FR interpretuje je jako nr strony. Zaznacz "zachowaj nagłówki i stopki" i " zachowaj podział na strony" w opcjach zapisu.

Autor:  pieluchowaty [ 22 lis 2013 13:32:32 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

dla lepszego efektu - mozesz wczytać pdfa do finereadera i sprawdzić poszczególne strony ręcznie, automat jak dajesz rozpoznawanie z menu kontekstowego potrafi nieraz namieszać
a jeszcze prościej - znajdź w pdfie rozdział, odszukaj miejsce w docx i tam wpisz ręcznie rozdział

Autor:  emindflow [ 22 lis 2013 14:36:55 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

SwFr - masz rację, rzeczywiście FR widzi je jak nr strony. Kłopot w tym, że nie ma opcji "zachowaj nagłówki " dla wyjściowego epuba, tylko dla formatów Worda jest taka możliwość. Dlatego tekst w rtf czy doc/docx nie budzi zastrzeżeń.
pieluchowaty - nie wiem na czym polega formatowanie rtf ani ręczna konwersja w FR, nie znam zbyt dobrze tej aplikacji.

Przy okazji pojawił się nowy kłopot - nie mogę w Calibre skonwertować książki w doxc na azw3, nie daje rady nawet jej otworzyć w Calibre. Pojawia sie komunikat "Frame object does not support indexing".
O co tu może chodzić ?

Autor:  pieluchowaty [ 22 lis 2013 15:09:02 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

formatowanie rtfa polega na tym że po usunięciu całego formatowania tekstu na nowo ustawiasz marginesy, wciecia czcionkę itp itd
ręczna korekta w FR polega na tym że otwierasz FR, wczytujesz pdfa - fr robi obróbkę (zaznacza bloki, OCR) teraz mozesz przejżeć wyniki tych działań strona po stronie i zmienić bloki tekstu jak chcesz, a dopiero potem wyeksportować (zapisać) w formacie worda
nowy problem - zapisz docx jako plik html (strona sieci web), wczytaj to potem do calibre i zrób konwersję
inny sposób - najpierw zrób konwersję do epub, a potem epub do azw3
jeszcze inny sposób zapisz docx jako rtf, wczytaj do calibre i konwertuj

Nie rób konwersji pdfa na epub z poziomu FR - wyjdzie kaszana

Autor:  emindflow [ 22 lis 2013 16:13:34 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

Dzięki za pomoc, pieluchowaty.

Ręcznego formatowania chyba nie ma sensu robić, bo tekst w formatach worda wygląda dobrze. Problem polega na tym, że żadnego z nich nie udaje mi się dobrze skonwertować do azw3.
Wypróbowałem 3 zaproponowane przez Ciebie sposoby z następującym efektem:
a) konwersja docx-html-azw3 trwała ok 20 minut (plik mniejszy niż 1 MB), a efekt jest bardzo kiepski,
b) konwersja docx-epub-azw3 nie udała się zupełnie - Calibre konsekwentnie pokazuje "Frame object does not support indexing"
Wynika z tego, że z jakiegoś powodu Calibre nie chce (nie może) przeczytać pliku wejściowego w formacie docx, ale dlaczego?
c) konwersja docx-rtf-azw3 - szybko i efekt zdecydowanie najlepszy. Właściwie jedyna rzecz, która mi się nie podoba to zamiana w dialogach przed każdym akapitem (zamiast myślnika jest duża kropka).

edit: Sprawdziłem, ta zamiana myślników na duże kropki to nie wynik konwersji. To się dzieje w trakcie dodawania pliku do Calibre

Autor:  pieluchowaty [ 22 lis 2013 16:32:12 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

spróbuj jeszcze tego - zapisz docx jako odt wczytaj do calibre i konwertuj

Autor:  pieluchowaty [ 22 lis 2013 16:42:19 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

c) konwersja docx-rtf-azw3 - szybko i efekt zdecydowanie najlepszy. Właściwie jedyna rzecz, która mi się nie podoba to zamiana w dialogach przed każdym akapitem (zamiast myślnika jest duża kropka).

ale kropka jako wypunktowanie, czy jako zwykły znak, który metodą szukaj zamień mozna zamienić na myslniki

wyjdzie ci tak zawsze jak w docx masz przy dialogach myślniki nie jako myslniki ale jako wypunktowanie, musisz najpierw zamienić wypunktowanie na zwykłe myslniki, a uzyskuje sie to poprzez makro

ActiveDocument.Range.ListFormat.ConvertNumbersToText

Autor:  emindflow [ 22 lis 2013 16:43:39 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

No nie, to też nie wygląda dobrze

Autor:  pieluchowaty [ 22 lis 2013 16:57:50 ]
Tytuł:  Re: problem z konwersją tekstu .rtf

a czy wogóle próbowałeś conwersji pdf na rtf w calibre?

Strona 1 z 2 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/