eKsiążki https://forum.eksiazki.org/ |
|
problem z konwersją tekstu .rtf https://forum.eksiazki.org/calibre-f164/problem-z-konwersja-tekstu-rtf-t13878.html |
Strona 1 z 2 |
Autor: | Jerzy [ 19 paź 2013 15:06:30 ] |
Tytuł: | problem z konwersją tekstu .rtf |
Witam. Przy konwersji tekstu zapisanego w rtf na epuba programem calibre pojawił się problem jego zniekształcania. Tak wygląda fragment tekstu w pliku rtf: Być może właśnie Andersen jako jeden z ostatnich rozpowszechniał historię, która miała na dobre zakorzenić się w rozrastającym się mieście nazywanym w owych czasach Kristianią. Otóż pewien woźnica z Grünerløkka poślubił kuzynkę z Värmland i razem przeprowadzili się na Seilduksgata, do pokoju z kuchnią w jednej z kamienic, w których budowie uczestniczył Andersen. A tak ten tekst wygląda po konwersji do epuba: Byă moýe wůaúnie Andersen jako jeden z ostatnich rozpowszechniaů historić, która miaůa na dobre zakorzeniă sić w rozrastajŕcym sić mieúcie nazywanym w owych czasach Kristianiŕ. Otóý pewien woęnica z Grünerl¸kka poúlubiů kuzynkę z Värmland i razem przeprowadzili się na Seilduksgata, do pokoju z kuchnią w jednej z kamienic, w których budowie uczestniczył Andersen. Generalnie cały tekst został przekonwertowany normalnie. Tego typu zniekształcenia występują w sporadycznie w kilku miejscach. Co może być tego przyczyną. Używam calibre od ok. 2. lat i nigdy się z czymś takim nie spotkałem. Ps. Tego typu usterki występują również przy konwersji tego tekstu do mobi czy do pdf. |
Autor: | Jerzy [ 20 paź 2013 9:47:51 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
Obszedłem problem. Zapisałem tekst w rtf jako strona sieci WEB przefiltrowana i z takiego formatu wykonałem konwersję do epub. Konwersja przebiegła bez błędów. Dalej jednak nie rozumiem dlaczego opisane błędy powstały przy konwersji z rtf. |
Autor: | t3d [ 20 paź 2013 19:56:01 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
Pewnie to z powodu kodowania znaków. W tym tekście były zarówno polskie znaki diakrytyczne jak i obcojęzyczne. To musiało zmylić calibre. |
Autor: | emindflow [ 21 lis 2013 22:25:56 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
Podłączę się pod ten temat, bo nie chcę zakładać nowego wątku, a mój problem również dotyczy konwersji tekstu z .rtf. Przygotowałem sobie e-booka w formacie .rtf do konwersji na .AZW3 w Calibre (rtf zrobiłem wcześniej w Fine Readerze z PDF). Tekst w rtf wygląda dokładnie tak jak chciałem i po konwersji w AZW3 wygląda tak samo dobrze, tylko wszystkie litery ma podkreślone. Wygląda to tak: Podłączę się pod ten temat, bo nie chcę zakładać nowego wątku, a mój problem również dotyczy konwersji tekstu z .rtf. Przygotowałem sobie e-booka w formacie .rtf do konwersji na .AZW3 w Calibre (rtf zrobiłem wcześniej w Fine Readerze z PDF). Tekst w rtf wygląda dokładnie tak jak chciałem i po konwersji w AZW3 wygląda tak samo dobrze, tylko wszystkie litery ma podkreślone. Nigdy nic podobnego mi się nie zdarzyło, a z Calibre korzystam nie od dziś i nic nie zmieniałem w ustawieniach. Co może być przyczyną i jak sobie z tym poradzić? Pomoże ktoś? |
Autor: | pieluchowaty [ 22 lis 2013 8:05:21 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
wyszyść formatowanie teksty w rtf-ie i sformatuj go na nowo lepsze efekty daje konwertowanie w calibre plików docx jeszcze jedno - zrób najpier upub-a - zobacz czy nie ma podkreśleń o potem przekonwertuj epub-a na azw3 |
Autor: | emindflow [ 22 lis 2013 10:21:56 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
Tekst w epub jest idealny, sprawdzałem to już wcześniej. Problem w tym, że w podczas konwersji z pdf do epub w Fine Readerze gdzieś giną numery oznaczające kolejne rozdziały i nie wiadomo, w którym miejscu kończy się jeden i zaczyna następny. Spróbuję jeszcze pobawić się tym docxem. |
Autor: | SwFr [ 22 lis 2013 13:29:59 ] | |||||||||
Tytuł: | Re: problem z konwersją tekstu .rtf | |||||||||
Być może - FR interpretuje je jako nr strony. Zaznacz "zachowaj nagłówki i stopki" i " zachowaj podział na strony" w opcjach zapisu. |
Autor: | pieluchowaty [ 22 lis 2013 13:32:32 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
dla lepszego efektu - mozesz wczytać pdfa do finereadera i sprawdzić poszczególne strony ręcznie, automat jak dajesz rozpoznawanie z menu kontekstowego potrafi nieraz namieszać a jeszcze prościej - znajdź w pdfie rozdział, odszukaj miejsce w docx i tam wpisz ręcznie rozdział |
Autor: | emindflow [ 22 lis 2013 14:36:55 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
SwFr - masz rację, rzeczywiście FR widzi je jak nr strony. Kłopot w tym, że nie ma opcji "zachowaj nagłówki " dla wyjściowego epuba, tylko dla formatów Worda jest taka możliwość. Dlatego tekst w rtf czy doc/docx nie budzi zastrzeżeń. pieluchowaty - nie wiem na czym polega formatowanie rtf ani ręczna konwersja w FR, nie znam zbyt dobrze tej aplikacji. Przy okazji pojawił się nowy kłopot - nie mogę w Calibre skonwertować książki w doxc na azw3, nie daje rady nawet jej otworzyć w Calibre. Pojawia sie komunikat "Frame object does not support indexing". O co tu może chodzić ? |
Autor: | pieluchowaty [ 22 lis 2013 15:09:02 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
formatowanie rtfa polega na tym że po usunięciu całego formatowania tekstu na nowo ustawiasz marginesy, wciecia czcionkę itp itd ręczna korekta w FR polega na tym że otwierasz FR, wczytujesz pdfa - fr robi obróbkę (zaznacza bloki, OCR) teraz mozesz przejżeć wyniki tych działań strona po stronie i zmienić bloki tekstu jak chcesz, a dopiero potem wyeksportować (zapisać) w formacie worda nowy problem - zapisz docx jako plik html (strona sieci web), wczytaj to potem do calibre i zrób konwersję inny sposób - najpierw zrób konwersję do epub, a potem epub do azw3 jeszcze inny sposób zapisz docx jako rtf, wczytaj do calibre i konwertuj Nie rób konwersji pdfa na epub z poziomu FR - wyjdzie kaszana |
Autor: | emindflow [ 22 lis 2013 16:13:34 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
Dzięki za pomoc, pieluchowaty. Ręcznego formatowania chyba nie ma sensu robić, bo tekst w formatach worda wygląda dobrze. Problem polega na tym, że żadnego z nich nie udaje mi się dobrze skonwertować do azw3. Wypróbowałem 3 zaproponowane przez Ciebie sposoby z następującym efektem: a) konwersja docx-html-azw3 trwała ok 20 minut (plik mniejszy niż 1 MB), a efekt jest bardzo kiepski, b) konwersja docx-epub-azw3 nie udała się zupełnie - Calibre konsekwentnie pokazuje "Frame object does not support indexing" Wynika z tego, że z jakiegoś powodu Calibre nie chce (nie może) przeczytać pliku wejściowego w formacie docx, ale dlaczego? c) konwersja docx-rtf-azw3 - szybko i efekt zdecydowanie najlepszy. Właściwie jedyna rzecz, która mi się nie podoba to zamiana w dialogach przed każdym akapitem (zamiast myślnika jest duża kropka). edit: Sprawdziłem, ta zamiana myślników na duże kropki to nie wynik konwersji. To się dzieje w trakcie dodawania pliku do Calibre |
Autor: | pieluchowaty [ 22 lis 2013 16:32:12 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
spróbuj jeszcze tego - zapisz docx jako odt wczytaj do calibre i konwertuj |
Autor: | pieluchowaty [ 22 lis 2013 16:42:19 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
c) konwersja docx-rtf-azw3 - szybko i efekt zdecydowanie najlepszy. Właściwie jedyna rzecz, która mi się nie podoba to zamiana w dialogach przed każdym akapitem (zamiast myślnika jest duża kropka). ale kropka jako wypunktowanie, czy jako zwykły znak, który metodą szukaj zamień mozna zamienić na myslniki wyjdzie ci tak zawsze jak w docx masz przy dialogach myślniki nie jako myslniki ale jako wypunktowanie, musisz najpierw zamienić wypunktowanie na zwykłe myslniki, a uzyskuje sie to poprzez makro ActiveDocument.Range.ListFormat.ConvertNumbersToText |
Autor: | emindflow [ 22 lis 2013 16:43:39 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
No nie, to też nie wygląda dobrze |
Autor: | pieluchowaty [ 22 lis 2013 16:57:50 ] |
Tytuł: | Re: problem z konwersją tekstu .rtf |
a czy wogóle próbowałeś conwersji pdf na rtf w calibre? |
Strona 1 z 2 | Wszystkie czasy w strefie UTC + 1 [czas letni (DST)] |
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group http://www.phpbb.com/ |