eKsiążki
https://forum.eksiazki.org/

Problem z konwersją rtf - mobi
https://forum.eksiazki.org/calibre-f164/problem-z-konwersja-rtf-mobi-t9410.html
Strona 1 z 2

Autor:  Vesper [ 20 gru 2010 22:13:25 ]
Tytuł:  Problem z konwersją rtf - mobi

Witam.
Mam problem z calibre (wersja 0.7.34).
Podczas konwersji wyskakuje taki błąd:


Oto log (szczegóły)z tego wydarzenia:

Cytuj:
---------------------------
Konwertuję 1 książkę z 1 (*************)
Resolved conversion options
calibre version: 0.7.34
{'asciiize': False,
'author_sort': None,
'authors': None,
'base_font_size': 0.0,
'book_producer': None,
'change_justification': u'original',
'chapter': u"//*[((name()='h1' or name()='h2') and re:test(., 'chapter|book|section|part|prologue|epilogue\\s+', 'i')) or @class = 'chapter']",
'chapter_mark': u'pagebreak',
'comments': None,
'cover': 'c:\\users\\admini~1\\appdata\\local\\temp\\calibre_0.7.34_tmp_6xuls2\\calibre_0.7.34_bgjhbm.jpeg',
'debug_pipeline': None,
'disable_font_rescaling': False,
'dont_compress': False,
'extra_css': None,
'font_size_mapping': None,
'footer_regex': u'(?i)(?<=<hr>)((\\s*<a name=\\d+></a>((<img.+?>)*<br>\\s*)?\\d+<br>\\s*.*?\\s*)|(\\s*<a name=\\d+></a>((<img.+?>)*<br>\\s*)?.*?<br>\\s*\\d+))(?=<br>)',
'header_regex': u'(?i)(?<=<hr>)((\\s*<a name=\\d+></a>((<img.+?>)*<br>\\s*)?\\d+<br>\\s*.*?\\s*)|(\\s*<a name=\\d+></a>((<img.+?>)*<br>\\s*)?.*?<br>\\s*\\d+))(?=<br>)',
'html_unwrap_factor': 0.5,
'input_encoding': None,
'input_profile': <calibre.customize.profiles.InputProfile object at 0x04E1D9F0>,
'insert_blank_line': False,
'insert_metadata': False,
'isbn': None,
'keep_ligatures': False,
'language': None,
'level1_toc': None,
'level2_toc': None,
'level3_toc': None,
'line_height': 0.0,
'linearize_tables': False,
'margin_bottom': 0.0,
'margin_left': 0.0,
'margin_right': 0.0,
'margin_top': 0.0,
'max_toc_links': 50,
'minimum_line_height': 120.0,
'mobi_ignore_margins': False,
'no_chapters_in_toc': False,
'no_inline_navbars': True,
'no_inline_toc': True,
'output_profile': <calibre.customize.profiles.KindleOutput object at 0x04E1DCD0>,
'page_breaks_before': u"//*[name()='h1' or name()='h2']",
'personal_doc': u'[PDOC]',
'prefer_author_sort': False,
'prefer_metadata_cover': False,
'preprocess_html': True,
'pretty_print': False,
'pubdate': None,
'publisher': None,
'rating': None,
'read_metadata_from_opf': 'c:\\users\\admini~1\\appdata\\local\\temp\\calibre_0.7.34_tmp_6xuls2\\calibre_0.7.34_xi4lta.opf',
'remove_first_image': False,
'remove_footer': False,
'remove_header': False,
'remove_paragraph_spacing': True,
'remove_paragraph_spacing_indent_size': 1.0,
'rescale_images': True,
'series': None,
'series_index': None,
'smarten_punctuation': False,
'tags': None,
'timestamp': None,
'title': None,
'title_sort': None,
'toc_filter': None,
'toc_threshold': 6,
'toc_title': None,
'use_auto_toc': False,
'verbose': 2}
InputFormatPlugin: RTF Input running
on D:\Moje dokumenty\ebooki\*****n\***************** (28)\******************.rtf
Converting RTF to XML...
Preprocessing to convert unicode characters
Parsing XML...
Converting XML to HTML...
********* Preprocessing HTML *********
There are 12862 total Line feeds, and 7428 marked up endings
There must be fewer than 1286.2 unmarked lines to add markup
There are 27 blank lines. 0.00363489499192 percent blank
found 39 pre-existing headings
Hard line breaks check returned False
*** Median line length is 538, calculated with html format ***
Cleaning up hyphenation
Done dehyphenating
Python function terminated unexpectedly
'utf8' codec can't decode byte 0xc2 in position 818: invalid continuation byte (Error Code: 1)
Traceback (most recent call last):
File "site.py", line 103, in main
File "site.py", line 85, in run_entry_point
File "site-packages\calibre\utils\ipc\worker.py", line 107, in main
File "site-packages\calibre\gui2\convert\gui_conversion.py", line 24, in gui_convert
File "site-packages\calibre\ebooks\conversion\plumber.py", line 853, in run
File "site-packages\calibre\customize\conversion.py", line 216, in __call__
File "site-packages\calibre\ebooks\rtf\input.py", line 299, in convert
File "site-packages\calibre\ebooks\conversion\utils.py", line 291, in __call__
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc2 in position 818: invalid continuation byte

Autor:  chesuli [ 21 gru 2010 0:00:31 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Witam,

Otwórz plik w Wordzie i korzystając z narzędzia "Zamień" (w rolecie "Edycja") dokonaj zamiany wszystkich występujących w tekście tzw. spacji nierozdzielających (^s) na normalną spację. Będzie grało :D

Autor:  Vesper [ 21 gru 2010 21:06:04 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Konwersja po tym zabiegu poszła bez problemu, niestety stworzony plik mobi nie ma polskich znaków diakrytycznych... Co prawda zamieniałem w OpenOffice a nie Wordzie, ale to chyba nie ma znaczenia?

Autor:  Mori [ 22 gru 2010 0:00:34 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Zapisz jako pojedynczy plik HTML i ewentualnie użyj Gżegżółki XP, by zmienić stronę kodową na UTF-8. Daj znać, jeśli to nie rozwiąże problemu.

Autor:  Vesper [ 22 gru 2010 0:04:00 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Problem już rozwiązany dzięki pomocy chesuli ;) Dzięki jeszcze raz :)

Autor:  Vesper [ 08 sty 2011 13:49:20 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Napiszę tutaj, żeby nie zaczynać nowego tematu:

Podczas konwersji Calibre zamienia mi zamykający cudzysłów na "h", jak sobie a tym poradzić?

Autor:  chesuli [ 08 sty 2011 18:32:02 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

@Vesper - jeżeli jest to wersja 0.7.38, to ma ona sporo problemów z konwersją rtf do mobi - szczególnie z polskimi znakami diakrytycznymi, oraz znakami specjalnymi.
W plikach rtf (tych z sieci) bardzo często jako cudzysłów zamykający jest wstawiany lekko nieprawidłowy znak - taki jaki wychodzi z OCR. Jak go zaznaczysz, a potem wstawisz znak " z klawiatury, to zobaczysz różnicę. Sugeruję wykorzystanie narzędzia "zamień" z opcją "wszystko". BTW, podobnie jest z apostrofem, który również jest w zasadzie nieprawidłowy.
Chodzi tu o to, że znaki te, aczkolwiek podobne do cudzysłowu zamakającego i apostrofu, mają jednak inne oznaczenie w tabeli znaków. Jak Calibre próbuje zamieniać znaki win1250 na UTF8, to się mu to miesza - stąd takie dziwolągi, jak zmiana cudzysłowu na literę "h"

A swoją drogą jeszcze raz proponuję opuścić update Calibre do numerku 0.7.38 :D

Autor:  Vesper [ 08 sty 2011 19:00:28 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

wersja 0.7.37, jakoś dwa dni temu zrobiłem update, a już jest nowa wersja? :)
Co do zamiany, to robić to w Wordzie, czy w Calibre? I jak zaznaczyć, żeby zamieniało tylko h na końcu słowa (które powinno być cudzysłowem) a nie każde "h"?

Autor:  chesuli [ 08 sty 2011 19:14:12 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

@Vesper - zamiana w pliku źródłowym (rtf) w Wordzie.

1. zaznaczasz "dziwny" znak cudzysłowu zamykającego w źródłowym pliku rtf;
2. otwierasz w Wordzie roletę "Edycja", polecenie "Zamień";
3. widzisz ekranik narzędzia "Znajdź i zamień" - w górnym polu powinien automatycznie pojawić Ci się "zaznaczony" wcześniej znak cudzysłowu (jeżeli nie, to trzeba przejść do dokumentu, ponownie zaznaczyć i ctrl+C, potem ponownie do narzędzia "Znajdź i zamieni", kliknąć na górnym polu i ctrl+V;
4. klikasz na dolnym polu i wstawisz z klawiatury znak cudzysłowu (");
5. klikasz "Zamień wszystko".
6. Zapisujesz;
7. Dodajesz do Calibre i konwertujesz.

Aha, Vesper ja korzystam z Worda 2003, a w Wordzie 2007 czy 2010 inaczej wygląda kwestia rolet :D Jak masz takowy, to już sam musisz sobie poszukać narzędzia "Znajdź i zamień".

Autor:  Vesper [ 08 sty 2011 19:34:16 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Heh, ja mam OpenOffice :) Ale jakoś sobie poradzę :)

Autor:  chesuli [ 08 sty 2011 19:48:48 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

W OO jest analogiczne narzędzie :D
Poza tym napisałeś:
Cytuj:
Co do zamiany, to robić to w Wordzie, czy w Calibre?

:P

Autor:  Vesper [ 08 sty 2011 20:02:18 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Tak, napisałem tak, bo akurat użycie tej funkcji w Wordzie czy OO nie sprawia mi różnicy, a gdybym zapytał jak to zrobić w OO, to mógłbyś nie wiedzieć :)

Autor:  Vesper [ 15 sty 2011 21:57:16 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

OK, chesuli, mam następną zagadkę. W czasie konwersji, jeśli słowo kończy się polskim znakiem diakrytycznym (ł, ą itd) calibre nie wstawia po nim spacji, tylko łączy z następnym słowem, np. godzinązamieniłsięmiejscami, pomachałstojącemu itp :)

Autor:  chesuli [ 15 sty 2011 22:59:15 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Witam,

Tu również podejrzewam plik "wejściowy". Osobiście z takim problemem w Calibre nigdy się nie spotkałem. PW.

Autor:  chesuli [ 16 sty 2011 15:51:58 ]
Tytuł:  Re: Problem z konwersją rtf - mobi

Witam,

@Vesper - problem solved... wróć do wersji Calibre 0.7.37, to właśnie wersja 0.7.4 robi takie kwiatki :D

Strona 1 z 2 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/