Re: problem z konwersją tekstu .rtf
No to ciekawostka..
Problem pewnie tkwi w pliku wejściowym i na tym cosiu calibre się wykłada.
Chętnie zaglądnę do tego pliku. Podeślij mi kawałek tekstu (docx, doc, rtf), najlepiej jeden rozdział z nagłówkami, dialogami itp.
____
Plik dostałem, otworzyłem, przeraziłem się...
Pierwszy wniosek jest taki: - gdybym był Calibre to też bym się wyłożył. Rzuciłbym tę robotę bez wypowiedzenia i zajął się ogrodnictwem
A teraz poważnie i bez metafor:
W pliku znalazłem:
1. kilkanaście czcionek
2. kilkadziesiąt! stylów (styli) tekstowych i kilka paragrafowych
3. nakładające się na siebie ramki tekstowe
4. tekst z kontry i biały na białym tle
5. nagłówki w górnym indeksie
6. cała masa pojedynczych, pustych linii o dziwacznych parametrach np: wielkość czcionki 0,5 pt, wcięcie z prawej 0,75 pt itd.
Ten miszmasz jest wynikiem zbyt doskonałego (nie mówię tego z przekąsem) programu OCR, który stara się jak najdokładniej odtworzyć skanowaną stronę.
Dlatego w przyszłości po przelocie prze FR - ustaw w opcjach zapisu Rtf/doc/word/docx/Układ strony NIE "dokładna kopia" tylko "tekst formatowany" i w zaawansowanych "kompatybilność z word 95"
Po otwarciu w Wordzie - zaznacz wszystko i w głównym oknie zmień czcionki na dowolną (byle jedną), wielkość na np. 12 pt. i kolor na czarny.
To jest kanon.
Reszta to żmudna praca edytorska: poprawianie tekstu, nagłówki, korekta itp, itd.
Najprostsze byłoby zapisywanie jako zwykły tekst bo pozbędziesz się wszystkich śmieci, ale niestety stracisz wszystkie atrybuty (pogrubienie, kursywa).
W starych Windows(98) był sobie taki program MS Write. Genialny, prosty edytor tekstu. Który zachowywał atrybuty i "znikał" formatowanie.
Poszukaj jakiegoś edytora (może Open Office), który potrafiłby to samo. Przepuszczenie przez niego niego pliku (przed edycją) bardzo uprościłby późniejszą pracę.