Re: Kindle 7 touch duże odstępy między wyrazami
Czasem dochodzą jeszcze inne kwiatki.
OK. Ja robię to tak w Sigilu:
1. Najpierw zaznaczam wszystkie pliki xhtml/html z wyjątkiem pierwszego (okładka)
2. Zaznaczone pliki łączę w jeden plik (opcja merge files - Ctrl + M) i nadaję mu nazwę book.xhtml
3. Pierwszy plik zmieniam na cover.xhtml
3. Czyszczę plik z wszelkiego śmiecia:
w sekcji styles w pliku css kasuję wszystko i umieszczam:
@page { margin-bottom: 5.000000pt; margin-top: 5.000000pt; }
h1,h2,h3,h4,h5,h6 {text-align: center}
p {text-align: justify; text-indent: 24px}
4. W pliku book.xhtml usuwam wszystkie śmieci za pomocą wyrażeń regularnych (Ctrl + F):
Find: <div>
Replace: PUSTE
(PUSTE oznacza pusty wiersz, bez żadnego znaku w Replace)
Find: <div [^>]*>
Replace: PUSTE
Find: </div>
Replace: PUSTE
To usunie z pliku wszystkie znaczniki div
Później:
Find: <p [^/>*>
Replace: <p>
Find: <i [^/>*>
Replace: <i>
Find: <b [^/>*>
Replace: <b>
Find: [SPACJA]</p>
Replace: </p>
ostatnie robię do skutku, aż znikną wszystkie końcowe spacje
Teraz mam względnie czysty plik. Łączę ze sobą akapity, które kończą się bez kropki:
Find: ([a-z]|,|;|-|ą|ć|ę|ł|ń|ś|ż|ź)</p>\s+<p>
Replace: \1[SPACJA]
([SPACJA] to znak spacji " ")
To likwiduje większość uszkodzonych wierszy.
Dodatkowo wyszukuję akapity, które rozpoczynają się od małej litery:
Find: <p>([a-z]|ć|ł|ś|ż)
I łączę je akapitem poprzednim, jeśli jest taka potrzeba. Ten proces również da się zautomatyzować, ale wymaga to już znajomości zasad budowy wyrażeń regularnych w Sigilu.
Przy konwersji z PDF często pojawiają się w tekście numery stron. Jeśli taki numer jest w osobnym akapicie, to usuwam go za pomocą:
Find: <p>[0-9][0-9][0-9]</p>
Replace: PUSTE
Find: <p>[0-9][0-9]</p>
Replace: PUSTE
Find: <p>[0-9]</p>
Replace: PUSTE
Gorzej, gdy numer zintegrował się z akapitem, wtedy trudniej go usunąć automatycznie, chociaż, jeśli jest na końcu akapitu, to można zastosować:
Find: [0-9]</p>
Replace: </p>
Łączę słówka jednoliterowe z następnym słowem:
Find: [SPACJA]([a-z]|ą|ć|ę|ł|ń|ó|ś|ż|ź|[A-Z]|Ą|Ć|Ę|Ł|Ń|Ó|Ś|Ż|Ź)[SPACJA]([a-z]|ą|ć|ę|ł|ń|ó|ś|ż|ź|[A-Z]|Ą|Ć|Ę|Ł|Ń|Ó|Ś|Ż|Ź)
Replace: [SPACJA]\1 \2
Teraz przeglądam plik i szukam rozdziałów, dodając w nich nagłówki <h2> (można czasem automatycznie). Przed każdym rozdziałem wstawiam Split Marker.
Dzielę plik na części (F6 - Split at Markers)
Tworzę Spis treści systemowy (można się bawić ze spisem treści na stronach, ale ja i tak z takiego nie korzystam).
I zwykle gotowe, czasem ręcznie coś poprawiam, np. na stronie tytułowej.
Niestety nie da się tego całkiem zautomatyzować, ponieważ każdy plik jest inny i wymaga indywidualnego podejścia. Ale mniej więcej tak to wygląda. W efekcie otrzymuję ebooka, który fajnie się czyta po konwersji na azw3 na Kindle, a bez konwersji na Trekstorze. Wyjątkiem jest inkbook classic, który nie potrafi poprawnie wyświetlać czystych plików HTML, o czym pisałem w innym poście.
Możecie sprawdzić te ebooki (w formacie epub, ale za pomocą Calibre da się je przekonwertować na inne formaty), trzymam część na chomiku
http://chomikuj.pl/geo1963/epubHasło: epub