eKsiążki
https://forum.eksiazki.org/

Kindle 7 touch duże odstępy między wyrazami
https://forum.eksiazki.org/problemy-techniczne-kindle-f184/kindle-7-touch-duze-odstepy-miedzy-wyrazami-t16143.html
Strona 1 z 1

Autor:  weronika.anuszewska@gmail.com [ 20 sie 2016 16:05:57 ]
Tytuł:  Kindle 7 touch duże odstępy między wyrazami

http://imgur.com/a/rcK7X Problem widoczny na zdjęciu, jak usunąć te przerwy i przeskakujące akapity? Z góry dziękuję za pomoc

Autor:  kriss.kg [ 20 sie 2016 23:55:10 ]
Tytuł:  Re: Kindle 7 touch duże odstępy między wyrazami

Ewidentnie zły plik mobi. Tak jak prawi athame. Jedynie co można zrobić z tym plikiem to samodzielnie edytować. Ale to jak się ktoś wyraził na tym forum to "krew, pot i łzy".
Inny sposób to poszukać na "gryzoniu" lepszej wersji pliku albo zakup oryginału w księgarni.

Autor:  geo1963 [ 15 wrz 2016 18:46:06 ]
Tytuł:  Re: Kindle 7 touch duże odstępy między wyrazami

kriss.kg napisał(a):
Ewidentnie zły plik mobi. Tak jak prawi athame. Jedynie co można zrobić z tym plikiem to samodzielnie edytować. Ale to jak się ktoś wyraził na tym forum to "krew, pot i łzy".
Inny sposób to poszukać na "gryzoniu" lepszej wersji pliku albo zakup oryginału w księgarni.

Każdego ebooka naprawiam w maksymalnie 10...20 min w Sigilu za pomocą wyrażeń regularnych i podmieniania tekstu (no, chyba że jest bardzo skopany, to daje sobie spokój). Zrobiłem tak już ponad setkę plików. Tego typu złe ebooki powstają najczęściej po konwersji z pdf. Można to dosyć łatwo usunąć, trzeba jednak znać się na HTML-u i wyrażeniach regularnych i tutaj może leżeć problem tej krwi, potu i łez.

Autor:  kriss.kg [ 15 wrz 2016 19:02:45 ]
Tytuł:  Re: Kindle 7 touch duże odstępy między wyrazami

geo1963 napisał(a):
Każdego ebooka naprawiam w maksymalnie 10...20 min w Sigilu za pomocą wyrażeń regularnych i podmieniania tekstu (no, chyba że jest bardzo skopany, to daje sobie spokój). Zrobiłem tak już ponad setkę plików. Tego typu złe ebooki powstają najczęściej po konwersji z pdf. Można to dosyć łatwo usunąć, trzeba jednak znać się na HTML-u i wyrażeniach regularnych i tutaj może leżeć problem tej krwi, potu i łez.


To może napiszesz jakiś krótki tutorial dla Sigla. Chętnie bym skorzystał z Twojej wiedzy bo ja niestety Sigla nie ogarniam. Może jakieś wskazówki?

Autor:  geo1963 [ 21 wrz 2016 18:13:33 ]
Tytuł:  Re: Kindle 7 touch duże odstępy między wyrazami

athame napisał(a):
geo1963 napisał(a):
Każdego ebooka naprawiam w maksymalnie 10...20 min w Sigilu za pomocą wyrażeń regularnych i podmieniania tekstu (no, chyba że jest bardzo skopany, to daje sobie spokój). Zrobiłem tak już ponad setkę plików. Tego typu złe ebooki powstają najczęściej po konwersji z pdf. Można to dosyć łatwo usunąć, trzeba jednak znać się na HTML-u i wyrażeniach regularnych i tutaj może leżeć problem tej krwi, potu i łez.


Jak tekst po konwersji z PDF jest możliwy do poprawy przy pomocy wyrażeń regularnych to można to zrobić w 3-5 minut (a przy wykorzystaniu skryptów nawet szybciej). Problem w tym, że wiele tekstów jest z natury tej, przy której dajesz sobie spokój.


Czasem dochodzą jeszcze inne kwiatki.
OK. Ja robię to tak w Sigilu:
1. Najpierw zaznaczam wszystkie pliki xhtml/html z wyjątkiem pierwszego (okładka)
2. Zaznaczone pliki łączę w jeden plik (opcja merge files - Ctrl + M) i nadaję mu nazwę book.xhtml
3. Pierwszy plik zmieniam na cover.xhtml
3. Czyszczę plik z wszelkiego śmiecia:
w sekcji styles w pliku css kasuję wszystko i umieszczam:
@page { margin-bottom: 5.000000pt; margin-top: 5.000000pt; }
h1,h2,h3,h4,h5,h6 {text-align: center}
p {text-align: justify; text-indent: 24px}
4. W pliku book.xhtml usuwam wszystkie śmieci za pomocą wyrażeń regularnych (Ctrl + F):
Find: <div>
Replace: PUSTE

(PUSTE oznacza pusty wiersz, bez żadnego znaku w Replace)

Find: <div [^>]*>
Replace: PUSTE

Find: </div>
Replace: PUSTE

To usunie z pliku wszystkie znaczniki div

Później:

Find: <p [^/>*>
Replace: <p>

Find: <i [^/>*>
Replace: <i>

Find: <b [^/>*>
Replace: <b>

Find: [SPACJA]</p>
Replace: </p>

ostatnie robię do skutku, aż znikną wszystkie końcowe spacje

Teraz mam względnie czysty plik. Łączę ze sobą akapity, które kończą się bez kropki:

Find: ([a-z]|,|;|-|ą|ć|ę|ł|ń|ś|ż|ź)</p>\s+<p>
Replace: \1[SPACJA]

([SPACJA] to znak spacji " ")

To likwiduje większość uszkodzonych wierszy.

Dodatkowo wyszukuję akapity, które rozpoczynają się od małej litery:

Find: <p>([a-z]|ć|ł|ś|ż)

I łączę je akapitem poprzednim, jeśli jest taka potrzeba. Ten proces również da się zautomatyzować, ale wymaga to już znajomości zasad budowy wyrażeń regularnych w Sigilu.

Przy konwersji z PDF często pojawiają się w tekście numery stron. Jeśli taki numer jest w osobnym akapicie, to usuwam go za pomocą:
Find: <p>[0-9][0-9][0-9]</p>
Replace: PUSTE

Find: <p>[0-9][0-9]</p>
Replace: PUSTE

Find: <p>[0-9]</p>
Replace: PUSTE

Gorzej, gdy numer zintegrował się z akapitem, wtedy trudniej go usunąć automatycznie, chociaż, jeśli jest na końcu akapitu, to można zastosować:
Find: [0-9]</p>
Replace: </p>

Łączę słówka jednoliterowe z następnym słowem:
Find: [SPACJA]([a-z]|ą|ć|ę|ł|ń|ó|ś|ż|ź|[A-Z]|Ą|Ć|Ę|Ł|Ń|Ó|Ś|Ż|Ź)[SPACJA]([a-z]|ą|ć|ę|ł|ń|ó|ś|ż|ź|[A-Z]|Ą|Ć|Ę|Ł|Ń|Ó|Ś|Ż|Ź)
Replace: [SPACJA]\1&nbsp;\2

Teraz przeglądam plik i szukam rozdziałów, dodając w nich nagłówki <h2> (można czasem automatycznie). Przed każdym rozdziałem wstawiam Split Marker.

Dzielę plik na części (F6 - Split at Markers)

Tworzę Spis treści systemowy (można się bawić ze spisem treści na stronach, ale ja i tak z takiego nie korzystam).

I zwykle gotowe, czasem ręcznie coś poprawiam, np. na stronie tytułowej.
Niestety nie da się tego całkiem zautomatyzować, ponieważ każdy plik jest inny i wymaga indywidualnego podejścia. Ale mniej więcej tak to wygląda. W efekcie otrzymuję ebooka, który fajnie się czyta po konwersji na azw3 na Kindle, a bez konwersji na Trekstorze. Wyjątkiem jest inkbook classic, który nie potrafi poprawnie wyświetlać czystych plików HTML, o czym pisałem w innym poście.

Możecie sprawdzić te ebooki (w formacie epub, ale za pomocą Calibre da się je przekonwertować na inne formaty), trzymam część na chomiku

http://chomikuj.pl/geo1963/epub

Hasło: epub

Strona 1 z 1 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/