Teraz jest 04 gru 2024 21:41:34




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 5 ] 
Kindle 7 touch duże odstępy między wyrazami 
Autor Wiadomość
Użytkownik

Dołączył(a): 20 sie 2016 15:45:27
Posty: 1
eCzytnik: kindle 7 touch
Post Kindle 7 touch duże odstępy między wyrazami
http://imgur.com/a/rcK7X Problem widoczny na zdjęciu, jak usunąć te przerwy i przeskakujące akapity? Z góry dziękuję za pomoc


20 sie 2016 16:05:57
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 14 lis 2014 22:47:23
Posty: 713
eCzytnik: PocketBook InkPad 3 (740)
Post Re: Kindle 7 touch duże odstępy między wyrazami
Ewidentnie zły plik mobi. Tak jak prawi athame. Jedynie co można zrobić z tym plikiem to samodzielnie edytować. Ale to jak się ktoś wyraził na tym forum to "krew, pot i łzy".
Inny sposób to poszukać na "gryzoniu" lepszej wersji pliku albo zakup oryginału w księgarni.

_________________
Czytniki:
1 - Onyx Book X61E - samoczynnie pękł ekran w trakcie całonocnego ładowania
2 - PocketBook Basic 2 (614W) - sprzedany w stanie idealnym po 20 miesiącach użytkowania.
3 - PocketBook Touch Lux 3 (626) - sprzedany w stanie idealnym po 55 miesiącach użytkowania.
4 - PocketBook Touch Lux 4 (627) - RIP :-( (samoistnie pękł ekran).
5 - PocketBook InkPad 3 (740) - mój, PocketBook Verse(629) - żony, Kindle PW5 - syna, Kindle 8 - córki, Kindle 7 - zapasowy :-)


20 sie 2016 23:55:10
Zobacz profil
Użytkownik

Dołączył(a): 25 cze 2016 10:30:03
Posty: 103
eCzytnik: kindle, pocketbook
Post Re: Kindle 7 touch duże odstępy między wyrazami
kriss.kg napisał(a):
Ewidentnie zły plik mobi. Tak jak prawi athame. Jedynie co można zrobić z tym plikiem to samodzielnie edytować. Ale to jak się ktoś wyraził na tym forum to "krew, pot i łzy".
Inny sposób to poszukać na "gryzoniu" lepszej wersji pliku albo zakup oryginału w księgarni.

Każdego ebooka naprawiam w maksymalnie 10...20 min w Sigilu za pomocą wyrażeń regularnych i podmieniania tekstu (no, chyba że jest bardzo skopany, to daje sobie spokój). Zrobiłem tak już ponad setkę plików. Tego typu złe ebooki powstają najczęściej po konwersji z pdf. Można to dosyć łatwo usunąć, trzeba jednak znać się na HTML-u i wyrażeniach regularnych i tutaj może leżeć problem tej krwi, potu i łez.


15 wrz 2016 18:46:06
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 14 lis 2014 22:47:23
Posty: 713
eCzytnik: PocketBook InkPad 3 (740)
Post Re: Kindle 7 touch duże odstępy między wyrazami
geo1963 napisał(a):
Każdego ebooka naprawiam w maksymalnie 10...20 min w Sigilu za pomocą wyrażeń regularnych i podmieniania tekstu (no, chyba że jest bardzo skopany, to daje sobie spokój). Zrobiłem tak już ponad setkę plików. Tego typu złe ebooki powstają najczęściej po konwersji z pdf. Można to dosyć łatwo usunąć, trzeba jednak znać się na HTML-u i wyrażeniach regularnych i tutaj może leżeć problem tej krwi, potu i łez.


To może napiszesz jakiś krótki tutorial dla Sigla. Chętnie bym skorzystał z Twojej wiedzy bo ja niestety Sigla nie ogarniam. Może jakieś wskazówki?

_________________
Czytniki:
1 - Onyx Book X61E - samoczynnie pękł ekran w trakcie całonocnego ładowania
2 - PocketBook Basic 2 (614W) - sprzedany w stanie idealnym po 20 miesiącach użytkowania.
3 - PocketBook Touch Lux 3 (626) - sprzedany w stanie idealnym po 55 miesiącach użytkowania.
4 - PocketBook Touch Lux 4 (627) - RIP :-( (samoistnie pękł ekran).
5 - PocketBook InkPad 3 (740) - mój, PocketBook Verse(629) - żony, Kindle PW5 - syna, Kindle 8 - córki, Kindle 7 - zapasowy :-)


15 wrz 2016 19:02:45
Zobacz profil
Użytkownik

Dołączył(a): 25 cze 2016 10:30:03
Posty: 103
eCzytnik: kindle, pocketbook
Post Re: Kindle 7 touch duże odstępy między wyrazami
athame napisał(a):
geo1963 napisał(a):
Każdego ebooka naprawiam w maksymalnie 10...20 min w Sigilu za pomocą wyrażeń regularnych i podmieniania tekstu (no, chyba że jest bardzo skopany, to daje sobie spokój). Zrobiłem tak już ponad setkę plików. Tego typu złe ebooki powstają najczęściej po konwersji z pdf. Można to dosyć łatwo usunąć, trzeba jednak znać się na HTML-u i wyrażeniach regularnych i tutaj może leżeć problem tej krwi, potu i łez.


Jak tekst po konwersji z PDF jest możliwy do poprawy przy pomocy wyrażeń regularnych to można to zrobić w 3-5 minut (a przy wykorzystaniu skryptów nawet szybciej). Problem w tym, że wiele tekstów jest z natury tej, przy której dajesz sobie spokój.


Czasem dochodzą jeszcze inne kwiatki.
OK. Ja robię to tak w Sigilu:
1. Najpierw zaznaczam wszystkie pliki xhtml/html z wyjątkiem pierwszego (okładka)
2. Zaznaczone pliki łączę w jeden plik (opcja merge files - Ctrl + M) i nadaję mu nazwę book.xhtml
3. Pierwszy plik zmieniam na cover.xhtml
3. Czyszczę plik z wszelkiego śmiecia:
w sekcji styles w pliku css kasuję wszystko i umieszczam:
@page { margin-bottom: 5.000000pt; margin-top: 5.000000pt; }
h1,h2,h3,h4,h5,h6 {text-align: center}
p {text-align: justify; text-indent: 24px}
4. W pliku book.xhtml usuwam wszystkie śmieci za pomocą wyrażeń regularnych (Ctrl + F):
Find: <div>
Replace: PUSTE

(PUSTE oznacza pusty wiersz, bez żadnego znaku w Replace)

Find: <div [^>]*>
Replace: PUSTE

Find: </div>
Replace: PUSTE

To usunie z pliku wszystkie znaczniki div

Później:

Find: <p [^/>*>
Replace: <p>

Find: <i [^/>*>
Replace: <i>

Find: <b [^/>*>
Replace: <b>

Find: [SPACJA]</p>
Replace: </p>

ostatnie robię do skutku, aż znikną wszystkie końcowe spacje

Teraz mam względnie czysty plik. Łączę ze sobą akapity, które kończą się bez kropki:

Find: ([a-z]|,|;|-|ą|ć|ę|ł|ń|ś|ż|ź)</p>\s+<p>
Replace: \1[SPACJA]

([SPACJA] to znak spacji " ")

To likwiduje większość uszkodzonych wierszy.

Dodatkowo wyszukuję akapity, które rozpoczynają się od małej litery:

Find: <p>([a-z]|ć|ł|ś|ż)

I łączę je akapitem poprzednim, jeśli jest taka potrzeba. Ten proces również da się zautomatyzować, ale wymaga to już znajomości zasad budowy wyrażeń regularnych w Sigilu.

Przy konwersji z PDF często pojawiają się w tekście numery stron. Jeśli taki numer jest w osobnym akapicie, to usuwam go za pomocą:
Find: <p>[0-9][0-9][0-9]</p>
Replace: PUSTE

Find: <p>[0-9][0-9]</p>
Replace: PUSTE

Find: <p>[0-9]</p>
Replace: PUSTE

Gorzej, gdy numer zintegrował się z akapitem, wtedy trudniej go usunąć automatycznie, chociaż, jeśli jest na końcu akapitu, to można zastosować:
Find: [0-9]</p>
Replace: </p>

Łączę słówka jednoliterowe z następnym słowem:
Find: [SPACJA]([a-z]|ą|ć|ę|ł|ń|ó|ś|ż|ź|[A-Z]|Ą|Ć|Ę|Ł|Ń|Ó|Ś|Ż|Ź)[SPACJA]([a-z]|ą|ć|ę|ł|ń|ó|ś|ż|ź|[A-Z]|Ą|Ć|Ę|Ł|Ń|Ó|Ś|Ż|Ź)
Replace: [SPACJA]\1&nbsp;\2

Teraz przeglądam plik i szukam rozdziałów, dodając w nich nagłówki <h2> (można czasem automatycznie). Przed każdym rozdziałem wstawiam Split Marker.

Dzielę plik na części (F6 - Split at Markers)

Tworzę Spis treści systemowy (można się bawić ze spisem treści na stronach, ale ja i tak z takiego nie korzystam).

I zwykle gotowe, czasem ręcznie coś poprawiam, np. na stronie tytułowej.
Niestety nie da się tego całkiem zautomatyzować, ponieważ każdy plik jest inny i wymaga indywidualnego podejścia. Ale mniej więcej tak to wygląda. W efekcie otrzymuję ebooka, który fajnie się czyta po konwersji na azw3 na Kindle, a bez konwersji na Trekstorze. Wyjątkiem jest inkbook classic, który nie potrafi poprawnie wyświetlać czystych plików HTML, o czym pisałem w innym poście.

Możecie sprawdzić te ebooki (w formacie epub, ale za pomocą Calibre da się je przekonwertować na inne formaty), trzymam część na chomiku

http://chomikuj.pl/geo1963/epub

Hasło: epub


21 wrz 2016 18:13:33
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 5 ] 


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 1 gość


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron