Calibre: Konwersja PDF na Mobi – usunięcie nagłówka i stopki
Witam, zainspirowany własnymi problemami z konwersją PDF na MOBI postanowiłem stworzyć mini tutorial.
Cel tutorialu:Jak pozbyć się niepotrzebnego nagłówka i stopki z pliku PDF przy konwersji na Mobi za pomocą programu
Calibre?
Do czego w ogóle jest mi to potrzebne?W wielu plikach PDF autorzy lub wydawnictwa (np. złotemyśli) umieszczają stopkę lub/i nagłówek na każdej stronie publikacji PDF, czasami jest też dodany nr strony. Informacje te są przydatne w przypadku, gdy drukujemy PDF’a lub czytamy go na komputerze natomiast gdy konwertujemy plik PDF na format bardziej strawny przez naszego kindla (lub inny czytnik) stają się one niepotrzebne, a wręcz przeszkadzają w komfortowym czytaniu. Na szczęście dzięki odpowiedniej funkcji programu Calibre możemy pozbyć się nagłówka i stopki z pliku PDF.
Jak tego dokonać?Na początku standardowo dodajemy plik PDF do programu Calibre. Następnie klikamy na książkę potem prawym przyciskiem myszki i wybieramy
konwertuj książki ->
konwertuj pojedynczo.
1. Teraz w karcie konwertowania (z menu po lewej stronie) wybieramy
Wyszukaj i Zmień (obrazek lornetki)
Załóżmy, że chcemy usunąć najpierw z pliku PDF nagłówek.
2. W polu „
wyszukaj wyrażenie regularne” wpisujemy powtarzające się wyrażenie z nagłówka, które chcemy usunąć np. dla złotychmyśli często jest to: „Nazwa publikacji – Autor” oraz „numer strony” (o tym jak usunąć numer strony z pliku PDF na samym końcu).
3. Następnie klikami w obrazek magicznej pałeczki i wciskamy
Test. Jeżeli jest takie wyrażenie w teksie, to powinna nam się wyświetlić
liczba wystąpień: jakaś tam liczba.
Jeżeli nic nam się nie wyświetli, to znaczy, że to wyrażenie nie jest poprawne, ale bez obaw. Wystarczy, że poszukamy go i skopujemy w tym oknie, które właśnie nam się wyświetliło (uwaga: wyrażenie kopiujemy najlepiej z całym formatowaniem typu: <b/> ) i wklejamy do zielonego okienka (
wyrażenie regularne).
Ponownie sprawdzamy przyciskiem
test i już nam się wyświetla
liczba wystąpień.
Analogicznie postępujemy ze stopką. Można ją też od razu skopiować i wkleić do zielonego okienka - tam gdzie nagłówek tylko po nagłówku, a przed stopką należy wstawić znak |(pionową kreskę na klawiaturze).
4. Potwierdzamy:
ok . W polu
tekst zastępujący: nie wpisujemy nic.
Jak usunąć numery stron?Jeżeli na każdej stronie mamy powtarzające się:
- str. 1 - str. 2 - str. 3 itp. to kopiujemy wyrażenie -
str. [0-9]+ Sam kod [0-9]+ oznacza wszystkie cyfry na wszystkich stronach.
Natomiast jeżeli mamy same numery stron w postaci: 1,2,3,4,5 to najlepiej wstawić ten kod z formatowaniem, które występuje w pliku, podejrzymy je klikając w magiczną pałeczkę - powinno ono wyglądać mniej więcej tak
<br> 1<br><hr> (dla różnych PDF’ów może to być trochę inaczej). i umieszczamy
<br> [0-9]+<br><hr> Sprawdzamy przyciskiem test i już nam się wyświetla liczba wystąpień. Potwierdzamy: ok . W polu tekst zastępujący: nie wpisujemy nic.
Gdy już wszystko zmienimy. Konwertujemy plik do wybranego formatu. Ja dla Kindla wybieram MOBI.
Postępując w ten sam sposób można przy konwersji zamienić jakiś powtarzający się w pliku znak, który nie wyświetla się poprawnie na kindlu na taki, który będzie się wyświetlał poprawnie. Aby to zrobić wystarczy w pole
wyszukaj wyrażenie regularne wkleić problematyczny znak, a w pole
tekst zastępujący wkleić znak poprawny.
Mam nadzieję, że nie było i że się komuś przyda. Screeny dodane. Jak coś nie jest jasne to piszcie.