eKsiążki
https://forum.eksiazki.org/

Jak podczas konwersji pdf/doc usunąć podział wyrazów?
https://forum.eksiazki.org/software-i-hardware-f24/jak-podczas-konwersji-pdf-doc-usunac-podzial-wyrazow-t8649.html
Strona 1 z 1

Autor:  lauffer [ 08 mar 2010 19:37:37 ]
Tytuł:  Jak podczas konwersji pdf/doc usunąć podział wyrazów?

Witam
Mam trochę w swoich zbiorach książek w pdf. A ze od tygodnia jestem szczęśliwym posiadaczem Kindle DX i mimo ze dosyć ładnie widać na nim książki w pdf'ie to zabrałem się do konwersji na mobi.
Juz generalnie wszystkie problemy rozwiązałem, pozostał jeden. Usuniecie podziału wyrazów.
Podział który był reprezentowany przez myslnik i znak konca linii rozwiązałem przez znajdz/zamien w wordzie przez wyrazenie regularne: -^p.
To było proste ;p
Niestety występuja tez wyrazy podzielone przez (część wyrazu,myslnik,spacja i dopiero reszta wyrazu). Znalazłem sposób na wyszukanie takiego ciągu wyrażeniem regularnym: ^$- (na końcu spacja). (^$ - oznacza dowolna literę) I teraz jest problem. Nie wiem jak zastąpić wyszukany fragment tak by litera przy myślniku została a został skasowany tylko myślnik i spacja. Niestety w pole "zamień" nie można wpisywać większości wyrażeń regularnych.

Za wszelka pomoc dziękuję.

Pozdrawiam

Autor:  Mori [ 08 mar 2010 19:54:05 ]
Tytuł:  Re: Jak podczas konwersji pdf/doc usunąć podział wyrazów?

Wciskacsz: Ctrl+H

Znajdź:
Kod:
(?)-

Zamień:
Kod:
\1


Zaznaczasz: Użyj symboli wieloznacznych (jest widoczne po kliknięciu na "Więcej").

I na koniec Zamień wszystko.

Więcej o regexpach w Wordzie: http://office.microsoft.com/en-us/help/ ... 51033.aspx

Autor:  lauffer [ 08 mar 2010 20:14:07 ]
Tytuł:  Re: Jak podczas konwersji pdf/doc usunąć podział wyrazów?

Dzięki wielkie za odpowiedź. Jednak twój sposób nie jest doskonały ponieważ (?) oznacza każdy znak czyli spację tez, co znaczy ze w dialogach zostanie skasowany myślnik. Ale dzięki wskazaniu metody już sobie poradziłem :)
Czyli by wyszukać: ([a-z])-
by zastąpić: \1

Jeszcze raz dzięki :)
Pozdrawiam

Autor:  muaddib2 [ 11 mar 2011 11:45:15 ]
Tytuł:  Re: Jak podczas konwersji pdf/doc usunąć podział wyrazów?

Wczoraj, chcąc dokonać konwersji jednego z dokumentów zauważyłem coś kuriozalnego, z czym spotkałem się po raz pierwszy. Łącznik opcjonalny dzielący wyrazy na końcu wersów był "niewidoczny" dla wyszukiwarki. Nie dało się go usunąć drogą zwykłej edycji. Można było usunąć literę przed nim, jak i po nim, ale "myślnik" ów pozostawał wciąż w tym samym miejscu - na końcu wiersza.

Wyglądało to, jak jakieś zautomatyzowane dzielenie wyrazów "zaszyte" na stałe w dokument.

Olśnienia doznałem konwertując ów RTF do zwykłego tekstu... Po tym zabiegu wszelkie znaki podziału wyrazu zniknęły. Ten sam efekt otrzymałem po konwersji do MOBI za pomocą Calibre.

Problem zniknął. Ja jednakowoż jestem ciekawy, w jaki sposób uzyskano ten efekt w dokumencie. Zna ktoś odpowiedź na moje, jak zakładam, dziecinnie proste pytanie? :)

Autor:  stonqoo [ 11 mar 2011 21:43:21 ]
Tytuł:  Re: Jak podczas konwersji pdf/doc usunąć podział wyrazów?

Może to skutek automatycznego dzielenia wyrazów?

[Kilka chwil...]

No i sobie sprawdziłem, no i to to :)

Strona 1 z 1 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/