Teraz jest 24 lis 2024 14:08:38




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 11 ] 
Konwersja .PDF do .PRC 
Autor Wiadomość
Post Konwersja .PDF do .PRC
Witam,
jak w temacie - mam kilka pdf i fajny soft do czytania prc, a pdf na smartfonie jest tak mały, że nic nie widać a jak powiększę to muszę suwać na boki - kaszana
Więc potrzebuję programu który przerobi mi pdf na prc :)
Czy możecie pomóc ? Dziękuję i pozdrawiam


18 gru 2007 0:37:54
Użytkownik
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:46:01
Posty: 887
Lokalizacja: www.eksiazki.org
Post 
Bezpośrednio chyba się nie da. Najpierw skonwertuj pdfa do doc lub txt (na przykład przy pomocy ABC Amber PDF Converter - link) a później dopiero na prc. Poradnik ja to zrobić znajdziesz tutaj


23 gru 2007 20:31:54
Zobacz profil WWW
Post 
Bezpośrednio z pdf na prc przerobisz Mobipocket Readerem (www.mobipocket.com).
Czasami po takiej przeróbce sypie się polska czcionka, dlatego wtedy najpierw na jakiś tekstowy (rtf, doc, txt) a później Mobipocket Readerem


27 lut 2008 22:41:45
Admin
Avatar użytkownika

Dołączył(a): 16 lip 2007 13:54:46
Posty: 656
Lokalizacja: Atol Bikini
eCzytnik: PRS-505, eClicto, Kindle 3, HTC LEO
Post 
No to fajnie!
@Andrzej.A - tylko czym najpierw do tego tekstowego, tylko tak, żeby nie było 15 % błędów i bez sprawdzania OCR? To pytanie za 1.000 punktów - znasz taki program?

A czcionki "wywalające" się przy konwersji przy użyciu Mobipocket Creatora zależą wyłącznie od "zawartości" pdf. Chodzi o to, że MC suportuje tylko dwie tablice znaków, a mianowicie UTF-8 (Unicode) i Windows 1250 (zachodnia Europa). Jak masz w pdf'ie zaszyte czcionki w tablicy Windows 1252 to będą krzaki. Sposób jest na to taki,że MC nie konwertuje od razu do prc, tylko najpierw robi html (bez problemu znajdziesz go w folderze My Publications). A taki plik można łatwo "poprawić" edytorem html, który posiada opcję "zamień wszystkie znaki ... na ... ". Inną drogą jest przeróbka samego pliku pdf (podstawienie tablicy), ale do tego potrzebne są dość drogie programy (legalne oczywiście) i dlatego w dobie Open Source i freeware nie będą ich polecał :-)

Chesuli

_________________
Pozdrawiam,
Chesuli

Cytuj:
Kobiety nie można zmienić.
Można zmienić kobietę, ale to nic... nie zmieni.


27 lut 2008 23:04:59
Zobacz profil
Post 
Do konwersji na doc, rtf używam ABBYY PDF Transformer 2.0 i nigdy nie miałem kłopotów z czcionkami i formatem.


28 lut 2008 13:21:39
Admin
Avatar użytkownika

Dołączył(a): 16 lip 2007 13:54:46
Posty: 656
Lokalizacja: Atol Bikini
eCzytnik: PRS-505, eClicto, Kindle 3, HTC LEO
Post 
Wiesz co, mam prośbę. Zanim zaczniesz pisać, to przeczytaj post, na który odpowiadasz. Czy ja pisałem o czcionkach czy formacie? Jeżeli uznajesz, że tak, to proszę o cytat.
To raz. A dwa, to nawet to co napisałeś nie jest prawdą - w zakresie formatu (o ile oznacza to u ciebie formatowanie stron). Po operacji z ABBYY PDF Transf. wynikowy plik doc czy rtf zawiera multum bugów edycyjnych w postaci niewymiarowych sekcji, ręcznego dzielenia wierszy, pomieszanych parametrów czcionek (kolor, światło, odstępy, obniżenie, interlinie itd.).
Ja pisałem o błędach OCR, których jest niemało po takiej operacji.
Any way przeczytać się pewnie da, ale przeczytać sią da konwertując każdą stronę pdf na tiffa czy jpg. Tylko czy o to chodzi?
Jak czytam książkę, to chcę mieć z tego jakąś przyjemność, a nie zastanawiać się, kto wypowiedział daną frazę, albo co w ogóle znaczy jakieś dziwnie przekręcone słowo. Albo dlaczego imię bohatera jest napisane na pięć różnych sposobów.
Szczerze, to już wolę konwersję od razu do prc i zapamiętanie, że dany "dyngs" to "ż", a inny to "ę", czy wreszcie, że symbol funta brytyjskiego do "Ł" .

Chesuli.

PS

A tak na marginesie, IMO wersja 1 ABBYY PDF Trans. lepiej rozpoznaje niż wersja 2. No, ale Ty możesz mić inne zdanie, bo to ocena subiektywna.

Ch.

_________________
Pozdrawiam,
Chesuli

Cytuj:
Kobiety nie można zmienić.
Można zmienić kobietę, ale to nic... nie zmieni.


28 lut 2008 15:31:37
Zobacz profil
Post 
1. Widocznie teraz inne jest znaczenie słowa pisanego niż za moich czasów :-)
2. Nie wiem jaki program używasz, ale w moim przypadku ABBYY PDF Transformer (obojętnie, która wersja, chociaż 2,0 jest lepsza) po właściwym ustawieniu nigdy (no może poza 1 - 2%) nie konwertował inaczej niż było to w oryginale. Programem tym przerobiłem kilka tysięcy książek i nigdy nie miałem zastrzeżeń do wyniku konwersji.


02 mar 2008 13:46:47
Admin
Avatar użytkownika

Dołączył(a): 16 lip 2007 13:54:46
Posty: 656
Lokalizacja: Atol Bikini
eCzytnik: PRS-505, eClicto, Kindle 3, HTC LEO
Post 
Witam,

Jak widać wszystko jest względne. Poczucie tego co jest poprawne, a co nie też. Ponadto gratuluję Ci sprawności, że przez ca 3 lat ( a tyle mniej więcej upłynęło od ukazania się pierwsze wersji Transformera) udało Ci się skonwertować na nim kilka tysięcy książek. Mam nadzieję, że będziemy mieli okazję skorzystać z Twoich zasobów i sami ocenić tą kwestię sporną co do prawidłowości procesu konwersji.

Jak dla mnie dyskusja w kwestii działania tego konwertera - przynajmniej do chwili możliwości zapoznania się z "próbkami" jest zakończona.

Chesuli

_________________
Pozdrawiam,
Chesuli

Cytuj:
Kobiety nie można zmienić.
Można zmienić kobietę, ale to nic... nie zmieni.


02 mar 2008 14:43:43
Zobacz profil
Mod
Avatar użytkownika

Dołączył(a): 16 lip 2007 16:39:15
Posty: 693
Post 
Nie zamierzam bronić ABBYY PDF Transformera w wersji 2.0, bo jak dotąd nie mam tak wielkiego, jak Andrzej.A "dorobku" konwertowanych za jego pomocą plików (raptem używałem go może z pięć razy), ale prawdą jest, że nie stwierdziłem żadnych rażących odstępstw w stosunku do pliku wyjściowego. Powtarzam, dla mnie jedynym mankamentem jest nieanalogiczne rozłożenie tekstu na stronach - jeśli wiecie co mam na myśli. Tu wystarcza jednak modyfikacja albo rozmiaru czcionki, albo przesunięcie w górę lub w dół paru wersów. I to wszystko.

EDIT:

chesuli a co innego polecałbyś do konwersji PDF-ów do jakichś "ludzkich" formatów, poza wzmiankowaną przez Ciebie pierwszą odsłoną ABBYY PDF Transformera. Ja próbowałem skorzystać z różnych, ale bywało z tym też różnie. Jednym z takich programów był Able2Doc PDF Conventer 4.0, jakkolwiek skuteczności i jakości konwersji tym programem nie mogłem ocenić z przyczyny "wywalania" się programu, albo zwyczajnego jego zawieszania w trakcie przerabiania pliku...

Cóż więc byś polecił? Byle byłoby to coś sprawdzonego! Najlepiej przez Twoją szanowną osobę :)

_________________
Cytuj:
"Z książkami jest tak samo jak z ludźmi: tylko niewielka część odgrywa dużą rolę, reszta gubi się w wielości."

Gregory Benford - "Zagrożenie Fundacji"


Cytuj:
"Out in the oceans of sand
I saw the future
Of a golden land
Below the plains
I've been meeting my fate
I stood the test
The universe
In the palm of my hand
Oh, am I blessed
Or cursed "


Savage Circus "Legend of Leto II"


02 mar 2008 14:56:29
Zobacz profil
Post 
Słuchajcie chłopaki. Przecież w Adobe readerze jest opcja 'save as text'. Ja z niej zawsze korzystam. Otwieram sobie pdfa (m. innymi z tej biblioteki) i zapisuję jako tekst. I tyle. Czasem jak są jakieś przypisy na stronie to ten fakt trochę burzy formatowanie (czytaj - masz akapity z objaśnieniem przypisów) ale poza tym wszystko jest 100% ok. Po co coś konwerować?


02 mar 2008 16:38:37
Admin
Avatar użytkownika

Dołączył(a): 16 lip 2007 13:54:46
Posty: 656
Lokalizacja: Atol Bikini
eCzytnik: PRS-505, eClicto, Kindle 3, HTC LEO
Post 
Witam,

@muaddib2 - co do ABBYY PDF to IMO jest to tak. Program rozpoznaje pdf ze wszystkimi jego cechami, z których część jest dla ebooka niepotrzebna, a nawet wręcz przeszkadza. To co będę pisał dalej z przyczyn oczywistych nie dotyczy pdf'św, które zostały stworzone na podstawie prawidłowo zedytowanych ebooków w formacie rtf czy doc. Natomiast jeżeli chodzi o pdf zrobiony ze scanu książki, to zawiera on mnóswto elementów niepożądanych, w znacznej części wynikających z działań edytorskich i na składzie przy tworzeniu książki. Książki składa się strona po stronie - edytor (chodzi tu o człowieka, który to robi) musi maksymalnie wykorzystać powierzchnie jak najmniej naruszając spoistość formy i będąc w zgodzie z różnymi zasadami (eliminacja tzw, "wdów", "bękartów", nieprzenoszenie jednego wersu z akapitu na następną stron i jeszcze inne). W swoim "arsenale" narzędziach, którymi minimalnie może m.i n. zmniejszać czy zwiększać szerokość i światło znaków, regulować interlinie, czy akapity podwyższać czy obniżać znaki czy wręcz je skalować - tu wymienię w zasadzie tylko te, które bez trudu można znaleźć w Wordzie - edytor ma ich znacznie więcej). W książkach co do zasady nie stosuję się automatycznego dzielenia wyrazów. Nawet w Wordzie znajdziecie różnego rodzaju znaki specjalne, w tym "miękki enter" czyli ręczny podział wiersza, łącznik opcjonalny (jeżeli wyraz jest ostatni w wersie, to w tym miejscu nastąpi jego podzielnie), spację nierozdzielającą (wyrazy muszą być w jednej linii) i tak dalej. Czytając książkę wydaje nam się że wszystkie strony (chodzi o marginesy wycięcia itd) oraz znaki i odstępy są takie same, ale tak ie jest - to właśnie efekt pracy edytora w przelewaniu tekstu do makiety strony. Fakt, gołym okiem tych różnic nie widzimy - ale programy OCR je widzą. ABBYY PDF też je widzi. Jak przepuścisz przez niego taki scan, to w efekcie uzyskujesz (wyłączam tu konwersję do txt przy czcionce nieskalowanej - np Courier) plik, w którym każda strona jest sekcją o całkiem innych parametrach strony, marginesów, akapitów tabulacji światła oraz wymiarów czcionek). Wymiar stron jest w 99% niestandardowy i jak spróbujesz to zmienić na A4 (a taki wymiar przyjął się jako standard w ebookach - ewentualnie letter w anglosaskich) to wszystko zaczyna się rozjeżdżać.
Jedną z większych bolączek automatycznej konwersji jest problem z ręcznym podziałem wersów Dlaczego. To proste, jak szerokość strony się zwiększy - a w przypadku 90 % ebooków tak jest, bo książki są ca w formacie B5 - to nagle wyrazy się rozchodzą i wyglądają jak super rozstrzelone (oczywiście przy utrzymaniu justowania, ale to też jest standard). Innym efektem, który też może nawet bardzo zaburzyć odbiór samej treści, a na pewno poduje konieczność zwiększonej uwagi jest takie zjawisko, gdy akapit dialogowy zostaje połączony z następującym po nim akapitem informacyjno.opisowym. Dialogi są wyróżnione (w naszym języku) znacznikiem "-" Wyobraź sobie taki dialog:

X patrzył na Y z niedowierzaniem.
- Jesteś śmieciem - powiedział.
Y uśmiechną się z politowaniem, co u X wywołało jeszcze większe wzburzenie.
- Wielkim śmieciem?

A teraz tak

X patrzył na Y z niedowierzaniem.
- Jesteś śmieciem - powiedział. Y uśmiechną się z politowaniem, co u X wywołało jeszcze większe wzburzenie.
- Wielkim śmieciem?

Oczywiście to jest bardzo prosty i stworzony et hoc przykład, ale jeżeli masz całą stronę dialogu, albo po ostatnim zdaniu dialogu zaczyna się połączony z nim akapit informacyjno-opisowy, to już po chwili zaczynasz się zastanawiać, co kto powiedział. Jeżeli do tego dołożysz możliwość, że w tym drugim przykładzie kropka pomiędzy słowami "powiedział" i "X" zostanie zmieniona na przecinek (a mylenie znaków interpunkcyjnych to w nawet najlepszych programach OCR to standard, to sens ulega całkowitemu wypaczeniu.

Inny jeszcze problem powstaje, gdy znika nam oznaczenie rozdzielenia (od siebie) akapitów - no bo OCR rozpoznał zamiast "twardego" akapitu akapit "miękki". Z bogiem sprawa, jak sprawa dotyczy akapitów opisujących tą samą scenę, ale jeżeli między nimi nastąpiła zmiana scen. Znowu trzeba się chwilę zastanowić, o co do diabła tu chodzi, i dlaczego o całkiem różnych sprawach mowa jest w jednym akapicie ciurkiem.

Dalej: W ABBYY PDF zaszyty jest silnik OCR ze starszych ciut wersji ABBY FineReadera. Sprawdź sobie ile razy przy translacji z pdf (scanu) ten program pomylił literę "O" z cyfrą 0, ile razy zamiast "I" masz cyfrę 1 czy zamiast np. "się w" masz "siew" ile razy zamiast "ale ja" masz "aleja" idt. Takich błędów (ich rodzajów) jest dużo więcej.
Odrębną sprawą są nazwy własne i szczególnie te obce. Jak np. masz w książce Niemca z nazwiskiem lub imieniem z "u" czy "o" umlałt, to ciekawy jestem ile razy to nazwisko zostało poprawnie odczytane. Ciekaw jestem jak wyglądają zamykające znaki cudzysłowia (o otwierające dość często są dobre). Jak jest ze standardem znaku dialogatora - chodzi mi tu o ten znaczek "-" przed dialogiem, bo może to być prosty myślnik, półpauza i pauza. Niewapne który, ale w całym ebooku powinien byń taki sam - a jest? Wcięcie pierwszego wersu akapitu i odstęp pierwszej litery wyrazu od wskaźnika dialogu też jest to samo - ech, chyba nie. A co z przypisami - szczególnie dolnymi, jeżeli oczywiście
są. Czy czasem nie sął totalnie porozjeżdżane. A jak jest nie daj Boże jakaś choćby minimalna grafika przy oznaczenia rozdziałów - to co się z nią dzieję? Totalny miszasz. A znaki "!" czy czasami nie są mylone z "l" i odwrotnie.

Można by tak jeszcze długo, albo i dłużej. Konkluzja jest jedna. Nie ma naprawdę skutecznego programu do konwersji scanów zapisanych jako pdf do formatów tekstowych - wyłączam tu z tego format txt, bo to jest de facto bark formatu :-) oczywiście. Jedyne wyjście własna żmudna praca i stosowanie programów do OCR, które zakładają współpracę z operatorem.
ABBYY PDF został stworzony do tego, by w biurach (szczególnie na zachodzie), w których jest mnóstwo scanerów czy kopiarek umożliwiających zapis do pdf można było szybko powrotnie przerzucić zawartość pdf'a do doc czy rtf. Jedna dwie no czasem trzy czy nawet cztery strony, ale nie trzysta, czy czterysta. Przy majłej liczbie stron, nie mówiąc już o dokumencie jednostronicowym większość ww problemów istotnie traci na znaczeniu, a ilość koniecznych poprawek jest do zaakceptowania.
Żeby nie było, że o tym nie wspomnieałem to można także przyjąć, że jak jest naprawdę dobrze zrobiony pdf, a plik ma być czytany na PDA, telefonie czy innym urządzeniu, które i tak dokonuje repaginacji, to większość opisanych powyżej problemów z edycją (nie dotyczy to błędów rozpoznania) traci dość mocno na znaczeniu.
Ale ta możliwość w miarę sensownego czytania na PDA nie rozwiązuje sprawy, bo w swym podstawowym założeniu ebooki winny być tak wykonane, by łatwo i bez strat można było je odtwarzać czy konwertować na różne platformy.

Ja nie polecałem ABBYY PDF Transformera v1, co to to nie. Ja napisałem, że z kilku wykonanych przeze mnie prób zarówno z wersją 1, jak i 2 w moim subiektywnym odczuciu mniej błędów i problemów edycyjnych miałem w przypadku wersji 1. Żadnego z tych programów ie polecam do konwersji pdf'ów, szczególnie tych robionych ze bezpośrednio ze scanóww.


@Brychoo - tiaaa, no tak, te pdf'y z Biblioteki (a przynajmniej większość z nich) zostały stworzone jako... konwersja doc czy rtf do pdf'a. Mają ustawione poprawne strony kodowe, zamarkowane czcionki i mnóstwo innych metadanych, o których w przypadku pdf'ów robionych ze scanów nawet nie ma co marzyć. Wystarczy tylko nie ta strona kodowa i pdf wyświetla Ci się dobrze, a w pliku tekstowym masz "krzaki" zamiast naszych ogonków.

A, i jeszcze jedno. Na samej górze forum, już nie pamiętam w którym dokładnie wątku (Chyba błędy w ebookach) jest zgłoszenie o straszenie spapranym ebooku Lovecrafta Zew Cthulh. Jest to właśnie wręcz akademicki przykład konwersji automatycznej - zobaczcie co z tego wyszło. Zaznaczam, że nie wiem jakim programem to było OCR-owane, ale na pewno był to automat. I jeszcze jedno, jak przy tym temacie: moje doświadczenie uczy mnie, że - poza naprawdę rzadkimi wyjątkami - jak ebook jest tylko w formacie doc, to w 90 procentach jest to niezła kaszana. Jest to po prostu surowy i niepoprawiony efekt automatycznego OCR.

Późno już jest, a ja się rozpisałem. Jak się trafią jakieś literówki czy bezsensowne sformułowania, to przepraszam, bo nie ma już siły sprawdzać tego long posta :D Jak jutro zauważę, to pewnie poprawię w drodze edycji.

Chesuli

_________________
Pozdrawiam,
Chesuli

Cytuj:
Kobiety nie można zmienić.
Można zmienić kobietę, ale to nic... nie zmieni.


03 mar 2008 2:32:01
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 11 ] 


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 1 gość


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron