eKsiążki
https://forum.eksiazki.org/

Skany książki
https://forum.eksiazki.org/onyx-boox-f162/skany-ksiazki-t13146.html
Strona 1 z 2

Autor:  sebusik [ 02 mar 2013 0:52:06 ]
Tytuł:  Skany książki

Czy onyx boox i62 będzie ładnie czytał skany książek w pdf. Zależy mi na czytniku na którym przyjemnie się czyta właśnie zeskanowane książki ?????????

Autor:  fraktal [ 02 mar 2013 10:04:14 ]
Tytuł:  Re: Skany książki

Najprawdopodobniej będzie je kiepsko czytał. Trochę mały ekran na takie działania. Zależy też od jakości skanów.
Ale raczej się to nie sprawdzi.

Autor:  Rhavir [ 02 mar 2013 11:19:36 ]
Tytuł:  Re: Skany książki

KAŻDY czytnik będzie je KIEPSKO czytał :D no może po za M92 i mu podobnymi - ale to wynika z DUŻEGO ekranu. :D

Jeśli bardzo Ci zależy i nie Masz możliwości zdobycie ksiązki w "normalnym" standardzie to pozostaje Ci OCR - "przepuszczas" takiego "cudaka PDF" przez program i dostaniesz tekst w normalnym formacie. Oczywiście czeka cię korekta, formatowanie - ale jak jakość "zaszytych" w PDF'fie grafik jest dobra to nie będzie dużo roboty.

Swoją ścieżką wyślij Zegarową Bombonierkę :D temu kut.... który "zrobił" taki PDF. Niech takie skany zapisuje jako DjVu bo do tego słuzy a nie w PDF'ach.

Autor:  tommik [ 03 mar 2013 10:35:56 ]
Tytuł:  Re: Skany książki

Da się tak czytać, ja już tak przeczytałem kilkadziesiąt książek na moim Boox 60. Wystarczy marginesy wyrzucić oraz podzielić skany na pół, tak aby wyświetlał tylko jedną stronę zamiast dwóch. Dodatkowo warto OCRa zrobić, jak kolega @Rhavir zauważył. Oczywiście komfort mniejszy niż przy czytaniu epubów, ale jeśli książka jest ważna, to wtedy da się znieść tego typu niedogodności.

Autor:  xaper [ 03 maja 2013 9:55:05 ]
Tytuł:  Re: Skany książki

Co do tego że na Boox60 można czytać skanowane książki(przynajmniej przy "poziomym" ustawieniu i obcięciu marginesów) nie mam wątpliwości, sporo skryptów matematycznych tak czytam(wiec OCR nie jest wyjsciem)
Problem jest inny: przy dobrej jakości skanie(wysokie dpi) przerzucanie kartek jest irytujaco powolne - kilka sekund na strone. Przeskalowanie pdf do 150dpi daje istotna poprawe, ale jest z tym duzo zabawy...
Czy w i62HD Firefly(256MB RAM) bedzie zauwazalnie lepiej? To glowny powod dla ktorego rozważam jego kupno (no i nadchodzacy Android, w repozytorium kodu figuruje od 2 miesiecy, ostatni commit 5 dni temu, to dobrze wróży)


Cytuj:
Swoją ścieżką wyślij Zegarową Bombonierkę :D temu kut.... który "zrobił" taki PDF. Niech takie skany zapisuje jako DjVu bo do tego słuzy a nie w PDF'ach.

Co jest zlego w zapisywaniu skanu jako pdf? Oprocz nieco wiekszego rozmiaru, ale przy "Mixed Raster Content" roznica jest mniejsza niz mozna sie spodziewac

Autor:  Alcek [ 03 maja 2013 11:46:00 ]
Tytuł:  Re: Skany książki

Rhavir napisał(a):
KAŻDY czytnik będzie je KIEPSKO czytał :D no może po za M92 i mu podobnymi - ale to wynika z DUŻEGO ekranu. :D

Jeśli bardzo Ci zależy i nie Masz możliwości zdobycie ksiązki w "normalnym" standardzie to pozostaje Ci OCR - "przepuszczas" takiego "cudaka PDF" przez program i dostaniesz tekst w normalnym formacie. Oczywiście czeka cię korekta, formatowanie - ale jak jakość "zaszytych" w PDF'fie grafik jest dobra to nie będzie dużo roboty.

Swoją ścieżką wyślij Zegarową Bombonierkę :D temu kut.... który "zrobił" taki PDF. Niech takie skany zapisuje jako DjVu bo do tego słuzy a nie w PDF'ach.

Kradzionemu lub darowanemu koniowi nie zagląda się w zęby.

Autor:  Rhavir [ 04 maja 2013 19:21:03 ]
Tytuł:  Re: Skany książki

NIE CO WIĘKSZEGO ? Boprawdy trudno 40 Megowy plik nazwać NIE CO większym gdy "czysty" plik zajmuje 1 - 2 Mega. Bez jaj, proszę.

Ja wychodzę z założenia, że jak coś robimy to róbmy to PORZĄDNIE - jak udostępniamy skany to mamy od tego format DjVu - który jest SPECIALNIE do skanów przeznaczony. A nie PDF z zaszytymi JPEG'ami.

A w ogóle to jak się bierzemy za skanowanie i "wrzucanie" książek to SZANUJMY innych i dokończmy to co zaczęliśmy. Przpuśćmy skany via OCR - zawsze znajdą się chćetni by nasze dzielo "obrobić" - poprawić błędy, sformatować.

W ten sposób okazujemy szacunek innym.

Ja wole NIE MIEĆ wcale ksiązki niż miec ją w postaci gów... skanów, kiepskiej jakości najczęściej. A to że za darmo nie oznacza, że kiepsko - są tacy (chwała im) którzy jakoś potrafią "obrobić" swoje wstawki.

Autor:  Tzigi [ 05 maja 2013 23:17:18 ]
Tytuł:  Re: Skany książki

Rhavir napisał(a):
A w ogóle to jak się bierzemy za skanowanie i "wrzucanie" książek to SZANUJMY innych i dokończmy to co zaczęliśmy. Przpuśćmy skany via OCR - zawsze znajdą się chćetni by nasze dzielo "obrobić" - poprawić błędy, sformatować.

W ten sposób okazujemy szacunek innym.

Ja wole NIE MIEĆ wcale ksiązki niż miec ją w postaci gów... skanów, kiepskiej jakości najczęściej. A to że za darmo nie oznacza, że kiepsko - są tacy (chwała im) którzy jakoś potrafią "obrobić" swoje wstawki.

Tylko teraz zakładasz, że skanujemy książki współczesne. Czy jestem Googlem, żeby mi OCR dobrze działał np. na takiej książce? NB Googlowi też działa nienajlepiej (ale chwała mu za to, że w ogóle działa!).

Autor:  Rhavir [ 06 maja 2013 9:52:31 ]
Tytuł:  Re: Skany książki

Skanowałem gorsze książki - wystarczy np. ABBYY FineReader - sam ładnych parę lat temu "udzielałem" się w grupie skanującej ksiązki. Sam zeskanowałem ładnych parę książek, w tym kilka, które były "kserówkami" o dużo gorszej czytelności.
Trzeba CHCIEĆ i tyle - skany "obrabiamy" - ja sam dokonywałem znacznych zmian (kontrast, "wycianie" kolorów itd. ) następnie OCR, korekta.

I robiłem to w czasach Win 98 - więc proszę nie mów, że się nie da.

Natomiast JAK już dajemy skany to do cięzkiej cho... mamy FORMAT DjVu który jest SPECIALNIE to tego celu przeznaczony. I skan DjVu nie zajmuje 50 Mega.

Autor:  Khouri [ 06 maja 2013 10:13:21 ]
Tytuł:  Re: Skany książki

Rhavir napisał(a):
Natomiast JAK już dajemy skany to do cięzkiej cho... mamy FORMAT DjVu który jest SPECIALNIE to tego celu przeznaczony. I skan DjVu nie zajmuje 50 Mega.



Ja się tylko wtrącę co do formatów. Popularność pdfa dorównuje nieznajomości tego formatu i ludzie najczęściej posługują się nim jak siekierą.
Pdfa można zrobić nawet z placków ziemniaczanych. Można go perfekcyjnie zoptymalizować (z jpg które są umiejętnie skompresowane, z tifów z włączona kompresją, wreszcie - nawet z plików tekstowych). Osobiście nienawidzę książek w formacie pdf, bo pdf jest formatem, który gwarantuje niezmienność wbudowanych treści a czytnik jest urządzeniem, które najlepiej działa z treściami dynamicznymi - w efekcie musimy czytać tak, jak nieświadomie zaplanował twórca pdfa (nieświadomie, bo gdyby używał mózgu nie robił by pdfa do zwykłej książki).

Nie wiem czy djvu dobrze się sprawuje na czytnikach - z tego co kojarzę najbardziej popularny czytnik czyli Kindle tego nie obsługuje, stąd zapewne mała popularność tego formatu. Natomiast zalew spiraconych książek w pdfach bierze się stąd, że microsoft umieścił moduł acrobata w swoim pakiecie i mamy pliki przygotowane przez ludzi, którzy zwyczajnie nie rozumieją takich pojęć jak kompresja i optymalizacja. Co ciekawe, panuje przekonanie, że pdf to najlepszy format pliku do takich akcji. Pdf to najlepszy format, ale do druku, nie do czytania na czytnikach...

Autor:  Tzigi [ 06 maja 2013 14:24:51 ]
Tytuł:  Re: Skany książki

Rhavir napisał(a):
Skanowałem gorsze książki - wystarczy np. ABBYY FineReader - sam ładnych parę lat temu "udzielałem" się w grupie skanującej ksiązki. Sam zeskanowałem ładnych parę książek, w tym kilka, które były "kserówkami" o dużo gorszej czytelności.
Trzeba CHCIEĆ i tyle - skany "obrabiamy" - ja sam dokonywałem znacznych zmian (kontrast, "wycianie" kolorów itd. ) następnie OCR, korekta.

I robiłem to w czasach Win 98 - więc proszę nie mów, że się nie da.

To pokaż mi porządny automatyczny OCR na jakiejkolwiek siedemnastowiecznej książce. Spróbuj chociażby odróżnić "I" od "s". Śmiało. Nic nie napisałam o poprawianiu kontrastu, poziomów itd. Odnosiłam się do tego, że uznałeś, że w każdym skanie należy zaszyć warstwę tekstową. I sugerowałeś, że wystarczy ją zrobić automatycznie. Pokazałam Ci książkę, na której nawet dobry program OCR -bo ten program działający w Google Books jest naprawdę niezły - się wykłada. Mnie akurat interesują tylko takie książki i tylko do ich czytania służy mi czytnik (współczesną beletrystykę wolę na celulozie).

Autor:  Khouri [ 06 maja 2013 18:48:10 ]
Tytuł:  Re: Skany książki

Tzigi napisał(a):
. Mnie akurat interesują tylko takie książki i tylko do ich czytania służy mi czytnik (współczesną beletrystykę wolę na celulozie).



No to ja uważam, że kompletnie źle wybrałeś urządzenie do czytania takich plików. Nie wiem jaki masz format czytnika, ale chyba inwestycja w 10 cali byłaby pierwszym krokiem do tego by polepszyć jakość czytania. Po drugie - jeśli skany są w wysokiej rozdzielczości (a do tego sztucznie napompowane rzekomą jakością i powolne jak krowy) - to lepszy procesor czyli tablet, bo zestarzejesz się zanim przewrócisz stronę. Nie ważne co się skanuje, ważne jak.

Autor:  Rhavir [ 06 maja 2013 22:31:57 ]
Tytuł:  Re: Skany książki

Proszę bardzo : ABBYY FineReader - bardzo dobry, sprawdzony.

A co do źródeł "gorszej" jakości - trzeba się przyłozyć. Jak miałem kiepskie "kserówki" to NAJPIERW obrabialem skany, czyściłem tło, wyostrzalem tekst, nakładałem filtry usuwające "zakłócenia" - ogólnie mówiąc za pomoca softu jak Photoshop czyścilem i przygotowywałem skany do OCR'u - następnie stosowalem ABBYY FineReader i nie było problemów.

Przedstawiona przez Ciebie książka jest calkiem wysokiej jakości, ma ZDECYDOWANIE rózne kolory tla i liter oraz ma wyraźnie i kontrastowe czcionki, co pozwala na szybką i stosunkowo łatwa separację od tła.

DjVu - to format opracowany specialnie do przechowywania skanów książek (najczęściej) - daje on pliki o jakości porównywalnej z oryginałem przy malych rozmiarach plików. DjVu umożliwia podzielnie obrazu na warstwy np. warstwę kolorową tła i warstwę Czarno-Białą tekstu - przy czym każda warstwa może mieć różną jakość, np. Tło 100 dpi a tekst 300 dpi. Moża też w przypadku ilustracji zaszyć w pliku obrazy w Jpeg, Tiff itp.
Do tego dzięki zastosowanej kompresji w stosunku do "gołych" Jpegów czy Tiffów pliki są mniejsze nawet o 10 razy a w stosunku do PDF'ow o 5 do 10 razy.
Większoć bibliotek cyfrowych stosuje DjVu do przechowywania zbiorów skanów.

A czemu nie jest popularny ? Raz Amazon ma glęboko w du... inne formaty niż zwój własny - a że jest prawie monopolistą więc i format DjVu nie jest popularny. A po drugie do czytników DjVu nadaje się równie dobrze jak PDF - czyli do du... Bo to SZTYWNY format mający zachwać oryginalne proporcje i rozkład stron - dokładnie jak PDF - a wiemy, że PDF i inne "sztywne" formary są wyjąkowo kiepskie na czytnikach.

Zresztą zarówno PocketBook jak i Onyx czytają DjVu - więc nie mamy kłopotów - sam posiadam sporo ksiązek w formacie DjVu i sprawdza się ZNACZNIE lepiej niż PDF ze skanami.

Autor:  Tzigi [ 06 maja 2013 23:39:25 ]
Tytuł:  Re: Skany książki

Khouri napisał(a):
No to ja uważam, że kompletnie źle wybrałaś urządzenie do czytania takich plików.

Fixed that for you.

Khouri napisał(a):
Nie wiem jaki masz format czytnika, ale chyba inwestycja w 10 cali byłaby pierwszym krokiem do tego by polepszyć jakość czytania. Po drugie - jeśli skany są w wysokiej rozdzielczości (a do tego sztucznie napompowane rzekomą jakością i powolne jak krowy) - to lepszy procesor czyli tablet, bo zestarzejesz się zanim przewrócisz stronę.

Ech, czytnik mi służy do tego, żeby był ze mną tam, gdzie nie może być laptop (no i do tego, żebym nie musiała drukować tysięcy stron na marnej drukarce laserowej - i tak, drukuję 4 strony na jednej, więc już ekran KT jest dla mnie większą opcją). 10 calowy czytnik jest wielkości i prawie wagi mojego laptopa. Po co mi zatem on? A tablet to zuo - ja komórkę ładuję dwa razy dziennie, to tablet wyładuję w pół dnia.

Rhavir napisał(a):
Proszę bardzo : ABBYY FineReader - bardzo dobry, sprawdzony.

A co do źródeł "gorszej" jakości - trzeba się przyłozyć. Jak miałem kiepskie "kserówki" to NAJPIERW obrabialem skany, czyściłem tło, wyostrzalem tekst, nakładałem filtry usuwające "zakłócenia" - ogólnie mówiąc za pomoca softu jak Photoshop czyścilem i przygotowywałem skany do OCR'u - następnie stosowalem ABBYY FineReader i nie było problemów.

Przedstawiona przez Ciebie książka jest calkiem wysokiej jakości, ma ZDECYDOWANIE rózne kolory tla i liter oraz ma wyraźnie i kontrastowe czcionki, co pozwala na szybką i stosunkowo łatwa separację od tła.


Coś ciężko Ci idzie czytanie ze zrozumieniem. W ogóle nie piszesz o tym, o czym ja pisałam. Nie chodzi mi o obróbkę obrazu zaszytego w pliku pdf/djvu (w razie wielkich problemów można nawet każdą pojedynczą stronę dopieszczać w Photoshopie) tylko o sensowność tego stwierdzenia:
Rhavir napisał(a):
A w ogóle to jak się bierzemy za skanowanie i "wrzucanie" książek to SZANUJMY innych i dokończmy to co zaczęliśmy. Przpuśćmy skany via OCR

Podałam Ci przykład dużej grupy książek, na której OCR się wykłada, bo nie jest "nauczony" rozpoznawania dziwacznych czcionek. Ale może nie jest to dość wyrazisty przykład. Weźmy zatem Eurypidesa w wydaniu Aldine. Z-OCR-uj mi to porządnie :D

Autor:  T4ng10r [ 07 maja 2013 8:00:58 ]
Tytuł:  Re: Skany książki

@Tzigi proponuje nie dramatyzować tak odnośnie masy. Faktem jest, że czytniki 10" (blisko dwa razy większe od popularnych maluchów) ważą blisko dwa razy więcej. Czyli Kindle PW 250g, a Onyx M92 - 520g. Nowy duży IPad to masa 650g. Z tego co widzę to laptopy mniej niż 1kg raczej nie ważą.
Dwa - zgadza się, że duży czytnik uwalnia od kłopotów z komfortem czytania PDFów. To brzmi jak banalny truizm, jednak ktoś kto doświadczył takiej przyjemności w pełni to zrozumie.
Trzy - skany są skanami. Zgadza się, że dostarczenie ich w formacie PDF jest nagminne, bo jest on NAJŁATWIEJ dostępny. Rhavir może i masz rację, że DJVU dałoby lepsze wyniki, a Twoje procedury OCR zasługują na zapisanie w osobnym wątku (jako samouczek). Jednak nie ma wielu tak rzetelnych osób. W końcu liczy się ilość ściągnięć, a jakość ... też pomysł ;)

Strona 1 z 2 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/