Teraz jest 19 kwi 2024 4:35:50




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 42 ]  Przejdź na stronę Poprzednia strona  1, 2, 3
Czy da się czytać zeskanowane książki? 
Autor Wiadomość
Użytkownik

Dołączył(a): 30 sty 2011 0:11:04
Posty: 195
eCzytnik: Onyx Boox M90
Post Re: Czy da się czytać zeskanowane książki?
t3d napisał(a):
Ostrzegam, że nawet jeśli sobie to skonwertujesz OCRem, albo kupisz w mobi czy epubie, to na 6" ekranie kod będzie się czytać TRAGICZNIE.

To pewnie i na 10'' też nie jest wesoło?


16 maja 2011 10:42:46
Zobacz profil
Użytkownik

Dołączył(a): 30 sty 2011 0:11:04
Posty: 195
eCzytnik: Onyx Boox M90
Post Re: Czy da się czytać zeskanowane książki?
garnizon napisał(a):
To pewnie u mnie było gorzej, bo czytnik wyświetlał jako pdf z tekstem, a nie pdf-skan. Nie chciało mi się podłączać kabelka, a przez mail od razu skonwertował (nawet się tego nie spodziewałem, wcześniej nie próbowałem nic podobnego).

Skonwertował tzn umieścił obraz w PDF-ie :)
Chyba raczej nie rozpoznał tekstu bo nawet gdyby się na to targnął, mielibyśmy w wyniku ładne krzaczki :)


16 maja 2011 10:45:41
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2835
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Czy da się czytać zeskanowane książki?
discharge napisał(a):
t3d napisał(a):
Ostrzegam, że nawet jeśli sobie to skonwertujesz OCRem, albo kupisz w mobi czy epubie, to na 6" ekranie kod będzie się czytać TRAGICZNIE.

To pewnie i na 10'' też nie jest wesoło?

Jest o wiele, wiele lepiej. Chodzi przede wszystkim o długość linii. Na małych ekranach do trudności z analizowaniem działania kodu dochodzi jeszcze zagadnienie zastanawiania się, czy w tym wypadku autor kodu dał specjalnie nową linię, czy też czytnik przerzucił resztę wersu do nowej linii, bo w poprzedniej już mu się nie zmieściło... Kod często jest pisany z wcięciami, żeby był czytelniejszy, a w przypadku takiego "maszynowego" dzielenia tekstu masz naprawdę zagwozdkę, bo wszystkie estetyczno-typograficzne konwencje szlag trafia i masz sieczkę.
Podobnie z tabelkami. Wyobraż sobie, że nagle w połowie tabeli zmienia się strona, a na drugiej nie widzisz co jest w tytułach kolumn. Jeśli taka tabelka jest bardziej złożona, to kilka razy będziesz musiał się cofać, żeby ją przeczytać ze zrozumieniem. DX ma ponad 2 razy większą powierzchnię ekranu, więc takie probelmy zdarzają się bez porównania rzadziej.

PS. Proszę nie rób nowego posta do każdego cytatu. W czasie pisania możesz kilkukrotnie użyć przycisku "quote" - posty interlokutorów masz widoczne pod polem wpisywania tesktu.

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


16 maja 2011 11:18:03
Zobacz profil WWW
Użytkownik

Dołączył(a): 13 paź 2010 12:12:54
Posty: 301
eCzytnik: Kindle
Post Re: Czy da się czytać zeskanowane książki?
discharge w sumie nie wiem, co ta konwersja zrobiła. Mogę poruszać się po tekście, tak jakby rozpoznał wyrazy i znaki, nie jest to dla niego sam obrazek. Ale kiedy chcę zrobić zaznaczenie, to nie działa. Mogę tylko zrobić zakładkę albo notatkę.

t3d, wiem jak zrobić zrzut ekranu z Kindla, ale z doświadczenia wiem też, że wyświetlany na pc wygląda inaczej i niekoniecznie musi być pomocny.


16 maja 2011 11:43:51
Zobacz profil
Użytkownik

Dołączył(a): 30 sty 2011 0:11:04
Posty: 195
eCzytnik: Onyx Boox M90
Post Re: Czy da się czytać zeskanowane książki?
t3d napisał(a):
Chodzi przede wszystkim o długość linii. Na małych ekranach do trudności z analizowaniem działania kodu dochodzi jeszcze zagadnienie zastanawiania się, czy w tym wypadku autor kodu dał specjalnie nową linię, czy też czytnik przerzucił resztę wersu do nowej linii, bo w poprzedniej już mu się nie zmieściło... Kod często jest pisany z wcięciami, żeby był czytelniejszy, a w przypadku takiego "maszynowego" dzielenia tekstu masz naprawdę zagwozdkę, bo wszystkie estetyczno-typograficzne konwencje szlag trafia i masz sieczkę.

Ok. To w pliku tekstowym (formatowanym lub nie). Jeste świadom tego mankamentu bo na razie czytuję na 3,2''.
A mnie wciąż idzie o ten nieszczęsny skan książki. Tam nie ma problemu z zawijaniem linii bo wszystko jest jak drukarnia dała - na sztywno. Problem jest z czytelnością.
Czy na tych 10'' da się czytać zeskanowaną stronę B5 (czy C5) w poprzek w jakości godnej wydanych 1500 zł na czytnik?
Cytuj:
PS. Proszę nie rób nowego posta do każdego cytatu. W czasie pisania możesz kilkukrotnie użyć przycisku "quote" - posty interlokutorów masz widoczne pod polem wpisywania tesktu.

Jeśli podejrzysz poprzednie strony zauważysz, że używam wielu cytatów w jednym poście.
Pisząc dany post trudno mi przewidzieć, że za chwilę pojawi się inny. Musiałbym edytować poprzednie posty a wtedy ktoś kto już przeczytał starą wersję nie czytałby drugi raz i pisałbym na próżno. :)


16 maja 2011 12:01:04
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Czy da się czytać zeskanowane książki?
discharge napisał(a):
Musiałbym edytować poprzednie posty a wtedy ktoś kto już przeczytał starą wersję nie czytałby drugi raz i pisałbym na próżno. :)

Ja w kwestii technicznej - u nas, jeśli edytowany post jest ostatnim w temacie, uaktualnia się jego data stworzenia, a także jest oznaczany jako nieprzeczytany. Nie ma więc powodu, jeśli nasz post jest ostatnim, by dokładać do tematu kolejny - można spokojnie go zedytować.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


16 maja 2011 12:05:42
Zobacz profil WWW
Użytkownik

Dołączył(a): 01 sty 2011 19:32:38
Posty: 172
Post Re: Czy da się czytać zeskanowane książki?
Cytuj:
Chyba raczej nie rozpoznał tekstu bo nawet gdyby się na to targnął, mielibyśmy w wyniku ładne krzaczki :)
gdybyś miał kody w formacie txt a nie zdjęcia, skonwertowałyby Ci się czytelnie.


16 maja 2011 22:31:07
Zobacz profil
Użytkownik

Dołączył(a): 30 sty 2011 0:11:04
Posty: 195
eCzytnik: Onyx Boox M90
Post Re: Czy da się czytać zeskanowane książki?
maruda napisał(a):
gdybyś miał kody w formacie txt a nie zdjęcia, skonwertowałyby Ci się czytelnie.

OCR to konwertowanie obrazu na tekst. Obraz nie zawiera znaków ale ich obraz. OCR "czyta" obraz i tworzy tekst.
Więc
maruda napisał(a):
gdybyś miał kody w formacie txt a nie zdjęcia
gdybym miał "txt", nie byłoby sprawy dla OCR'a w ogóle.


16 maja 2011 22:53:21
Zobacz profil
Użytkownik

Dołączył(a): 01 sty 2011 19:32:38
Posty: 172
Post Re: Czy da się czytać zeskanowane książki?
dziękuję doprawdy za wyjaśnienie.
Mam na myśli to, że jaki ma sens w ogóle powoływanie się na calibre w kontekście co może zrobić a czego nie, skoro calibre nie odczyta znaków dlatego, że fotografie traktuje jako fotografie i takimi je zostawi, natomiast Twoje wypowiedzi zdają się mieć wydźwięk, jakby niemożliwością było przerobienie przez program kodów, które Cię interesują.


18 maja 2011 0:34:53
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Czy da się czytać zeskanowane książki?
Proszę Państwa, prosimy zabijać się poza barem, bo tu potem nie ma kto sprzątać!

Podsumowując dyskusję - na 6" duże PDFy czyta się średnio przyjemnie, tym bardziej duże strony (A4), które zostały zeskanowane. Jeśli ktoś chce to robić (skany są złe!), to znacznie lepiej nadadzą się do tego duże eCzytniki (9.7"), przy czym Amazon chyba odpuścił sobie aktualizowanie softu DXa, więc rozsądnie jest też popatrzeć na Pocketbooka 902/3 i Onyx Booxy M90/1.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


18 maja 2011 2:34:17
Zobacz profil WWW
Użytkownik

Dołączył(a): 30 sty 2011 0:11:04
Posty: 195
eCzytnik: Onyx Boox M90
Post Re: Czy da się czytać zeskanowane książki?
Mori napisał(a):
Amazon chyba odpuścił sobie aktualizowanie softu DXa, więc rozsądnie jest też popatrzeć na Pocketbooka 902/3 i Onyx Booxy M90/1.

Mnie się ten Amazon od początku nie podobał. To trochę jak Microsoft - fajerwerki po wierzchu i mają większość rynku. A jak coś poważniejszego to się szuka Unixa gdyż Windows pod maską to stara dobra Syrenka :) (jakby młodzież nie wiedziała, kiedyś było takie fatalne auto). Zresztą to znamienne dla takich co wydają dla wymagających ładu wizualnego jako cechy naczelnej.
maruda napisał(a):
Mam na myśli to, że jaki ma sens w ogóle powoływanie się na calibre w kontekście co może zrobić a czego nie, skoro calibre nie odczyta znaków dlatego, że fotografie traktuje jako fotografie i takimi je zostawi

Czy ja jednym słowem wspomniałem o tym całym Calibre? Sama rozumiesz - jak widzę powyżej - że na nic sie tu nie zda.

maruda napisał(a):
natomiast Twoje wypowiedzi zdają się mieć wydźwięk, jakby niemożliwością było przerobienie przez program kodów, które Cię interesują.

Jaki program? OCR? Wszystko jest możliwe tylko trzeba oszacować koszty (czas, praca). Jeśli wydrukujesz stronę A4 sporządzoną czcionką powiedzmy Times 12 w procesorze tekstu (np. Word czy Writer) i wydrukujesz czarno na białym a następnie wsadzisz na szybę i zeskanujesz po czym wyślesz do OCR (chyba z dostępnycgh Fine Reader jest najsprawniejszy), to otrzymasz plik tekstowy (np. Doc) z rozpoznanym tekstem gdzie znajdzie się 10-20 "wątpliwości" wbudowanej "sztucznej inteligencji" (tak zwanej bo z inteligencją ma to tyle wspólnego co że była potrzebna do jej stworzenia). Zwykle taki proponowany znak jest błędny. Do tego kilka błędów niezauważonych przez OCR. Jeśli zamiast Times zastosujesz czcionkę Courier (większość kodów w książkach jest pisana tą czcionką) to liczba błędów wzrośnie powiedzmy 2 razy. Bo czcionka ma cieńszy krój i jest mniej popularna więc może owe sztuczne inteligencje mają gorsze wzorce? Generalnie - cieńsza linia, mniejsza tolerancja na "ubytki" w rozpoznawanym znaku.
Do tego trzeba wziąć fakt, że w przeciwieństwie do powieści, w tekście programistycznym jest masa znaków niealfanumerycznych czyli wszelkie nawiasy (już ich rozróżnienie stanowi dla OCR powszedni problem), ukośniki, "ampersandy" :), operatory matematyczne, itp. A w kodzie programu nie ma dowolności - poprawność tych znaków dla wykonania programu ma znaczenie krytyczne. Oczywiście czytając można się domyśleć jak być powinno ale jaki sens czytania usianego błędami gruzu? To tak jakby uczyć się gramatyki angielskiej z książki naszpikowanej błędami ortograficznymi i tłumaczeniowymi. Da się ale po prostu razi i uprzykrza naukę.
Tak więc strona z kodami rozpoznana przez taki OCR to sterta gruzu i nie warto jej poprawiać. IMHO łatwiej przepisać książkę. Mniej stresu.


18 maja 2011 20:43:46
Zobacz profil
Użytkownik

Dołączył(a): 30 sty 2011 0:11:04
Posty: 195
eCzytnik: Onyx Boox M90
Post Re: Czy da się czytać zeskanowane książki?
garnizon napisał(a):
Tak - fit to screen na dłuższym boku jest słabo czytelny, tj. da się w sumie całość rozczytać, ale trochę trzeba się domyślać, np. n potrafi wyglądać jak r, bo gubi nóżkę.


Możliwe, że Tobie - Garnizon - zrobiło wtedy GIF z tego obrazka i dlatego go postrzępiło.
Doczytałem teraz (bo wracam do tematu gdyż czas coś kupić), że MOBI może zawierać tylko GIFy. Ty pisałeś że PDF ale nie wiem co to był za konwerter. Mógł też zmniejszyć rozdzielczość bitmapy.

maruda napisał(a):
tak, k3.
U mnie plik był całkowicie czytelny (pdf był formatu a4), bez domyslania się, nawet przy widoczności 100% czyli całej szerokości str. Więc przy 150 % było jeszcze lepiej i wyraźniej (nie chce mi się przeliczać, zakładam, że 150% widoczności tekstu dla ekranu 6 calowego dałoby takiej wielkości czcionkę dla całej strony dla ekranu 10 cali).
Ogólnie jak dla mnie największy problem stanowiłoby to, że czcionka w oryginale wąska i chuda, przez co gubi się w czytniku, gdyby była lepsza raczej nie byłoby wg mnie problemu z tym, że to miałyby być skany.


To obiecująca wiadomość (odświerzam temat po ptrzerwie). Choć wcześniej pisałaś, że:

maruda napisał(a):
z ciekawości wrzuciłam Twoją fotkę i zrobilam pdf i skonwertowałam.
Jako pdf wygląda to mało imponująco, tekst jest drobny, przydałaby się inna czcionka, ale bez zapisania pliku jako tekstu nic z tym nie zrobisz. Przydałby się więc jak to w przypadku pdf większy ekran. Ale i tak wygląda to chudo po powiększeniu (przy 150 % nie powala, przy 200 zaczyna to być w miarę sensowne).
Wrzuciłam też plik w calibre, ale co było dp przewidzenia, program potraktował to po prostu jak obraz. Więc nici z powiększenia tekstu itp, tekst mały i drobny
W obu przypadkach to nie szarość ekranu stanowi problem.

Krótko mowiąc najlepiej chyba by było, żebyś rzeczywiście przerobił skany na teksty i dopiero potem na docelowy format, inaczej nie widzę specjalnie sensu.


W każdym razie przygotuję sobie parę plików testowych i wybiorę się do sklepu. Jak testy wypadną pomyślnie pomysle o zakupach.

Dziękuję Wam za ówczesna pomoc.


11 cze 2011 22:30:43
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 42 ]  Przejdź na stronę Poprzednia strona  1, 2, 3


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 1 gość


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron