eKsiążki
https://forum.eksiazki.org/

Biblia na czytnik
https://forum.eksiazki.org/ogolnie-o-eczytnikach-f155/biblia-na-czytnik-t9540-30.html
Strona 3 z 5

Autor:  airs [ 25 sie 2011 11:35:33 ]
Tytuł:  Re: Biblia na czytnik

t3d napisał(a):
Trzeba jednak użyć jakiegoś obejścia w przypadku nazw ze spacjami, jak "2 J". na linuksie można całą nazwę opakować w cudzysłowy, albo dać \ przed spacją. Jak się z tym uporać na windowsie nie wiem :D

Działa poprawnie pod Windows XP - też można opakować w "cudzysłowy" i "2 J" generuje się :)

Pozostaje mi kwestia interpretacji z okna pod windą polskich znaków do UTF-8, bo Łk nie wchodzi, pisząc komunikat:
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 0-1: invalid data" lub
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 1-2: unexpected end of data", ale to tylko 2 księgi ;) - muszę pokombinować ze znakami.

Zawartość jest poprawna - bardzo fajnie - bo o to chodziło.
Świetna robota !! Brawo!

[Edit:] PS. W wynikowym html jest poprawnie, ale ta małpa Calibre po konwersji do innego formatu "gubi" w spisie treści (zwartość jest) wszystkie księgi które są numerowane, jak np. 1 P; 2 P w NT :|

Autor:  t3d [ 25 sie 2011 11:52:02 ]
Tytuł:  Re: Biblia na czytnik

airs napisał(a):
Pozostaje mi kwestia interpretacji z okna pod windą polskich znaków do UTF-8, bo Łk nie wchodzi, pisząc komunikat:
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 0-1: invalid data" lub
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 1-2: unexpected end of data", ale to tylko 2 księgi ;) - muszę pokombinować ze znakami.

Jest jedno nieładne rozwiązanie, które możesz wypróbować.
Dodaj
Kod:
if sys.getdefaultencoding() == "ascii":
    reload(sys)
    sys.setdefaultencoding('utf-8')

przed linią
Kod:
if len(sys.argv) != 2:

I proszę daj znać, jak to działa. Zastanawiam się tylko, czy to w przyszłości nie popsuje na zapisywania do pliku...

Te moje wątpliwości wynikają z tego, że ten skrypt to mój pierwszy kod w pythonie (poza receptami i pluginami z calibre, które nie są samodzielne) :P

Autor:  airs [ 25 sie 2011 13:07:52 ]
Tytuł:  Re: Biblia na czytnik

t3d napisał(a):
Jest jedno nieładne rozwiązanie, które możesz wypróbować.

Myślę, że problem tkwi nie w pythonie i kodzie tylko w samych Windowsach... Spróbowałem i zachowuje się dokładnie tak samo z dodatkiem, który zaproponowałeś, jak i bez niego.

Windows (XP) ma wspracie dla UTF-8, ale w linii komend (cmd) jeśli wprowadza się polskie litery, on na wejściu podaje je w kodowaniu ANSI (CP1250), co widać po odpowiedziach ze skryptu (litera "Ł" jako kod "0xa3", a "ł" jako "0xb3") - co nie ma odpowiedników w UTF-8 (sprawdzałem w http://mynthon.net/howto/-/charset-konwersja-cp1250-bytes-to-utf8-bytes.txt).

Rozwiązaniem było by tu wprowadzenie w poleceniu takiego znaku, który (w bajtach) miałby prawidłowy odpowiednik w UTF-8, ale nie mam w tej chwili do tego głowy :?

Najważniejszy cel osiągnięty - można wygenerować kompletny tekst Pisma Świętego (ST i NT) z przypisami, w strawnym dla dowolnego czytnika e-ink formacie, co Ci się udało bardzo dobrze. :)
Stronie Deon.pl można zaufać, że jest wszystko.

PS. Co do generowania spisu treści to niepotrzebnie zwaliłem całą winę na Calibre, bo problem jest raczej w interpretacji ToC w ePUB - w mobi jest wszystko dobrze.
[Edit:] A jednak Calibre ;) - znalazłem w logu coś takiego:
Kod:
Creating EPUB Output...
Removing invalid fragment identifier u'Kp\u0142' from TOC
Removing invalid fragment identifier '1 Sm' from TOC
Removing invalid fragment identifier '2 Sm' from TOC
Removing invalid fragment identifier '1 Krl' from TOC
Removing invalid fragment identifier '2 Krl' from TOC
Removing invalid fragment identifier '1 Krn' from TOC
Removing invalid fragment identifier '2 Krn' from TOC
Removing invalid fragment identifier '1 Mch' from TOC
Removing invalid fragment identifier '2 Mch' from TOC
Removing invalid fragment identifier 'Rdz 1P1' from TOC
Removing invalid fragment identifier 'Rdz 1P2' from TOC
Removing invalid fragment identifier 'Rdz 1P3' from TOC
Removing invalid fragment identifier 'Rdz 2P4' from TOC

i dla Nowego odpowiednio:
Kod:
Creating EPUB Output...
Removing invalid fragment identifier u'\u0141k' from TOC
Removing invalid fragment identifier '1 Kor' from TOC
Removing invalid fragment identifier '2 Kor' from TOC
Removing invalid fragment identifier '1 Tes' from TOC
Removing invalid fragment identifier '2 Tes' from TOC
Removing invalid fragment identifier '1 Tm' from TOC
Removing invalid fragment identifier '2 Tm' from TOC
Removing invalid fragment identifier '1 P' from TOC
Removing invalid fragment identifier '2 P' from TOC
Removing invalid fragment identifier '1 J' from TOC
Removing invalid fragment identifier '2 J' from TOC
Removing invalid fragment identifier '3 J' from TOC
(...)

Autor:  t3d [ 25 sie 2011 16:38:20 ]
Tytuł:  Re: Biblia na czytnik

airs napisał(a):
t3d napisał(a):
Jest jedno nieładne rozwiązanie, które możesz wypróbować.

Myślę, że problem tkwi nie w pythonie i kodzie tylko w samych Windowsach... Spróbowałem i zachowuje się dokładnie tak samo z dodatkiem, który zaproponowałeś, jak i bez niego.

Windows (XP) ma wspracie dla UTF-8

A, bo ja na 7 testowałem, a on ma w cmd ascii. W takim razie dodaj samo
Kod:
reload(sys)
sys.setdefaultencoding('utf-8')

bez wcięć i zobaczymy :)

airs napisał(a):
PS. Co do generowania spisu treści to niepotrzebnie zwaliłem całą winę na Calibre, bo problem jest raczej w interpretacji ToC w ePUB - w mobi jest wszystko dobrze.
[Edit:] A jednak Calibre ;) - znalazłem w logu coś takiego:
Kod:
Creating EPUB Output...
Removing invalid fragment identifier u'Kp\u0142' from TOC
Removing invalid fragment identifier '1 Sm' from TOC
Removing invalid fragment identifier '2 Sm' from TOC

W zasadzie nic dziwnego, bo adres odsyłacza ze spacją w środku jest sprzeczny ze standardem HTML i tak naprawdę nic nie ma obowiązku z tym działać. Akuat przy konwersji na mobi w calibre nie widziałem żeby protestował, więc przymknąłem na to oko. Podobnie z polskimi znakami w adresie odsyłacza. Nie jest probemem, żeby to naprawić, choć skrypt nieco zwolni, bo będzie miał więcej podmian do zrobienia :)

airs napisał(a):
Stronie Deon.pl można zaufać, że jest wszystko.

Jakoś szczególnie się nie przykładam do sprawdzania, a ciągle jakieś błedy widzę w związku z przypisami. Ale to można zgłaszać na maila (którego czytają i reagują :D).

EDIT: Poprawiam teraz linki w odsyłaczach. Nie będzie w nich spacji ani polskich znaków. Powinno się ładnie konwertować na epub. Rozgrzebałem, myślałem, że jest już dobrze i wykomitowałem, ale okazuje się, że nie jest. Efekt jest taki, że bierząca wersja nie działa...

Do odwołania należy korzystać z tej: https://github.com/t3d/project_b/blob/b ... oject_b.py

Autor:  Stephen King [ 25 sie 2011 21:05:32 ]
Tytuł:  Re: Biblia na czytnik

W XXI jeszcze ktoś czyta te starożytne bazgroły*? I to na czytniku? :) Mogę w zamian polecić dobre podręczniki do biologii i fizyki ;) Kiedyś czytałem Stary Testament, ale pełny jest brutalności i bezsensownej przemocy. Szybko zaprzestałem lektury tego... "dzieła".





* cytat z "Root of all evil" - Richard Dawkins

Autor:  airs [ 25 sie 2011 21:45:12 ]
Tytuł:  Re: Biblia na czytnik

@Stephen: Te "starożytne bazgroły" to List do ludzi i o ludziach, a że jesteśmy pełni brutalności i stosujemy bezsensowną przemoc, to taki i tekst. Ale jak się człowiek wsłucha, to jest w niej Duch -
- nie masz pojęcia ilu ludzi na świecie kocha tą Księgę 8)
Ale wątek nie o tym, tylko o imporcie na czytnik.
Cała Biblia jest duża i ciężka, a czytnik mieści się w kieszeni...

t3d napisał(a):
A, bo ja na 7 testowałem, a on ma w cmd ascii. W takim razie dodaj samo
Kod:
reload(sys)
sys.setdefaultencoding('utf-8')
bez wcięć i zobaczymy :)
Efekt taki sam jak poprzednio - czyli bez efektu ;) (input jest filtrowany przez WinXP, jak w 7 działa to można to zostawić)

t3d napisał(a):
EDIT: Poprawiam teraz linki w odsyłaczach. Nie będzie w nich spacji ani polskich znaków. Powinno się ładnie konwertować na epub. Rozgrzebałem, myślałem, że jest już dobrze i wykomitowałem, ale okazuje się, że nie jest. Efekt jest taki, że bierząca wersja nie działa...
Ale bardzo dobrze się konwertuje na ePUB - wyjątkiem jest ten ToC. Spis Ksiąg jest na poczatku (czyli jakby "Spis treści") a wszystkie linki działają, pod warunkiem, że zrobiło się całość do 1 pliku (ok 10MB html).
Jeśli ściągnie się w częściach, to działają linki w obrębie tej części - zewnętrzne po prostu nigdzie nie przenoszą.
Można uznać, że narzędzie jest OK.

U mnie czyta się dobrze na BOOX-ie html (najlepiej w ZIP), ePUB (przez FBReader), czy mobi, a na Kindlu oczywiście mobi (na tel. z Androidem też super :) ).

Autor:  mario82 [ 25 sie 2011 21:47:30 ]
Tytuł:  Re: Biblia na czytnik

Ja czytam i jestem wdzięczny osobom, które wkładają trud i poświęcają swój czas na przygotowanie tekstu Pisma Świętego na czytnik. (Dodam, że sam opracowuję tekst Biblii Jerozolimskiej z przypisami, nazwami rozdziałów a w NT dodatkowo z Praktycznym Komentarzem bp. Romaniuka i nie szkoda mi na to czasu.)
Gdybyś zagłębił się choć trochę w historię powstawania Biblii to nie podchodziłbyś do niej jak do podręcznika bo nie chodzi o sens dosłowny tekstu. Piszesz o brutalności i przemocy a czy dotarłeś do Pieśni nad Pieśniami albo Psalmów? Piękno tych ksiąg zdumiewa ludzi od 3 tysięcy lat.
Wiem, że to nie jest tematem tego wątku więc tylko raz jeszcze podziękuję "t3d" i "airs" za ich pracę.
Tak dalej ;-)

Autor:  t3d [ 25 sie 2011 22:55:57 ]
Tytuł:  Re: Biblia na czytnik

airs napisał(a):
Ale bardzo dobrze się konwertuje na ePUB - wyjątkiem jest ten ToC. Spis Ksiąg jest na poczatku (czyli jakby "Spis treści") a wszystkie linki działają, pod warunkiem, że zrobiło się całość do 1 pliku (ok 10MB html).
Jeśli ściągnie się w częściach, to działają linki w obrębie tej części - zewnętrzne po prostu nigdzie nie przenoszą.
Można uznać, że narzędzie jest OK.

Nie denerwuj mnie takim gadaniem. Komputer jest po to, żeby żyło się prościej i wygodniej. Jeśli jest jakaś głupia (albo mniej głupia) robota do zrobienia to lepiej wykorzystać do niej maszynę, niż samemu tracić czas, albo męczyć się z czymś niedorobionym. Nie wiem skąd się bierze taka spolegliwość wobec programistów. Może to lata tresury przy MS Windows tak wpływają na obniżenie oczekiwań? :)

Poprawka będzie jutro :D

Autor:  airs [ 26 sie 2011 9:51:23 ]
Tytuł:  Re: Biblia na czytnik

t3d napisał(a):
Może to lata tresury przy MS Windows tak wpływają na obniżenie oczekiwań? :)
:mrgreen: Dokładnie.

Autor:  t3d [ 26 sie 2011 16:49:49 ]
Tytuł:  Re: Biblia na czytnik

Informuję, że gdyby ktoś miał ochotę na spieranie się z użytkownikiem Stephen King, to jego post trafił do innego wątku: post77713.html#p77713
Jako bonus za tracenie mojego i innych czasu dostaje dodatkowo ostrzeżenie.

EDIT: Jest już poprawka błędów z kodowaniem. Adresy do linków są teraz bez polskich zanków i bez spacji. Walidator w3c czepia się jeszcze gdy na początku adresu odsyłacza jest cyfra, ale to chyba nie miesza szyków calibre, więc odkładam to na później.

Znalazłem też kolejny błąd w denonie. Zobaczcie sobie Kpł 3,16 i jego źródła HTML. Zaraz to będę zgłaszał :)

EDIT2: Jak się wrzuci całą treść do walidatora w3c to wychodzi 2529 błędów. Część z nich to wspomniane odsyłacze z cyfrą na pierwszej pozycji, ale jest też dużo niedomkniętych tagów <div> i multum słów w trójkątnych nawiasach, które przeglądarka próbuje interpretować jako tagi...
Np.
Kod:
Wtedy wybrałem <spośród głów waszych pokoleń> mężów mądrych

Kod:
jak&#261; <na nich> na&#322;o&#380;y m&#261;&#380;

Będę chciał to teraz wyprostować...

Autor:  Mori [ 26 sie 2011 22:29:09 ]
Tytuł:  Re: Biblia na czytnik

Ale już np. Kpł 3,16 tutaj jest ok: http://biblia.deon.pl/PS/03_KPL_/003T.HTM (http://biblia.deon.pl/PS/Biblia.html). A tu mają bez nawiasów: http://biblia.deon.pl/rozdzial.php?id=100, więc chyba tylko tu: http://biblia.deon.pl/widget/rozdzial.php?id=100 jest źle (swoją drogą - ileż wersji :/).

Autor:  t3d [ 26 sie 2011 23:03:41 ]
Tytuł:  Re: Biblia na czytnik

Nawiasy mają swoje znaczenie.
Cytuj:
<> - nawias trójkątny zamyka glosy lub miejsca w tekście przekazanym krytycznie niepewne.

Do tej pory wydawało mi się, że ta widgetowa wersja jest oparta na tej samej treści...

Po pozbyciu się niezgodnych ze standardem linków, zostało 245 błedów w NT i 399 w ST. Z tym, że praktycznie każdy taki fragment z nawiasami generuje kilka błędów w walidatorze. Poza tym są jeszcze błędy banalne, jak niedomknięte tagi <div> i błędy kuriozalne, jak tagi <przypis> z atrybutem "cel"

Ogólnie wygląda mi na to, że takich fragmentów "znikniętych" przez trójkątne nawiasy jest kilkadziesiąt.

Ah, i jeszcze jest kwestia źle ponumerowanych lub brakujących przypisów, których żaden walidator nie policzy...


Ogólnie zaczynam się zastanawiać, czy ta stara wersja http://biblia.deon.pl/PS/Biblia.html nie byłaby jednak łatwiejsza do obróbki (tzn. czy nie zawiera mniejszej ilości błędów).

Autor:  Mori [ 26 sie 2011 23:11:49 ]
Tytuł:  Re: Biblia na czytnik

Nie sugerowałem, że nawiasy są bez znaczenia - tylko, że w wersji widgetowej jest źle, w wersji oldschoolowej dobrze (tj. kodowane jako &gt; i &lt;), a w wersji "podstawowej" - pozbyli się ich. Bądź mądry i pisz wiersze.

Autor:  egzeg [ 28 sie 2011 22:56:29 ]
Tytuł:  Re: Biblia na czytnik

Zainteresowanym tematem polecam to:
http://jesuswanted.net/baza/prolog.html
jest tam ciekawe achiwum http://jesuswanted.net/arch/bibleDjVu.tgz

Format DjVu - powinno dać się przekonwertować na pdf.

mój czytnik (Icarus) nie czyta niestety DjVu - może ktoś kto ma ten format u siebie w czytniku spróbuje i napisze jak mu to działa?

ewentualnie tu jest bardzo interesujący przekład NT (pdf-y) z bogatymi komentarzami tłumacza:
http://www.feib.pl/index.php?dl=nt
niestety ST długo nie ma chociaż od dawna jest zapowiadany

Autor:  airs [ 29 sie 2011 0:49:44 ]
Tytuł:  Re: Biblia na czytnik

egzeg napisał(a):
http://jesuswanted.net/baza/prolog.html
jest tam ciekawe achiwum http://jesuswanted.net/arch/bibleDjVu.tgz

Ten pierwszy link jest ciekawy, bo na stronie są różne wersje łącznie z łacińską i grecką, również angielska i hebrajska, chociaż bez przypisów.
Archiwum rzeczywiście ciekawe (przerażająca liczba plików - ponad 15 tys.) wersja offline tej strony. Do mojego BOOX-a nie wczytywałem (obsługuje DjVu) bo strony w A4 na większe czytniki... (niewygodnie się powiększa) lub na notebook-a.

Natomiast ten drugi, to czysto ewangelicka wersja i tylko PDF-y - bleee ;)

Strona 3 z 5 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/