Teraz jest 28 mar 2024 21:58:44




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 75 ]  Przejdź na stronę Poprzednia strona  1, 2, 3, 4, 5  Następna strona
Biblia na czytnik 
Autor Wiadomość
Użytkownik
Avatar użytkownika

Dołączył(a): 09 lis 2009 20:20:04
Posty: 1433
Lokalizacja: Kraków
eCzytnik: inkBOOK Onyx
Post Re: Biblia na czytnik
t3d napisał(a):
Trzeba jednak użyć jakiegoś obejścia w przypadku nazw ze spacjami, jak "2 J". na linuksie można całą nazwę opakować w cudzysłowy, albo dać \ przed spacją. Jak się z tym uporać na windowsie nie wiem :D

Działa poprawnie pod Windows XP - też można opakować w "cudzysłowy" i "2 J" generuje się :)

Pozostaje mi kwestia interpretacji z okna pod windą polskich znaków do UTF-8, bo Łk nie wchodzi, pisząc komunikat:
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 0-1: invalid data" lub
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 1-2: unexpected end of data", ale to tylko 2 księgi ;) - muszę pokombinować ze znakami.

Zawartość jest poprawna - bardzo fajnie - bo o to chodziło.
Świetna robota !! Brawo!

[Edit:] PS. W wynikowym html jest poprawnie, ale ta małpa Calibre po konwersji do innego formatu "gubi" w spisie treści (zwartość jest) wszystkie księgi które są numerowane, jak np. 1 P; 2 P w NT :|

_________________
W Obrazek też ;)


25 sie 2011 11:35:33
Zobacz profil WWW
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2835
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Biblia na czytnik
airs napisał(a):
Pozostaje mi kwestia interpretacji z okna pod windą polskich znaków do UTF-8, bo Łk nie wchodzi, pisząc komunikat:
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 0-1: invalid data" lub
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position 1-2: unexpected end of data", ale to tylko 2 księgi ;) - muszę pokombinować ze znakami.

Jest jedno nieładne rozwiązanie, które możesz wypróbować.
Dodaj
Kod:
if sys.getdefaultencoding() == "ascii":
    reload(sys)
    sys.setdefaultencoding('utf-8')

przed linią
Kod:
if len(sys.argv) != 2:

I proszę daj znać, jak to działa. Zastanawiam się tylko, czy to w przyszłości nie popsuje na zapisywania do pliku...

Te moje wątpliwości wynikają z tego, że ten skrypt to mój pierwszy kod w pythonie (poza receptami i pluginami z calibre, które nie są samodzielne) :P

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


25 sie 2011 11:52:02
Zobacz profil WWW
Użytkownik
Avatar użytkownika

Dołączył(a): 09 lis 2009 20:20:04
Posty: 1433
Lokalizacja: Kraków
eCzytnik: inkBOOK Onyx
Post Re: Biblia na czytnik
t3d napisał(a):
Jest jedno nieładne rozwiązanie, które możesz wypróbować.

Myślę, że problem tkwi nie w pythonie i kodzie tylko w samych Windowsach... Spróbowałem i zachowuje się dokładnie tak samo z dodatkiem, który zaproponowałeś, jak i bez niego.

Windows (XP) ma wspracie dla UTF-8, ale w linii komend (cmd) jeśli wprowadza się polskie litery, on na wejściu podaje je w kodowaniu ANSI (CP1250), co widać po odpowiedziach ze skryptu (litera "Ł" jako kod "0xa3", a "ł" jako "0xb3") - co nie ma odpowiedników w UTF-8 (sprawdzałem w http://mynthon.net/howto/-/charset-konwersja-cp1250-bytes-to-utf8-bytes.txt).

Rozwiązaniem było by tu wprowadzenie w poleceniu takiego znaku, który (w bajtach) miałby prawidłowy odpowiednik w UTF-8, ale nie mam w tej chwili do tego głowy :?

Najważniejszy cel osiągnięty - można wygenerować kompletny tekst Pisma Świętego (ST i NT) z przypisami, w strawnym dla dowolnego czytnika e-ink formacie, co Ci się udało bardzo dobrze. :)
Stronie Deon.pl można zaufać, że jest wszystko.

PS. Co do generowania spisu treści to niepotrzebnie zwaliłem całą winę na Calibre, bo problem jest raczej w interpretacji ToC w ePUB - w mobi jest wszystko dobrze.
[Edit:] A jednak Calibre ;) - znalazłem w logu coś takiego:
Kod:
Creating EPUB Output...
Removing invalid fragment identifier u'Kp\u0142' from TOC
Removing invalid fragment identifier '1 Sm' from TOC
Removing invalid fragment identifier '2 Sm' from TOC
Removing invalid fragment identifier '1 Krl' from TOC
Removing invalid fragment identifier '2 Krl' from TOC
Removing invalid fragment identifier '1 Krn' from TOC
Removing invalid fragment identifier '2 Krn' from TOC
Removing invalid fragment identifier '1 Mch' from TOC
Removing invalid fragment identifier '2 Mch' from TOC
Removing invalid fragment identifier 'Rdz 1P1' from TOC
Removing invalid fragment identifier 'Rdz 1P2' from TOC
Removing invalid fragment identifier 'Rdz 1P3' from TOC
Removing invalid fragment identifier 'Rdz 2P4' from TOC

i dla Nowego odpowiednio:
Kod:
Creating EPUB Output...
Removing invalid fragment identifier u'\u0141k' from TOC
Removing invalid fragment identifier '1 Kor' from TOC
Removing invalid fragment identifier '2 Kor' from TOC
Removing invalid fragment identifier '1 Tes' from TOC
Removing invalid fragment identifier '2 Tes' from TOC
Removing invalid fragment identifier '1 Tm' from TOC
Removing invalid fragment identifier '2 Tm' from TOC
Removing invalid fragment identifier '1 P' from TOC
Removing invalid fragment identifier '2 P' from TOC
Removing invalid fragment identifier '1 J' from TOC
Removing invalid fragment identifier '2 J' from TOC
Removing invalid fragment identifier '3 J' from TOC
(...)

_________________
W Obrazek też ;)


25 sie 2011 13:07:52
Zobacz profil WWW
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2835
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Biblia na czytnik
airs napisał(a):
t3d napisał(a):
Jest jedno nieładne rozwiązanie, które możesz wypróbować.

Myślę, że problem tkwi nie w pythonie i kodzie tylko w samych Windowsach... Spróbowałem i zachowuje się dokładnie tak samo z dodatkiem, który zaproponowałeś, jak i bez niego.

Windows (XP) ma wspracie dla UTF-8

A, bo ja na 7 testowałem, a on ma w cmd ascii. W takim razie dodaj samo
Kod:
reload(sys)
sys.setdefaultencoding('utf-8')

bez wcięć i zobaczymy :)

airs napisał(a):
PS. Co do generowania spisu treści to niepotrzebnie zwaliłem całą winę na Calibre, bo problem jest raczej w interpretacji ToC w ePUB - w mobi jest wszystko dobrze.
[Edit:] A jednak Calibre ;) - znalazłem w logu coś takiego:
Kod:
Creating EPUB Output...
Removing invalid fragment identifier u'Kp\u0142' from TOC
Removing invalid fragment identifier '1 Sm' from TOC
Removing invalid fragment identifier '2 Sm' from TOC

W zasadzie nic dziwnego, bo adres odsyłacza ze spacją w środku jest sprzeczny ze standardem HTML i tak naprawdę nic nie ma obowiązku z tym działać. Akuat przy konwersji na mobi w calibre nie widziałem żeby protestował, więc przymknąłem na to oko. Podobnie z polskimi znakami w adresie odsyłacza. Nie jest probemem, żeby to naprawić, choć skrypt nieco zwolni, bo będzie miał więcej podmian do zrobienia :)

airs napisał(a):
Stronie Deon.pl można zaufać, że jest wszystko.

Jakoś szczególnie się nie przykładam do sprawdzania, a ciągle jakieś błedy widzę w związku z przypisami. Ale to można zgłaszać na maila (którego czytają i reagują :D).

EDIT: Poprawiam teraz linki w odsyłaczach. Nie będzie w nich spacji ani polskich znaków. Powinno się ładnie konwertować na epub. Rozgrzebałem, myślałem, że jest już dobrze i wykomitowałem, ale okazuje się, że nie jest. Efekt jest taki, że bierząca wersja nie działa...

Do odwołania należy korzystać z tej: https://github.com/t3d/project_b/blob/b ... oject_b.py

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


25 sie 2011 16:38:20
Zobacz profil WWW
Użytkownik
Avatar użytkownika

Dołączył(a): 18 sie 2011 16:18:06
Posty: 36
Lokalizacja: Wiedeń/Tychy
eCzytnik: Kindle 3
Post Re: Biblia na czytnik
W XXI jeszcze ktoś czyta te starożytne bazgroły*? I to na czytniku? :) Mogę w zamian polecić dobre podręczniki do biologii i fizyki ;) Kiedyś czytałem Stary Testament, ale pełny jest brutalności i bezsensownej przemocy. Szybko zaprzestałem lektury tego... "dzieła".





* cytat z "Root of all evil" - Richard Dawkins


25 sie 2011 21:05:32
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 09 lis 2009 20:20:04
Posty: 1433
Lokalizacja: Kraków
eCzytnik: inkBOOK Onyx
Post Re: Biblia na czytnik
@Stephen: Te "starożytne bazgroły" to List do ludzi i o ludziach, a że jesteśmy pełni brutalności i stosujemy bezsensowną przemoc, to taki i tekst. Ale jak się człowiek wsłucha, to jest w niej Duch -
- nie masz pojęcia ilu ludzi na świecie kocha tą Księgę 8)
Ale wątek nie o tym, tylko o imporcie na czytnik.
Cała Biblia jest duża i ciężka, a czytnik mieści się w kieszeni...

t3d napisał(a):
A, bo ja na 7 testowałem, a on ma w cmd ascii. W takim razie dodaj samo
Kod:
reload(sys)
sys.setdefaultencoding('utf-8')
bez wcięć i zobaczymy :)
Efekt taki sam jak poprzednio - czyli bez efektu ;) (input jest filtrowany przez WinXP, jak w 7 działa to można to zostawić)

t3d napisał(a):
EDIT: Poprawiam teraz linki w odsyłaczach. Nie będzie w nich spacji ani polskich znaków. Powinno się ładnie konwertować na epub. Rozgrzebałem, myślałem, że jest już dobrze i wykomitowałem, ale okazuje się, że nie jest. Efekt jest taki, że bierząca wersja nie działa...
Ale bardzo dobrze się konwertuje na ePUB - wyjątkiem jest ten ToC. Spis Ksiąg jest na poczatku (czyli jakby "Spis treści") a wszystkie linki działają, pod warunkiem, że zrobiło się całość do 1 pliku (ok 10MB html).
Jeśli ściągnie się w częściach, to działają linki w obrębie tej części - zewnętrzne po prostu nigdzie nie przenoszą.
Można uznać, że narzędzie jest OK.

U mnie czyta się dobrze na BOOX-ie html (najlepiej w ZIP), ePUB (przez FBReader), czy mobi, a na Kindlu oczywiście mobi (na tel. z Androidem też super :) ).

_________________
W Obrazek też ;)


25 sie 2011 21:45:12
Zobacz profil WWW
Użytkownik

Dołączył(a): 05 sie 2011 23:24:50
Posty: 11
eCzytnik: Kindle 3
Post Re: Biblia na czytnik
Ja czytam i jestem wdzięczny osobom, które wkładają trud i poświęcają swój czas na przygotowanie tekstu Pisma Świętego na czytnik. (Dodam, że sam opracowuję tekst Biblii Jerozolimskiej z przypisami, nazwami rozdziałów a w NT dodatkowo z Praktycznym Komentarzem bp. Romaniuka i nie szkoda mi na to czasu.)
Gdybyś zagłębił się choć trochę w historię powstawania Biblii to nie podchodziłbyś do niej jak do podręcznika bo nie chodzi o sens dosłowny tekstu. Piszesz o brutalności i przemocy a czy dotarłeś do Pieśni nad Pieśniami albo Psalmów? Piękno tych ksiąg zdumiewa ludzi od 3 tysięcy lat.
Wiem, że to nie jest tematem tego wątku więc tylko raz jeszcze podziękuję "t3d" i "airs" za ich pracę.
Tak dalej ;-)

_________________
Obrazek Obrazek


25 sie 2011 21:47:30
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2835
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Biblia na czytnik
airs napisał(a):
Ale bardzo dobrze się konwertuje na ePUB - wyjątkiem jest ten ToC. Spis Ksiąg jest na poczatku (czyli jakby "Spis treści") a wszystkie linki działają, pod warunkiem, że zrobiło się całość do 1 pliku (ok 10MB html).
Jeśli ściągnie się w częściach, to działają linki w obrębie tej części - zewnętrzne po prostu nigdzie nie przenoszą.
Można uznać, że narzędzie jest OK.

Nie denerwuj mnie takim gadaniem. Komputer jest po to, żeby żyło się prościej i wygodniej. Jeśli jest jakaś głupia (albo mniej głupia) robota do zrobienia to lepiej wykorzystać do niej maszynę, niż samemu tracić czas, albo męczyć się z czymś niedorobionym. Nie wiem skąd się bierze taka spolegliwość wobec programistów. Może to lata tresury przy MS Windows tak wpływają na obniżenie oczekiwań? :)

Poprawka będzie jutro :D

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


25 sie 2011 22:55:57
Zobacz profil WWW
Użytkownik
Avatar użytkownika

Dołączył(a): 09 lis 2009 20:20:04
Posty: 1433
Lokalizacja: Kraków
eCzytnik: inkBOOK Onyx
Post Re: Biblia na czytnik
t3d napisał(a):
Może to lata tresury przy MS Windows tak wpływają na obniżenie oczekiwań? :)
:mrgreen: Dokładnie.

_________________
W Obrazek też ;)


26 sie 2011 9:51:23
Zobacz profil WWW
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2835
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Biblia na czytnik
Informuję, że gdyby ktoś miał ochotę na spieranie się z użytkownikiem Stephen King, to jego post trafił do innego wątku: post77713.html#p77713
Jako bonus za tracenie mojego i innych czasu dostaje dodatkowo ostrzeżenie.

EDIT: Jest już poprawka błędów z kodowaniem. Adresy do linków są teraz bez polskich zanków i bez spacji. Walidator w3c czepia się jeszcze gdy na początku adresu odsyłacza jest cyfra, ale to chyba nie miesza szyków calibre, więc odkładam to na później.

Znalazłem też kolejny błąd w denonie. Zobaczcie sobie Kpł 3,16 i jego źródła HTML. Zaraz to będę zgłaszał :)

EDIT2: Jak się wrzuci całą treść do walidatora w3c to wychodzi 2529 błędów. Część z nich to wspomniane odsyłacze z cyfrą na pierwszej pozycji, ale jest też dużo niedomkniętych tagów <div> i multum słów w trójkątnych nawiasach, które przeglądarka próbuje interpretować jako tagi...
Np.
Kod:
Wtedy wybrałem <spośród głów waszych pokoleń> mężów mądrych

Kod:
jak&#261; <na nich> na&#322;o&#380;y m&#261;&#380;

Będę chciał to teraz wyprostować...

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


26 sie 2011 16:49:49
Zobacz profil WWW
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Biblia na czytnik
Ale już np. Kpł 3,16 tutaj jest ok: http://biblia.deon.pl/PS/03_KPL_/003T.HTM (http://biblia.deon.pl/PS/Biblia.html). A tu mają bez nawiasów: http://biblia.deon.pl/rozdzial.php?id=100, więc chyba tylko tu: http://biblia.deon.pl/widget/rozdzial.php?id=100 jest źle (swoją drogą - ileż wersji :/).

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


26 sie 2011 22:29:09
Zobacz profil WWW
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2835
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Biblia na czytnik
Nawiasy mają swoje znaczenie.
Cytuj:
<> - nawias trójkątny zamyka glosy lub miejsca w tekście przekazanym krytycznie niepewne.

Do tej pory wydawało mi się, że ta widgetowa wersja jest oparta na tej samej treści...

Po pozbyciu się niezgodnych ze standardem linków, zostało 245 błedów w NT i 399 w ST. Z tym, że praktycznie każdy taki fragment z nawiasami generuje kilka błędów w walidatorze. Poza tym są jeszcze błędy banalne, jak niedomknięte tagi <div> i błędy kuriozalne, jak tagi <przypis> z atrybutem "cel"

Ogólnie wygląda mi na to, że takich fragmentów "znikniętych" przez trójkątne nawiasy jest kilkadziesiąt.

Ah, i jeszcze jest kwestia źle ponumerowanych lub brakujących przypisów, których żaden walidator nie policzy...


Ogólnie zaczynam się zastanawiać, czy ta stara wersja http://biblia.deon.pl/PS/Biblia.html nie byłaby jednak łatwiejsza do obróbki (tzn. czy nie zawiera mniejszej ilości błędów).

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


26 sie 2011 23:03:41
Zobacz profil WWW
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Biblia na czytnik
Nie sugerowałem, że nawiasy są bez znaczenia - tylko, że w wersji widgetowej jest źle, w wersji oldschoolowej dobrze (tj. kodowane jako &gt; i &lt;), a w wersji "podstawowej" - pozbyli się ich. Bądź mądry i pisz wiersze.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


26 sie 2011 23:11:49
Zobacz profil WWW
Użytkownik

Dołączył(a): 27 sie 2011 22:43:22
Posty: 6
Post Re: Biblia na czytnik
Zainteresowanym tematem polecam to:
http://jesuswanted.net/baza/prolog.html
jest tam ciekawe achiwum http://jesuswanted.net/arch/bibleDjVu.tgz

Format DjVu - powinno dać się przekonwertować na pdf.

mój czytnik (Icarus) nie czyta niestety DjVu - może ktoś kto ma ten format u siebie w czytniku spróbuje i napisze jak mu to działa?

ewentualnie tu jest bardzo interesujący przekład NT (pdf-y) z bogatymi komentarzami tłumacza:
http://www.feib.pl/index.php?dl=nt
niestety ST długo nie ma chociaż od dawna jest zapowiadany


28 sie 2011 22:56:29
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 09 lis 2009 20:20:04
Posty: 1433
Lokalizacja: Kraków
eCzytnik: inkBOOK Onyx
Post Re: Biblia na czytnik
egzeg napisał(a):
http://jesuswanted.net/baza/prolog.html
jest tam ciekawe achiwum http://jesuswanted.net/arch/bibleDjVu.tgz

Ten pierwszy link jest ciekawy, bo na stronie są różne wersje łącznie z łacińską i grecką, również angielska i hebrajska, chociaż bez przypisów.
Archiwum rzeczywiście ciekawe (przerażająca liczba plików - ponad 15 tys.) wersja offline tej strony. Do mojego BOOX-a nie wczytywałem (obsługuje DjVu) bo strony w A4 na większe czytniki... (niewygodnie się powiększa) lub na notebook-a.

Natomiast ten drugi, to czysto ewangelicka wersja i tylko PDF-y - bleee ;)

_________________
W Obrazek też ;)


29 sie 2011 0:49:44
Zobacz profil WWW
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 75 ]  Przejdź na stronę Poprzednia strona  1, 2, 3, 4, 5  Następna strona


Kto przegląda forum

Użytkownicy przeglądający to forum: Google [Bot] i 1 gość


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do: