Teraz jest 22 sty 2021 2:15:30




Utwórz nowy wątek Ten wątek jest zamknięty. Nie możesz w nim pisać ani edytować postów.  [ Posty: 242 ]  Przejdź na stronę Poprzednia strona  1, 2, 3, 4, 5 ... 17  Następna strona
Polskie treści w calibre - komentarze 
Autor Wiadomość
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
Cujo napisał(a):
Nie wiem za bardzo o jakich "receptach" gadacie ;)

A próbowałeś kiedyś nacisnąć przycisk "pobierz aktualności" w calibre?

A propos fraza:
Dziś nieco poprawiłem regułkę, ale już mi ręce opadają. Kod HTML tej strony łamie wszelkie zasady. Na ich stronach z artykułami regułą jest, że dokument ma dwie deklaracje <body> i <head>. W połączeniu z tym, że żaden z tagów nie jest opisany id ani nie ma przypisanej klasy, otrzymuje się jakiś koszmar.

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


14 kwi 2010 23:29:20
Zobacz profil WWW
Użytkownik

Dołączył(a): 15 kwi 2009 15:12:30
Posty: 6
Post Re: Polskie treści w calibre - komentarze
Witam. Chciałbym zadac laickie pytanie. Czy jest również możliwośc dodawania e-zinów? Jeśli tak, to czy mógłbym liczyc na dodanie "Esensji" do zasobów Calibre? Tak czy siak, dzięki.


20 kwi 2010 16:35:10
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
WielkiPrzedwieczny napisał(a):
Witam. Chciałbym zadac laickie pytanie. Czy jest również możliwośc dodawania e-zinów? Jeśli tak, to czy mógłbym liczyc na dodanie "Esensji" do zasobów Calibre? Tak czy siak, dzięki.

Wygląda na to, że nie będzie przeszkód. Postaram się dodać w ciągu tygodnia.

EDIT:
Dopiero po dłuższej chwili zorientowałem się, że magazyn pojawia się periodycznie, niezależnie od RSSów :P
Żeby dobrze zrobić recipe dla magazynu musiałbym nauczyć się Pythona, a na to na razie nie mam czasu.

Na otarcie łez wrzucam prowizoryczną recepturkę dla zwykłych RSSów z esensji: http://github.com/t3d/kalibrator/raw/te ... sja.recipe
Ale ona też nie jest bez wad. Dwie najważniejsze to to, że ucina wszystkie długie treści do pierwszej strony i likwiduje formatowanie (np. tytuł i autor napisane są identyczną czcionką jak reszta treści).

Jeśli ktoś czuje się na siłach, to zapraszam do poprawiania tych niedokończonych recipe'ów.

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


26 kwi 2010 22:01:58
Zobacz profil WWW
Użytkownik

Dołączył(a): 15 kwi 2009 15:12:30
Posty: 6
Post Re: Polskie treści w calibre - komentarze
Cóż, szkoda.
W każdym bądź razie, dzięki za starania.
Pozdrawiam. Przemek.


29 kwi 2010 4:01:04
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
Zmieniłem koncepcję z wersjami testowymi. Od teraz wszystkie regułki znajdują się w jednej gałęzi. Te, które jeszcze nie do końca dobrze działają (np. ucinają część treści, zawierają jakieś śmieci, albo po prostu brzydko wyglądają) trafiły do katalogu beta. A więc mamy teraz 11 dobrych reguł (znajdujących się już w Calibre) i następujące 4 niedokończone:



Zwłaszcza te 4 polecam uwadze tych, którzy mają ochotę trochę poeksperymentować z edytorem ;)

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


29 kwi 2010 21:02:58
Zobacz profil WWW
Użytkownik

Dołączył(a): 30 sie 2010 11:49:30
Posty: 12
Lokalizacja: śląsk
eCzytnik: iPod 8GB, Kindle 3 WIFI
Post Re: Polskie treści w calibre - komentarze
Witam,

Mój pierwszy post.
A czy gazeta.pl jest w planach jako źródło wiadomości ?

Pozdrawiam

t3d: dygresje na ten temat przeniosłem do wątku:
http://forum.eksiazki.org/offtopic-f20/dlaczego-omijam-wyborcz-t8976.html


30 sie 2010 19:38:00
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
Na prośbę spadaka rozpocząłem prace nad recipem dla rmf24.pl

Na razie jest to wersja bardzo mocno niedopracowana, ale jeszcze nad nią posiedzę. Plan jest taki, żeby zrobić 3 recipe'y:
  • FAKTY (a w nich kraj i świat),
  • drugi recipe z kanałami tematycznymi: Ekonomia, Sport, Kultura, Nauka,
  • OPINIE, a w nich blogi, wywiady i komentarze.
Chodzi o to, żeby nie pakować wszystkiego do jednego worka, bo wtedy calibre zamuli na długi czas, a plik będzie duży i nieporęczny (a więc czytnik też się będzie męczył).

Pierwszy szkic dla faktów można pobrać tutaj: http://github.com/t3d/kalibrator/raw/17 ... f24.recipe

Uwag co do działania proszę na razie nie zgłaszać ;)

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


31 sie 2010 18:40:11
Zobacz profil WWW
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
Nieco poprawiony recipe. Uważam, że jest całkiem przyzwoity, aczkolwiek są jeszcze detale do poprawienia. Na przykład napis "Zdjęcie" nad każdym obraziem pewnie nie jest potrzebny.

http://github.com/t3d/kalibrator/raw/1c ... f24.recipe

Zapraszam do testowania i komentowania :)

Biorę się do pozostałych feedów.

EDIT:
No i jest komplet 3 zapowiadanych recipe'ów:
Fakty
Ekonomia, Sport, Kultura, Nauka
Opinie

W planach mam następujące poprawki:
* usunięcie napisu "Zdjęcie"
* usunięcie wstawek "czytaj też" itp.
* usunięcie śladów po dołączanych plikach dźwiękowych i filmach
* usunięcie galerii.

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


06 wrz 2010 21:21:42
Zobacz profil WWW
Użytkownik

Dołączył(a): 30 sie 2010 11:49:30
Posty: 12
Lokalizacja: śląsk
eCzytnik: iPod 8GB, Kindle 3 WIFI
Post Re: Polskie treści w calibre - komentarze
@t3d
Wygląda super. Żeby usunąć napis zdjęcie dodałem do listy usuwanych elementów:
dict(name='div', attrs={'class':'boxHeader'}),

Będę dalej testował.


08 wrz 2010 13:01:18
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
spadak napisał(a):
@t3d
Wygląda super. Żeby usunąć napis zdjęcie dodałem do listy usuwanych elementów:
dict(name='div', attrs={'class':'boxHeader'})

Niby tak, ale ta klasa pojawia się na stronach wielokrotnie. Bezpieczniej jest wyciąć ten fragment wyrażeniem regularnym.

EDIT:

Zrealizowałem wszystkie planowane poprawki dla faktów i ESKN ;)
fakty
ESKN

Jeśli nie będzie uwag, zgłoszę te 2 recipe'y Kovidowi do dołączenia do Calibre.

A nad opiniami trzeba jeszcze popracować...

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


09 wrz 2010 9:31:07
Zobacz profil WWW
Użytkownik

Dołączył(a): 30 sie 2010 11:49:30
Posty: 12
Lokalizacja: śląsk
eCzytnik: iPod 8GB, Kindle 3 WIFI
Post Re: Polskie treści w calibre - komentarze
Można by jeszcze usunąć linka do Facebook'a:
preprocess_regexps = [
(re.compile(i[0], re.IGNORECASE | re.DOTALL), i[1]) for i in
[
(r'<h2>Zdj.cie</h2>', lambda match: '</div>'),
(r'(<a href="http://www.facebook.com/)*(>RMF24.pl</a>) on Facebook</div>', lambda match: '</div>')
]
]


09 wrz 2010 14:53:52
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
spadak napisał(a):
Można by jeszcze usunąć linka do Facebook'a:
preprocess_regexps = [
(re.compile(i[0], re.IGNORECASE | re.DOTALL), i[1]) for i in
[
(r'<h2>Zdj.cie</h2>', lambda match: '</div>'),
(r'(<a href="http://www.facebook.com/)*(>RMF24.pl</a>) on Facebook</div>', lambda match: '</div>')
]
]

Ha! Nawet się pewnie nie spodziewałeś, ale w tym cytacie zwróciłeś mi uwagę na błąd, jakim było zamienianie z pierwszego wyrażenia. Nie powinno być tam </div> :)

Wycinanie facebooka oczywiście zaimplementowałem :)
fakty i ESKN już wyjąłem z katalogu beta.

Z opiniami jest taki problem, że niektóre wpisy w feedach RSS linkują do strony z samym dźwiękiem - bez sensownego tekstu. Trzeba by te wpisy przefiltrować, ale na razie nie wiem jak.

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


09 wrz 2010 21:44:57
Zobacz profil WWW
Użytkownik
Avatar użytkownika

Dołączył(a): 27 sie 2010 16:31:49
Posty: 55
Lokalizacja: Bydgoszcz
eCzytnik: Kiindle 3
Post Re: Polskie treści w calibre - komentarze
Dałoby się dodać z http://www.pomorska.pl wiadomości z obrazkami tak ładnie jak np. "Interia.pl - Fakty" i "eKsiazki.org"?
Jeżeli chodzi o zakres treści to połączenie tych dwóch rss'ów:
www.pomorska.pl/rss.xml
www.pomorska.pl/region.xml


10 wrz 2010 1:04:13
Zobacz profil
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2789
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
Richard napisał(a):
Dałoby się dodać z http://www.pomorska.pl wiadomości z obrazkami tak ładnie jak np. "Interia.pl - Fakty" i "eKsiazki.org"?
Jeżeli chodzi o zakres treści to połączenie tych dwóch rss'ów:
http://www.pomorska.pl/rss.xml
http://www.pomorska.pl/region.xml

A czy przypadkiem region nie jest podzbiorem tego głównego kanału?

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


10 wrz 2010 9:00:13
Zobacz profil WWW
Użytkownik
Avatar użytkownika

Dołączył(a): 27 sie 2010 16:31:49
Posty: 55
Lokalizacja: Bydgoszcz
eCzytnik: Kiindle 3
Post Re: Polskie treści w calibre - komentarze
t3d napisał(a):
A czy przypadkiem region nie jest podzbiorem tego głównego kanału?

Tak, z tym że jest tyle więcej wiadomości w głównym że patrząc na najnowsze wiadomości z głównego załapuje się jakieś 20% wiadomości z kategorii "Region".

To może tylko sumę tych dwóch (zaznaczam że kategoria Bydgoszcz nie jest podzbiorem kategorii Region) :
http://www.pomorska.pl/region.xml
http://www.pomorska.pl/bydgoszcz.xml
Jeśli znajdzie się czas to też osobno cały główny, jak nie to wystarczy mi Region+Bydgoszcz.


10 wrz 2010 9:46:54
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Ten wątek jest zamknięty. Nie możesz w nim pisać ani edytować postów.  [ Posty: 242 ]  Przejdź na stronę Poprzednia strona  1, 2, 3, 4, 5 ... 17  Następna strona


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 1 gość


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron