eKsiążki
https://forum.eksiazki.org/

Polskie treści w calibre - komentarze
https://forum.eksiazki.org/recepty-f172/polskie-tresci-w-calibre-komentarze-t8606-15.html
Strona 2 z 17

Autor:  t3d [ 14 kwi 2010 23:29:20 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Cujo napisał(a):
Nie wiem za bardzo o jakich "receptach" gadacie ;)

A próbowałeś kiedyś nacisnąć przycisk "pobierz aktualności" w calibre?

A propos fraza:
Dziś nieco poprawiłem regułkę, ale już mi ręce opadają. Kod HTML tej strony łamie wszelkie zasady. Na ich stronach z artykułami regułą jest, że dokument ma dwie deklaracje <body> i <head>. W połączeniu z tym, że żaden z tagów nie jest opisany id ani nie ma przypisanej klasy, otrzymuje się jakiś koszmar.

Autor:  WielkiPrzedwieczny [ 20 kwi 2010 16:35:10 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Witam. Chciałbym zadac laickie pytanie. Czy jest również możliwośc dodawania e-zinów? Jeśli tak, to czy mógłbym liczyc na dodanie "Esensji" do zasobów Calibre? Tak czy siak, dzięki.

Autor:  t3d [ 26 kwi 2010 22:01:58 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

WielkiPrzedwieczny napisał(a):
Witam. Chciałbym zadac laickie pytanie. Czy jest również możliwośc dodawania e-zinów? Jeśli tak, to czy mógłbym liczyc na dodanie "Esensji" do zasobów Calibre? Tak czy siak, dzięki.

Wygląda na to, że nie będzie przeszkód. Postaram się dodać w ciągu tygodnia.

EDIT:
Dopiero po dłuższej chwili zorientowałem się, że magazyn pojawia się periodycznie, niezależnie od RSSów :P
Żeby dobrze zrobić recipe dla magazynu musiałbym nauczyć się Pythona, a na to na razie nie mam czasu.

Na otarcie łez wrzucam prowizoryczną recepturkę dla zwykłych RSSów z esensji: http://github.com/t3d/kalibrator/raw/te ... sja.recipe
Ale ona też nie jest bez wad. Dwie najważniejsze to to, że ucina wszystkie długie treści do pierwszej strony i likwiduje formatowanie (np. tytuł i autor napisane są identyczną czcionką jak reszta treści).

Jeśli ktoś czuje się na siłach, to zapraszam do poprawiania tych niedokończonych recipe'ów.

Autor:  WielkiPrzedwieczny [ 29 kwi 2010 4:01:04 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Cóż, szkoda.
W każdym bądź razie, dzięki za starania.
Pozdrawiam. Przemek.

Autor:  t3d [ 29 kwi 2010 21:02:58 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Zmieniłem koncepcję z wersjami testowymi. Od teraz wszystkie regułki znajdują się w jednej gałęzi. Te, które jeszcze nie do końca dobrze działają (np. ucinają część treści, zawierają jakieś śmieci, albo po prostu brzydko wyglądają) trafiły do katalogu beta. A więc mamy teraz 11 dobrych reguł (znajdujących się już w Calibre) i następujące 4 niedokończone:

esensja
frazpc
osnews
wprost


Zwłaszcza te 4 polecam uwadze tych, którzy mają ochotę trochę poeksperymentować z edytorem ;)

Autor:  spadak [ 30 sie 2010 19:38:00 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Witam,

Mój pierwszy post.
A czy gazeta.pl jest w planach jako źródło wiadomości ?

Pozdrawiam

t3d: dygresje na ten temat przeniosłem do wątku:
http://forum.eksiazki.org/offtopic-f20/dlaczego-omijam-wyborcz-t8976.html

Autor:  t3d [ 31 sie 2010 18:40:11 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Na prośbę spadaka rozpocząłem prace nad recipem dla rmf24.pl

Na razie jest to wersja bardzo mocno niedopracowana, ale jeszcze nad nią posiedzę. Plan jest taki, żeby zrobić 3 recipe'y:
  • FAKTY (a w nich kraj i świat),
  • drugi recipe z kanałami tematycznymi: Ekonomia, Sport, Kultura, Nauka,
  • OPINIE, a w nich blogi, wywiady i komentarze.
Chodzi o to, żeby nie pakować wszystkiego do jednego worka, bo wtedy calibre zamuli na długi czas, a plik będzie duży i nieporęczny (a więc czytnik też się będzie męczył).

Pierwszy szkic dla faktów można pobrać tutaj: http://github.com/t3d/kalibrator/raw/17 ... f24.recipe

Uwag co do działania proszę na razie nie zgłaszać ;)

Autor:  t3d [ 06 wrz 2010 21:21:42 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Nieco poprawiony recipe. Uważam, że jest całkiem przyzwoity, aczkolwiek są jeszcze detale do poprawienia. Na przykład napis "Zdjęcie" nad każdym obraziem pewnie nie jest potrzebny.

http://github.com/t3d/kalibrator/raw/1c ... f24.recipe

Zapraszam do testowania i komentowania :)

Biorę się do pozostałych feedów.

EDIT:
No i jest komplet 3 zapowiadanych recipe'ów:
Fakty
Ekonomia, Sport, Kultura, Nauka
Opinie

W planach mam następujące poprawki:
* usunięcie napisu "Zdjęcie"
* usunięcie wstawek "czytaj też" itp.
* usunięcie śladów po dołączanych plikach dźwiękowych i filmach
* usunięcie galerii.

Autor:  spadak [ 08 wrz 2010 13:01:18 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

@t3d
Wygląda super. Żeby usunąć napis zdjęcie dodałem do listy usuwanych elementów:
dict(name='div', attrs={'class':'boxHeader'}),

Będę dalej testował.

Autor:  t3d [ 09 wrz 2010 9:31:07 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

spadak napisał(a):
@t3d
Wygląda super. Żeby usunąć napis zdjęcie dodałem do listy usuwanych elementów:
dict(name='div', attrs={'class':'boxHeader'})

Niby tak, ale ta klasa pojawia się na stronach wielokrotnie. Bezpieczniej jest wyciąć ten fragment wyrażeniem regularnym.

EDIT:

Zrealizowałem wszystkie planowane poprawki dla faktów i ESKN ;)
fakty
ESKN

Jeśli nie będzie uwag, zgłoszę te 2 recipe'y Kovidowi do dołączenia do Calibre.

A nad opiniami trzeba jeszcze popracować...

Autor:  spadak [ 09 wrz 2010 14:53:52 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Można by jeszcze usunąć linka do Facebook'a:
preprocess_regexps = [
(re.compile(i[0], re.IGNORECASE | re.DOTALL), i[1]) for i in
[
(r'<h2>Zdj.cie</h2>', lambda match: '</div>'),
(r'(<a href="http://www.facebook.com/)*(>RMF24.pl</a>) on Facebook</div>', lambda match: '</div>')
]
]

Autor:  t3d [ 09 wrz 2010 21:44:57 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

spadak napisał(a):
Można by jeszcze usunąć linka do Facebook'a:
preprocess_regexps = [
(re.compile(i[0], re.IGNORECASE | re.DOTALL), i[1]) for i in
[
(r'<h2>Zdj.cie</h2>', lambda match: '</div>'),
(r'(<a href="http://www.facebook.com/)*(>RMF24.pl</a>) on Facebook</div>', lambda match: '</div>')
]
]

Ha! Nawet się pewnie nie spodziewałeś, ale w tym cytacie zwróciłeś mi uwagę na błąd, jakim było zamienianie z pierwszego wyrażenia. Nie powinno być tam </div> :)

Wycinanie facebooka oczywiście zaimplementowałem :)
fakty i ESKN już wyjąłem z katalogu beta.

Z opiniami jest taki problem, że niektóre wpisy w feedach RSS linkują do strony z samym dźwiękiem - bez sensownego tekstu. Trzeba by te wpisy przefiltrować, ale na razie nie wiem jak.

Autor:  Richard [ 10 wrz 2010 1:04:13 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Dałoby się dodać z http://www.pomorska.pl wiadomości z obrazkami tak ładnie jak np. "Interia.pl - Fakty" i "eKsiazki.org"?
Jeżeli chodzi o zakres treści to połączenie tych dwóch rss'ów:
www.pomorska.pl/rss.xml
www.pomorska.pl/region.xml

Autor:  t3d [ 10 wrz 2010 9:00:13 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Richard napisał(a):
Dałoby się dodać z http://www.pomorska.pl wiadomości z obrazkami tak ładnie jak np. "Interia.pl - Fakty" i "eKsiazki.org"?
Jeżeli chodzi o zakres treści to połączenie tych dwóch rss'ów:
http://www.pomorska.pl/rss.xml
http://www.pomorska.pl/region.xml

A czy przypadkiem region nie jest podzbiorem tego głównego kanału?

Autor:  Richard [ 10 wrz 2010 9:46:54 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

t3d napisał(a):
A czy przypadkiem region nie jest podzbiorem tego głównego kanału?

Tak, z tym że jest tyle więcej wiadomości w głównym że patrząc na najnowsze wiadomości z głównego załapuje się jakieś 20% wiadomości z kategorii "Region".

To może tylko sumę tych dwóch (zaznaczam że kategoria Bydgoszcz nie jest podzbiorem kategorii Region) :
http://www.pomorska.pl/region.xml
http://www.pomorska.pl/bydgoszcz.xml
Jeśli znajdzie się czas to też osobno cały główny, jak nie to wystarczy mi Region+Bydgoszcz.

Strona 2 z 17 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/