Autor |
Wiadomość |
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
A próbowałeś kiedyś nacisnąć przycisk "pobierz aktualności" w calibre? A propos fraza: Dziś nieco poprawiłem regułkę, ale już mi ręce opadają. Kod HTML tej strony łamie wszelkie zasady. Na ich stronach z artykułami regułą jest, że dokument ma dwie deklaracje <body> i <head>. W połączeniu z tym, że żaden z tagów nie jest opisany id ani nie ma przypisanej klasy, otrzymuje się jakiś koszmar.
_________________ Porównywarka cen ebooków
|
14 kwi 2010 23:29:20 |
|
|
Użytkownik
Dołączył(a): 15 kwi 2009 15:12:30 Posty: 6
|
Re: Polskie treści w calibre - komentarze
Witam. Chciałbym zadac laickie pytanie. Czy jest również możliwośc dodawania e-zinów? Jeśli tak, to czy mógłbym liczyc na dodanie "Esensji" do zasobów Calibre? Tak czy siak, dzięki.
|
20 kwi 2010 16:35:10 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
Wygląda na to, że nie będzie przeszkód. Postaram się dodać w ciągu tygodnia. EDIT: Dopiero po dłuższej chwili zorientowałem się, że magazyn pojawia się periodycznie, niezależnie od RSSów Żeby dobrze zrobić recipe dla magazynu musiałbym nauczyć się Pythona, a na to na razie nie mam czasu. Na otarcie łez wrzucam prowizoryczną recepturkę dla zwykłych RSSów z esensji: http://github.com/t3d/kalibrator/raw/te ... sja.recipeAle ona też nie jest bez wad. Dwie najważniejsze to to, że ucina wszystkie długie treści do pierwszej strony i likwiduje formatowanie (np. tytuł i autor napisane są identyczną czcionką jak reszta treści). Jeśli ktoś czuje się na siłach, to zapraszam do poprawiania tych niedokończonych recipe'ów.
_________________ Porównywarka cen ebooków
|
26 kwi 2010 22:01:58 |
|
|
Użytkownik
Dołączył(a): 15 kwi 2009 15:12:30 Posty: 6
|
Re: Polskie treści w calibre - komentarze
Cóż, szkoda. W każdym bądź razie, dzięki za starania. Pozdrawiam. Przemek.
|
29 kwi 2010 4:01:04 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
Zmieniłem koncepcję z wersjami testowymi. Od teraz wszystkie regułki znajdują się w jednej gałęzi. Te, które jeszcze nie do końca dobrze działają (np. ucinają część treści, zawierają jakieś śmieci, albo po prostu brzydko wyglądają) trafiły do katalogu beta. A więc mamy teraz 11 dobrych reguł (znajdujących się już w Calibre) i następujące 4 niedokończone: Zwłaszcza te 4 polecam uwadze tych, którzy mają ochotę trochę poeksperymentować z edytorem
_________________ Porównywarka cen ebooków
|
29 kwi 2010 21:02:58 |
|
|
Użytkownik
Dołączył(a): 30 sie 2010 11:49:30 Posty: 12 Lokalizacja: śląsk
eCzytnik: iPod 8GB, Kindle 3 WIFI
|
Re: Polskie treści w calibre - komentarze
Witam, Mój pierwszy post. A czy gazeta.pl jest w planach jako źródło wiadomości ? Pozdrawiam t3d: dygresje na ten temat przeniosłem do wątku: http://forum.eksiazki.org/offtopic-f20/dlaczego-omijam-wyborcz-t8976.html
|
30 sie 2010 19:38:00 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
Na prośbę spadaka rozpocząłem prace nad recipem dla rmf24.pl Na razie jest to wersja bardzo mocno niedopracowana, ale jeszcze nad nią posiedzę. Plan jest taki, żeby zrobić 3 recipe'y: - FAKTY (a w nich kraj i świat),
- drugi recipe z kanałami tematycznymi: Ekonomia, Sport, Kultura, Nauka,
- OPINIE, a w nich blogi, wywiady i komentarze.
Chodzi o to, żeby nie pakować wszystkiego do jednego worka, bo wtedy calibre zamuli na długi czas, a plik będzie duży i nieporęczny (a więc czytnik też się będzie męczył). Pierwszy szkic dla faktów można pobrać tutaj: http://github.com/t3d/kalibrator/raw/17 ... f24.recipeUwag co do działania proszę na razie nie zgłaszać
_________________ Porównywarka cen ebooków
|
31 sie 2010 18:40:11 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
Nieco poprawiony recipe. Uważam, że jest całkiem przyzwoity, aczkolwiek są jeszcze detale do poprawienia. Na przykład napis "Zdjęcie" nad każdym obraziem pewnie nie jest potrzebny. http://github.com/t3d/kalibrator/raw/1c ... f24.recipe Zapraszam do testowania i komentowania Biorę się do pozostałych feedów. EDIT: No i jest komplet 3 zapowiadanych recipe'ów: FaktyEkonomia, Sport, Kultura, NaukaOpinieW planach mam następujące poprawki: * usunięcie napisu "Zdjęcie" * usunięcie wstawek "czytaj też" itp. * usunięcie śladów po dołączanych plikach dźwiękowych i filmach * usunięcie galerii.
_________________ Porównywarka cen ebooków
|
06 wrz 2010 21:21:42 |
|
|
Użytkownik
Dołączył(a): 30 sie 2010 11:49:30 Posty: 12 Lokalizacja: śląsk
eCzytnik: iPod 8GB, Kindle 3 WIFI
|
Re: Polskie treści w calibre - komentarze
@t3d Wygląda super. Żeby usunąć napis zdjęcie dodałem do listy usuwanych elementów: dict(name='div', attrs={'class':'boxHeader'}),
Będę dalej testował.
|
08 wrz 2010 13:01:18 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
Niby tak, ale ta klasa pojawia się na stronach wielokrotnie. Bezpieczniej jest wyciąć ten fragment wyrażeniem regularnym. EDIT: Zrealizowałem wszystkie planowane poprawki dla faktów i ESKN faktyESKNJeśli nie będzie uwag, zgłoszę te 2 recipe'y Kovidowi do dołączenia do Calibre. A nad opiniami trzeba jeszcze popracować...
_________________ Porównywarka cen ebooków
|
09 wrz 2010 9:31:07 |
|
|
Użytkownik
Dołączył(a): 30 sie 2010 11:49:30 Posty: 12 Lokalizacja: śląsk
eCzytnik: iPod 8GB, Kindle 3 WIFI
|
Re: Polskie treści w calibre - komentarze
Można by jeszcze usunąć linka do Facebook'a: preprocess_regexps = [ (re.compile(i[0], re.IGNORECASE | re.DOTALL), i[1]) for i in [ (r'<h2>Zdj.cie</h2>', lambda match: '</div>'), (r'(<a href="http://www.facebook.com/)*(>RMF24.pl</a>) on Facebook</div>', lambda match: '</div>') ] ]
|
09 wrz 2010 14:53:52 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
Ha! Nawet się pewnie nie spodziewałeś, ale w tym cytacie zwróciłeś mi uwagę na błąd, jakim było zamienianie z pierwszego wyrażenia. Nie powinno być tam </div> Wycinanie facebooka oczywiście zaimplementowałem fakty i ESKN już wyjąłem z katalogu beta. Z opiniami jest taki problem, że niektóre wpisy w feedach RSS linkują do strony z samym dźwiękiem - bez sensownego tekstu. Trzeba by te wpisy przefiltrować, ale na razie nie wiem jak.
_________________ Porównywarka cen ebooków
|
09 wrz 2010 21:44:57 |
|
|
Użytkownik
Dołączył(a): 27 sie 2010 16:31:49 Posty: 55 Lokalizacja: Bydgoszcz
eCzytnik: Kiindle 3
|
Re: Polskie treści w calibre - komentarze
Dałoby się dodać z http://www.pomorska.pl wiadomości z obrazkami tak ładnie jak np. "Interia.pl - Fakty" i "eKsiazki.org"? Jeżeli chodzi o zakres treści to połączenie tych dwóch rss'ów: www.pomorska.pl/rss.xmlwww.pomorska.pl/region.xml
|
10 wrz 2010 1:04:13 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
A czy przypadkiem region nie jest podzbiorem tego głównego kanału?
_________________ Porównywarka cen ebooków
|
10 wrz 2010 9:00:13 |
|
|
Użytkownik
Dołączył(a): 27 sie 2010 16:31:49 Posty: 55 Lokalizacja: Bydgoszcz
eCzytnik: Kiindle 3
|
Re: Polskie treści w calibre - komentarze
Tak, z tym że jest tyle więcej wiadomości w głównym że patrząc na najnowsze wiadomości z głównego załapuje się jakieś 20% wiadomości z kategorii "Region". To może tylko sumę tych dwóch (zaznaczam że kategoria Bydgoszcz nie jest podzbiorem kategorii Region) : http://www.pomorska.pl/region.xmlhttp://www.pomorska.pl/bydgoszcz.xmlJeśli znajdzie się czas to też osobno cały główny, jak nie to wystarczy mi Region+Bydgoszcz.
|
10 wrz 2010 9:46:54 |
|
|