eKsiążki https://forum.eksiazki.org/ |
|
Polskie treści w calibre - komentarze https://forum.eksiazki.org/recepty-f172/polskie-tresci-w-calibre-komentarze-t8606-15.html |
Strona 2 z 17 |
Autor: | t3d [ 14 kwi 2010 23:29:20 ] | |||||||||
Tytuł: | Re: Polskie treści w calibre - komentarze | |||||||||
A próbowałeś kiedyś nacisnąć przycisk "pobierz aktualności" w calibre? A propos fraza: Dziś nieco poprawiłem regułkę, ale już mi ręce opadają. Kod HTML tej strony łamie wszelkie zasady. Na ich stronach z artykułami regułą jest, że dokument ma dwie deklaracje <body> i <head>. W połączeniu z tym, że żaden z tagów nie jest opisany id ani nie ma przypisanej klasy, otrzymuje się jakiś koszmar. |
Autor: | WielkiPrzedwieczny [ 20 kwi 2010 16:35:10 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Witam. Chciałbym zadac laickie pytanie. Czy jest również możliwośc dodawania e-zinów? Jeśli tak, to czy mógłbym liczyc na dodanie "Esensji" do zasobów Calibre? Tak czy siak, dzięki. |
Autor: | t3d [ 26 kwi 2010 22:01:58 ] | |||||||||
Tytuł: | Re: Polskie treści w calibre - komentarze | |||||||||
Wygląda na to, że nie będzie przeszkód. Postaram się dodać w ciągu tygodnia. EDIT: Dopiero po dłuższej chwili zorientowałem się, że magazyn pojawia się periodycznie, niezależnie od RSSów Żeby dobrze zrobić recipe dla magazynu musiałbym nauczyć się Pythona, a na to na razie nie mam czasu. Na otarcie łez wrzucam prowizoryczną recepturkę dla zwykłych RSSów z esensji: http://github.com/t3d/kalibrator/raw/te ... sja.recipe Ale ona też nie jest bez wad. Dwie najważniejsze to to, że ucina wszystkie długie treści do pierwszej strony i likwiduje formatowanie (np. tytuł i autor napisane są identyczną czcionką jak reszta treści). Jeśli ktoś czuje się na siłach, to zapraszam do poprawiania tych niedokończonych recipe'ów. |
Autor: | WielkiPrzedwieczny [ 29 kwi 2010 4:01:04 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Cóż, szkoda. W każdym bądź razie, dzięki za starania. Pozdrawiam. Przemek. |
Autor: | t3d [ 29 kwi 2010 21:02:58 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Zmieniłem koncepcję z wersjami testowymi. Od teraz wszystkie regułki znajdują się w jednej gałęzi. Te, które jeszcze nie do końca dobrze działają (np. ucinają część treści, zawierają jakieś śmieci, albo po prostu brzydko wyglądają) trafiły do katalogu beta. A więc mamy teraz 11 dobrych reguł (znajdujących się już w Calibre) i następujące 4 niedokończone: Zwłaszcza te 4 polecam uwadze tych, którzy mają ochotę trochę poeksperymentować z edytorem |
Autor: | spadak [ 30 sie 2010 19:38:00 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Witam, Mój pierwszy post. A czy gazeta.pl jest w planach jako źródło wiadomości ? Pozdrawiam t3d: dygresje na ten temat przeniosłem do wątku: http://forum.eksiazki.org/offtopic-f20/dlaczego-omijam-wyborcz-t8976.html |
Autor: | t3d [ 31 sie 2010 18:40:11 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Na prośbę spadaka rozpocząłem prace nad recipem dla rmf24.pl Na razie jest to wersja bardzo mocno niedopracowana, ale jeszcze nad nią posiedzę. Plan jest taki, żeby zrobić 3 recipe'y:
Pierwszy szkic dla faktów można pobrać tutaj: http://github.com/t3d/kalibrator/raw/17 ... f24.recipe Uwag co do działania proszę na razie nie zgłaszać |
Autor: | t3d [ 06 wrz 2010 21:21:42 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Nieco poprawiony recipe. Uważam, że jest całkiem przyzwoity, aczkolwiek są jeszcze detale do poprawienia. Na przykład napis "Zdjęcie" nad każdym obraziem pewnie nie jest potrzebny. http://github.com/t3d/kalibrator/raw/1c ... f24.recipe Zapraszam do testowania i komentowania Biorę się do pozostałych feedów. EDIT: No i jest komplet 3 zapowiadanych recipe'ów: Fakty Ekonomia, Sport, Kultura, Nauka Opinie W planach mam następujące poprawki: * usunięcie napisu "Zdjęcie" * usunięcie wstawek "czytaj też" itp. * usunięcie śladów po dołączanych plikach dźwiękowych i filmach * usunięcie galerii. |
Autor: | spadak [ 08 wrz 2010 13:01:18 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
@t3d Wygląda super. Żeby usunąć napis zdjęcie dodałem do listy usuwanych elementów: dict(name='div', attrs={'class':'boxHeader'}), Będę dalej testował. |
Autor: | t3d [ 09 wrz 2010 9:31:07 ] | |||||||||
Tytuł: | Re: Polskie treści w calibre - komentarze | |||||||||
Niby tak, ale ta klasa pojawia się na stronach wielokrotnie. Bezpieczniej jest wyciąć ten fragment wyrażeniem regularnym. EDIT: Zrealizowałem wszystkie planowane poprawki dla faktów i ESKN fakty ESKN Jeśli nie będzie uwag, zgłoszę te 2 recipe'y Kovidowi do dołączenia do Calibre. A nad opiniami trzeba jeszcze popracować... |
Autor: | spadak [ 09 wrz 2010 14:53:52 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Można by jeszcze usunąć linka do Facebook'a: preprocess_regexps = [ (re.compile(i[0], re.IGNORECASE | re.DOTALL), i[1]) for i in [ (r'<h2>Zdj.cie</h2>', lambda match: '</div>'), (r'(<a href="http://www.facebook.com/)*(>RMF24.pl</a>) on Facebook</div>', lambda match: '</div>') ] ] |
Autor: | t3d [ 09 wrz 2010 21:44:57 ] | |||||||||
Tytuł: | Re: Polskie treści w calibre - komentarze | |||||||||
Ha! Nawet się pewnie nie spodziewałeś, ale w tym cytacie zwróciłeś mi uwagę na błąd, jakim było zamienianie z pierwszego wyrażenia. Nie powinno być tam </div> Wycinanie facebooka oczywiście zaimplementowałem fakty i ESKN już wyjąłem z katalogu beta. Z opiniami jest taki problem, że niektóre wpisy w feedach RSS linkują do strony z samym dźwiękiem - bez sensownego tekstu. Trzeba by te wpisy przefiltrować, ale na razie nie wiem jak. |
Autor: | Richard [ 10 wrz 2010 1:04:13 ] |
Tytuł: | Re: Polskie treści w calibre - komentarze |
Dałoby się dodać z http://www.pomorska.pl wiadomości z obrazkami tak ładnie jak np. "Interia.pl - Fakty" i "eKsiazki.org"? Jeżeli chodzi o zakres treści to połączenie tych dwóch rss'ów: www.pomorska.pl/rss.xml www.pomorska.pl/region.xml |
Autor: | t3d [ 10 wrz 2010 9:00:13 ] | |||||||||
Tytuł: | Re: Polskie treści w calibre - komentarze | |||||||||
A czy przypadkiem region nie jest podzbiorem tego głównego kanału? |
Autor: | Richard [ 10 wrz 2010 9:46:54 ] | |||||||||
Tytuł: | Re: Polskie treści w calibre - komentarze | |||||||||
Tak, z tym że jest tyle więcej wiadomości w głównym że patrząc na najnowsze wiadomości z głównego załapuje się jakieś 20% wiadomości z kategorii "Region". To może tylko sumę tych dwóch (zaznaczam że kategoria Bydgoszcz nie jest podzbiorem kategorii Region) : http://www.pomorska.pl/region.xml http://www.pomorska.pl/bydgoszcz.xml Jeśli znajdzie się czas to też osobno cały główny, jak nie to wystarczy mi Region+Bydgoszcz. |
Strona 2 z 17 | Wszystkie czasy w strefie UTC + 1 [czas letni (DST)] |
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group http://www.phpbb.com/ |