|
|
Teraz jest 21 lis 2024 21:20:18
|
Polskie treści w calibre - komentarze
Autor |
Wiadomość |
Użytkownik
Dołączył(a): 09 cze 2011 14:29:58 Posty: 131
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
_________________ No rest for the wicked. But there is a little... very little... hope.
|
21 lip 2011 17:45:51 |
|
|
Użytkownik
Dołączył(a): 22 lip 2011 15:38:04 Posty: 3
eCzytnik: Kindle 3G
|
Re: Polskie treści w calibre - komentarze
Przygotowałem takie coś dla nowyobywatel.pl - strony „Nowego Obywatela” - kwartalnika o tematyce społeczno-politycznej. Recipe powinien zasysać artykuły z trzech działów: "Aktualności", "Opinie" i "Nasze rozmowy". Akurat w ciągu ostatnich 7 dni nie było żadnych artykułów w działach "Opinie" i "Nasze rozmowy", więc gdyby ktoś chciał sobie ściągnąć jakieś teksty z tych sekcji, musi zmienić oldest_article = 7 na np. 30... Nie wiem, czy wszystko jest ok, czy coś można by zrobić lepiej?
Ostatnio edytowano 22 lip 2011 19:27:31 przez ps82, łącznie edytowano 1 raz
|
22 lip 2011 16:00:44 |
|
|
Użytkownik
Dołączył(a): 12 lip 2011 23:29:14 Posty: 26 Lokalizacja: WLKP
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
popraw i wstaw w Code ... teraz OK wieczorem to oblookam ... działa
_________________ Pozdrawiam {:-) M . nauka słówek śmiech TO zdrowie meczyki.TV
|
22 lip 2011 21:25:13 |
|
|
Użytkownik
Dołączył(a): 16 lip 2011 14:21:10 Posty: 133
eCzytnik: Kindle 3
|
Re: Polskie treści w calibre - komentarze
Dziękuję za odpowiedzi w sprawie artykułów wielostronicowych. Niestety w tym przypadku wersja do druku nie pomoże, gdyż takowej nie ma (ok, jest ale dla osób opłacających abonament). Chodzi mi o stronę gry-online.pl, poniżej link do przykładowej, wielostronicowej zapowiedzi http://www.gry-online.pl/S022.asp?ID=7581. Analizując reguły w calibre znalazłem funkcję append_page ale jest ona dla mnie niezbyt zrozumiała i byłbym wdzięczny o wytłumaczenie jej działania. Poniższy kod opierałem na append_page z reguły pclab.pl i adventure gamers. def append_page(self, soup, appendtag, position): pager = soup.find(name='a',attrs={'class':'num_str_nex'}) if pager: nexturl = pager['href'] soup2 = self.index_to_soup('http://www.gry-online.pl/' + nexturl) pagetext = soup2.find(name='p', attrs={'class':'wtx1'}) pagetext.extract() pos = len(appendtag.contents) appendtag.insert(pos, pagetext) pos = len(appendtag.contents) self.append_page(soup2, appendtag) Link do całej reguły: http://www.mediafire.com/?s1kdd22a9ah2542. Pozdrawiam.
|
24 lip 2011 11:49:15 |
|
|
Użytkownik
Dołączył(a): 12 lip 2011 23:29:14 Posty: 26 Lokalizacja: WLKP
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
chłopaki możecie sprawdzić u siebie recepte na rzeczpospolitą bo u mnie sciąga tylko 25 artykułów a nie tak jak mam ustawione 100 oldest_article = 1 max_articles_per_feed = 100 chodzi o to że w ciągu roboczego dnia jest więcej do pobrania - nie liczyłem dokładnie ale na pewno więcej niż 25 - a takie zachowanie wycina wiadomości najlepiej to sprawdzić porównując z czytnikiem rss i tym co zapodało nam calibre
_________________ Pozdrawiam {:-) M . nauka słówek śmiech TO zdrowie meczyki.TV
|
26 lip 2011 16:42:33 |
|
|
Użytkownik
Dołączył(a): 12 lip 2011 23:29:14 Posty: 26 Lokalizacja: WLKP
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
zauważyłem ten problem również w innych gazetkach - calibre pobiera tylko ostanie 25 news'ów - można to łatwo podejrzeć w spisie treści
czy u Was jest tak samo?
_________________ Pozdrawiam {:-) M . nauka słówek śmiech TO zdrowie meczyki.TV
|
02 sie 2011 12:09:39 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
Drodzy czytelnicy rzepy Macie max. 25 artykułów w kategorii, bo rssy rzepy nie zawierają więcej: http://rss.feedsportal.com/c/32536/f/482351/index.rssW czytniku rss może być ich więcej, jeśli łączy się częściej niż raz w ciągu doby. A calibre zaczytuje kanał rss jednorazowo, bezpośrednio przed stworzeniem pliku.
_________________ Porównywarka cen ebooków
|
02 sie 2011 12:18:47 |
|
|
Użytkownik
Dołączył(a): 12 lip 2011 23:29:14 Posty: 26 Lokalizacja: WLKP
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
nie tylko rp.pl tak robi bbc en ma tak samo w sumie nie spotkałem kanału który 'nadaje' więcej więc ... w takim razie do czego jest to
_________________ Pozdrawiam {:-) M . nauka słówek śmiech TO zdrowie meczyki.TV
|
02 sie 2011 16:47:25 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
na wszelki wypadek
_________________ Porównywarka cen ebooków
|
02 sie 2011 20:11:14 |
|
|
Użytkownik
Dołączył(a): 16 lip 2011 14:21:10 Posty: 133
eCzytnik: Kindle 3
|
Re: Polskie treści w calibre - komentarze
Ostatnio edytowano 18 sie 2011 17:08:31 przez fenuks, łącznie edytowano 1 raz
|
09 sie 2011 13:01:43 |
|
|
Admin
Dołączył(a): 11 lip 2007 19:38:54 Posty: 3266 Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
|
Re: Polskie treści w calibre - komentarze
Czemu one są takie ubogie w informacje o samych recepturkach? Ani słowa o autorze, tytule, opisie, licencji... To można spokojnie dodać i one wtedy będą jeszcze ładniejsze
_________________
|
09 sie 2011 13:06:02 |
|
|
Użytkownik
Dołączył(a): 16 lip 2011 14:21:10 Posty: 133
eCzytnik: Kindle 3
|
Re: Polskie treści w calibre - komentarze
To detale. Na razie chcę po prostu przetestować na cierpliwych użytkownikach forum czy nie mają jakichś karygodnych błędów, a jeśli nie to dodam brakujące informacje i zgłoszę receptury do calibre;P
|
09 sie 2011 15:26:53 |
|
|
Admin
Dołączył(a): 11 lip 2007 19:38:54 Posty: 3266 Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
|
Re: Polskie treści w calibre - komentarze
Ach, chyba że tak. Myślałem, że to wersja finalna, stąd moje uwaga.
_________________
|
09 sie 2011 15:48:45 |
|
|
Użytkownik
Dołączył(a): 14 sie 2011 17:02:41 Posty: 1
eCzytnik: Kindle
|
Re: Polskie treści w calibre - komentarze
Poprawiona recepta dla rp.pl | | | | Kod: from calibre.web.feeds.news import BasicNewsRecipe
class RzeczpospolitaRecipe(BasicNewsRecipe): __license__ = 'GPL v3' __author__ = u'kwetal and Tomasz Dlugosz' language = 'pl' version = 1
title = u'Rzeczpospolita OnLine' publisher = u'Presspublica Sp.' category = u'News' description = u'Newspaper' oldest_article = 1 max_articles_per_feed = 100
no_stylesheets = True remove_javascript = True encoding = 'utf-8' # Seems to work best, but YMMV simultaneous_downloads = 1
feeds = [] feeds.append(u'http://www.rp.pl/rss/2.html') feeds.append(u'http://www.rp.pl/rss/10.html') feeds.append(u'http://www.rp.pl/rss/11.html') feeds.append(u'http://www.rp.pl/rss/12.html') feeds.append(u'http://www.rp.pl/rss/4.html') feeds.append(u'http://www.rp.pl/rss/5.html') feeds.append(u'http://www.rp.pl/rss/6.html') feeds.append(u'http://www.rp.pl/rss/7.html') feeds.append(u'http://www.rp.pl/rss/8.html')
keep_only_tags =[] keep_only_tags.append(dict(name = 'div', attrs = {'id' : 'story'}))
remove_tags =[] remove_tags.append(dict(name = 'div', attrs = {'id' : 'socialTools'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'articleToolBoxTop'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'clr'})) remove_tags.append(dict(name = 'div', attrs = {'id' : 'recommendations'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'editorPicks'})) remove_tags.append(dict(name = 'div', attrs = {'id' : 'articleCopyrightText'})) remove_tags.append(dict(name = 'div', attrs = {'id' : 'articleCopyrightButton'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'articleToolBoxBottom'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'more'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'addRecommendation'}))
extra_css = ''' body {font-family: verdana, arial, helvetica, geneva, sans-serif ;} h1{text-align: left;} h2{font-size: medium; font-weight: bold;} p.lead {font-weight: bold; text-align: left;} .authordate {font-size: small; color: #696969;} .fot{font-size: x-small; color: #666666;} .srodtytul {font-weight: bold;} '''
def skip_ad_pages(self, soup): if ('advertisement' in soup.find('title').string.lower()): href = soup.find('a').get('href') return self.index_to_soup(href, raw=True) else: return None
def print_version(self, url): start, sep, rest = url.rpartition('/') forget, sep, index = rest.rpartition(',')
return start + '/' + index + '?print=tak' | | | | |
t3d: kod na forum owijamy w znaczniki [ code ]. Bez tego stracisz formatowanie i python się wyłoży. Poza tym diff byłby lepszy
|
14 sie 2011 20:28:18 |
|
|
SwiatCzytnikow.pl
Dołączył(a): 14 sie 2010 11:00:21 Posty: 1873
eCzytnik: kindle, onyx, nook, kobo, pb, ipad
|
Re: Polskie treści w calibre - komentarze
@t3d: z ciekawości, po co diff, skoro receptę można wkleić w całości?
_________________ http://swiatczytnikow.pl (dawniej: Świat Kindle) http://ebooki.swiatczytnikow.pl - (prawie) wszystkie polskie e-booki w jednym miejscu, czyli porównywarka ofert księgarni.
|
14 sie 2011 20:35:10 |
|
|
Kto przegląda forum |
Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości |
|
Nie możesz rozpoczynać nowych wątków Nie możesz odpowiadać w wątkach Nie możesz edytować swoich postów Nie możesz usuwać swoich postów
|
|
|
|