eKsiążki
https://forum.eksiazki.org/

Polskie treści w calibre - komentarze
https://forum.eksiazki.org/recepty-f172/polskie-tresci-w-calibre-komentarze-t8606-135.html
Strona 10 z 17

Autor:  koliberek [ 21 lip 2011 17:45:51 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

:oops:

Autor:  ps82 [ 22 lip 2011 16:00:44 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Przygotowałem takie coś dla nowyobywatel.pl - strony „Nowego Obywatela” - kwartalnika o tematyce społeczno-politycznej. Recipe powinien zasysać artykuły z trzech działów: "Aktualności", "Opinie" i "Nasze rozmowy".
Kod:
class NowyObywatel(BasicNewsRecipe):
   title          = u'NowyObywatel.pl'
   publisher = u'Stowarzyszenie „Obywatele Obywatelom”'
   description = u'Strona WWW kwartalnika „Nowy Obywatel”'
   language = 'pl'
   __author__ = u'Stowarzyszenie „Obywatele Obywatelom”'
   oldest_article = 7
   max_articles_per_feed = 100
   cover_url = 'http://nowyobywatel.pl/img/nowyobywatel.gif'

   feeds          = [(u'Aktualno\u015bci',
u'http://nowyobywatel.pl/?cat=3&feed=rss2'),
                         (u'Opinie',
u'http://nowyobywatel.pl/?cat=7&feed=rss2'),
                         (u'Nasze rozmowy',
u'http://nowyobywatel.pl/?cat=8&feed=rss2')
                        ]


Akurat w ciągu ostatnich 7 dni nie było żadnych artykułów w działach "Opinie" i "Nasze rozmowy", więc gdyby ktoś chciał sobie ściągnąć jakieś teksty z tych sekcji, musi zmienić oldest_article = 7 na np. 30...

Nie wiem, czy wszystko jest ok, czy coś można by zrobić lepiej?

Autor:  Skarbek [ 22 lip 2011 21:25:13 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

ps82 napisał(a):
Nie wiem, czy wszystko jest ok, czy coś można by zrobić lepiej?

popraw i wstaw w Code ... teraz OK
wieczorem to oblookam ... działa

Autor:  fenuks [ 24 lip 2011 11:49:15 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Dziękuję za odpowiedzi w sprawie artykułów wielostronicowych. Niestety w tym przypadku wersja do druku nie pomoże, gdyż takowej nie ma (ok, jest ale dla osób opłacających abonament). Chodzi mi o stronę gry-online.pl, poniżej link do przykładowej, wielostronicowej zapowiedzi http://www.gry-online.pl/S022.asp?ID=7581. Analizując reguły w calibre znalazłem funkcję append_page ale jest ona dla mnie niezbyt zrozumiała i byłbym wdzięczny o wytłumaczenie jej działania. Poniższy kod opierałem na append_page z reguły pclab.pl i adventure gamers.

def append_page(self, soup, appendtag, position):
pager = soup.find(name='a',attrs={'class':'num_str_nex'})

if pager:
nexturl = pager['href']
soup2 = self.index_to_soup('http://www.gry-online.pl/' + nexturl)
pagetext = soup2.find(name='p', attrs={'class':'wtx1'})
pagetext.extract()
pos = len(appendtag.contents)
appendtag.insert(pos, pagetext)
pos = len(appendtag.contents)
self.append_page(soup2, appendtag)

Link do całej reguły: http://www.mediafire.com/?s1kdd22a9ah2542. Pozdrawiam.

Autor:  Skarbek [ 26 lip 2011 16:42:33 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

chłopaki możecie sprawdzić u siebie recepte na rzeczpospolitą bo u mnie sciąga tylko 25 artykułów a nie tak jak mam ustawione 100
oldest_article = 1
max_articles_per_feed = 100
chodzi o to że w ciągu roboczego dnia jest więcej do pobrania - nie liczyłem dokładnie ale na pewno więcej niż 25 - a takie zachowanie wycina wiadomości
najlepiej to sprawdzić porównując z czytnikiem rss i tym co zapodało nam calibre

Autor:  Skarbek [ 02 sie 2011 12:09:39 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

zauważyłem ten problem również w innych gazetkach - calibre pobiera tylko ostanie 25 news'ów - można to łatwo podejrzeć w spisie treści

czy u Was jest tak samo?

Autor:  t3d [ 02 sie 2011 12:18:47 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Drodzy czytelnicy rzepy :D

Macie max. 25 artykułów w kategorii, bo rssy rzepy nie zawierają więcej: http://rss.feedsportal.com/c/32536/f/482351/index.rss

W czytniku rss może być ich więcej, jeśli łączy się częściej niż raz w ciągu doby. A calibre zaczytuje kanał rss jednorazowo, bezpośrednio przed stworzeniem pliku.

Autor:  Skarbek [ 02 sie 2011 16:47:25 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

nie tylko rp.pl tak robi bbc en ma tak samo
w sumie nie spotkałem kanału który 'nadaje' więcej
więc ... w takim razie do czego jest to
Kod:
max_articles_per_feed = 100

Autor:  t3d [ 02 sie 2011 20:11:14 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

na wszelki wypadek :)

Autor:  fenuks [ 09 sie 2011 13:01:43 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Przygotowałem kilka receptur. Nie dostrzegłem żadnych usterek, jeśli jednak takowe się znajdą proszę mnie o tym poinformować i postaram się je poprawić. Oto one:
Android.org.pl - http://www.mediafire.com/?dr4ca2myhex1dgm
Bash.org.pl - http://www.mediafire.com/?emh7aa5w8zyvfc0
Cd-action.pl - http://www.mediafire.com/?wi8f8zxkj81xbda
Dobreprogramy.pl - http://www.mediafire.com/?z85jih8p7k1auij
Filmweb.pl - http://www.mediafire.com/?h0l6ath2nb3v06p
Gram.pl - http://www.mediafire.com/?r51ss4r1psb9220
Niebezpiecznik.pl - http://www.mediafire.com/?223l3kagj225eb2
Popnauka.pl - http://www.mediafire.com/?fmfy9h0kbbna9z6

Enjoy;D

Autor:  Mori [ 09 sie 2011 13:06:02 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Czemu one są takie ubogie w informacje o samych recepturkach? Ani słowa o autorze, tytule, opisie, licencji... To można spokojnie dodać i one wtedy będą jeszcze ładniejsze :D

Autor:  fenuks [ 09 sie 2011 15:26:53 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

To detale. Na razie chcę po prostu przetestować na cierpliwych użytkownikach forum czy nie mają jakichś karygodnych błędów, a jeśli nie to dodam brakujące informacje i zgłoszę receptury do calibre;P

Autor:  Mori [ 09 sie 2011 15:48:45 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Ach, chyba że tak. Myślałem, że to wersja finalna, stąd moje uwaga.

Autor:  wyzimir [ 14 sie 2011 20:28:18 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

Poprawiona recepta dla rp.pl

Kod:
from calibre.web.feeds.news import BasicNewsRecipe

class RzeczpospolitaRecipe(BasicNewsRecipe):
    __license__  = 'GPL v3'
    __author__ = u'kwetal and Tomasz Dlugosz'
    language = 'pl'
    version = 1

    title          = u'Rzeczpospolita OnLine'
    publisher = u'Presspublica Sp.'
    category = u'News'
    description = u'Newspaper'
    oldest_article = 1
    max_articles_per_feed = 100

    no_stylesheets = True
    remove_javascript = True
    encoding = 'utf-8'
    # Seems to work best, but YMMV
    simultaneous_downloads = 1

    feeds = []
    feeds.append(u'http://www.rp.pl/rss/2.html')
    feeds.append(u'http://www.rp.pl/rss/10.html')
    feeds.append(u'http://www.rp.pl/rss/11.html')
    feeds.append(u'http://www.rp.pl/rss/12.html')
    feeds.append(u'http://www.rp.pl/rss/4.html')
    feeds.append(u'http://www.rp.pl/rss/5.html')
    feeds.append(u'http://www.rp.pl/rss/6.html')
    feeds.append(u'http://www.rp.pl/rss/7.html')
    feeds.append(u'http://www.rp.pl/rss/8.html')

    keep_only_tags =[]
    keep_only_tags.append(dict(name = 'div', attrs = {'id' : 'story'}))

    remove_tags =[]
    remove_tags.append(dict(name = 'div', attrs = {'id' : 'socialTools'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'articleToolBoxTop'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'clr'}))
    remove_tags.append(dict(name = 'div', attrs = {'id' : 'recommendations'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'editorPicks'}))
    remove_tags.append(dict(name = 'div', attrs = {'id' : 'articleCopyrightText'}))
    remove_tags.append(dict(name = 'div', attrs = {'id' : 'articleCopyrightButton'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'articleToolBoxBottom'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'more'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'addRecommendation'}))

    extra_css = '''
                    body {font-family: verdana, arial, helvetica, geneva, sans-serif ;}
                    h1{text-align: left;}
                    h2{font-size: medium; font-weight: bold;}
                    p.lead {font-weight: bold; text-align: left;}
                    .authordate {font-size: small; color: #696969;}
                    .fot{font-size: x-small; color: #666666;}
                    .srodtytul {font-weight: bold;}
                    '''

    def skip_ad_pages(self, soup):
        if ('advertisement' in soup.find('title').string.lower()):
            href = soup.find('a').get('href')
            return self.index_to_soup(href, raw=True)
        else:
            return None

    def print_version(self, url):
        start, sep, rest = url.rpartition('/')
        forget, sep, index = rest.rpartition(',')

        return start + '/' + index + '?print=tak'

t3d: kod na forum owijamy w znaczniki [ code ]. Bez tego stracisz formatowanie i python się wyłoży. Poza tym diff byłby lepszy :D

Autor:  Vroo [ 14 sie 2011 20:35:10 ]
Tytuł:  Re: Polskie treści w calibre - komentarze

@t3d: z ciekawości, po co diff, skoro receptę można wkleić w całości? :-)

Strona 10 z 17 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/