Teraz jest 22 gru 2024 19:20:47




Utwórz nowy wątek Ten wątek jest zamknięty. Nie możesz w nim pisać ani edytować postów.  [ Posty: 242 ]  Przejdź na stronę Poprzednia strona  1 ... 10, 11, 12, 13, 14, 15, 16, 17  Następna strona
Polskie treści w calibre - komentarze 
Autor Wiadomość
Admin

Dołączył(a): 13 cze 2008 14:47:02
Posty: 2836
Lokalizacja: Gdańsk
eCzytnik: kindle
Post Re: Polskie treści w calibre - komentarze
fenuks, taka jest moja odpowiedź na Twoje sugestie: https://github.com/t3d/kalibrator/commi ... 38d2b5fefa
Dzięki!

Zaraz napiszę na mobileread do Kovida i dodam info o histmagu.

_________________
Zgred - Rafał Ziemkiewicz napisał(a):
Dziś trzeba pisać o mieczach, czarach, toporach i wojowniczkach w blaszanych bikini, wszystko inne to już jest nisza w niszy. Albo o nastoletnich wampirach.
Porównywarka cen ebooków


15 lis 2011 21:22:20
Zobacz profil WWW
Użytkownik

Dołączył(a): 17 maja 2011 20:06:17
Posty: 4
eCzytnik: kindle 3
Post Re: Polskie treści w calibre - komentarze
Czy ktoś byłby tak miły i zrobił receptę do mp.pl?


30 lis 2011 2:50:38
Zobacz profil
Użytkownik

Dołączył(a): 12 lip 2011 23:29:14
Posty: 26
Lokalizacja: WLKP
eCzytnik: Kindle 3 WiFi
Post Re: Polskie treści w calibre - komentarze
Przem napisał(a):
Czy ktoś byłby tak miły i zrobił receptę do mp.pl?

pewnie sam sobie zrobiłbyś to najlepiej ale nie widzisz [tak jak ja] kanału RSS - napisz do nich że chcesz czytać ich www przez czytnik RSS i jak dodadzą ten kanał na pewno sam sobie poradzisz

_________________
Pozdrawiam {:-) M
.
nauka słówek
śmiech TO zdrowie
meczyki.TV


30 lis 2011 12:31:40
Zobacz profil ICQ WWW
Użytkownik

Dołączył(a): 16 lip 2011 14:21:10
Posty: 133
eCzytnik: Kindle 3
Post Re: Polskie treści w calibre - komentarze
Skarbek napisał(a):
pewnie sam sobie zrobiłbyś to najlepiej ale nie widzisz [tak jak ja] kanału RSS - napisz do nich że chcesz czytać ich www przez czytnik RSS i jak dodadzą ten kanał na pewno sam sobie poradzisz

RSS oczywiście znacznie upraszcza sprawę, ale nie jest wymagany. Można samemu stworzyć listę artykułów za pomocą funkcji parse_index() jak zrobiłem to np. w recepturze do Nowej Fantastyki, która nie ma kanału RSS.

Sama strona jest całkiem ciekawa i może w przypływie wolnego czasu zrobię stosowną recepturę.


30 lis 2011 20:56:07
Zobacz profil
Użytkownik

Dołączył(a): 17 maja 2011 20:06:17
Posty: 4
eCzytnik: kindle 3
Post Re: Polskie treści w calibre - komentarze
fenuks napisał(a):
Sama strona jest całkiem ciekawa i może w przypływie wolnego czasu zrobię stosowną recepturę.


Byłbym wdzięczny, próbowałem sam zrobić, ale nic z tego nie wyszło.


01 gru 2011 14:20:04
Zobacz profil
Użytkownik

Dołączył(a): 19 lis 2011 17:15:44
Posty: 13
eCzytnik: kundelek
Post Re: Polskie treści w calibre - komentarze
stworzyłem swoją pierwszą receptę dla portalu Rynek Zdrowia. Proszę o recenzję i wszelkie sugestie, jako że o programowaniu nie mam większego pojęcia i działałem po omacku metodą prób i błędów. A jak by ktoś mi podpowiedział co należy dopisać w recepcie by pojawiły się artykuły z dwóch działów tego portalu które nie mają RSS (http://www.rynekzdrowia.pl/Wywiady/ oraz http://www.rynekzdrowia.pl/Moim-zdaniem/) to byłbym bardzo wdzięczny. oto ona:
Kod:
class rynekzdrowia(BasicNewsRecipe):
    title          = u'Rynek Zdrowia'
    __author__ = u'spi630'
    masthead_url = 'http://k.rynekzdrowia.pl/images/headerLogo.png'
    cover_url = 'http://k.rynekzdrowia.pl/images/headerLogo.png'
    oldest_article = 1
    max_articles_per_feed = 25
    no_stylesheets = True
    auto_cleanup = True
    remove_empty_feeds=True
   
    remove_tags_before = dict(name='h3')
   
    feeds          = [(u'Finanse i Zarz\u0105dzanie', u'http://www.rynekzdrowia.pl/Kanal/finanse.html'), (u'Inwestycje', u'http://www.rynekzdrowia.pl/Kanal/inwestycje.html'), (u'Aparatura i wyposa\u017cenie', u'http://www.rynekzdrowia.pl/Kanal/aparatura.html'), (u'Informatyka', u'http://www.rynekzdrowia.pl/Kanal/informatyka.html'), (u'Prawo', u'http://www.rynekzdrowia.pl/Kanal/prawo.html'), (u'Polityka zdrowotna', u'http://www.rynekzdrowia.pl/Kanal/polityka_zdrowotna.html'), (u'Ubezpieczenia Zdrowotne', u'http://www.rynekzdrowia.pl/Kanal/ubezpieczenia.html'), (u'Farmacja', u'http://www.rynekzdrowia.pl/Kanal/farmacja.html'), (u'Badania i rozw\xf3j', u'http://www.rynekzdrowia.pl/Kanal/badania.html'), (u'Nauka', u'http://www.rynekzdrowia.pl/Kanal/nauka.html'), (u'Po godzinach', u'http://www.rynekzdrowia.pl/Kanal/godziny.html'), (u'Us\u0142ugi medyczne', u'http://www.rynekzdrowia.pl/Kanal/uslugi.html')]

    def print_version(self, url):
        url = url.replace('.html', ',drukuj.html')
        return url


Ostatnio edytowano 06 gru 2011 10:55:39 przez spi630, łącznie edytowano 1 raz



06 gru 2011 9:34:08
Zobacz profil
Użytkownik

Dołączył(a): 16 lip 2011 14:21:10
Posty: 133
eCzytnik: Kindle 3
Post Re: Polskie treści w calibre - komentarze
Zamknij kod w znaczniku code, gdyż straciłeś formatowanie, które jest kluczowe dla pythona.
Warto dodać remove_empty_feeds=True, dzięki czemu puste kategorie zostaną usunięte z ebooka.
spi630 napisał(a):
co należy dopisać w recepcie by pojawiły się artykuły z dwóch działów tego portalu które nie mają RSS

Można posłużyć się funkcją parse_index() [manual], ale ma to taką wadę, że nie możesz używać wtedy RSSów w ogóle, dla każdego działu sam musisz utworzyć listę artykułów, choć jeśli strona jest jednolicie napisana to wystarczy napisać pomocniczą funkcję której zadaniem jest pozyskanie listy i podawać jej jako argument URL, może to wyglądać tak:Spoiler!
Kod:
def find_articles(self, url):
        articles = []
        soup=self.index_to_soup(url)
        tag=soup.find(attrs={'class':'belka1-tlo-m'})
        art=tag.findAll(name='a', attrs={'class':'a-box'})
        for i in art:
            title=i.string
            url=self.INDEX+i['href']
            #date=soup.find(id='footer').ul.li.string[41:-1]
            articles.append({'title' : title,
                   'url'   : url,
                   'date'  : '',
                   'description' : ''
                    })
        return articles

    def parse_index(self):
         feeds = []
         feeds.append((u"Opowiadania", self.find_articles('http://www.fantastyka.pl/3.html')))
         feeds.append((u"Publicystyka", self.find_articles('http://www.fantastyka.pl/6.html')))
         feeds.append((u"Hype Park", self.find_articles('http://www.fantastyka.pl/9.html')))

         return feeds

Jest też funkcja parse_feeds(), dzięki której można przeprowadzić edycję listy artykułów, czyli choć tego nie testowałem najpewniej mógłbyś tam dodać dodatkowe artykuły bez konieczności rezygnacji z RSSów.


06 gru 2011 10:23:58
Zobacz profil
Użytkownik

Dołączył(a): 19 lis 2011 17:15:44
Posty: 13
eCzytnik: kundelek
Post Re: Polskie treści w calibre - komentarze
fenuks napisał(a):
Zamknij kod w znaczniku code, gdyż straciłeś formatowanie, które jest kluczowe dla pythona.
Warto dodać remove_empty_feeds=True, dzięki czemu puste kategorie zostaną usunięte z ebooka.

dziękuję, już poprawiłem


06 gru 2011 11:00:03
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 09 cze 2011 14:29:58
Posty: 131
eCzytnik: Kindle 3 WiFi
Post Re: Polskie treści w calibre - komentarze
Nowa fantastyka ściąga się bez problemu,ale ściągniętego pliku nie da się otworzyć ani pod calibrem ani w czytniku. Ja robię coś źle, czy jest jakiś błąd?

_________________
No rest for the wicked. But there is a little... very little... hope.


07 gru 2011 15:14:42
Zobacz profil
Użytkownik

Dołączył(a): 16 lip 2011 14:21:10
Posty: 133
eCzytnik: Kindle 3
Post Re: Polskie treści w calibre - komentarze
Nie zauważyłem nic podobnego w swoim przypadku, więc najpewniej 'robisz coś źle'. Poza tym nie podałeś w ogóle żadnych szczegółów, jakiego systemu używasz, wersji calibre, co dokładnie się dzieje podczas otwierania (ebook-viewer się zawiesza, pokazuje komunikaty błędów itd.).


08 gru 2011 10:41:48
Zobacz profil
Użytkownik

Dołączył(a): 10 lis 2011 22:02:29
Posty: 6
eCzytnik: K4
Post Re: Polskie treści w calibre - komentarze
Ja mam to samo co koliberek. NF ściąga się bez problemu na mojego K4, lecz gdy chcę przejść do treści wyskakuje komunikat, że dokument mógł zostać otworzony i mam skontaktować się z Amazonem.


08 gru 2011 17:49:19
Zobacz profil
Użytkownik

Dołączył(a): 31 maja 2011 11:21:12
Posty: 4
eCzytnik: K3 3G+WIFI
Post Re: Polskie treści w calibre - komentarze
Witam
Miałem to samo do wersji poniżej 0.8.28. Po ściągnięciu plik był nie do odczytu pod calibre i w czytniku. Mobipocket reader czytał go bez problemu.
Pomagała konwersja w calibre mobi -> mobi
W wersji 0.8.28 problem u mnie już nie występuje


08 gru 2011 18:19:06
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 09 cze 2011 14:29:58
Posty: 131
eCzytnik: Kindle 3 WiFi
Post Re: Polskie treści w calibre - komentarze
Mój błąd, przepraszam. Tyle czasu siedziałem na supporcie, a teraz sam zgłaszam błędy jak ostatni lamer :-)

Nowa fantastyka ściągana calibre'em w wersji 0.8.29, recepta chyba razem z updatem przyszła.
Objaw - plik otwiera się w przeglądarce calibre, po załadowaniu na Kindle'a (niezależnie od tego czy pocztą czy kablem) komunikat: File could not be opened. Oprogramowanie calibre w wersji 3.3 (od wczoraj, wreszcie update zrobiłem...)
Rzeczywiście pomogła konwersja MOBI -> MOBI, po niej plik wrzucony kablem na czytnik dał się otworzyć. Dziękuję za podpowiedź.

_________________
No rest for the wicked. But there is a little... very little... hope.


08 gru 2011 21:32:38
Zobacz profil
Użytkownik

Dołączył(a): 21 mar 2011 17:12:46
Posty: 517
Lokalizacja: Gdańsk
eCzytnik: K3, K4, KT, KPW, M92B, Galaxy Note
Post Re: Polskie treści w calibre - komentarze
Moja pierwsza recepta : Focus
Dopiero kiedy ją skończyłem to zauważyłem, że w calibre jest wersja [edit]fenuksa[/edit], która nie działa, dlatego zamieszczam moją tutaj :

Kod:
import re

from calibre.web.feeds.news import BasicNewsRecipe

class FocusRecipe(BasicNewsRecipe):
    __license__ = 'GPL v3'
    __author__ = u'intromatyk <intromatyk@gmail.com>'
    language = 'pl'
    version = 1

    title = u'Focus'
    publisher = u'Gruner + Jahr Polska'
    category = u'News'
    description = u'Newspaper'
    category='magazine'
    cover_url=''
    remove_empty_feeds= True
    no_stylesheets=True
    oldest_article = 7
    max_articles_per_feed = 100000
    recursions = 0

    no_stylesheets = True
    remove_javascript = True
    encoding = 'utf-8'
    # Seems to work best, but YMMV
    simultaneous_downloads = 5

    r = re.compile('.*(?P<url>http:\/\/(www.focus.pl)|(rss.feedsportal.com\/c)\/.*\.html?).*')
    keep_only_tags =[]
    keep_only_tags.append(dict(name = 'div', attrs = {'id' : 'cll'}))
   
    remove_tags =[]
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'ulm noprint'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'txb'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'h2'}))
    remove_tags.append(dict(name = 'ul', attrs = {'class' : 'txu'}))
    remove_tags.append(dict(name = 'div', attrs = {'class' : 'ulc'}))

    extra_css = '''
                    body {font-family: verdana, arial, helvetica, geneva, sans-serif ;}
                    h1{text-align: left;}
                    h2{font-size: medium; font-weight: bold;}
                    p.lead {font-weight: bold; text-align: left;}
                    .authordate {font-size: small; color: #696969;}
                    .fot{font-size: x-small; color: #666666;}
                    '''   


    feeds          = [
                            ('Nauka', 'http://focus.pl.feedsportal.com/c/32992/f/532693/index.rss'),
                            ('Historia', 'http://focus.pl.feedsportal.com/c/32992/f/532694/index.rss'),
                            ('Cywilizacja', 'http://focus.pl.feedsportal.com/c/32992/f/532695/index.rss'),
                            ('Sport', 'http://focus.pl.feedsportal.com/c/32992/f/532696/index.rss'),
                            ('Technika', 'http://focus.pl.feedsportal.com/c/32992/f/532697/index.rss'),
                            ('Przyroda', 'http://focus.pl.feedsportal.com/c/32992/f/532698/index.rss'),
                            ('Technologie', 'http://focus.pl.feedsportal.com/c/32992/f/532699/index.rss'),                           
                          ]

    def skip_ad_pages(self, soup):
        if ('advertisement' in soup.find('title').string.lower()):
            href = soup.find('a').get('href')
            return self.index_to_soup(href, raw=True)
        else:
            return None

    def get_cover_url(self):
        soup=self.index_to_soup('http://www.focus.pl/magazyn/')
        tag=soup.find(name='div', attrs={'class':'clr fl'})
        if tag:
            self.cover_url='http://www.focus.pl/' + tag.a['href']
            return getattr(self, 'cover_url', self.cover_url)

    def print_version(self, url):
     if url.count ('focus.pl.feedsportal.com'):
            u = url.find('focus0Bpl')
            u = 'http://www.focus.pl/' + url[u + 11:]
            u = u.replace('0C', '/')
            u = u.replace('A', '')
            u = u.replace ('0E','-')
            u = u.replace('/nc/1//story01.htm', '/do-druku/1')
     else:
            u = url.replace('/nc/1','/do-druku/1')           
     return u

_________________


Ostatnio edytowano 17 gru 2011 19:59:23 przez Artur Stachecki, łącznie edytowano 1 raz



17 gru 2011 11:53:28
Zobacz profil WWW
Użytkownik

Dołączył(a): 16 lip 2011 14:21:10
Posty: 133
eCzytnik: Kindle 3
Post Re: Polskie treści w calibre - komentarze
Faktycznie recepta dla Focus.pl nie działa, wysłałem dzisiaj garść nowych i poprawionych recept na mobileread, ale Focus mi jakoś umknął. Poprawię w wolnym czasie, zresztą i tak calibre wyjdzie najwcześniej w piątek. Dzięki za cynk. Jeśli chcesz możesz podmienić moją wersję swoją i oszczędzisz mi przy tym pracy, jakbyś był zainteresowany to możesz podpiąć się tutaj. Przy okazji nie działają recepty dla National Geographic i Kopalni Wiedzy.
At last but not least: proszę popraw mój nick na fenuks, fenkus brzmi jak nazwa jakiejś małpy z Afryki :cry:


17 gru 2011 18:28:35
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Ten wątek jest zamknięty. Nie możesz w nim pisać ani edytować postów.  [ Posty: 242 ]  Przejdź na stronę Poprzednia strona  1 ... 10, 11, 12, 13, 14, 15, 16, 17  Następna strona


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do: