|
|
Teraz jest 21 lis 2024 16:54:58
|
Polskie treści w calibre - komentarze
Autor |
Wiadomość |
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: Polskie treści w calibre - komentarze
fenuks, taka jest moja odpowiedź na Twoje sugestie: https://github.com/t3d/kalibrator/commi ... 38d2b5fefaDzięki! Zaraz napiszę na mobileread do Kovida i dodam info o histmagu.
_________________ Porównywarka cen ebooków
|
15 lis 2011 21:22:20 |
|
|
Użytkownik
Dołączył(a): 17 maja 2011 20:06:17 Posty: 4
eCzytnik: kindle 3
|
Re: Polskie treści w calibre - komentarze
Czy ktoś byłby tak miły i zrobił receptę do mp.pl?
|
30 lis 2011 2:50:38 |
|
|
Użytkownik
Dołączył(a): 12 lip 2011 23:29:14 Posty: 26 Lokalizacja: WLKP
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
pewnie sam sobie zrobiłbyś to najlepiej ale nie widzisz [tak jak ja] kanału RSS - napisz do nich że chcesz czytać ich www przez czytnik RSS i jak dodadzą ten kanał na pewno sam sobie poradzisz
_________________ Pozdrawiam {:-) M . nauka słówek śmiech TO zdrowie meczyki.TV
|
30 lis 2011 12:31:40 |
|
|
Użytkownik
Dołączył(a): 16 lip 2011 14:21:10 Posty: 133
eCzytnik: Kindle 3
|
Re: Polskie treści w calibre - komentarze
RSS oczywiście znacznie upraszcza sprawę, ale nie jest wymagany. Można samemu stworzyć listę artykułów za pomocą funkcji parse_index() jak zrobiłem to np. w recepturze do Nowej Fantastyki, która nie ma kanału RSS. Sama strona jest całkiem ciekawa i może w przypływie wolnego czasu zrobię stosowną recepturę.
|
30 lis 2011 20:56:07 |
|
|
Użytkownik
Dołączył(a): 17 maja 2011 20:06:17 Posty: 4
eCzytnik: kindle 3
|
Re: Polskie treści w calibre - komentarze
Byłbym wdzięczny, próbowałem sam zrobić, ale nic z tego nie wyszło.
|
01 gru 2011 14:20:04 |
|
|
Użytkownik
Dołączył(a): 19 lis 2011 17:15:44 Posty: 13
eCzytnik: kundelek
|
Re: Polskie treści w calibre - komentarze
stworzyłem swoją pierwszą receptę dla portalu Rynek Zdrowia. Proszę o recenzję i wszelkie sugestie, jako że o programowaniu nie mam większego pojęcia i działałem po omacku metodą prób i błędów. A jak by ktoś mi podpowiedział co należy dopisać w recepcie by pojawiły się artykuły z dwóch działów tego portalu które nie mają RSS ( http://www.rynekzdrowia.pl/Wywiady/ oraz http://www.rynekzdrowia.pl/Moim-zdaniem/) to byłbym bardzo wdzięczny. oto ona: | | | | Kod: class rynekzdrowia(BasicNewsRecipe): title = u'Rynek Zdrowia' __author__ = u'spi630' masthead_url = 'http://k.rynekzdrowia.pl/images/headerLogo.png' cover_url = 'http://k.rynekzdrowia.pl/images/headerLogo.png' oldest_article = 1 max_articles_per_feed = 25 no_stylesheets = True auto_cleanup = True remove_empty_feeds=True remove_tags_before = dict(name='h3') feeds = [(u'Finanse i Zarz\u0105dzanie', u'http://www.rynekzdrowia.pl/Kanal/finanse.html'), (u'Inwestycje', u'http://www.rynekzdrowia.pl/Kanal/inwestycje.html'), (u'Aparatura i wyposa\u017cenie', u'http://www.rynekzdrowia.pl/Kanal/aparatura.html'), (u'Informatyka', u'http://www.rynekzdrowia.pl/Kanal/informatyka.html'), (u'Prawo', u'http://www.rynekzdrowia.pl/Kanal/prawo.html'), (u'Polityka zdrowotna', u'http://www.rynekzdrowia.pl/Kanal/polityka_zdrowotna.html'), (u'Ubezpieczenia Zdrowotne', u'http://www.rynekzdrowia.pl/Kanal/ubezpieczenia.html'), (u'Farmacja', u'http://www.rynekzdrowia.pl/Kanal/farmacja.html'), (u'Badania i rozw\xf3j', u'http://www.rynekzdrowia.pl/Kanal/badania.html'), (u'Nauka', u'http://www.rynekzdrowia.pl/Kanal/nauka.html'), (u'Po godzinach', u'http://www.rynekzdrowia.pl/Kanal/godziny.html'), (u'Us\u0142ugi medyczne', u'http://www.rynekzdrowia.pl/Kanal/uslugi.html')]
def print_version(self, url): url = url.replace('.html', ',drukuj.html') return url | | | | |
Ostatnio edytowano 06 gru 2011 10:55:39 przez spi630, łącznie edytowano 1 raz
|
06 gru 2011 9:34:08 |
|
|
Użytkownik
Dołączył(a): 16 lip 2011 14:21:10 Posty: 133
eCzytnik: Kindle 3
|
Re: Polskie treści w calibre - komentarze
Zamknij kod w znaczniku code, gdyż straciłeś formatowanie, które jest kluczowe dla pythona. Warto dodać remove_empty_feeds=True, dzięki czemu puste kategorie zostaną usunięte z ebooka. Można posłużyć się funkcją parse_index() [ manual], ale ma to taką wadę, że nie możesz używać wtedy RSSów w ogóle, dla każdego działu sam musisz utworzyć listę artykułów, choć jeśli strona jest jednolicie napisana to wystarczy napisać pomocniczą funkcję której zadaniem jest pozyskanie listy i podawać jej jako argument URL, może to wyglądać tak: Spoiler! Jest też funkcja parse_feeds(), dzięki której można przeprowadzić edycję listy artykułów, czyli choć tego nie testowałem najpewniej mógłbyś tam dodać dodatkowe artykuły bez konieczności rezygnacji z RSSów.
|
06 gru 2011 10:23:58 |
|
|
Użytkownik
Dołączył(a): 19 lis 2011 17:15:44 Posty: 13
eCzytnik: kundelek
|
Re: Polskie treści w calibre - komentarze
|
06 gru 2011 11:00:03 |
|
|
Użytkownik
Dołączył(a): 09 cze 2011 14:29:58 Posty: 131
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
Nowa fantastyka ściąga się bez problemu,ale ściągniętego pliku nie da się otworzyć ani pod calibrem ani w czytniku. Ja robię coś źle, czy jest jakiś błąd?
_________________ No rest for the wicked. But there is a little... very little... hope.
|
07 gru 2011 15:14:42 |
|
|
Użytkownik
Dołączył(a): 16 lip 2011 14:21:10 Posty: 133
eCzytnik: Kindle 3
|
Re: Polskie treści w calibre - komentarze
Nie zauważyłem nic podobnego w swoim przypadku, więc najpewniej 'robisz coś źle'. Poza tym nie podałeś w ogóle żadnych szczegółów, jakiego systemu używasz, wersji calibre, co dokładnie się dzieje podczas otwierania (ebook-viewer się zawiesza, pokazuje komunikaty błędów itd.).
|
08 gru 2011 10:41:48 |
|
|
Użytkownik
Dołączył(a): 10 lis 2011 22:02:29 Posty: 6
eCzytnik: K4
|
Re: Polskie treści w calibre - komentarze
Ja mam to samo co koliberek. NF ściąga się bez problemu na mojego K4, lecz gdy chcę przejść do treści wyskakuje komunikat, że dokument mógł zostać otworzony i mam skontaktować się z Amazonem.
|
08 gru 2011 17:49:19 |
|
|
Użytkownik
Dołączył(a): 31 maja 2011 11:21:12 Posty: 4
eCzytnik: K3 3G+WIFI
|
Re: Polskie treści w calibre - komentarze
Witam Miałem to samo do wersji poniżej 0.8.28. Po ściągnięciu plik był nie do odczytu pod calibre i w czytniku. Mobipocket reader czytał go bez problemu. Pomagała konwersja w calibre mobi -> mobi W wersji 0.8.28 problem u mnie już nie występuje
|
08 gru 2011 18:19:06 |
|
|
Użytkownik
Dołączył(a): 09 cze 2011 14:29:58 Posty: 131
eCzytnik: Kindle 3 WiFi
|
Re: Polskie treści w calibre - komentarze
Mój błąd, przepraszam. Tyle czasu siedziałem na supporcie, a teraz sam zgłaszam błędy jak ostatni lamer Nowa fantastyka ściągana calibre'em w wersji 0.8.29, recepta chyba razem z updatem przyszła. Objaw - plik otwiera się w przeglądarce calibre, po załadowaniu na Kindle'a (niezależnie od tego czy pocztą czy kablem) komunikat: File could not be opened. Oprogramowanie calibre w wersji 3.3 (od wczoraj, wreszcie update zrobiłem...) Rzeczywiście pomogła konwersja MOBI -> MOBI, po niej plik wrzucony kablem na czytnik dał się otworzyć. Dziękuję za podpowiedź.
_________________ No rest for the wicked. But there is a little... very little... hope.
|
08 gru 2011 21:32:38 |
|
|
Użytkownik
Dołączył(a): 21 mar 2011 17:12:46 Posty: 517 Lokalizacja: Gdańsk
eCzytnik: K3, K4, KT, KPW, M92B, Galaxy Note
|
Re: Polskie treści w calibre - komentarze
Moja pierwsza recepta : FocusDopiero kiedy ją skończyłem to zauważyłem, że w calibre jest wersja [edit]fenuksa[/edit], która nie działa, dlatego zamieszczam moją tutaj : | | | | Kod: import re
from calibre.web.feeds.news import BasicNewsRecipe
class FocusRecipe(BasicNewsRecipe): __license__ = 'GPL v3' __author__ = u'intromatyk <intromatyk@gmail.com>' language = 'pl' version = 1
title = u'Focus' publisher = u'Gruner + Jahr Polska' category = u'News' description = u'Newspaper' category='magazine' cover_url='' remove_empty_feeds= True no_stylesheets=True oldest_article = 7 max_articles_per_feed = 100000 recursions = 0
no_stylesheets = True remove_javascript = True encoding = 'utf-8' # Seems to work best, but YMMV simultaneous_downloads = 5
r = re.compile('.*(?P<url>http:\/\/(www.focus.pl)|(rss.feedsportal.com\/c)\/.*\.html?).*') keep_only_tags =[] keep_only_tags.append(dict(name = 'div', attrs = {'id' : 'cll'})) remove_tags =[] remove_tags.append(dict(name = 'div', attrs = {'class' : 'ulm noprint'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'txb'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'h2'})) remove_tags.append(dict(name = 'ul', attrs = {'class' : 'txu'})) remove_tags.append(dict(name = 'div', attrs = {'class' : 'ulc'}))
extra_css = ''' body {font-family: verdana, arial, helvetica, geneva, sans-serif ;} h1{text-align: left;} h2{font-size: medium; font-weight: bold;} p.lead {font-weight: bold; text-align: left;} .authordate {font-size: small; color: #696969;} .fot{font-size: x-small; color: #666666;} '''
feeds = [ ('Nauka', 'http://focus.pl.feedsportal.com/c/32992/f/532693/index.rss'), ('Historia', 'http://focus.pl.feedsportal.com/c/32992/f/532694/index.rss'), ('Cywilizacja', 'http://focus.pl.feedsportal.com/c/32992/f/532695/index.rss'), ('Sport', 'http://focus.pl.feedsportal.com/c/32992/f/532696/index.rss'), ('Technika', 'http://focus.pl.feedsportal.com/c/32992/f/532697/index.rss'), ('Przyroda', 'http://focus.pl.feedsportal.com/c/32992/f/532698/index.rss'), ('Technologie', 'http://focus.pl.feedsportal.com/c/32992/f/532699/index.rss'), ]
def skip_ad_pages(self, soup): if ('advertisement' in soup.find('title').string.lower()): href = soup.find('a').get('href') return self.index_to_soup(href, raw=True) else: return None
def get_cover_url(self): soup=self.index_to_soup('http://www.focus.pl/magazyn/') tag=soup.find(name='div', attrs={'class':'clr fl'}) if tag: self.cover_url='http://www.focus.pl/' + tag.a['href'] return getattr(self, 'cover_url', self.cover_url)
def print_version(self, url): if url.count ('focus.pl.feedsportal.com'): u = url.find('focus0Bpl') u = 'http://www.focus.pl/' + url[u + 11:] u = u.replace('0C', '/') u = u.replace('A', '') u = u.replace ('0E','-') u = u.replace('/nc/1//story01.htm', '/do-druku/1') else: u = url.replace('/nc/1','/do-druku/1') return u | | | | |
_________________
Ostatnio edytowano 17 gru 2011 19:59:23 przez Artur Stachecki, łącznie edytowano 1 raz
|
17 gru 2011 11:53:28 |
|
|
Użytkownik
Dołączył(a): 16 lip 2011 14:21:10 Posty: 133
eCzytnik: Kindle 3
|
Re: Polskie treści w calibre - komentarze
Faktycznie recepta dla Focus.pl nie działa, wysłałem dzisiaj garść nowych i poprawionych recept na mobileread, ale Focus mi jakoś umknął. Poprawię w wolnym czasie, zresztą i tak calibre wyjdzie najwcześniej w piątek. Dzięki za cynk. Jeśli chcesz możesz podmienić moją wersję swoją i oszczędzisz mi przy tym pracy, jakbyś był zainteresowany to możesz podpiąć się tutaj. Przy okazji nie działają recepty dla National Geographic i Kopalni Wiedzy. At last but not least: proszę popraw mój nick na fenuks, fenkus brzmi jak nazwa jakiejś małpy z Afryki
|
17 gru 2011 18:28:35 |
|
|
Kto przegląda forum |
Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości |
|
Nie możesz rozpoczynać nowych wątków Nie możesz odpowiadać w wątkach Nie możesz edytować swoich postów Nie możesz usuwać swoich postów
|
|
|
|