|
|
Teraz jest 24 lis 2024 9:54:38
|
Autor |
Wiadomość |
Użytkownik
Dołączył(a): 03 gru 2009 20:13:29 Posty: 30
|
www.pbi.edu.pl
Cześć Nie wiem czy ktoś z tego woogole korzysta, ale napisałem skrypcik który umożliwia zgranie i scalenie książek z http://www.pbi.edu.pl/Na razie tylko tych które są w formie tekstowej, niestety nie jest to aż tak proste, gdyż wymaga do działania pod windowsem cygwina, ( http://www.cygwin.com ) albo linuksa. Ale działa, po ściągnięciu można książkę wprost przerzucić do eclicto Instrukcja, skrypt oraz katalog pbi jest dostępny tutaj: http://chomikuj.pl/rdst75/programiki plik pbi.zip W skrócie należy zainstalować cygwina, (koniecznie wybierając dodatkowo wget), przegrać pliczek z zipa do katalogu cygwina. Odpalić skrypt, przegrać plik .html z katalogu książki na czytnik, czy jak to tam chcemy używać.
|
16 lut 2010 14:53:47 |
|
|
Admin
Dołączył(a): 11 lip 2007 19:38:54 Posty: 3266 Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
|
Re: www.pbi.edu.pl
Ja też byłem proszony o to, więc tak niejako "na kolanie" napisałem prosty skrypt PHP do pobierania książek (nawet dwie przykładowe są w środku): http://www.mediafire.com/?knyxmqcwejyPHP w wersji 5 wymagane - file_put_contents dochodzi, to dlatego =] curl jako rozszerzenie do PHP również wymagany (dla użytkowników Windowsa polecam ściągnąć sobie XAMPP [może być wersja lite]). Skrypt można pewnie zoptymalizować, ładniej zapisać, przerobić na klasę itp. - ja nie miałem ani czasu, ani ochoty, by to zrobić.
_________________
|
18 lut 2010 1:20:29 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: www.pbi.edu.pl
Dobry pomysł z tym skryptem, ale mam kilka uwag A propos instrukcji... Polskie znaki są u mnie skrzaczone, zdanie u działaniu pod linuksem urwane, a poza tym id nie jest cyfrą, jak piszesz, tylko liczbą A propos skryptu (jeszcze go nie odpalałem, ale takie mam pierwsze przemyślenia po zajrzeniu do niego) 1. Nie podałeś licencji 2. Może dobrym rozwiązaniem byłoby użycie "mktemp -d" A tak ogólnie, to chomik nie jest zbyt dobrym miejscem na publikację kodu. Polecam githuba. Umożliwia wygodną współpracę, sam pakuje w archiwa i (z powodu oparcia na gicie) wspaniale ułatwia śledzenie zmian w kodzie (i ich ewentualne wycofanie, jeśli coś zostało popsute )
_________________ Porównywarka cen ebooków
|
19 lut 2010 12:07:02 |
|
|
Użytkownik
Dołączył(a): 03 gru 2009 20:13:29 Posty: 30
|
Re: www.pbi.edu.pl
Licencje wybierz sobie dowolną, to tylko kilka linijek nie warto się bawić, dopisze public domain przy jakiś poprawkach. To samo do publikacji, na razie nie sądzę żeby dużo osób korzystało z programu, sama instalacja cygwina większość odstraszy... Jak będzie inaczej to można się bawić w githuby czy inne. Chyba że jest jakiś portal z programami, programikami pomocnymi przy ebookach. Linuksiaże mogą sobie poprawić kodowanie instrukcji w terminalu wrzuce w html będzie ok dla wszystkich. Dobra poprawie że id to cyfry nie cyfra... Apropo pbi. Chciałem sprawdzić ile stron ogólnie posiadają, trzeba zgrać strone indeksu, spisać ilość stron i to samo dla następnej książki. Podzieliłbym 3,5 miliona które dostali na ilość stron Ale jak zapuściłem skrypta to padł ich mysql czy co tam mają, kilka pytań i wywala błędy select xxx zwrócił zero Trzeba było rozdzielać 3 sekundową przerwą, więc narazie dałem sobie spokój, jeszcze mnie za hakera wezmą.
|
19 lut 2010 21:38:08 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: www.pbi.edu.pl
Właśnie chodzi mi po głowie pomysł stworzenia jakiegoś pakietu użytków do ebooków. Można by zautomatyzować kilka czynności, chociażby takich jak tworzenie djvu, konwersja między formatami itp. Pytanie tylko czy jest taka potrzeba... Zwłaszcza, że jest calibre.... A co do Twojego skryptu - mam jeszcze pomysł na 2 funkcjonalności. Przeszukiwanie załączonego spisu po słowach - grep wyrzucałby wyniki i byłaby opcja wybrania z menu utworu do ściągnięcia. Wtedy można by zapomnieć o id - obsługiwane by to było w sposób niewidoczny dla użytkownika. A druga rzecz to obsługa grafiki. EDIT: Uruchomiłem skrypt i dopiero teraz mamy o czym gadać Jabyś dał na githuba to bym przesłał patche
_________________ Porównywarka cen ebooków
|
19 lut 2010 22:54:21 |
|
|
Użytkownik
Dołączył(a): 03 gru 2009 20:13:29 Posty: 30
|
Re: www.pbi.edu.pl
eee tam poradziłeś sobie... Jak masz miejsce gdzieś to wrzuć tam poprawione i tyle Może ktoś jeszcze coś dopisze, albo to moriego się zamontuje. Mi brak czegoś co by popoprawiało teksty, dużo plików txt kończy się na 80 znaku w lini, nie ma akapitów. A tak wzasadzie to wystarczy przeparsować taki plik, poszukać czy linia kończy się. jak nie to połączyć.
|
19 lut 2010 23:19:08 |
|
|
Użytkownik
Dołączył(a): 03 gru 2009 20:13:29 Posty: 30
|
Re: www.pbi.edu.pl
Ok, poprawki naniesione. Licencja, brak komunikatów o tworzeniu katalogów itp...
Zapraszam do testowania, jak znajdę chwile czasu i energi to postaram się dodać opcje ściągania obrazkowych książek
|
20 lut 2010 13:55:21 |
|
|
Użytkownik
Dołączył(a): 18 lut 2009 17:55:48 Posty: 211
eCzytnik: iPad, dawniej: iRex DR1000S
|
Re: www.pbi.edu.pl
Dzięki, rdst75. Dobra robota. Jutro potestuję. (Moriemu już dziękowałem ).
_________________ Copywriting
|
20 lut 2010 23:42:42 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: www.pbi.edu.pl
http://github.com/t3d/sciagnijpbiNiebawem wszystko pozmieniam (łącznie z licencją) Oryginalna wersja od rdst75 zawsze będzie osiągalna pod tym linkiem: http://github.com/t3d/sciagnijpbi/tree/ ... fd3cc7fb4c@rdst75 Jak generowałeś spis z katalogu? W pierwszej linii są jakieś śmieci...
_________________ Porównywarka cen ebooków
|
21 lut 2010 18:06:49 |
|
|
Użytkownik
Dołączył(a): 03 gru 2009 20:13:29 Posty: 30
|
Re: www.pbi.edu.pl
Innym skryptem oczywiście, potem jeszcze poprawki i sortowanie w Open Officie.
A tak przyokazji to można już sciągać książki obrazkowe, znaczy ściągnie pokolei wszystki .jpg Pytanie tylko co potem z nimi, Image Magic do pdf?
|
21 lut 2010 19:58:01 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: www.pbi.edu.pl
Dobra, to jak jakieś update'y wypuścisz do katalogu, to daj znać Ja bym je po prostu wrzucił do katalogu z odpowiednią nazwą. Już w takiej postaci wygodnie się to czyta na komputerze. Poza tym można zrobić pdf, można djvu, można zrobić archiwum cbz, albo cbr, ale to już raczej sprawa użytkownika co z tym zrobi dalej EDIT: @rdst75 jak jest z curl pod cygwinem? Jest domyślnie, czy trzeba coś doinstalować?
_________________ Porównywarka cen ebooków
|
21 lut 2010 22:14:49 |
|
|
Użytkownik
Dołączył(a): 18 lut 2009 17:55:48 Posty: 211
eCzytnik: iPad, dawniej: iRex DR1000S
|
Re: www.pbi.edu.pl
Najlepiej byłoby, gdyby skrypt przed złożeniem PDFa przekonwertował obrazki do 2 kolorów (czerń/biel), np. przez unpaper http://unpaper.berlios.de/.
_________________ Copywriting
|
21 lut 2010 22:32:11 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: www.pbi.edu.pl
ImageMagick sam to potrafi A poza tym lepsza jest większa ilość kolorów, bo przecież czytniki mają kilka(naście) odcieni szarości. Można po prostu ograniczyć kolory do szarości.
_________________ Porównywarka cen ebooków
|
21 lut 2010 23:02:14 |
|
|
Użytkownik
Dołączył(a): 18 lut 2009 17:55:48 Posty: 211
eCzytnik: iPad, dawniej: iRex DR1000S
|
Re: www.pbi.edu.pl
Wiele odcieni szarości oznacza często niską czytelność tekstu. Bo zamiast czarnego tekstu na białym tle mamy szary tekst na szarawym tle.
_________________ Copywriting
|
21 lut 2010 23:26:45 |
|
|
Admin
Dołączył(a): 13 cze 2008 14:47:02 Posty: 2836 Lokalizacja: Gdańsk
eCzytnik: kindle
|
Re: www.pbi.edu.pl
Owszem, niektóre z algorytmów binaryzacji potrafią bardzo ładnie wyciąć szumy tła i nieistostne informacje, ale wątpię żeby ustawienie w skrypcie jakieś prostej metody binaryzacji dało dobre rezultaty dla wszystkich możliwych plików które się nawiną. Optowałbym raczej za wydzieleniem tych operacji do innego skryptu, który można byłoby zapuścić testowo kilka razy, przejrzeć wyniki, w razie potrzeby skorygować jakieś parametry itd... Lektura na temat binaryzacji dla ambitniejszych (materiały z moich studiów ): http://www.mif.pg.gda.pl/homepages/marcin/Wyklad3.pdf
_________________ Porównywarka cen ebooków
|
22 lut 2010 0:10:28 |
|
|
Kto przegląda forum |
Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości |
|
Nie możesz rozpoczynać nowych wątków Nie możesz odpowiadać w wątkach Nie możesz edytować swoich postów Nie możesz usuwać swoich postów
|
|
|
|