Teraz jest 20 paź 2019 14:18:45




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 2 ] 
ebook z cytatami 
Autor Wiadomość
Użytkownik

Dołączył(a): 16 lip 2011 14:21:10
Posty: 133
eCzytnik: Kindle 3
Post ebook z cytatami
Witam,
poszukiwałem ebooka z cytatami. Niestety nie znalazłem nic wartego uwagi, po pierwsze takowych jest ich jak na lekarstwo i większość z nich jest w formacie PDF z Adobe DRM. Oczywiście DRM można zdjąć, ale nie po to kupuję ebooka, by potem kombinować jak usunąć zabezpieczenie i przekonwertować całość na ePub/mobi, podczas gdy w internecie krążą wersje pozbawione tych problemów. Mam nadzieję, że co poniektórzy wydawcy pójdą kiedyś po rozum do głowy...
Eh, wracając do tematu, przypomniałem sobie, że w zamierzchłej przeszłości używałem programu o nazwie CyTaT (nierozwijany od kilku lat, na licencji freeware, klik). Program ma własną, całkiem imponującą bazę cytatów (ponad 20 tys.) trzymanych w pojedynczym pliku tekstowym. Przekonwertowałem więc ten plik na ePub i efekt jest naprawdę zadowalający. Właściwie to jest tylko jeden, ale dosyć poważny mankament. Chodzi o to, że cytaty są posortowane alfabetycznie. Myślę o podzieleniu ebooka na rozdziały (każdy rozdział poświęcony kolejnemu autorowi). Ukończony ebook chciałbym udostępnić, żeby moja praca się nie zmarnowała. Nie jestem jednak pewien czy licencja mi na to pozwala, próbowałem skontaktować się z twórcami programu, ale adresy email są nieaktualne. Jestem w rozterce. Taki ebook to byłaby świetna sprawa, na forum jest dużo oczytanych osób, więc nawet moglibyśmy się pokusić o dodanie nowych cytatów, ale z drugiej strony nie chcę łamać licencji. Co o tym myślicie?

EDIT 1:
Udało mi się nawiązać emailową korespondencję z jednym z twórców bazy i otrzymałem zgodę na stworzenie ebooka. Od tamtego czasu wiele wody upłynęło w każdej dowolnej rzece i moja praca, chociaż ślimaczo-wolna przyniosła efekty. Nie, nie mam jeszcze gotowego ebooka w ePubie, chodzi o to, że udało mi się posortować całą bazę. Większość pracy wykonały za mnie sed i awk, za pomocą których wstępnie posortowałem plik, ale z racji tego, że baza nie trzymała się żadnego wzorca nazewnictwa autorów czy też tematycznego, resztę musiałem zrobić ręcznie. Podzieliłem bazę na kilka plików, których nazwy mam nadzieję będą opisowe.
Dodałem na początku każdego cytatu ostatnie słowo w linijce, które w założeniu jest nazwiskiem autora, dzięki czemu łatwiej sortować bazę zarówno wzrokowo jak i za pomocą skryptów. Niestety zdarzają się osoby o takim samym nazwisku albo cytaty bez autora albo cytaty które po nazwie autora mają dodatkowo komentarz i to trzeba sortować ręcznie. Tak samo jest w przypadku gdy chce się podzielić cytaty na kategorie tematyczne, tego może dokonać jedynie człowiek. W celu zapewnienia jak najwyższej jakości końcowego ebooka przydało by się kompleksowo sprawdzić akuratność bazy, która liczy ponad 20 tys. wpisów... Jednemu człowiekowi zajmie to wieki, więc zamieszczam tutaj, jeżeli jest ktoś chętny do pomocy to byłbym wdzięczny.
cytaty
Główny plik bazy to cytaty.txt, tam znajduje się większość cytatów, tj. cytaty, którego autora znamy. Jeżeli w pliku cytaty.txt znajduje się np. cytat z piosenki, nawet jeśli znamy autora, cytat powinien zostać przeniesiony do pliku piosenki.txt itp.

Może omówię krótko sposób w jaki dane są sformatowane lub mają być sformatowane.
Grupę cytatów danego autora oddzielamy pojedynczym enterem od innej grupy. Pierwszy wyraz linijki to nazwisko autora, żeby łatwiej było wzrokowo sortować cytaty. Na koniec rzecz jasna zostanie to usunięte. Następnie znajduje się jakichś cytat, który powinien się kończyć jednym ze znaków w j. polskim kończących zdanie, czyli [. ? !]. Chyba innych znaków kończących zdanie nie ma. Dalej kolejność nie gra zasadniczej roli, ale najlepiej by było gdyby trzymać się zasugerowanego przeze mnie początku. Tak więc dalej powinien być autor. Żeby jakoś zunifikować nazewnictwo polecam używać np. nazwy pod jakim znajduje się w wikipedii. Jeżeli autor jest znany głównie pod pseudonimem, warto dodać jego prawdziwe imię(ona) i nazwisko. Do tego służy { i zamykamy jego prawdziwe personalia analogicznym }. Dalej w " zamieszczamy nazwę utworu z którego pochodzi cytat. Jeżeli dodatkowo wiemy kto w danym utworze wypowiada kwestię, możemy pomiędzy // o tym poinformować skrypt, którego użyję do wygenerowania ePuba. oraz podać stronę w formacie np. s. 1. Na koniec pomiędzy ## możemy zamieścić komentarz, który wielu cytatom nadaje sens.
Przykład jak wygląda pojedyncza linijka z cytatem:
Young Przedwczoraj widziałam jelenia, wczoraj królika, a dzisiaj Ciebie. Robert F. Young {właśc. Jakiś Ktoś} "The Dandelion Girl" /Julie Danvers/ s. 15 #cytat ten jest bardzo znany i został użyty w wielu produkcjach np. sparafrazowany w Portalu 2#
Zwróćcie uwagę na to że po znaku "specjalnym" nie używa się spacji.
Uff. To chyba wszystko. Jeżeli macie jakieś dodatkowe pytania to z chęcią odpowiem.

Na koniec jeżeli ktoś się zdecyduje pomóc niech poinformuje o tym w tym temacie, żeby nie dublować pracy. Myślę, że najlepiej będzie jeżeli pojedyncza osoba zadeklaruje sprawdzenie wszystkich cytatów autorów na daną literę i potem prześle poprawki, a ja zaktualizuję pliki. Wszystkich, którzy pomogą czeka wieczna sława, gdyż zostaną uwzględnieni jako współautorzy tego ePuba.


19 kwi 2012 17:30:10
Zobacz profil
Użytkownik

Dołączył(a): 16 lip 2011 14:21:10
Posty: 133
eCzytnik: Kindle 3
Post Re: ebook z cytatami
W celu uproszczenia edycji dodałem pliki do skydrive, odnośnik - https://skydrive.live.com/redir.aspx?ci ... ewPd92qEJo.


25 kwi 2012 20:04:57
Zobacz profil
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 2 ] 


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 2 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do: