Teraz jest 29 lis 2024 5:35:50




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 37 ]  Przejdź na stronę 1, 2, 3  Następna strona
Watermark - skuteczność, usuwanie 
Autor Wiadomość
SwiatCzytnikow.pl
Avatar użytkownika

Dołączył(a): 14 sie 2010 11:00:21
Posty: 1873
eCzytnik: kindle, onyx, nook, kobo, pb, ipad
Post Watermark - skuteczność, usuwanie
No właśnie, pliku MOBI nie da się chyba oznakować przy sprzedaży. Swoją drogą ciekaw jestem jak to jest z tymi watermarkami z EPUBa po konwersji do MOBI.

_________________
http://swiatczytnikow.pl (dawniej: Świat Kindle)
http://ebooki.swiatczytnikow.pl - (prawie) wszystkie polskie e-booki w jednym miejscu, czyli porównywarka ofert księgarni.


10 paź 2011 18:05:12
Zobacz profil WWW
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku
Vroo napisał(a):
Swoją drogą ciekaw jestem jak to jest z tymi watermarkami z EPUBa po konwersji do MOBI.

Całkiem prywatnie powiedziałbym, że znika. Nie wraca również po konwersji ponownej do ePUBa, natomiast ePUB -> ePUB w Calibre watermarka nie usuwa.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


10 paź 2011 18:29:05
Zobacz profil WWW
Użytkownik

Dołączył(a): 10 sie 2011 12:44:00
Posty: 20
eCzytnik: Kindle 3G
Post Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku
No nie powinien znikać.
W sumie zależy jak jest zrobiony. Co jest modyfikowane. Jeśli np. jeden znak UTF jest zamieniany na inny ale podobnie wyglądający znak UTF, to bez odpowiednich konwersji zniknąć nie powinien. Podobnie z watermarkami semantycznymi (dobrze pamietam nazwę?), gdzie zamieniane są całe wyrazy.

Ma ktoś może jakieś konkretne, techniczne informacje w jaki sposób znakuje się tekst? Owszem jest trochę publikacji naukowych, ale ciekaw jestem metod stosowanych na rynku, a nie w laboratoriach.


11 paź 2011 7:43:21
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 28 maja 2011 19:15:33
Posty: 338
eCzytnik: Kidle 3G
Post Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku
Każda szczegółowa metoda stosowania watermarku jest ściśle strzeżona. Jeżeli była by dostępna, to nie było by problemu z jego usunięciem, więc tracił by sens.

Ja mogę potwierdzić, że znalazłem dwie metody umieszczenia go w pliku, żeby nie zniknął po konwersji na Calibre i jestem w trakcie testowania trzeciego rozwiązania (każde niezależne od pozostałych).

_________________
Terry Pratchett napisał(a):
"Osoby używające więcej niż 3 wykrzykników lub pytajników to osoby z zaburzeniami własnej osobowości."


11 paź 2011 12:58:27
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku
Koovert napisał(a):
Ja mogę potwierdzić, że znalazłem dwie metody umieszczenia go w pliku, żeby nie zniknął po konwersji na Calibre i jestem w trakcie testowania trzeciego rozwiązania (każde niezależne od pozostałych).

Ja natomiast bardzo chętnie bym się przekonał o tym ;) Jeśli będziesz gotowy ze swoim zabezpieczeniem, chętnie przeprowadzę audyt bezpieczeństwa tej metody :)

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


11 paź 2011 15:10:38
Zobacz profil WWW
Użytkownik

Dołączył(a): 10 sie 2011 12:44:00
Posty: 20
eCzytnik: Kindle 3G
Post Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku
Chodziło mi raczej o algorytmy. Sam algorytm pewnie tajny nie jest.

W grafice jest prościej często nawet nie można potwierdzić czy jakieś dane zostały tam ukryte czy nie bez znajomości klucza. Wystarczy popatrzeć na narzędzia do "wykrywania steganografii" w plikach graficznych i dźwiękowych. Przez analogię steganografia dla plików tekstowych też powinna być trudna do wykrycia bez znajomości klucza.

A pochwalisz się tymi metodami?


11 paź 2011 17:09:34
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 28 maja 2011 19:15:33
Posty: 338
eCzytnik: Kidle 3G
Post Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku
W swoim czasie Moriego pewnie poproszę o rzeczony audyt, ale na pewno się nią publicznie nie pochwalę, bo z watermarkiem jest tak, że jego skuteczność (wg. mnie) w mniejszym stopniu zależy od trudności złamania, a bardziej od trudności z jego zlokalizowaniem, więc opublikowanie sposobu/miejsca wprowadzenia znaku wodnego niweluje korzyść związaną z jego wprowadzeniem.

W skrócie: problemem nie jest ominięcia znaku wodnego tylko jego znalezienie, żeby było wiadomo co trzeba ominąć.

_________________
Terry Pratchett napisał(a):
"Osoby używające więcej niż 3 wykrzykników lub pytajników to osoby z zaburzeniami własnej osobowości."


12 paź 2011 1:19:13
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku
Wprawdzie to zależy od tego, co chcemy osiągnąć, ale generalnie watermarków się nie łamie, bo to zupełnie zbędne. Watermarki się po prostu usuwa - a do tego wystarczy je zlokalizować, co podkreślił Koovert (chyba, że zależy nam na pozyskaniu czyichś danych zaszytych w watermarku).

@bmalkow: co do przykładu grafiki - tu nas nie interesuje odkrywanie, jakie dane zostały ukryte, ale jedynie ich usunięcie. Zatem nie głowimy się, jak w okładce książki ukryto nasze dane, ale modyfikujemy (lub wręcz podmieniamy) obrazek. Sam fakt istnienia dodatkowych danych w pliku można łatwo zaobserwować, weryfikując sumy kontrolne dwóch różnych wersji pliku (czyli kupujemy książkę z dwóch różnych kont, dokonujemy weryfikacji krzyżowej, zajmujemy się plikami, które się różnią).

EDIT: Podzieliłem temat, żeby w tamtym już nie mieszać.
P.S. MOBI powinno się dać dość łatwo oznakować :) Przy czym skuteczność takiego watermarka jest podobna do tego w ePUBie.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


12 paź 2011 1:48:40
Zobacz profil WWW
Użytkownik

Dołączył(a): 10 sie 2011 12:44:00
Posty: 20
eCzytnik: Kindle 3G
Post Re: Watermark - skuteczność, usuwanie
Sprawdzenie sum kontrolnych pozwoli tylko stwierdzić, że pliki się różnią (data generacji w metadanych, lub inny drobiazg).
Porównanie treści dwóch plików zawsze pozwoli usunąć lub zniszczyć watermark.
@Koovert: no właśnie lokalizacja i sam hm… "wygląd" watermarka (czyli konkretna modyfikacja dokumentu) powinny być zależne od klucza.
Przecież Ty chcesz mieć możliwość zidentyfikowania danej kopii, więc (na przykład) będziesz podmieniał znaczki "a".
Niech ID kopii to 10110
To łapiesz kolejne "a" z tekstu i zamieniasz je na "а" (to naprawdę są różne literki!!!) gdy 1 lub pozostawiasz "a" gdy 0.
Teraz wprowadźmy klucz krypto: zamiast kolejnych wystąpień "a" (1,2,3,4,5), zostaną wybrane wystąpienia 78,32,1,49,123,4.

Jeśli nie znam klucza, to nie znajdę pozycji, które zostały zmodyfikowane (pomińmy tu różnice między "a" i "а" ). Aby je odnaleźć muszę porównać dwie różne kopie pliku.

I teraz dochodzimy do sedna tego co mnie interesuje: CO jest modyfikowane w komercyjnych systemach używanych np. przez Gandalfa?
* dodawane zbędne znaki interpunkcyjne?
* homografy (a/а)
* zamiana wyrazów ("że" na "iż")
* dodawanie danych między elementami HTML (ePub to wewnętrznie html, prawda?) czy innymi elementami sterującymi tekstem

I tak: wiem, że wystarczy kupić dwie książki z dwóch kont, żeby to ustalić, ale chyba lepiej podyskutować?


12 paź 2011 9:03:23
Zobacz profil
Użytkownik
Avatar użytkownika

Dołączył(a): 28 maja 2011 19:15:33
Posty: 338
eCzytnik: Kidle 3G
Post Re: Watermark - skuteczność, usuwanie
Doskonale Cię zrozumiałem.

I podtrzymuję to, co powiedziałem wcześniej. Jeżeli informacje na ten temat wyciekły by z firmy, to jej znak wodny byłby nieskuteczny. Wystarczyła by wtedy zmiana jednego "a" na "а" i znak wodny jest złamany (a więc nie ma sensu jako zabezpieczenie, nie działa).

Swoją drogą znak wodny ma ten plus, że prawie nigdy łamiący nie ma pewności, że go usunął. Jeżeli usunie dwa, nie wie, że nie ma tam też jeszcze trzeciego miejsca zakodowania informacji. A ciężko doprowadzić pliki do tych samych sum md5, chociażby ze względu na wspomnianą "datę generacji w metadanych, lub inny drobiazg"

_________________
Terry Pratchett napisał(a):
"Osoby używające więcej niż 3 wykrzykników lub pytajników to osoby z zaburzeniami własnej osobowości."


12 paź 2011 9:45:10
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Watermark - skuteczność, usuwanie
bmalkow napisał(a):
Sprawdzenie sum kontrolnych pozwoli tylko stwierdzić, że pliki się różnią (data generacji w metadanych, lub inny drobiazg).

Ale, patrząc po dostępnych plikach, tak się w chwili obecnej chyba nie dzieje. Watermarkowanie polega raczej obecnie na otwarciu ePUBa w locie, wprowadzeniu zmian i zapisaniu pliku wynikowego, po czym zaserwowanie go użytkownikowi.

bmalkow napisał(a):
I teraz dochodzimy do sedna tego co mnie interesuje: CO jest modyfikowane w komercyjnych systemach używanych np. przez Gandalfa?

Ale odpowiedź na to pytanie jest równoznaczna z opisaniem sposobu, jak taki watermark usunąć.

bmalkow napisał(a):
* dodawane zbędne znaki interpunkcyjne?

To IMO nie jest rozwiązaniem. Można dodawać znaki białe, bo ich nie widać, ale interpunkcyjnych nie, bo to byłyby błędy interpunkcyjne.

Czyli ciąg "To jest proste zdanie." możemy zamienić na:
Kod:
To jest  proste zdanie.

ale nie na:
Kod:
To jest proste zdanie..


bmalkow napisał(a):
* homografy (a/а)

To też nie jest rozwiązaniem, bo psuje sporo. Nie dość, że możesz trafić na urządzenie, które z rosyjskich bukw zrobi Ci krzaki (albo na konwerter, który to uczyni), to dodatkowo właśnie wyłączyłeś możliwość wyszukiwania słów w tekście (no, chyba, że ktoś szuka jednocześnie "alice" i "аlice", a także podobnych kombinacji z innymi literami).

bmalkow napisał(a):
* zamiana wyrazów ("że" na "iż")

To byłoby czasochłonne (opracowanie i przetestowanie każdej pozycji), a także wprowadzałoby sporo problemów. No i mogłoby się nie sprawdzić w każdej sytuacji (co, jeśli książka nie ma wystarczająco "że"? Albo autor sam stosuje "że" i "iż" zamiennie?). Jak dla mnie - znowu odpada.

bmalkow napisał(a):
* dodawanie danych między elementami HTML (ePub to wewnętrznie html, prawda?) czy innymi elementami sterującymi tekstem

Tak, ePUB to (upraszczając nieco) HTML spakowany ZIPem. Dysponujemy więc podobnym zakresem możliwości co w przypadku statycznych stron WWW. Tutaj mamy jednocześnie spore pole do popisu, jak i musimy pamiętać, że jedno kliknięcie w Calibre może zniweczyć nasz trud (np. przetwarzanie heurystyczne).

Koovert napisał(a):
I podtrzymuję to, co powiedziałem wcześniej. Jeżeli informacje na ten temat wyciekły by z firmy, to jej znak wodny byłby nieskuteczny. Wystarczyła by wtedy zmiana jednego "a" na "а" i znak wodny jest złamany (a więc nie ma sensu jako zabezpieczenie, nie działa).

A przynajmniej "złamany" w sensie "możliwy do usunięcia", a nie "możliwy do odczytania".

Koovert napisał(a):
Swoją drogą znak wodny ma ten plus, że prawie nigdy łamiący nie ma pewności, że go usunął. Jeżeli usunie dwa, nie wie, że nie ma tam też jeszcze trzeciego miejsca zakodowania informacji. A ciężko doprowadzić pliki do tych samych sum md5, chociażby ze względu na wspomnianą "datę generacji w metadanych, lub inny drobiazg"

Śmiem się nie zgodzić - dysponując dwoma plikami można spokojnie doprowadzić do odnalezienia wszystkich różnic, co z kolei pozwala nam na ich ujednolicenie, a więc wyrugowanie watermarka.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


12 paź 2011 10:55:13
Zobacz profil WWW
Użytkownik
Avatar użytkownika

Dołączył(a): 28 maja 2011 19:15:33
Posty: 338
eCzytnik: Kidle 3G
Post Re: Watermark - skuteczność, usuwanie
Tak, ale do wtedy do usunięcie go potrzebujesz dwóch niezależnych plików, które musisz najpierw legalnie kupić, a to zawsze zysk dla formy. Co innego "złamać" plik, który i tak kupiłeś i podzielić się nim z innymi, a co innego celowo wyłożyć bez sensu własną kasę na kolejną wersję, żeby sprawdzić czy na pewno go usunąłeś. Zawsze możesz się z kimś dogadać, żeby Ci wysłał swoją wersję, ale równie dobrze mógł Ci ją wysłać zanim kupiłeś plik, na takich samych zasadach jak pożyczyłby Ci tradycyjną książkę (tylko że jest w stanie to zrobić na odległość).

Biorąc pod uwagę, że po tygodniu, dwóch, MAX miesiącu (prawie) każda książka jest dostępna w necie jako piracki e-book po OCRrze, to ewentualne złamanie watermarka i tak nie wpłynie na "wolumen" piractwa, to takie łamanie go poprzez zakup dwóch plików wpłynie pozytywnie na sprzedaż (sprzeda się o jeden więcej egzemplarz).

_________________
Terry Pratchett napisał(a):
"Osoby używające więcej niż 3 wykrzykników lub pytajników to osoby z zaburzeniami własnej osobowości."


12 paź 2011 19:45:47
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Watermark - skuteczność, usuwanie
Koovert napisał(a):
Tak, ale do wtedy do usunięcie go potrzebujesz dwóch niezależnych plików, które musisz najpierw legalnie kupić, a to zawsze zysk dla formy. Co innego "złamać" plik, który i tak kupiłeś i podzielić się nim z innymi, a co innego celowo wyłożyć bez sensu własną kasę na kolejną wersję, żeby sprawdzić czy na pewno go usunąłeś.

Ale przecież to jednorazowo, by opracować metodę. Jednorazowe wydanie pieniędzy na drugą kopię nie zmienia niczego w większej skali, no, chyba że ilość sprzedanych kopii liczy się w pojedynczych sztukach.

No i tak czy siak do usunięcia watermarka czy DRMu potrzebujesz pliku tak zabezpieczonego - czyli legalnie kupionego ;)

Koovert napisał(a):
Biorąc pod uwagę, że po tygodniu, dwóch, MAX miesiącu (prawie) każda książka jest dostępna w necie jako piracki e-book po OCRrze

Może się nie znam, ale IMO wyolbrzymiasz skuteczność amatorów skanowania.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


12 paź 2011 20:25:29
Zobacz profil WWW
Użytkownik
Avatar użytkownika

Dołączył(a): 28 maja 2011 19:15:33
Posty: 338
eCzytnik: Kidle 3G
Post Re: Watermark - skuteczność, usuwanie
Sprawdziłem sobie kiedyś losowo jakieś 5-7 książek-nowości, takich bardziej popularnych. I wszystkie pojawiły się właśnie w tym czasie.

A odnośnie jednokrotnego sprawdzenia pliku: można mieć opracowane na przykład cztery metody i do jednego tytułu dostępnego wszystkim użytkownikom przyporządkowywać losowe dwie. Inny tytuł - WM w innym miejscu.
Poszczególny plik byłby wtedy bardziej narażony na zamazanie WM, ale ochroa całego serwisu bardziej skuteczna. Tak samo jak nie masz zawsze pary plików, to możesz się nadziać na update zabezpieczeń, których nie zdejmiesz, a wtedy wkur... zirytowane wydawnictwo ma Twoje dane i może Cię za to ścigać (i wywalić pozew cywilny po przeszacowaniu strat). Trochę zbyt duże ryzyko na wolontariat w udostępnianiu pliku. Co innego anonimowy torrent, a co innego jak dokładnie wiadomo kto wypuścił plik do sieci.

_________________
Terry Pratchett napisał(a):
"Osoby używające więcej niż 3 wykrzykników lub pytajników to osoby z zaburzeniami własnej osobowości."


12 paź 2011 21:10:15
Zobacz profil
Admin
Avatar użytkownika

Dołączył(a): 11 lip 2007 19:38:54
Posty: 3266
Lokalizacja: Kraków
eCzytnik: eClicto, iPad, K3 WiFi, K4
Post Re: Watermark - skuteczność, usuwanie
Koovert napisał(a):
Sprawdziłem sobie kiedyś losowo jakieś 5-7 książek-nowości, takich bardziej popularnych. I wszystkie pojawiły się właśnie w tym czasie.

Ciągle pozwolę się z tym nie zgodzić, ale dobrze, nie róbmy off-topicu ;)

Koovert napisał(a):
A odnośnie jednokrotnego sprawdzenia pliku: można mieć opracowane na przykład cztery metody i do jednego tytułu dostępnego wszystkim użytkownikom przyporządkowywać losowe dwie. Inny tytuł - WM w innym miejscu.

Idąc tym tropem - można mieć opracowane i tysiąc dwadzieścia cztery metody, a serwować losowe dwie. Problem w tym, że opracowanie takiej ilości metod jest zupełnie nieopłacalne - nie oferują one aż tak zwiększonej ochrony, natomiast ich stworzenie, przetestowanie i wdrożenie darmowe nie są.

Koovert napisał(a):
Tak samo jak nie masz zawsze pary plików, to możesz się nadziać na update zabezpieczeń, których nie zdejmiesz, a wtedy wkur... zirytowane wydawnictwo ma Twoje dane i może Cię za to ścigać (i wywalić pozew cywilny po przeszacowaniu strat). Trochę zbyt duże ryzyko na wolontariat w udostępnianiu pliku. Co innego anonimowy torrent, a co innego jak dokładnie wiadomo kto wypuścił plik do sieci.

Pozywanie to zupełnie odrębna kwestia - bo jeszcze wypada udowodnić, że zrobił to pan X, a nie ktoś, kto bezprawnie uzyskał dostęp do komputera pana X.

_________________
Cytuj:
Muad'Dib uczył się prędko, ponieważ najpierw przeszedł szkolenie jak się uczyć. A najpierwszą ze wszystkich otrzymał lekcję podstawowej wiary, że może się nauczyć. Szokuje odkrycie, jak wielu ludzi nie wierzy, że mogą się nauczyć, a o ile więcej uważa, że nauka jest trudna.


12 paź 2011 21:28:48
Zobacz profil WWW
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 37 ]  Przejdź na stronę 1, 2, 3  Następna strona


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Skocz do:  
cron