eKsiążki
https://forum.eksiazki.org/

Watermark - skuteczność, usuwanie
https://forum.eksiazki.org/ksiegarnie-ebookow-i-audiobookow-f156/watermark-skutecznosc-usuwanie-t10395.html
Strona 1 z 3

Autor:  Vroo [ 10 paź 2011 18:05:12 ]
Tytuł:  Watermark - skuteczność, usuwanie

No właśnie, pliku MOBI nie da się chyba oznakować przy sprzedaży. Swoją drogą ciekaw jestem jak to jest z tymi watermarkami z EPUBa po konwersji do MOBI.

Autor:  Mori [ 10 paź 2011 18:29:05 ]
Tytuł:  Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku

Vroo napisał(a):
Swoją drogą ciekaw jestem jak to jest z tymi watermarkami z EPUBa po konwersji do MOBI.

Całkiem prywatnie powiedziałbym, że znika. Nie wraca również po konwersji ponownej do ePUBa, natomiast ePUB -> ePUB w Calibre watermarka nie usuwa.

Autor:  bmalkow [ 11 paź 2011 7:43:21 ]
Tytuł:  Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku

No nie powinien znikać.
W sumie zależy jak jest zrobiony. Co jest modyfikowane. Jeśli np. jeden znak UTF jest zamieniany na inny ale podobnie wyglądający znak UTF, to bez odpowiednich konwersji zniknąć nie powinien. Podobnie z watermarkami semantycznymi (dobrze pamietam nazwę?), gdzie zamieniane są całe wyrazy.

Ma ktoś może jakieś konkretne, techniczne informacje w jaki sposób znakuje się tekst? Owszem jest trochę publikacji naukowych, ale ciekaw jestem metod stosowanych na rynku, a nie w laboratoriach.

Autor:  Koovert [ 11 paź 2011 12:58:27 ]
Tytuł:  Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku

Każda szczegółowa metoda stosowania watermarku jest ściśle strzeżona. Jeżeli była by dostępna, to nie było by problemu z jego usunięciem, więc tracił by sens.

Ja mogę potwierdzić, że znalazłem dwie metody umieszczenia go w pliku, żeby nie zniknął po konwersji na Calibre i jestem w trakcie testowania trzeciego rozwiązania (każde niezależne od pozostałych).

Autor:  Mori [ 11 paź 2011 15:10:38 ]
Tytuł:  Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku

Koovert napisał(a):
Ja mogę potwierdzić, że znalazłem dwie metody umieszczenia go w pliku, żeby nie zniknął po konwersji na Calibre i jestem w trakcie testowania trzeciego rozwiązania (każde niezależne od pozostałych).

Ja natomiast bardzo chętnie bym się przekonał o tym ;) Jeśli będziesz gotowy ze swoim zabezpieczeniem, chętnie przeprowadzę audyt bezpieczeństwa tej metody :)

Autor:  bmalkow [ 11 paź 2011 17:09:34 ]
Tytuł:  Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku

Chodziło mi raczej o algorytmy. Sam algorytm pewnie tajny nie jest.

W grafice jest prościej często nawet nie można potwierdzić czy jakieś dane zostały tam ukryte czy nie bez znajomości klucza. Wystarczy popatrzeć na narzędzia do "wykrywania steganografii" w plikach graficznych i dźwiękowych. Przez analogię steganografia dla plików tekstowych też powinna być trudna do wykrycia bez znajomości klucza.

A pochwalisz się tymi metodami?

Autor:  Koovert [ 12 paź 2011 1:19:13 ]
Tytuł:  Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku

W swoim czasie Moriego pewnie poproszę o rzeczony audyt, ale na pewno się nią publicznie nie pochwalę, bo z watermarkiem jest tak, że jego skuteczność (wg. mnie) w mniejszym stopniu zależy od trudności złamania, a bardziej od trudności z jego zlokalizowaniem, więc opublikowanie sposobu/miejsca wprowadzenia znaku wodnego niweluje korzyść związaną z jego wprowadzeniem.

W skrócie: problemem nie jest ominięcia znaku wodnego tylko jego znalezienie, żeby było wiadomo co trzeba ominąć.

Autor:  Mori [ 12 paź 2011 1:48:40 ]
Tytuł:  Re: „Gra o tron” G. R. R. Martina – po raz pierwszy w ebooku

Wprawdzie to zależy od tego, co chcemy osiągnąć, ale generalnie watermarków się nie łamie, bo to zupełnie zbędne. Watermarki się po prostu usuwa - a do tego wystarczy je zlokalizować, co podkreślił Koovert (chyba, że zależy nam na pozyskaniu czyichś danych zaszytych w watermarku).

@bmalkow: co do przykładu grafiki - tu nas nie interesuje odkrywanie, jakie dane zostały ukryte, ale jedynie ich usunięcie. Zatem nie głowimy się, jak w okładce książki ukryto nasze dane, ale modyfikujemy (lub wręcz podmieniamy) obrazek. Sam fakt istnienia dodatkowych danych w pliku można łatwo zaobserwować, weryfikując sumy kontrolne dwóch różnych wersji pliku (czyli kupujemy książkę z dwóch różnych kont, dokonujemy weryfikacji krzyżowej, zajmujemy się plikami, które się różnią).

EDIT: Podzieliłem temat, żeby w tamtym już nie mieszać.
P.S. MOBI powinno się dać dość łatwo oznakować :) Przy czym skuteczność takiego watermarka jest podobna do tego w ePUBie.

Autor:  bmalkow [ 12 paź 2011 9:03:23 ]
Tytuł:  Re: Watermark - skuteczność, usuwanie

Sprawdzenie sum kontrolnych pozwoli tylko stwierdzić, że pliki się różnią (data generacji w metadanych, lub inny drobiazg).
Porównanie treści dwóch plików zawsze pozwoli usunąć lub zniszczyć watermark.
@Koovert: no właśnie lokalizacja i sam hm… "wygląd" watermarka (czyli konkretna modyfikacja dokumentu) powinny być zależne od klucza.
Przecież Ty chcesz mieć możliwość zidentyfikowania danej kopii, więc (na przykład) będziesz podmieniał znaczki "a".
Niech ID kopii to 10110
To łapiesz kolejne "a" z tekstu i zamieniasz je na "а" (to naprawdę są różne literki!!!) gdy 1 lub pozostawiasz "a" gdy 0.
Teraz wprowadźmy klucz krypto: zamiast kolejnych wystąpień "a" (1,2,3,4,5), zostaną wybrane wystąpienia 78,32,1,49,123,4.

Jeśli nie znam klucza, to nie znajdę pozycji, które zostały zmodyfikowane (pomińmy tu różnice między "a" i "а" ). Aby je odnaleźć muszę porównać dwie różne kopie pliku.

I teraz dochodzimy do sedna tego co mnie interesuje: CO jest modyfikowane w komercyjnych systemach używanych np. przez Gandalfa?
* dodawane zbędne znaki interpunkcyjne?
* homografy (a/а)
* zamiana wyrazów ("że" na "iż")
* dodawanie danych między elementami HTML (ePub to wewnętrznie html, prawda?) czy innymi elementami sterującymi tekstem

I tak: wiem, że wystarczy kupić dwie książki z dwóch kont, żeby to ustalić, ale chyba lepiej podyskutować?

Autor:  Koovert [ 12 paź 2011 9:45:10 ]
Tytuł:  Re: Watermark - skuteczność, usuwanie

Doskonale Cię zrozumiałem.

I podtrzymuję to, co powiedziałem wcześniej. Jeżeli informacje na ten temat wyciekły by z firmy, to jej znak wodny byłby nieskuteczny. Wystarczyła by wtedy zmiana jednego "a" na "а" i znak wodny jest złamany (a więc nie ma sensu jako zabezpieczenie, nie działa).

Swoją drogą znak wodny ma ten plus, że prawie nigdy łamiący nie ma pewności, że go usunął. Jeżeli usunie dwa, nie wie, że nie ma tam też jeszcze trzeciego miejsca zakodowania informacji. A ciężko doprowadzić pliki do tych samych sum md5, chociażby ze względu na wspomnianą "datę generacji w metadanych, lub inny drobiazg"

Autor:  Mori [ 12 paź 2011 10:55:13 ]
Tytuł:  Re: Watermark - skuteczność, usuwanie

bmalkow napisał(a):
Sprawdzenie sum kontrolnych pozwoli tylko stwierdzić, że pliki się różnią (data generacji w metadanych, lub inny drobiazg).

Ale, patrząc po dostępnych plikach, tak się w chwili obecnej chyba nie dzieje. Watermarkowanie polega raczej obecnie na otwarciu ePUBa w locie, wprowadzeniu zmian i zapisaniu pliku wynikowego, po czym zaserwowanie go użytkownikowi.

bmalkow napisał(a):
I teraz dochodzimy do sedna tego co mnie interesuje: CO jest modyfikowane w komercyjnych systemach używanych np. przez Gandalfa?

Ale odpowiedź na to pytanie jest równoznaczna z opisaniem sposobu, jak taki watermark usunąć.

bmalkow napisał(a):
* dodawane zbędne znaki interpunkcyjne?

To IMO nie jest rozwiązaniem. Można dodawać znaki białe, bo ich nie widać, ale interpunkcyjnych nie, bo to byłyby błędy interpunkcyjne.

Czyli ciąg "To jest proste zdanie." możemy zamienić na:
Kod:
To jest  proste zdanie.

ale nie na:
Kod:
To jest proste zdanie..


bmalkow napisał(a):
* homografy (a/а)

To też nie jest rozwiązaniem, bo psuje sporo. Nie dość, że możesz trafić na urządzenie, które z rosyjskich bukw zrobi Ci krzaki (albo na konwerter, który to uczyni), to dodatkowo właśnie wyłączyłeś możliwość wyszukiwania słów w tekście (no, chyba, że ktoś szuka jednocześnie "alice" i "аlice", a także podobnych kombinacji z innymi literami).

bmalkow napisał(a):
* zamiana wyrazów ("że" na "iż")

To byłoby czasochłonne (opracowanie i przetestowanie każdej pozycji), a także wprowadzałoby sporo problemów. No i mogłoby się nie sprawdzić w każdej sytuacji (co, jeśli książka nie ma wystarczająco "że"? Albo autor sam stosuje "że" i "iż" zamiennie?). Jak dla mnie - znowu odpada.

bmalkow napisał(a):
* dodawanie danych między elementami HTML (ePub to wewnętrznie html, prawda?) czy innymi elementami sterującymi tekstem

Tak, ePUB to (upraszczając nieco) HTML spakowany ZIPem. Dysponujemy więc podobnym zakresem możliwości co w przypadku statycznych stron WWW. Tutaj mamy jednocześnie spore pole do popisu, jak i musimy pamiętać, że jedno kliknięcie w Calibre może zniweczyć nasz trud (np. przetwarzanie heurystyczne).

Koovert napisał(a):
I podtrzymuję to, co powiedziałem wcześniej. Jeżeli informacje na ten temat wyciekły by z firmy, to jej znak wodny byłby nieskuteczny. Wystarczyła by wtedy zmiana jednego "a" na "а" i znak wodny jest złamany (a więc nie ma sensu jako zabezpieczenie, nie działa).

A przynajmniej "złamany" w sensie "możliwy do usunięcia", a nie "możliwy do odczytania".

Koovert napisał(a):
Swoją drogą znak wodny ma ten plus, że prawie nigdy łamiący nie ma pewności, że go usunął. Jeżeli usunie dwa, nie wie, że nie ma tam też jeszcze trzeciego miejsca zakodowania informacji. A ciężko doprowadzić pliki do tych samych sum md5, chociażby ze względu na wspomnianą "datę generacji w metadanych, lub inny drobiazg"

Śmiem się nie zgodzić - dysponując dwoma plikami można spokojnie doprowadzić do odnalezienia wszystkich różnic, co z kolei pozwala nam na ich ujednolicenie, a więc wyrugowanie watermarka.

Autor:  Koovert [ 12 paź 2011 19:45:47 ]
Tytuł:  Re: Watermark - skuteczność, usuwanie

Tak, ale do wtedy do usunięcie go potrzebujesz dwóch niezależnych plików, które musisz najpierw legalnie kupić, a to zawsze zysk dla formy. Co innego "złamać" plik, który i tak kupiłeś i podzielić się nim z innymi, a co innego celowo wyłożyć bez sensu własną kasę na kolejną wersję, żeby sprawdzić czy na pewno go usunąłeś. Zawsze możesz się z kimś dogadać, żeby Ci wysłał swoją wersję, ale równie dobrze mógł Ci ją wysłać zanim kupiłeś plik, na takich samych zasadach jak pożyczyłby Ci tradycyjną książkę (tylko że jest w stanie to zrobić na odległość).

Biorąc pod uwagę, że po tygodniu, dwóch, MAX miesiącu (prawie) każda książka jest dostępna w necie jako piracki e-book po OCRrze, to ewentualne złamanie watermarka i tak nie wpłynie na "wolumen" piractwa, to takie łamanie go poprzez zakup dwóch plików wpłynie pozytywnie na sprzedaż (sprzeda się o jeden więcej egzemplarz).

Autor:  Mori [ 12 paź 2011 20:25:29 ]
Tytuł:  Re: Watermark - skuteczność, usuwanie

Koovert napisał(a):
Tak, ale do wtedy do usunięcie go potrzebujesz dwóch niezależnych plików, które musisz najpierw legalnie kupić, a to zawsze zysk dla formy. Co innego "złamać" plik, który i tak kupiłeś i podzielić się nim z innymi, a co innego celowo wyłożyć bez sensu własną kasę na kolejną wersję, żeby sprawdzić czy na pewno go usunąłeś.

Ale przecież to jednorazowo, by opracować metodę. Jednorazowe wydanie pieniędzy na drugą kopię nie zmienia niczego w większej skali, no, chyba że ilość sprzedanych kopii liczy się w pojedynczych sztukach.

No i tak czy siak do usunięcia watermarka czy DRMu potrzebujesz pliku tak zabezpieczonego - czyli legalnie kupionego ;)

Koovert napisał(a):
Biorąc pod uwagę, że po tygodniu, dwóch, MAX miesiącu (prawie) każda książka jest dostępna w necie jako piracki e-book po OCRrze

Może się nie znam, ale IMO wyolbrzymiasz skuteczność amatorów skanowania.

Autor:  Koovert [ 12 paź 2011 21:10:15 ]
Tytuł:  Re: Watermark - skuteczność, usuwanie

Sprawdziłem sobie kiedyś losowo jakieś 5-7 książek-nowości, takich bardziej popularnych. I wszystkie pojawiły się właśnie w tym czasie.

A odnośnie jednokrotnego sprawdzenia pliku: można mieć opracowane na przykład cztery metody i do jednego tytułu dostępnego wszystkim użytkownikom przyporządkowywać losowe dwie. Inny tytuł - WM w innym miejscu.
Poszczególny plik byłby wtedy bardziej narażony na zamazanie WM, ale ochroa całego serwisu bardziej skuteczna. Tak samo jak nie masz zawsze pary plików, to możesz się nadziać na update zabezpieczeń, których nie zdejmiesz, a wtedy wkur... zirytowane wydawnictwo ma Twoje dane i może Cię za to ścigać (i wywalić pozew cywilny po przeszacowaniu strat). Trochę zbyt duże ryzyko na wolontariat w udostępnianiu pliku. Co innego anonimowy torrent, a co innego jak dokładnie wiadomo kto wypuścił plik do sieci.

Autor:  Mori [ 12 paź 2011 21:28:48 ]
Tytuł:  Re: Watermark - skuteczność, usuwanie

Koovert napisał(a):
Sprawdziłem sobie kiedyś losowo jakieś 5-7 książek-nowości, takich bardziej popularnych. I wszystkie pojawiły się właśnie w tym czasie.

Ciągle pozwolę się z tym nie zgodzić, ale dobrze, nie róbmy off-topicu ;)

Koovert napisał(a):
A odnośnie jednokrotnego sprawdzenia pliku: można mieć opracowane na przykład cztery metody i do jednego tytułu dostępnego wszystkim użytkownikom przyporządkowywać losowe dwie. Inny tytuł - WM w innym miejscu.

Idąc tym tropem - można mieć opracowane i tysiąc dwadzieścia cztery metody, a serwować losowe dwie. Problem w tym, że opracowanie takiej ilości metod jest zupełnie nieopłacalne - nie oferują one aż tak zwiększonej ochrony, natomiast ich stworzenie, przetestowanie i wdrożenie darmowe nie są.

Koovert napisał(a):
Tak samo jak nie masz zawsze pary plików, to możesz się nadziać na update zabezpieczeń, których nie zdejmiesz, a wtedy wkur... zirytowane wydawnictwo ma Twoje dane i może Cię za to ścigać (i wywalić pozew cywilny po przeszacowaniu strat). Trochę zbyt duże ryzyko na wolontariat w udostępnianiu pliku. Co innego anonimowy torrent, a co innego jak dokładnie wiadomo kto wypuścił plik do sieci.

Pozywanie to zupełnie odrębna kwestia - bo jeszcze wypada udowodnić, że zrobił to pan X, a nie ktoś, kto bezprawnie uzyskał dostęp do komputera pana X.

Strona 1 z 3 Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/