Jun 18, 2007

デジタル指紋

前のエントリーから続いて。いるのか?
iTunes Plusのファイルには、ファイルを特定する「署名のようなもの?」が付いているらしいことがわかった。
これは「透かし」ではないらしい。
しかし、違法アップロードに対してある程度の抑止力を持つだろう。

デジタル指紋によるビデオ共有サイトのフィルタリングは「機能していない」:NewTeeVeeの実験(P2Pとかその辺のお話)

所謂、「デジタル指紋」というものがどういうものなのか、良く知らないんで何ですが、、。

ネット上で軽く調べると、電子透かしと混同されてるという話もあったり。
8年前に書かれた説明 をちょっと引用。
暗号化について(大坪家の書庫)

デジタル指紋:これはIBMの定義によれば、デジタル透かしと対をなす技術のことだ。IBMの定義ではデジタル透かしとは送り手側の情報を埋め込む事を指し、デジタル指紋とは、受取手側の情報を埋め込む事を指すらしい。もっとも他の「電子透かし」のページを見てみると両者を合わせて「電子透かし」と読んでいる場合も多いような気がするが。

つらつら読むに、電子署名は見えるが透かしは見えないということらしい。
しかもコンテンツデータそのものの中に気付かれないよう埋め込むらしい。

うーーん。
思うんだけど、フィルタリングは機能していないと言う記事、初歩的な疑問で悪いんだけど、実験でアップロードされたファイルに指紋なり透かしなりは入っていたのかい?
入ってないなら、何度もアップロードできて当たり前だと思うわけで。
Daily Showのクリップってのは、入ってるという前提でやってるんだよね、、?
このクリップのファイルには「誰に売りました」という情報が埋め込まれてるということなんだろうか。

  1. YouTube上で「Daily Show」を検索する。
  2. Jon Stewartの本物のDaily Showの最初のクリップを選択肢、KeepVid.com経由でダウンロードする。
  3. Soapboxにアップロードできるフォーマットに変換する
  4. SoapboxにDaily Showのクリップをアップロードする
  5. Soapboxが処理し、変換し、そして(おそらく)著作物かどうかのスキャンのためにかかる時間を待つ

こういった過程で得られ、いじられたファイル、それでも消えない指紋なり透かしっていうデジタル技術は、自分のような素人には想像がつかない。データベースと比較するというのも、すさまじい話だなあと思い、どうも何か違うと思い、、。

オープンソースのデジタル音楽ファイル識別サービス(hotwired)
4年前の記事だけど。

音響デジタル指紋技術は、米リレータブル社が開発したもので、曲に固有のオーディオ的特徴1分当たりの拍数、高音域と低音域の量などを抽出し、『ミュージックブレインズ・タガー』によってそれぞれに独自の識別マークをつける。

これって、まったく前述のIBMの定義の話と違ってくるんですが。
しかしこっちのほうが、問題になっている「デジタル指紋」に近い技術のように見えます。曲や映像の「固有の特徴からデータを抽出してデータベースと比較する」という。
気が遠くなるけど。

機能していないという記事が載ったAudible Magic社の技術だけど、5月のネットニュースにリンク。
マイスペース、著作権保護技術「Take Down Stay Down」を導入へ--不正動画の再投稿防止(1/2/3)(cnet japan)

どえらいことを言っている。

Ikezoye氏は「人間が同じコンテンツだと認識する作業をシミュレートしている」と語っている。

どういうフィルターなのだろう。
これが「デジタル指紋」ということなら、権利者がファイルに何か埋め込んでいるとか、そういうのは一切関係ないってことになる。YouTubeからダウンロードしようがフォーマット変換しようが、関係ない。
すごくファジーな部分をカバーする技術だと思う。

実際どこまで機能するのか疑問、とあるが、さもありなん。
だって人間って見間違いするし。それをコンピュータがシミュレートするなら見間違いも増えそうだよね。

しかし、記事を読んでいて、「デジタル指紋」がどのようなものを指すのかというのは、混乱しやすいんじゃないかと思った。

MySpaceのプレスリリースによると、著作権所有者はTake Down Stay Downを無料で利用できるという。MySpaceは、ホスティングサービス「MySpace Videos」経由でホスティングされた著作権で保護された動画の排除を要請する通知を受け取ると、その新機能がその動画の「デジタル指紋」を採取し、コンテンツの再投稿を阻止する著作権フィルタにデータを登録する。Audible Magicの最高経営責任者(CEO)であるVance Ikezoye氏によると、「これは、コンテンツに印を付け、それを特定できるようデータベースに登録する機能だ」という。

これを読むと、あらかじめファイルに組み込まれた指紋を、要請によってデータベースに登録する、というふうにも受け取れる。
しかし「あらかじめファイルに組み込まれた指紋」があるなら、「新機能がその動画の「デジタル指紋」を採取」なんてことはしなくても、その指紋のデータそのものを著作権所有者がMySpace・Audible Magicに送りつければいいだけの話では?

コンテンツに印を付けるという言い方は、あたかも「そのコンテンツに指紋を埋め込む」かのように見える。そして、その指紋を「それを特定できるようデータベースに登録する」というふうに読んでしまう。
しかし、その印はどこに付いているのか。
どうやら「ファイル自体に組み込まれた指紋が印」なわけじゃなく「データベースに登録された=印が付いている」と考えた方が話が通る。

英語記事の原文は、
「 "(It's) the ability to have a piece of content imprinted and put in a database so we can identify it," said Vance Ikezoye, CEO of Audible Magic.」
意訳してみる。
「(それは)コンテンツの一部を刻印にしてデータベースに入れることで、それを特定可能にする能力だ、とAudible MagicのCEO、Vance Ikezoye氏は言った。」
こう言った方が分かりやすいのでは。

電子フロンティア財団(EFF)の弁護士スタッフであるCorynne McSherry氏によると、ビデオフィルタリングから人の介入を排除すると、不当に排除されるコンテンツが出てくる可能性があるという。

(中略)

McSherry氏は、「デジタル指紋を組み込みたいなら、最終的な安全対策や防止対策が必要だ。特定の素材に関する対抗通知があったら、適切でない可能性もあるため自動デジタル指紋の削除が必要になるかもしれない。少なくとも、判断は人が行うべきだ」と語っている。

「デジタル指紋を組み込みたいなら、」という言葉のせいで分かりにくい。
うっかりすると、コンテンツに指紋を組み込むかのように読み違える。

英文記事原文では「"If you want to build in a digital fingerprint,」とある。
「デジタル指紋に取り込みたいなら」とか「デジタル指紋を取りたいなら」としたほうがいいと思う。

同氏は、「コンテンツの特定に関しては指紋の方がはるかに堅牢だ。ハッシュはファイルを特定するだけだ」と説明している。もし、Viacomの依頼を受けて「Colbert Report」の映像を排除したとすると、MySpaceのフィルタはMPEGファイルからAVIファイルまで、同映像のあらゆる品質の全形式をブロックする。また、排除された作品のごく一部しか含まれないビデオクリップも排除可能だ。Ikezoye氏は「人間が同じコンテンツだと認識する作業をシミュレートしている」と語っている。

うーむ、「ファイルを特定する」だけではないらしい。
いや、むしろファイルの特定なんかの機能があったら邪魔で、コンテンツの集合が引っ掛かってくれればいいということなんだろう。だって、コンテンツとしては同じでもファイルは無数に存在するもんね。長さとかフォーマットとか違うのはいくらでもアップされている。

これって「デジタル指紋」というような呼び名から受けるような正確さを持ったものとは考えにくい。
モンタージュとか、似顔絵レベルのもんじゃないのかなあ、、。
IBMの言葉の使い方のケース(8年前のものではあるけど)もあることだし、まぎらわしい呼び方はして欲しくないのだけど。
指紋っていうと、あたかもファイル・コンテンツ自体にくっついていて正確に他との識別が可能な属性のように感じられますから。

もしかして、自分が間違ってる?、ちょっとよく分からないんですよね、、。

Posted at 10:03 in NoCCCD | WriteBacks (0) | Edit Tagged as: ,