« ハッキングでなくてもプライバシーが流出する可能性 | トップページ | 今や個人情報は漏れる時代になっているのだろう »

2013年11月25日 (月)

ビッグデータとプライバシー

 前回、家電のスマートかとプライバシーについて感想を書いた。今回は、ビッグデータとプライバシーである。ビッグデータ時代にプライバシーを保護する方策を考える--Suica事例は何が問題だったのか:ITproという記事に、ビッグデータ時代のプライバシーとして、SUICAの事例を例に、プライバシー保護の難しさが解説されていた。読めば読むほどやっかいな話である。この記事のポイントは、「データ活用と匿名化技術との両立は難しい」ということである。データ活用する際に、プライバシー保護のために必要なのは匿名化である。ところが、匿名化と仮名化とは混同されやすいという。私も混同していた。少し引用する。

 そもそも匿名化は、仮名化などと混同されやすい。この二つの違いを図示したのが、以下に掲載する三つの図だ。実名は、図1のように異なるコンテキストの間で1対1で対応するパターンだ。仮名とは、図2のように異なる場面の間で対応が切られて、元のIDをたどれない状態のことだ。だが、それぞれの場面で使われる名前は同一とする。Suicaの事例も当初は、別のIDを振り当てた仮名化だったとされる。
 さらに匿名とするには、同じ場面であっても同一性が切断されて一人ひとりのデータと分からない状態となる必要がある(図3)。しかし一方でここまでくると、同じ場面の中のどんな間隔で切断するかによって、匿名データと集計された統計データとの線引きが難しくなってくるという。

 概念としてはよくわかるが、実際には、引用文の中でも指摘されているように、どこで切断すべきか、というのは本当に難しい。しかも、そんな切断されたデータがどんな役に立つのかもよくわからない。ひょっとすると、匿名化されたデータでは、実ビジネスで欲しいデータ活用が本当にできるのか疑問になってくる。

« ハッキングでなくてもプライバシーが流出する可能性 | トップページ | 今や個人情報は漏れる時代になっているのだろう »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/568535/58643577

この記事へのトラックバック一覧です: ビッグデータとプライバシー:

« ハッキングでなくてもプライバシーが流出する可能性 | トップページ | 今や個人情報は漏れる時代になっているのだろう »

2017年8月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

公告

  • Google Adsense
無料ブログはココログ