1: 2016/01/15(金) 21:59:56.10 ID:CAP_USER.net
【プレスリリース】暗号化したままデータを分類できるビッグデータ向け解析技術を開発 - 日本の研究.com
https://research-er.jp/articles/view/42398

images


ポイント

•ビッグデータ解析で多用されているロジスティック回帰分析をデータ暗号化のまま計算可能に
•暗号化された1億件のデータを30分以内で複数グループに分類できることをシミュレーションで確認
•ビッグデータ解析におけるプライバシー保護への応用に期待


NICT セキュリティ基盤研究室は、大量のデータを暗号化したまま複数のグループに分類できるビッグデータ向け解析技術を開発しました。

本技術は、NICTが開発していた準同型暗号技術SPHERE(スフィア)とロジスティック回帰分析技術を組み合わせることで実現したものです。
暗号化した状態でデータを分類できるので、個人情報などの機微な情報を安全に効率よく分類することが可能になります。
応用例の一つとして、本技術を用いて健康診断等のデータから病気の判定を行う際に、データ処理を行う第三者にデータの内容を開示せずに済み、プライバシーを保護できるようになると期待されます。

続きはソースで

引用元: 【情報技術】暗号化したままデータを分類できるビッグデータ向け解析技術を開発

3: 2016/01/15(金) 22:21:31.37 ID:YncZdTiG.net
暗号化したままのデータを読み取る技術ももうすぐだな

4: 2016/01/15(金) 22:22:47.99 ID:ZR1RLLli.net
まさか暗号化されてない付加タグで分類とかじゃないだろうなw

5: 2016/01/15(金) 22:28:30.64 ID:vzjx2COR.net
暗号って、パターンを読めないから暗号なのでは?

6: 2016/01/15(金) 22:44:05.82 ID:b58HzkHk.net
データコピー取ってそっちデコードしてるとかじゃないの?

7: 2016/01/15(金) 23:02:06.50 ID:dcWNIecs.net
辞書(平文)を用意して、暗号文と同時に細かく分類すれば事実上なんでも解読できる
新しい暗号解読法として特許出願予定

8: 2016/01/15(金) 23:28:17.91 ID:n5szUdZU.net
エンクリプトした文字列をソートして行数を数えてみましたって話か?

12: 2016/01/15(金) 23:59:25.63 ID:dcWNIecs.net
768人分のデータの576件を学習に使って
残りの192件を分析したら
平文でも暗号文でも正答率約80%(ただし、誤答の判定対象が同じかどうかは不明みたい)

ビッグデータがどこに出てくるのかと思ったら
>シミュレーションによって、サーバ上で1億件のデータを30分以内で分析可能であることが確認できました(図3参照)
だそうだ

13: 2016/01/16(土) 01:49:00.02 ID:FgjRzvja.net
>>12
つまりグループAやらBの内容はともかく、
暗号化したままデータを分類出来るって事か?
せっかくエントロピー最大化して暗号化したのに、意味無くなるね。

15: 2016/01/16(土) 09:15:42.75 ID:lxLvt3xg.net
たとえば、1を「桜散る」と暗号化し、
2を「ニイタカヤマノボレ」と暗号化し、
3を「花子さんが子供を産んだ」と暗号化したとすれば、
分類はできる。しかし、「桜散る」がどういうことを
表わした暗号なのかはわからないままだ。
 しかし、結果的に頻度の分析から、少しの情報が
漏れる。たとえば頻出する英字はEであるというような。
頻度の少ない事象の連絡は重要事項なんだろうと想像できるなど。

16: 2016/01/16(土) 09:35:53.19 ID:dzKGYOm4.net
これまで「計算に膨大な時間がかかる」っていうのが今ひとつピンとこなかったんだけど、
最近サーバーをいじるようになってきて漸くそれが理解できるようになってきた。

18: 2016/01/16(土) 11:12:48.81 ID:vNxREotz.net
準同型性を保持する演算しか使えない
まだ加法と乗法を同時に満足する体系は見つかってない
つまり加法しか出来ないと考えていい
条件満たす総数計算したり
計算すると総数を暗号化したものが得られるので
それを復号すればいい

21: 2016/01/16(土) 12:35:08.85 ID:YDdueqWx.net
>>18
http://www.atmarkit.co.jp/ait/articles/1508/14/news001_2.html
>しかし、「加法と乗法の両方を同時に実現する」準同型暗号は
>長らく実現していませんでした。そのような暗号を
>「完全準同型暗号(FHE:Fully HE)」といいます。

https://research-er.jp/articles/view/42398
>データをあらかじめ完全準同型暗号技術を用いて暗号化しておき、
>(省略) 理論的には可能ですが、それには膨大な時間を要するため、
>現実的な時間で大量のデータを処理することは困難でした
>
>今回開発した技術の概要
>既存の手法(ロジスティック回帰分析アルゴリズムと
>完全準同型暗号の単純な組み合わせ)に対して、
>以下に説明する2つの高速化技術を適用しました。

19: 2016/01/16(土) 11:59:30.35 ID:N1E1m7x7.net
格子暗号なら出来る。量子コンピュータによる解読にも耐えうる。

25: 2016/01/16(土) 14:29:29.46 ID:Upq0BLNh.net
これは暗号といえるのか?
線形代数的に考えると 同じだけど別の線形空間に変換しただけだろ?

28: 2016/01/16(土) 16:54:34.74 ID:ZbMaXSsX.net
模範解答を暗号化し
それに近い値を分類とかじゃないよね。
4択の回答とか。回答の範囲が絞らてるとか。

14: 2016/01/16(土) 06:57:24.11 ID:6J0mZyu/.net
暗号文が新たな平文になるになるだけだろ