電子情報通信学会総合大会講演要旨
D-19-11
データ間距離に基づいた匿名化アルゴリズムの一考察
○秋山寛子(長野高専)・中山雅哉(東大)・加藤 朗・砂原秀樹(慶大)
プライバシ保護技術の一つとして,個人を特定・識別できないような形にパーソナル情報を加工する匿名化技術がある.匿名化技術の一つに,複数のデータを他の同一値に置換する「一般化」がある.プライバシに配慮したデータ活用においては,匿名性を保持しながら,情報の歪曲や損失が小さくなることが望ましい.しかし,匿名化を行うことにより,もとの情報量が減少してしまい,匿名性と情報量のトレードオフが生じるという問題がある.そこで,匿名化情報と元のデータとがどの程度変化したかを表す「情報損失」という指標を用いて,情報の損失が極小となる匿名化アルゴリズムを開発する.提案アルゴリズムでは,データ間の距離を基にデータを分割する.さらに,データの分布と希望するk匿名度との関係について考察する.