電子情報通信学会ソサイエティ大会講演要旨
A-19-10
Web情報を活用したデータ統合手法の基礎評価
○西村康孝・吉原貴仁(KDDI総合研究所)
表データやデータベースなどの構造化された複数のデータを統合して分析することで,個々のデータからは分からなかったことを知ることができる.例えば,各市町村が公開する公共施設や保育施設,犯罪件数などのデータを統合して分析することで,居住地の施設充実度や治安などを比較しながら転居先を検討できる.一方,データが含む属性の名前は,「施設名」や「名称」のように各市町村で異なる場合が多く,データ統合の際には属性間の対応関係を把握する必要がある.属性の名前やデータ型などの様々な特徴量を用いて対応関係を推定する既存手法があるが,これらの特徴量だけでは推定が困難なケースがあった.そこで従来の特徴量に加え,Web情報から特徴量を抽出し,これらから対応関係の推定精度向上を図るデータ統合手法を著者らは検討している.本稿では検討手法の基礎評価結果を報告する.