電子情報通信学会総合大会講演要旨
D-4-3
FP-Growth法に基づく平均超過パターンの発見
○高橋和志・亀谷由隆(名城大)
データマイニングの代表的手法として頻出パターン発見が知られている.一方,現実には,トランザクション(アイテム集合)全体に重みがついているデータベースが存在している.例えば,ホテルのレビュー記事に現れる単語の集合をトランザクション,評価点を重みとみなすことができる.このようなデータベースに対し,本研究ではFP-Growth法に基づいて重みのトランザクション平均を超過するパターン発見手法を提案する.この提案手法では分枝限定法と生産性制約に基づく枝刈りにより効率的な探索を可能としている.検証実験では,提案手法をホテルのレビュー記事に適用し,その効果を確認した.