電子情報通信学会総合大会講演要旨
D-12-12
LDAによる次元削減と二分探索木を用いた高速・高精度日本語文字認識
◎大館良介・後藤英昭(東北大)
スマートフォンなどの携帯機器による文字認識の需要が高まっており,字種数の多い日本語・中国語の認識の高速化が必要とされる.そのため我々は,二分探索木を用いたクラスタリングと次元削減を用いた,高速・高精度な最近傍探索手法を提案したが,本稿ではその改良手法を提案する.提案手法では,手書き文字データに含まれる外れ値の切り捨てと,線形判別分析(LDA)を用いた次元削減を導入することで,効率的な二分木の構築を可能にし,精度を維持した高速化を実現した.既存手法と同程度の精度で20%前後の速度向上が見られた.