電子情報通信学会総合大会講演要旨
D-4-18
タスク数を考慮した分散問合せ処理性能の向上
○木村由香・藤島永太・山口実靖(工学院大)
インターネット上における多種多様なサービスにより,ライフログや,センサーデータなど,データは蓄積され増え続けている.そういった大規模なデータに対し,並列に処理するプログラミングモデルとして,MapReduceがある.
本論文では,Hiveを用いたMapReduce処理に着目し、データ分割サイズと処理性能の関係について考察する.