電子情報通信学会総合大会講演要旨
C-15-19
超並列計算におけるPML吸収境界条件付きFDTD法の実行性能: MICとGPUの実行性能比較
◎今井 稜・香取勇太・鈴木敬久・大久保 寛(首都大東京)
本稿ではPML吸収境界条件付きの電磁界FDTD法をGPU(Graphics Processing Unit)とMIC(Many Integrated Core)のそれぞれで実装し,その実行性能の計算規模依存性を調べる.また,PMLを配置しないモデルにおける実行性能との比較を行う.測定の結果,GPU,MICでは規模の増加に伴い性能が上昇することが確認された.実行性能はGPU+CUDA,MIC+OpenMP,GPU+OpenACC,CPU+OpenMPの順に高く,最大規模(512x512x512セル)の計算においてCPU+OpenMPの実行性能を1とすると,GPU+CUDAで20,MIC+OpenMPで9.7,GPU+OpenACCで4.8であった.これより,MIC+OpenMPはGPU+CUDAに性能は劣るものの,GPU+OpenACCより優れた性能を有しており,ディレクティブ挿入型の並列化手法を用いる際には有効であると考えられる.また,MIC実装ではPML付きのモデルはPML無しのモデルと比較して演算性能が低いことが確認された.