イベント企画
トップコンファレンス4-1 パターン認識・メディア理解
9月4日9:30-12:00
第4イベント会場

座長:西山 正志(鳥取大学)

9:30-9:50 講演(1) ブラックボックス忘却
桑名 優輔(東京理科大学 大学院工学研究科情報工学専攻入江研究室 修士課程2年)
【原発表の書誌情報】Kuwana, Y., Goto, Y., Shibata, Y., Irie, G.: Black-Box Forgetting, Advances in Neural Information Processing Systems (NeurIPS), 37:58792-58815, 2024.
【概要】大規模事前学習モデルは高い汎用性を有する一方、不要な物体クラスの記憶が運用上の課題となり得る。この問題に対処すべく、特定クラスのみを認識不能にする「選択的忘却」への関心が高まっている。従来法はモデルの内部情報の利用を前提としていたが、本研究では詳細が非公開なブラックボックスモデルに対する新たな選択的忘却法を開発し、その有用性を示した。
【略歴】2024年東京理科大学工学部情報工学科卒業。同年同大学大学院工学研究科情報工学専攻修士課程入学、現在在学中。入江研究室にて認識モデルに対する選択的忘却の研究に従事。
9:50-10:10 講演(2) 能動学習におけるインスタンスごとの教師レベル最適化
松尾 信之介(九州大学 大学院システム情報科学府情報理工学専攻 博士後期課程)
【原発表の書誌情報】Matsuo, S., Togashi, R., Bise, R., Uchida, S., Nomura, M.: Instance-wise Supervision-level Optimization in Active Learning, Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), pp. 4939-4947 (2025).
【概要】能動学習は,限られたラベル付け予算の中で,学習効率の最大化を目的に,ラベル付けを行うデータを選択する手法である.本講演では,従来一般的である正確だが高コストな full supervision と,大まかではあるものの低コストでラベル付与が可能な weak supervision のどちらを各データに付与するかも同時に最適化する,新たな能動学習の枠組みである Instance-wise Supervision-Level Optimization (ISO) を紹介する.
【略歴】2023年九州大学大学院システム情報科学府修士課程を修了.同年より同大学院博士課程に在学.同年4月より日本学術振興会特別研究員DC1,10月からはJST ACT-X研究員としても活動.現在は,実データに対する機械学習応用の研究に従事.
10:10-10:30 講演(3) モダンホップフィールドネットワークにおける分布外データの除外
森合 遼(東京科学大学 大学院情報理工学院情報工学系佐藤育郎研究室 卒業生)
【原発表の書誌情報】Ryo Moriai, Nakamasa Inoue, Masayuki Tanaka, Rei Kawakami, Satoshi Ikehata and Ikuro Sato:
Rectified Lagrangian for Out-of-Distribution Detection in Modern Hopfield Networks,
The 39th Annual AAAI Conference on Artificial Intelligence(poster)
【概要】MHNは、クエリ入力に対しエネルギー関数の局所最小に状態を収束させることで記憶想起を行うが、分布外サンプルの入力に対し堅牢でない。本研究で提案するRecLag-MHNでは、新たなラグランジアンの導入と相互作用行列の最適化により、分布外サンプルによる誤検索を抑制しつつ既存MHNと同等の記憶想起を実現する。
【略歴】2023年東京工業大学情報理工学院情報工学系卒業。その後同大学院修士課程にて佐藤育郎特任教授に師事する。2025年3月に修士課程を卒業し、現在はソフトウェア開発業務に従事。
10:30-10:50 講演(4) 巡回対称性を持つグロモフ・ワッサースタイン問題
武田 翔一郎(NTT株式会社)
【原発表の書誌情報】S. Takeda, Y. Akagi, "Gromov-Wasserstein Problem with Cyclic Symmetry," in Proceedings of the Computer Vision and Pattern Recognition Conference (CVPR), 2025, pp. 21011-21020.
【概要】グロモフ・ワッサースタイン問題は、データ間の構造的な類似度や対応関係を求める問題であり、画像マッチングや三次元再構成などの様々なコンピュータビジョンタスクで応用されています。今回我々は、実世界のデータに潜む巡回対称性を利用することで、この問題を高速に解く新しいアルゴリズムを開発しました。人工データと実世界データを用いた実験により、提案したアルゴリズムの有効性を確認し、理論的にもその妥当性を確認しました。
【略歴】2014年慶應義塾大学理工学部生命情報学科卒業。2016年同大学大学院基礎理工学専攻博士前期課程修了。2021年筑波大学大学院情報理工学位プログラム博士後期課程修了。2016年日本電信電話株式会社入社。専門は信号処理、最適化、神経科学。特に近年は、最適輸送問題に関する研究に従事。第3回サイエンス・インカレ奨励表彰(2014年)、情報処理学会AVM優秀賞(2019年)、情報処理学会CGVI優秀研究発表賞(2019年)各受賞。
10:50-11:10 講演(5) 視覚言語基盤モデルにおけるモダリティ整合のための事後訓練
山口 真弥(NTT コンピュータ&データサイエンス研究所 准特別研究員)
【原発表の書誌情報】Yamaguchi, S., Feng, D., Kanai, S., Adachi, K., & Chijiwa, D. (2025).
Post-pre-training for modality alignment in vision-language foundation models.
In Proceedings of the Computer Vision and Pattern Recognition Conference (pp. 4256-4266).
【概要】画像とテキストを共通の特徴空間に埋め込む CLIP のような視覚言語基盤モデルは強力なゼロショット性能を示すが、画像とテキストが特徴空間上で異なるクラスタを形成するモダリティギャップという課題が知られている。本研究ではモダリティギャップを事前学習後に改善するための軽量な事後学習手法 CLIP-Refine を紹介する。
【略歴】2017年横浜国立大学大学院工学府修士課程修了。同年より NTT 研究所に入社。2025年京都大学大学院情報学研究科博士課程修了見込み。合成データ活用、転移学習、説明可能AI、マルチモーダル表現学習などの研究に従事。令和四年度PRMU研究奨励賞、ACML2023 Best Paper Award 受賞。
11:10-11:30 講演(6) HuPerFlow:人間と機械による動き推定の比較のための包括的ベンチマーク
楊 詠皓(京都大学 大学院情報学研究科 知能情報学コース 特定研究員)
【原発表の書誌情報】C1.Yang, Y.-H., Sun, Z., Fukiage, T., & Nishida, S. (2025). HuPerFlow: A comprehensive benchmark for human vs. machine motion estimation comparison. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2025). Nashville, TN, USA.
【概要】In this study, we propose “HuPerFlow,” a novel benchmark for comparing and evaluating motion estimation performance between humans and machines. HuPerFlow consists of a dataset, experimental protocol, and evaluation metrics that enable quantitative comparison of human visual perception and computer vision model outputs across various motion scenarios. Our initial evaluation reveals systematic differences between recent optical flow algorithms and human observers. The proposed benchmark provides a foundation for quantitatively exploring the gap between human-centric visual understanding and AI-based motion processing.
【略歴】Yung-Hao Yang is a researcher at the Cognitive Informatics Lab, Kyoto University (since 2021), where he studies human motion perception using psychophysical methods and computer vision approaches. He previously held research positions at NTT Communication Science Laboratories (2018–2021), Harvard Medical School (2017–2018), and National Taiwan University (2009–2017). He received his Ph.D. in General Psychology from National Taiwan University in 2016.