Attention-Based Relation Reasoning Network for Video-Text Retrieval (Ni Wang, et al.. ICME 2021) 에 대한 논문 리뷰입니다 0. Abstraction - Attention-based Relation Reasoning Network(ARRN)를 제안한다 - ARRN은 sentence의 word의 관계를 추론하고, 비디오 frame간의 temporal한 관계를 추론한다 1. Introduction - 다른 model들이 different modality간의 inter-modal relationship에 집중한다 - 하지만 single modality안의(각 video, 각 text) relationship 역시 중요하다. 이것을 모델..