Fine-tune multimodal embedding với Sentence Transformers: hướng dẫn setup VDR từ dữ liệu, loss tới evaluator để tăng chất lượng retrieval