Qwen2.5-VL Technical Report
2025-11-06
Zotero attachment
372 字
|
2 分钟
Visual Instruction Tuning
2025-11-04
Zotero attachment
73 字
|
1 分钟
Decouple_Before_Interact_Multi-Modal_Prompt_Learning_for_Continual_Visual_Question
我们提出看了 TRIPLET 方法,建立在预训练的 VL 模型上,包含解耦提示和提示交互策略来捕捉模态之间的复杂交互。解耦提示包含一组可学习的参数从不同方面解耦,提示词交互策略负责建模提示与输入的交互
1797 字
|
9 分钟
MMCL-Survey
多模态持续学习综述
3062 字
|
15 分钟
Meta_Continual_Learning_REVISITED
通常的持续学习至今都使用了基于正则化的方法,这些方法都归结为依赖于模型权重的海森矩阵近似.但是这些方法在知识迁移和遗忘之间存在次优的均衡.另一类元持续学习方法要求先前的任务梯度和当前的任务梯度一致.在本文中,我们把元持续学习和正则化的方法连接起来,
3463 字
|
17 分钟