Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation
2025-11-04
Zotero attachment
681 字
|
3 分钟
CVPR_2025_Synthetic_Data_is_an_Elegant_GIFT_for_Continual_Vision-Language_Models
2025-08-24
image.png
1154 字
|
6 分钟
ICCV_2023_Preventing_Zero-Shot_Transfer_Degradation_in_Continual_Learning_of_Vision-Language_Models_paper
2025-08-22
image.png
839 字
|
4 分钟
Decouple_Before_Interact_Multi-Modal_Prompt_Learning_for_Continual_Visual_Question
2025-08-21
我们提出看了 TRIPLET 方法,建立在预训练的 VL 模型上,包含解耦提示和提示交互策略来捕捉模态之间的复杂交互。解耦提示包含一组可学习的参数从不同方面解耦,提示词交互策略负责建模提示与输入的交互
1797 字
|
9 分钟
Meta_Continual_Learning_REVISITED
2025-08-19
通常的持续学习至今都使用了基于正则化的方法,这些方法都归结为依赖于模型权重的海森矩阵近似.但是这些方法在知识迁移和遗忘之间存在次优的均衡.另一类元持续学习方法要求先前的任务梯度和当前的任务梯度一致.在本文中,我们把元持续学习和正则化的方法连接起来,
3463 字
|
17 分钟