FlyingWhite - FlyingWhite的个人博客

Qwen2.5-VL Technical Report

2025-11-06

未分类

无标签

Zotero attachment

372 字

|

2 分钟

Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation

2025-11-04

未分类

无标签

Zotero attachment

681 字

|

3 分钟

Visual Instruction Tuning

2025-11-04

未分类

无标签

Zotero attachment

73 字

|

1 分钟

CVPR_2025_Synthetic_Data_is_an_Elegant_GIFT_for_Continual_Vision-Language_Models

2025-08-24

论文阅读

/

多模态

/

持续学习

image.png

1154 字

|

6 分钟

ICCV_2023_Preventing_Zero-Shot_Transfer_Degradation_in_Continual_Learning_of_Vision-Language_Models_paper

2025-08-22

论文阅读

/

持续学习

image.png

839 字

|

4 分钟

Decouple_Before_Interact_Multi-Modal_Prompt_Learning_for_Continual_Visual_Question

2025-08-21

论文阅读

/

持续学习

我们提出看了 TRIPLET 方法，建立在预训练的 VL 模型上，包含解耦提示和提示交互策略来捕捉模态之间的复杂交互。解耦提示包含一组可学习的参数从不同方面解耦，提示词交互策略负责建模提示与输入的交互

1797 字

|

9 分钟

MMCL-Survey

2025-08-20

论文阅读

/

持续学习

/

综述

/

多模态

多模态持续学习综述

3062 字

|

15 分钟

Meta_Continual_Learning_REVISITED

2025-08-19

论文阅读

/

持续学习

通常的持续学习至今都使用了基于正则化的方法,这些方法都归结为依赖于模型权重的海森矩阵近似.但是这些方法在知识迁移和遗忘之间存在次优的均衡.另一类元持续学习方法要求先前的任务梯度和当前的任务梯度一致.在本文中,我们把元持续学习和正则化的方法连接起来,

3463 字

|

17 分钟