部署
在部署 Fastapi 或者其他的 Web APId 的时候,有几个概念值得了解.
1707 字
|
9 分钟
[[文件夹操作]]
2024-10-24
os,glob,shutil,pathlib 是文件夹操作的 4 天王
163 字
|
1 分钟
大模型词表
在文本输入 embedding 层之前,以中文文本为例,首先对文本进行分词并进行 one-hot 编码,分词肯定是根据词表来进行分词,那构建一个合适的词表就显得至关重要,过大或者过小都会对后续模型的训练效果产生影响。所以这里介绍当前各个大模型的词表构建方法。
1289 字
|
6 分钟
[[CLIP.pdf|CLIP]]
目前的 sota 的计算机视觉系统在一组被事先定义好的目标分类中进行训练,这种受限的监督形式限制了它们的通用性和可用性,因为需要额外的标记数据来指定任何其他视觉概念。我们证明了预测图像与哪个描述相匹配的方法是高效的并且达到了 SOTA 的效果.预训练后,模型能够使用自然语言来引用到视觉概念,使得模型可以零样本转移到下游任务汇总
632 字
|
3 分钟
[[Vitron.pdf|Vitron]]
Vitron 在前端采用了集合了 image,video,像素级别的视觉 encoder.在后端集成了最专业的视觉专家,让 Vitron 覆盖了基本所有的视觉任务。为了确保从 LLM 到后端模块进行功能调用时有效且精确的信息传递,通过同时整合离散的文本指令和连续的信号嵌入我们提出了一种新颖的混合方法。此外,我们设计了多种像素级时空视觉语言对齐学习,以使 VITRON 达到最佳的细粒度视觉能力。最后,建议一个跨任务协同模块,以学习最大化任务不变的细粒度视觉特征,增强不同视觉任务之间的协同。
2028 字
|
10 分钟
OFA-达摩院多模态模型
通用统一的预训练大模型逐渐变成 AI 研究热潮之一.大规模多模态预训练已经成为未来 AI 的基础设施,AI 模型也变得更加通用统一,通用统一的预训练大模型也已成为当前 AI 研究的一大趋势.
2596 字
|
13 分钟
Cover Image of the Post
重参数化技巧
2024-10-11
https://kexue.fm/archives/6705
833 字
|
4 分钟
希腊字母对照表
2024-10-11
image.png
1 字
|
1 分钟