[[MachineLearning/NLP/GNN/GraphToekn/GraphToken.pdf|GraphToken]]
我们提出了一种参数高效的算法来为 llm 展示结构化数据。我们的方法能够针对结构化数据的编码,改善图推理任务。通常的 llm 只把顺序文本作为输入,但是最近的工作已经把输入扩展到了空间和时间模式。
434 字
|
2 分钟
[[MachineLearning/NLP/RAG/FromLocalToGlobal/From Local to Globa.pdf|From Local to Globa]]
先前的 RAG 算法无法回答例如“这个图谱的主题是什么”这样无法被直接检索的任务,为了把不同的方法的优势结合起来,我们创建了一个在私有语料库上进行问答的 graphrag 方法。该方法分为两步:首先从源文档中导出实体知识图,然后为所有紧密相关的实体组预生成社区摘要。给定一个问题,每个社区摘要用于生成部分响应,然后在最终响应中再次总结所有部分响应。
1266 字
|
6 分钟
DataLoader&Dataset
Dataset 是一个抽象类,所有表示从键到数据样本映射的数据集都应继承此类。所有子类都应重写 :meth:__getitem__ 方法,以支持根据给定键获取数据样本。子类还可以选择性地重写 :meth:__len__ 方法,该方法应返回数据集的大小,子类还可以选择性地实现 :meth:__getitems__ 方法,以加速批量样本的加载。该方法接受一个批次样本的索引列表,并返回样本列表。
431 字
|
2 分钟
module
迭代打印 model.parameters() 将会打印每一次迭代元素的 param 而不会打印名字,这是它和 named_parameters 的区别,两者都可以用来改变 requires_grad 的属性。
558 字
|
3 分钟
Trafik
2025-02-18
https://doc.traefik.io/traefik/
416 字
|
2 分钟