RagFlow学习笔记

==作者:cybsky==

[toc]

用户

1
2
多租户模式
团队就是租户

数据

1
一个租户一个索引

解析

TABLE

源码解读
1
2
3
4
5
6
7
8
9
10
使用pandas读取excel
pd.read_csv和pd.read_excel
遍历sheet
Excel可能有多个sheet,通常会遍历每个sheet。
遍历行列
对每个sheet,遍历所有行和列,读取每个单元格的内容。
结构化输出
把每个sheet的数据转成list of dict(每行一个dict,key为列名)。
返回结果
返回结构化后的数据,供后续分块、向量化等用。
适用场景
  • 结构化表格文件
    Excel(.xls, .xlsx)、CSV、TSV等标准表格文件。
  • 文档中嵌入的表格
    Word(.docx)中的表格、PDF中的表格区域。
  • 知识库/FAQ表格
    问答对、术语表、产品参数表等以表格形式存储的知识。
文章作者: CYBSKY
文章链接: https://cybsky.top/2025/06/23/cyb-mds/AI/ragflow/ragflow学习笔记/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 CYBSKY