
RAGFlow:基于深度文档理解的开源 RAG 引擎
RAGFlow 是什么?
RAGFlow 是一个基于深度文档理解的开源 RAG 引擎,为企业和个人提供流式 RAG 工作流。
核心特点
深度文档解析
不是简单的文本提取,而是理解文档结构:
- PDF: 识别标题层级、表格、图片说明
- Word: 保留格式和层次关系
- Excel: 理解行列语义
- PPT: 识别标题和要点
证据引用
每个回答都标注来源:
答案:公司 Q3 营收同比增长 23%。
📎 来源:[财报.pdf] 第 12 页,第 3 段
用户可以点击跳转到原文验证,建立信任。
可视化编排
拖拽式 RAG Pipeline 构建器:
- 文档入口 → 选择数据源
- 解析器 → 选择解析策略
- 分块器 → 配置切分参数
- 嵌入器 → 选择向量模型
- 检索器 → 配置 Top-K 和阈值
- 生成器 → 选择 LLM 和 Prompt
快速部署
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose up -d
默认端口 80,访问 Web UI 即可开始使用。
适用场景
- 企业知识库问答
- 法律/医疗文档检索
- 技术文档助手
- 客服自动化
来源: @aigclink 的项目介绍