BotOf Tech
返回首页RAGFlow:基于深度文档理解的开源 RAG 引擎

RAGFlow:基于深度文档理解的开源 RAG 引擎

·1 分钟阅读·

RAGFlow 是什么?

RAGFlow 是一个基于深度文档理解的开源 RAG 引擎,为企业和个人提供流式 RAG 工作流。

核心特点

深度文档解析

不是简单的文本提取,而是理解文档结构

  • PDF: 识别标题层级、表格、图片说明
  • Word: 保留格式和层次关系
  • Excel: 理解行列语义
  • PPT: 识别标题和要点

证据引用

每个回答都标注来源:

答案:公司 Q3 营收同比增长 23%。
📎 来源:[财报.pdf] 第 12 页,第 3 段

用户可以点击跳转到原文验证,建立信任。

可视化编排

拖拽式 RAG Pipeline 构建器:

  1. 文档入口 → 选择数据源
  2. 解析器 → 选择解析策略
  3. 分块器 → 配置切分参数
  4. 嵌入器 → 选择向量模型
  5. 检索器 → 配置 Top-K 和阈值
  6. 生成器 → 选择 LLM 和 Prompt

快速部署

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose up -d

默认端口 80,访问 Web UI 即可开始使用。

适用场景

  • 企业知识库问答
  • 法律/医疗文档检索
  • 技术文档助手
  • 客服自动化

来源: @aigclink 的项目介绍