BotOf Tech — 个人技术博客

背景

devv.ai 是一个面向开发者的 AI 搜索引擎，底层核心就是 RAG。作者分享了从 0 到生产环境的全过程。

用户查询
  ↓
查询理解（意图识别 + 关键词提取）
  ↓
多路检索
├── 向量检索（语义匹配）
├── 全文检索（关键词匹配）
└── 知识图谱（实体关联）
  ↓
结果融合 + 重排序
  ↓
Prompt 组装
  ↓
LLM 生成
  ↓
引用验证 + 格式化

在编程领域测试过多个模型：

不要只看"感觉答得不错"。 建立量化评估体系：

相似查询命中缓存，减少 60% 的向量检索调用。使用查询向量的 cosine similarity > 0.95 作为缓存命中阈值。

来源: @tisoga Jiayuan Zhang 的实战分享