RAG 平台/数据管理Chunk 质量增强

Chunk 质量增强

HyDE 问题改写 + 摘要增强 + 实体标注 — 提升检索召回率的核心工具
-
总 Chunk 数
-
已生成问题
-
已生成摘要
-
已标注实体
-
问题总数

HyDE 问题改写

为每个 Chunk 生成 3~5 个假设性查询问题,构建问题→Chunk 反向索引,大幅提升检索召回率

摘要增强

为每个 Chunk 生成 50~100 字结构化摘要 + 关键词列表,辅助粗排和展示

自动实体标注

自动提取命名实体(公司/人名/指标/日期) + 主题标签,支持精确筛选