

构建一个“论文检索 + 推理”知识库服务,支持用户上传 PDF/LATEX 源码后,秒级检索并获得基于内容的问答、摘要、引用等功能
本文介绍了一个端到端的“论文检索+推理”知识库服务系统。该系统支持用户上传PDF/LaTeX文档后实现秒级检索,提供基于内容的问答、摘要和引用功能。核心架构包括:数据管道(文档解析、分块、嵌入和索引构建)、混合检索策略(BM25和语义检索融合)、微服务化设计(嵌入、检索、记忆和摘要服务)以及基于Agent的交互系统。系统采用可插拔组件设计,支持热替换嵌入模型和重排器,并通过监控指标(nDCG@10、忠实度、延迟等)持续优化。该方案在检索效率、功能完整性和系统弹性方面具有显著优势。