【Poster】openGauss向量数据库AI生态构建—RAG、MCP应用的完美融合

openGauss向量数据库AI生态构建—RAG、MCP应用的完美融合

作者:陶颖、孙德超、陈欢
{taoying20, sundechao2,chenhuan67}@huawei.com

摘要

openGauss 作为国产领先的企业级开源数据库,不仅具备稳定高效的核心能力,还构建起一个开放、多元、协同演进的 AI 生态体系。openGauss深度适配主流 RAG(检索增强生成)业务编排工具openEuler Intelligence 、 Dify 、 RAGFlow。作为 RAG 架构中的数据库服务,openGauss 不仅能够全面满足基础的数据存储与查询需求,一方面通过BoostKit量化压缩算法进行向量检索加速,另一方面它整合了传统关系型数据库能力、知识图谱检索能力、全文索引检索能力以及新兴的向量数据库能力,构建起“四库合一”的融合查询体系,进一步拓展了其智能化能力边界。openGauss同时兼容 MCP(Model Context Protocol)协议,使 LLM 可以与外部数据库、API 和工具进行高效交互。

RAG框架-openEuler Intelligence 、 Dify 、 RAGflow

RAG(Retrieval-Augmented Generation,检索增强生成)框架是一种结合检索和生成技术的模型,旨在通过引用知识库的信息来生成高质量、准确且具有可解释性的答案或内容。

openGauss作为国产高性能开源数据库,在RAG(检索增强生成)生态中展现出强大的适配能力,不仅深度集成自有工具链openEuler Intelligence ,还积极兼容主流RAG业务编排开源框架Dify、RAGFlow,为开发者提供了灵活、高效的向量知识库解决方案。此外,openGauss在适配RAG编排系统时,不仅支持向量检索加速,同时实现了 “结构化过滤 + 全文检索 + 向量搜索 + 图搜索” 四位一体 的混合查询能力。

① 向量检索加速

  • 支持基于鲲鹏BoostKit量化压缩算法,高效压缩高维向量,减少近似检索计算量,提升检索效率。
  • 通过鲲鹏NEON和SVE指令集对热点距离计算函数进行SIMD加速,充分利用鲲鹏多核算力,同时减少指令数量,降低访存次数,速度提升20%。

② openGauss四库合一

  • openGauss能力全覆盖:传统关系型数据库能力、知识图谱检索能力、全文索引检索能力、向量数据库能力。
  • openGauss支持容器化部署,部署方式简单、快捷,相较于原先多种类型数据库差异化部署,极大降低部署成本,实现数据库部署归一。

RAG工具简介

工具 简介
openEuler Intelligence openEuler Intelligence是一个基于 openEuler 操作系统的人工智能助手,主要包含多路增强RAG、知识库管理、workbench等核心功能,以 openGauss 为默认文档数据库,作为底层数据支撑平台,贯通整个RAG流程。项目地址:euler-copilot-framework: A framework named EulerCopilot, designed for resource management and scheduling.
Dify Dify是一款开源的LLM应用开发平台,提供可视化RAG(检索增强生成)工作流编排能力,支持快速集成openGauss等向量数据库与各类大语言模型,帮助开发者零代码构建企业级AI应用。项目地址:Release v1.1.3 · langgenius/dify · GitHub
RAGFlow RAGFlow是一款轻量级、开源的RAG(检索增强生成)业务编排框架,支持与openGauss等向量数据库深度集成,提供文档解析、向量化存储和智能检索的一站式解决方案,助力开发者快速构建AI知识库应用。项目地址:KunpengRAG: Kunpeng-RAG解决方案: 涵盖Gen AI平台、openGauss向量数据库、文档处理、切分、Embedding、Reranker等鲲鹏亲和微服务,基于鲲鹏指令和硬件亲和加速特性充分发挥处理器算力,实现RAG解决方案丝滑部署,性能开箱最优。 - Gitee.com

AI Agent-MCP

MCP 是一种开放协议,它标准化了应用程序向 LLM 提供上下文的方式。可以将 MCP 视为 AI 应用程序的 USB-C 端口。正如 USB-C 提供了一种将设备连接到各种外围设备和配件的标准化方式一样,MCP 提供了一种将 AI 模型连接到不同数据源和工具的标准化方式。

openGauss已深度适配 MCP 协议,使其能够无缝集成到 RAG(检索增强生成)、智能问答、数据分析等 AI 应用场景中,提供 高效、标准化的数据接入能力。


本次 openGauss 发布两项 MCP Server 服务:

  • openGauss MCP Server: 可以和 openGauss 数据库安全交互的 MCP Server,全面支持执行 SQL 语句,实现自然语言与数据库的无损交互。
  • DataKit MCP Server:可以帮助用户管理,安装,监控运维自己的 openGauss 数据库以及对应的物理机资源,完成数据库的运维,监控,迁移,开发,建模等复杂的操作,赋能 AI Agent 应用构建。

使用链接

https://gitee.com/kunpeng_compute/KunpengRAG