FastGPT是一个基于LLM大语言模型的知识库问答系统,支持数据处理、模型调用等能力,并提供可视化界面供用户快捷创建、编排应用。
ZStack AIOS内置FastGPT安装包,支持一键部署FastGPT平台。
本场景假定某用户希望基于FastGPT构建定制化对话应用,通过接入专属知识库,实现对特定领域问题的精准回答,确保应用的回答均基于知识库检索和生成。
本节将以上述场景为例,详细介绍在ZStack AIOS上部署FastGPT并创建对话应用的方法,主要包括以下步骤:
- 创建推理服务
- 部署FastGPT
- 登录FastGPT和OneAPI
- 接入推理服务API
- 创建知识库
- 创建应用
-
创建推理服务
创建对话应用需准备三种模型:
- 大预言模型:负责理解用户输入并生成回复
- 文本嵌入模型:将文本转换为向量,并实现数据库检索
- 重排序模型:对文本嵌入模型的检索结果做进一步精细排序,提升检索准确性
-
创建大语言推理服务
本场景使用系统模型DeepSeek-R1-Distill-Qwen-7B。在ZStack AIOS主菜单,点击AI模型平台 > 模型仓库,进入模型仓库界面。找到并点击需部署的模型,在右侧详情页,点击创建推理服务。配置推理服务参数,点击确定,开始创建。详情可参考创建推理服务。
-
创建文本嵌入推理服务
本场景使用系统模型bge-reranker-large。创建方法同上。
-
创建重排序推理服务
本场景使用系统模型bge-large-zh-v1.5。创建方法同上。
-
部署FastGPT
在ZStack AIOS主菜单,点击AI模型平台 > 应用开发服务 > 全部,找到FastGPT,点击部署服务,弹出部署服务界面。可参考以下示例输入相应内容:
- 名称:设置应用开发服务名称
- 简介:可选项,可留空不填
- 部署方式:当前仅支持云主机部署
- CPU架构:选择云主机CPU架构
- 高级选项:可选项,指定云主机所在集群、主存储和IP地址。本场景不指定,由系统自动分配
- 根盘容量:默认为500GB
- CPU和内存:设置云主机CPU和内存
配置完成后,点击确定,开始部署。如图1所示:
图1 部署FastGPT -
登录FastGPT和OneAPI
等待Dify部署完成。进入应用开发服务 > 已部署,找到部署完成的FastGPT。
-
登录FastGPT
找到部署完成的FastGPT,点击进入服务 > 应用工作台,使用账户名root和初始密码1234登录。
-
登录OneAPI
找到部署完成的FastGPT,点击进入服务 > OneAPI,使用账户名root和初始密码123456登录。
-
登录FastGPT
-
接入推理服务API
- 查看推理服务API URL和服务ID
-
接入推理服务
支持两种方式接入推理服务:通过OneAPI接入、通过FastGPT接入。
- 通过OneAPI接入进入OneAPI,在顶部点击渠道 > 添加新的渠道,进入创建新的渠道界面,将步骤1中创建的三个推理服务依次接入。注意设置以下参数:
- 类型:选择自定义渠道
- Base URL:输入推理服务的API URL
- 名称:填写推理服务的服务ID
- 分组:本场景使用默认分组
- 模型:如模型框内已有其他模型,先点击清除所有模型,将已有模型清除。在输入自定义模型名称中输入推理服务的服务ID,并点击填入
设置完成后,点击提交,开始创建渠道。
如图4所示:
图4 新增渠道 - 通过FastGPT接入进入FastGPT,在左侧点击账号 > 模型提供商 > 模型配置,进入模型配置界面,点击新增模型并选择模型类型,将步骤1中创建的三个推理服务依次接入i说明:
- 大语言推理服务选择语言模型
- 文本嵌入推理服务选择索引模型
- 重排序推理服务选择重排模型
在弹出的模型参数编辑界面,设置以下参数:- 模型ID:输入推理服务的服务ID
- 模型提供商:选择模型提供商
- 别名:输入模型别名,可任意设置
- 自定义请求地址:按以下格式填写:
- 大语言推理服务:${APIURL}/v1/chat/completions
- 文本嵌入推理服务:${APIURL}/v1/embeddings
- 重排序推理服务:${APIURL}/v1/rerank
i说明: ${APIURL}均标识推理服务的API URL
设置完成后,点击确定,开始添加模型。
如图5所示:
图5 新增模型
- 通过OneAPI接入
-
创建知识库
-
准备知识库文件
准备用于知识库的文本文件,可以是企业内部文档、FAQ、规范信息等。可以是以下形式:
- 本地文件:PDF、TXT、DOCX等
- 网页链接:读取静态网页内容作为数据集
- 自定义文本:手动输入一段文本作为数据集
本场景选择准备一个本地PDF文件。 -
创建知识库
进入FastGPU,在左侧点击知识库 > 新建 > 通用知识库,进入创建通用知识库界面,设置以下参数:
- 名称:输入知识库名称
- 索引模型:选择步骤4中接入的文本嵌入推理服务
- 文本理解模型:选择步骤4中接入的大语言推理服务
设置完成后,点击确认创建。如图6所示:
图6 创建知识库 -
上传文本文件
点击进入已创建的知识库,在界面顶端点击数据集 > 新建/导入 > 文本数据集 > 本地文件,设置以下参数:
- 选择文件:选择需上传的本地文件
- 数据处理:设置数据处理方式和处理参数
设置完成后,点击开始上传。如图7所示:
图7 上传文本文件
-
准备知识库文件
-
创建聊天应用
-
创建简易应用
进入FastGPT,在左侧点击工作台 > 新建 > 简易应用,进入创建简易应用界面,设置以下参数:
- 取个名字:输入应用名称
- 从模板创建:本场景选择知识库+对话引导,点击使用,将创建简易应用
如图8所示:
图8 创建简易应用 -
配置应用
应用创建完成后,将自动跳转到应用配置界面,设置以下参数:
- AI模型:选择步骤4中接入的大语言推理服务
- 关联知识库:
- 选择:点击选择,选择步骤5中创建的知识库
- 参数:选择完成后,点击参数,进行知识库搜索配置。勾选结果重排,可使用步骤4中接入的重排推理服务对搜索结果进行二次排序
其他参数可按需设置,设置完成后,点击保存并发布,完成应用配置。如图9所示:
图9 配置应用
-
创建简易应用

