进阶功能 ⏱️ 约30分钟

第4章:知识库使用

让Bot拥有自己的"专属记忆",回答基于你的私有数据。

4.1 什么是知识库

知识库是Bot的"记忆",让它可以回答专属问题。

💡 举个例子

没有知识库的Bot:只能回答通用知识,比如"什么是年假"

有知识库的Bot:可以回答"我们公司年假有几天?""怎么申请年假?"

知识库适用于以下场景:

  • 📋 公司内部制度、HR政策问答
  • 📚 产品说明书、帮助文档查询
  • 📖 学习资料、课程知识库
  • 💬 客服常见问题解答

4.2 创建知识库

在Coze中创建知识库非常简单,按以下步骤操作:

1

进入知识库页面

点击左侧导航栏的 "知识库" 选项

知识库导航
2

创建新知识库

点击右上角的 "创建知识库" 按钮(蓝色按钮)

3

命名知识库

输入知识库名称(如"公司HR政策")和描述,点击确定

💡 命名建议

使用清晰、有区分度的名称,方便后续管理多个知识库

4.3 导入数据方式

Coze支持三种数据导入方式,根据你的需求选择:

方式一:上传文件

支持格式:PDF、Word(.doc/.docx)、TXT、Markdown

1

选择文件上传

在知识库页面点击 "导入数据""上传文件"

2

选择本地文件

支持拖拽或点击选择文件,一次可上传多个文件

3

等待处理完成

系统会自动解析文件内容,显示处理进度

✅ 文件上传最佳实践
  • 确保文件内容可编辑(扫描版PDF需先OCR处理)
  • 单个文件建议不超过50MB
  • 文件名最好是有意义的,方便后续管理

方式二:网页抓取

输入网址,Coze自动爬取网页内容

1

选择网页抓取

点击 "导入数据""网页抓取"

2

输入网址

粘贴要抓取的网页URL,可以一次输入多个(每行一个)

3

设置抓取选项

选择抓取范围:只抓当前页 / 抓取子页面(可设置深度)

⚠️ 注意事项

部分网站有反爬虫机制,可能抓取失败。建议先测试单个页面。

方式三:手动输入

在线表格形式,适合少量内容快速录入

1

选择手动输入

点击 "导入数据""手动输入"

2

编辑内容

在表格中填写:标题 + 内容,支持添加多行

3

保存数据

点击保存,内容即可进入知识库

💡 适用场景

适合FAQ问答对、简单的知识点补充、快速测试等场景

4.4 知识库设置

导入数据后,可以调整知识库的检索参数,优化问答效果。

检索模式

进入知识库设置页面,找到"检索模式"选项:

检索模式 特点 适用场景
全文检索 匹配关键词,速度快,对精确词敏感 专业术语、固定表述的文档
语义检索 理解含义,能识别同义表达,更智能 自然语言问答、描述性内容
混合检索 结合两种优势(如支持) 通用场景,推荐首选
💡 选择建议

如果用户问法比较固定(如"请假流程是什么"),用全文检索;如果问法多变(如"怎么请假""请假需要什么"),用语义检索。

召回数量

设置每次查询返回多少条相关知识:

  • 数量较少(3-5条):回答更聚焦,可能漏掉相关信息
  • 数量适中(5-10条):平衡选择,推荐设置
  • 数量较多(10条以上):信息更全面,但可能引入噪音
🎯 建议设置

一般设置 5-8条,如果知识库内容多且杂,可适当增加。

匹配阈值

控制知识匹配的严格程度(0-1之间):

  • 阈值较高(如0.8):只返回高度相关的内容,回答更准确但可能"不知道"
  • 阈值适中(如0.6):平衡选择,推荐设置
  • 阈值较低(如0.4):返回更多可能相关的内容,回答更宽泛
⚠️ 阈值调整建议

如果Bot经常回答"根据知识库找不到答案",适当降低阈值;如果回答经常跑偏,提高阈值。

4.5 在Bot中使用知识库

关联知识库

1

进入Bot编辑页

打开目标Bot,进入编辑页面

2

添加知识库

在左侧找到 "知识库" 区域,点击 "+""添加知识库"

3

选择知识库

从列表中选择要关联的知识库(可多选),点击确定

测试问答效果

1

打开调试窗口

点击右侧的 "预览与调试" 打开测试窗口

2

测试相关问题

输入知识库中有的问题,查看回答是否准确

3

检查引用来源

好的回答会基于知识库内容,可以尝试问"根据什么资料?"

优化策略

✅ 数据优化
  • 合理分段:长文档建议按主题分段,每段聚焦一个知识点
  • 清洗数据:删除页眉页脚、页码等无关信息
  • 添加标题:每段内容加清晰的标题,方便检索
  • 定期更新:知识库内容过期要及时更新
✅ 提示词优化
  • 在Bot提示词中说明"优先使用知识库回答"
  • 设置"如果知识库中没有,请明确告知"
  • 要求回答时引用知识库来源

4.6 实战案例:公司HR政策问答Bot

下面做一个完整的HR政策问答Bot, step by step。

Step 1:准备资料

收集公司HR相关政策文档,如:

  • 员工手册.pdf
  • 考勤制度.docx
  • 休假管理办法.docx
  • 薪酬福利说明.pdf

Step 2:创建知识库

操作
1. 点击"知识库" → "创建知识库"
2. 名称:公司HR政策知识库
3. 描述:包含员工手册、考勤、休假、薪酬等HR政策

Step 3:导入文档

操作
1. 点击"导入数据" → "上传文件"
2. 选择准备好的4个文档
3. 等待处理完成(约1-3分钟)

Step 4:调整设置

推荐设置
检索模式:语义检索(问法多样)
召回数量:6条
匹配阈值:0.65

Step 5:创建Bot并关联

Bot提示词
# 角色
你是公司的智能HR助手,专门解答员工关于公司政策的问题。

# 技能
- 解答考勤、休假、薪酬、福利相关问题
- 引导员工使用正确的流程办理各项事务
- 对于敏感问题建议咨询人工HR

# 约束
- 只回答公司HR政策相关问题
- 优先使用知识库中的信息回答
- 如果知识库中没有相关信息,告知用户"这个问题建议咨询HR部门"
- 不猜测、不编造政策内容

# 输出格式
- 使用礼貌、专业的语气
- 回答后可以追问"还有其他问题吗?"
- 涉及流程的问题,分步骤说明

Step 6:测试验证

测试以下问题,验证效果:

测试问题 期望结果
年假有几天? 根据员工手册中的年假政策回答
怎么申请病假? 分步骤说明病假申请流程
加班怎么算工资? 引用薪酬制度相关内容
公司附近有什么好吃的? 礼貌告知不在知识库范围内
🎯 进阶优化

可以在提示词中加入"对于请假相关问题,主动询问员工工号以便查询剩余假期"等个性化功能。

本章小结

  • ✅ 知识库让Bot拥有专属知识,回答私有数据相关问题
  • ✅ 支持三种导入方式:上传文件、网页抓取、手动输入
  • ✅ 关键设置:检索模式、召回数量、匹配阈值
  • ✅ 优化策略:合理分段、清洗数据、提示词引导