AI 与智能化
如果要做 AI 知识库或企业 AI 助手,前期需要准备什么资料?
这类项目第一版能不能跑顺,多半取决于资料准备得齐不齐。我们一般会让客户提前准备四类内容:知识内容本身、使用场景信息、权限边界、效果评估样本。资料越完整,第一版的准确率越稳,后续迭代成本越低。
具体清单大致是这样:
1. 知识内容
- 内部制度、政策、SOP、操作手册
- 产品资料、技术参数、规格书、报价规则
- 常见问答记录(客服日志、IT 报修历史、HR 答疑)
- 历史项目复盘、典型案例、内部 Wiki
- 行业标准、规范、外部权威资料(如果需要纳入)
资料形式不限:Word、PDF、Excel、扫描件、网页、Confluence、群聊导出都可以接,但越规整后续效果越稳。如果有版本号、生效日期、所属业务线的标注,最好一并附上。
2. 场景信息
- 系统主要面向哪些角色(销售?工程师?一线员工?外部客户?)
- 要解决什么具体问题(提效?合规检查?培训?答疑?)
- 嵌在哪个入口里(企微/钉钉/飞书机器人?Web 工作台?小程序?)
- 期望的响应速度、并发量、上线时间
3. 权限边界
- 哪些资料只给特定角色看(财务、研发、销售、外部合作方)
- 哪些资料涉及合规、商密,不能进 RAG 库
- 哪些字段答复时要脱敏
权限要在系统层划清,不能依赖提示词约束。提前梳理这些,能避免后续返工。
4. 效果样本
- 20–50 个高频问题及对应标准答案
- 一批"模型容易答错的边角问题"作为压力测试
- 一两位熟悉业务的同事,在试点期做答案核对
资料分散没关系,我们经常遇到客户文档散在不同部门。如果不方便自己梳理,滚水科技也可以先派一位 PM 上门做半天到一天的梳理工作坊,把适合纳入知识库的内容范围圈定下来,再分阶段往里灌资料。这种"先圈范围、再上系统"的做法比一次性把所有文档塞进去要稳得多。