基于人工智能标记语言 (AIML)和任务型对话系统(Task)的深度智能对话机器人demo

2022 年 2 月 12 日
筆記
Python, 人工智能, 分享, 后端, 学习

起因

本demo基于基于人工智能标记语言 (AIML)和开放域问答(WebQA)的深度智能对话模型而来

无意间发现一个基于人工智能标记语言 (AIML)和开放域问答(WebQA)的深度智能对话模型，但由于年代久远代码已经跑不通了，而且采用的是py2，于是边看变改，在自己摸索下，写了一个相对完整的demo且有相对完整的注释，特此开源供各位参考学习

源码与介绍

本项目相较于原项目

实现功能

知识库匹配（AIML）回答问题
任务型对话系统(Task)
利用API完成的闲聊系统回答问题
待更新….

特点

AIML知识库更多（共35个）
敏感词库更广（共1.5W个），同时敏感词判断更合理
新增NLP功能，用于处理文本相似度。
- 针对文本相似度使用了：音形码算法+余弦相似度算法
更多的API接口demo可以调用（支持莉莉、青云客、ownthink、如意、mcenjoy）

使用方法

首先下载解压你会得到一个这样一个目录结构

目录结构

chatbot_aiml_task_demo
├─ init.py
└─ core
├─ init.py
├─ chatbot.py
├─ config.cfg
├─ crawler
│ ├─ init.py
│ ├─ crawl.py
│ ├─ search.py
│ ├─ stationID.json
│ └─ weather.py
├─ deeplearning
│ ├─ NLP.py
│ ├─ …….
│ ├─ SimilarCharactor
│ ├─ init.py
│ └─ deep.py
├─ log
│ ├─ .gitkeep
│ └─ …….
├─ resources
│ ├─ Book.aiml
│ ├─ …….
│ ├─ save.aiml
│ ├─ load.aiml
│ ├─ main.aiml
│ ├─ sensitive.txt
│ ├─ …….
│ └─ …….
└─ tool
├─ init.py
└─ filter.py

其中：
chatbot.py 是主程序
config.cfg 是各种路径的配置文件
tool文件夹 下是存放的是用于敏感词过滤使用的filter.py文件
resources文件夹 建议存放AIML知识库和敏感词库
deeplearning文件夹 存放的是NLP主要代码
crawler文件夹 存放的是任务型对话系统(Task)主要代码

源码介绍与处理流程

预处理
限制字数
过滤敏感词（恶心、政治、色情、违法……）

当你需要增加敏感词时候直接在sensitive.txt中添加即可

当你需要更改敏感词库位置时候请在config.cfg中修改filter_file

知识库匹配（AIML）
基本功能：打招呼、闲聊……
异常处理：问题太长、空白问题、找不到回复……
情绪回答：表情、夸奖、嘲笑……
如果匹配不到回答，进行步骤三
任务型对话匹配
如果可以请不要完全依赖于本人提供的任务功能，请自行修改接口和对应的匹配关键词。因为本人提供的接口随时可能失效，无法保证效果。
你可以自行添加功能和匹配关键词。包括但不限制于天气查询、汉字查询、空气质量查询、百科等机器人功能

任务型对话系统(Task)功能函数建议放在search.py中

关键词逻辑判断建议写在crawl.py文件中
同时你可要单独写一个功能文件调用，例如给出的例子weather.py用于取天气

神经网络
与原作者相同，我也暂时实现不了神经网络部分功能，同样使用了API代替，同时加入了NLP文本相似度计算。

如果你需要使用API请到deep.py对应的函数中填入自己的api_key

在deep.py的bot_reply()函数中，你可以选择使用的API接口和个数，同时也支持你自己添加API

学习功能

利用AIML模板+shelve存储，同时修复了已知BUG

学习功能模板为learn.aiml库，可以自定义修改

- 说错 *
- 答错 *
……

效果展示：

源码

欢迎Star欢迎━(｀∀´)ノ亻!
github

参考

基于人工智能标记语言 (AIML)和开放域问答(WebQA)的深度智能对话模型
 中文相似度匹配算法
 wenyangchou/SimilarCharactor
敏感词过滤的几种实现+某1w词敏感词库

Tags: Python 人工智能分享后端学习

基于人工智能标记语言 (AIML)和任务型对话系统(Task)的深度智能对话机器人demo

起因

源码与介绍

实现功能

特点

使用方法

目录结构

源码介绍与处理流程

学习功能

源码

参考

VirMach 便宜 VPS

QNews

基于人工智能标记语言 (AIML)和任务型对话系统(Task)的深度智能对话机器人demo

起因

源码与介绍

实现功能

特点

使用方法

目录结构

源码介绍与处理流程

学习功能

源码

参考

分享此文：

Related Posts

正式班D13

表达式得到期望结果的组成种数问题

Win11升级又出bug：CPU异常发热 打印机无法工作

曹德旺大动作！开始为100亿建大学“输血”

VirMach 便宜 VPS

QNews

熱門搜尋

Win11升级又出bug：CPU异常发热打印机无法工作