Rasa 聊天机器人专栏(二):命令行界面

  • 2019 年 12 月 12 日
  • 筆記

作者 | VK

编辑 | 奇予纪

出品 | 磐创AI团队出品

命令行界面:

备忘单

命令行界面(CLI)为你提供易于记忆的常见任务命令。

使用示例训练数据,操作和配置文件创建新项目

创建新项目

以下命令使用示例训练数据为你建立一个完整的项目。

rasa init  

这将创建以下文件:

.  ├── __init__.py  ├── actions.py  ├── config.yml  ├── credentials.yml  ├── data  │   ├── nlu.md  │   └── stories.md  ├── domain.yml  ├── endpoints.yml  └── models      └── <timestamp>.tar.gz  

rasa init命令将询问你是否要使用此数据训练初始模型。如果你回答否,则models目录将为空。

随着此项目建立,一些常用命令非常容易记住。要训练模型,输入rasa train;在命令行上与模型通信,使用rasa shell;测试模型类型使用rasa test

训练模型

主要命令是:

rasa train  

该命令训练Rasa模型,该模型结合了Rasa NLU和Rasa Core模型。如果你只想训练NLU或Core模型,你可以运行rasa train nlurasa train core。但是,如果训练数据和配置没有改变,Rasa将自动跳过训练Core或NLU。

rasa train将训练好的模型存储在--out指定的目录中。模型的名称默认是<timestamp>.tar.gz。如果要为模型命名,可以使用--fixed-model-name指定名称。

以下参数可用于配置训练过程:

用法: rasa train [-h] [-v] [-vv] [--quiet] [--data DATA [DATA ...]]                    [-c CONFIG] [-d DOMAIN] [--out OUT]                    [--augmentation AUGMENTATION] [--debug-plots]                    [--dump-stories] [--fixed-model-name FIXED_MODEL_NAME]                    [--force]                    {core,nlu} ...    位置参数:  {core,nlu}      core        使用你的故事训练Rasa Core模型      nlu         使用你的NLU数据训练Rasa NLU模型    可选参数:   -h, --help     显示帮助消息并退出。   --data DATA [DATA ...]                  Core和NLU数据文件的路径。(默认:['data'])   -c CONFIG, --config CONFIG                  机器人的策略和NLU管道配置。(默认:config.yml)   -d DOMAIN, --domain DOMAIN                  域规范(yml文件)。(默认:domain.yml)   --out OUT      存储模型的目录。(默认:models)   --augmentation AUGMENTATION                  在训练期间使用多少数据扩充。(默认值:50)   --debug-plots  如果启用,将创建展示检查点( checkpoints)和它们在文件(`story_blocks_connections.html`)中的故事块之间的联系的图表。(默认:False)   --dump-stories 如果启用,将展开的故事保存到文件中。(默认:False)   --fixed-model-name FIXED_MODEL_NAME                  如果设置,则模型文件/目录的名称将为设置为给定的名称。(默认:None)   --force        即使数据没有改变,也强制进行模型训练。(默认值:False)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)  

注意: 使用rasa train训练模型时,确保Core和NLU的训练数据存在。如果仅存在一种模型类型的训练数据,则该命令将根据提供的训练文件自动回退到rasa train nlurasa train core

交互式学习

与你的助手开始交互式学习会话,运行:

rasa interactive  

如果使用--model参数提供训练模型,则使用提供的模型启动交互式学习过程。如果没有指定模型,且没有其他目录传递给--data参数,rasa interactive将使用位于data/目录中的数据训练一个新的Rasa模型。在训练初始模型之后,交互式学习会话开始。如果训练数据和配置没有改变,将跳过训练。

可以为rasa interactive设置的参数的完整列表:

用法: rasa interactive [-h] [-v] [-vv] [--quiet] [-m MODEL]                          [--data DATA [DATA ...]] [--skip-visualization]                          [--endpoints ENDPOINTS] [-c CONFIG] [-d DOMAIN]                          [--out OUT] [--augmentation AUGMENTATION]                          [--debug-plots] [--dump-stories] [--force]                          {core} ... [model-as-positional-argument]    位置参数:   {core}      core        启动交互式学习会话模型通过聊天来创建用于Rasa Core模型的新训练数据。使用'RegexInterpreter',即`/ <intent>`输入格式。   model-as-positional-argument                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)    可选参数:   -h, --help     显示帮助消息并退出。   -m MODEL, --model MODEL                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)   --data DATA [DATA ...]                  Core和NLU数据文件的路径。(默认:['data'])   --skip-visualization                  在交互学习期间禁用绘制可视化。(默认值:False)   --endpoints ENDPOINTS                  模型服务和连接器的配置文件为yml文件。(默认:None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)    训练参数:   -c CONFIG, --config CONFIG                  机器人的策略和NLU管道配置。(默认:config.yml)   -d DOMAIN, --domain DOMAIN                  域规范(yml文件)。(默认:domain.yml)   --out OUT      存储模型的目录。(默认:models)   --augmentation AUGMENTATION                  在训练期间使用多少数据扩充。(默认值:50)   --debug-plots                  如果启用,将创建展示检查点( checkpoints)和它们在文件(`story_blocks_connections.html`)中的故事块之间的联系的图表(默认:False)   --dump-stories                  如果启用,将展开的故事保存到文件中。(默认值:False)   --force        即使数据没有改变,也强制进行模型训练。(默认值:False)  

和你的助手交谈

要在命令行上与助手开始聊天,请运行:

rasa shell  

应该用于与机器人交互的模型可以由--model指定。如果仅使用NLU模型启动shell,则rasa shell允许你获取在命令行上输入的任何文本的意图(intent)和实体。如果你的模型包含经过训练的Core模型,你可以与机器人聊天,并查看机器人预测的下一步操作。如果你已经训练了一个组合的Rasa模型,但是想要查看模型从文本中提取的意图和实体,你可以使用命令rasa shell nlu

提高日志记录级别以便调试,请运行:

rasa shell --debug  

rasa shell的完整选项列表:

用法: rasa shell [-h] [-v] [-vv] [--quiet] [-m MODEL] [--log-file LOG_FILE]                    [--endpoints ENDPOINTS] [-p PORT] [-t AUTH_TOKEN]                    [--cors [CORS [CORS ...]]] [--enable-api]                    [--remote-storage REMOTE_STORAGE]                    [--credentials CREDENTIALS] [--connector CONNECTOR]                    [--jwt-secret JWT_SECRET] [--jwt-method JWT_METHOD]                    {nlu} ... [model-as-positional-argument]    位置参数:   {nlu}      nlu         使用NLU模型解释命令行上的消息。   model-as-positional-argument                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)    可选参数:   -h, --help     显示帮助消息并退出。   -m MODEL, --model MODEL                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)   --log-file LOG_FILE                  将日志存储在指定文件中。(默认:None)   --endpoints ENDPOINTS                  模型服务和连接器的配置文件为yml文件。(默认:None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)    服务设置:   -p PORT, --port PORT                  用于运行服务的端口。(默认值:5005)   -t AUTH_TOKEN, --auth-token AUTH_TOKEN                  启用基于令牌的身份验证,请求需要提供可被接受的令牌。(默认:None)    --cors [CORS [CORS ...]]                  为传递的来源启用CORS。使用`*`将所有来源添加到白名单。(默认:None)   --enable-api                  除输入渠道外,还启动Web服务API渠道。(默认值:False)   --remote-storage REMOTE_STORAGE                  设置Rasa模型所在的远程存储位置,例如在AWS上。(默认:None)    渠道(Channels):   --credentials CREDENTIALS                 连接器的身份验证凭据为yml文件。(默认:None)   --connector CONNECTOR                  连接的服务。 (默认: None)    JWT身份验证:   --jwt-secret JWT_SECRET                  非对称JWT方法的公钥或对称方法的共享机密。还请确保使用 --jwt-method 选择签名方法,否则这个参数将被忽略。(默认:None)  --jwt-method JWT_METHOD                  用于JWT的认证负载签名的方法。(默认:HS256)  

启动服务

启动服务运行Rasa模型,请运行:

rasa run  

以下参数可用于配置Rasa服务:

用法: rasa run [-h] [-v] [-vv] [--quiet] [-m MODEL] [--log-file LOG_FILE]                  [--endpoints ENDPOINTS] [-p PORT] [-t AUTH_TOKEN]                  [--cors [CORS [CORS ...]]] [--enable-api]                  [--remote-storage REMOTE_STORAGE] [--credentials CREDENTIALS]                  [--connector CONNECTOR] [--jwt-secret JWT_SECRET]                  [--jwt-method JWT_METHOD]                  {actions} ... [model-as-positional-argument]    位置参数:   {actions}      actions     运行操作服务(action server)。   model-as-positional-argument                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)    可选参数:   -h, --help     显示帮助消息并退出。   -m MODEL, --model MODEL                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)   --log-file LOG_FILE                  将日志存储在指定文件中。(默认:None)   --endpoints ENDPOINTS                  模型服务和连接器的配置文件为yml文件。(默认:None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)    服务设置:   -p PORT, --port PORT                  用于运行服务的端口。(默认值:5005)   -t AUTH_TOKEN, --auth-token AUTH_TOKEN                  启用基于令牌的身份验证,请求需要提供可被接受的令牌。(默认:None)    --cors [CORS [CORS ...]]                  为传递的来源启用CORS。使用`*`将所有来源添加到白名单。(默认:None)   --enable-api                  除输入渠道外,还启动Web服务API渠道。(默认值:False)   --remote-storage REMOTE_STORAGE                  设置Rasa模型所在的远程存储位置,例如在AWS上。(默认:None)    渠道(Channels):   --credentials CREDENTIALS                 连接器的身份验证凭据为yml文件。(默认:None)   --connector CONNECTOR                  连接的服务。 (默认: None)    JWT身份验证:   --jwt-secret JWT_SECRET                  非对称JWT方法的公钥或对称方法的共享机密。还请确保使用 --jwt-method 选择签名方法,否则这个参数将被忽略。(默认:None)  --jwt-method JWT_METHOD                  用于JWT的认证负载签名的方法。(默认:HS256)  

有关其他参数的详细信息,请参阅[运行服务]()。有关所有端点的详细文档,请参阅Rasa HTTP API文档。

启动操作服务(Action Server)

运行你的操作服务:

rasa run actions  

以下参数可用于调整服务设置:

用法: rasa run actions [-h] [-v] [-vv] [--quiet] [-p PORT]                          [--cors [CORS [CORS ...]]] [--actions ACTIONS]    可选参数:   -h, --help     显示帮助消息并退出   -p PORT, --port PORT                  用于运行服务的端口。(默认值:5005)  --cors [CORS [CORS ...]]                  为传递的来源启用CORS。使用`*`将所有来源添加到白名单。(默认:None)  --actions ACTIONS                  要加载的操作包的名称。(默认值:None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)  

可视化故事

打开浏览器标签页以图的形式显示故事:

rasa visualize  

通常,data目录中的训练故事是可视化的。如果你的故事位于其他地方,则可以使用--stories指定其位置。

其他参数是:

用法: rasa visualize [-h] [-v] [-vv] [--quiet] [-d DOMAIN] [-s STORIES]                        [-c CONFIG] [--out OUT] [--max-history MAX_HISTORY]                        [-u NLU]    可选参数:   -h, --help     显示帮助消息并退出。   -d DOMAIN, --domain DOMAIN                  域规范(yml文件)。(默认:domain.yml)   -s STORIES, --stories STORIES                 包含你的训练故事的文件或文件夹。(默认:data)   -c CONFIG, --config CONFIG                  机器人的策略和NLU管道配置。(默认:config.yml)   --out OUT      输出路径的文件名,例如'graph.html'。(默认: graph.html)   --max-history MAX_HISTORY                  在输出图合并路径时要考虑的最大历史记录。(默认:2)   -u NLU, --nlu NLU                  包含NLU数据的文件或文件夹,用于将示例消息插入图表中。(默认:None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)  

在测试数据上评估模型

要在测试数据上评估模型,请运行:

rasa test  

使用--model指定要测试的模型。查看有关[评估NLU模型]和[评估Core模型]的更多详细信息。

以下参数可用于rasa test

用法: rasa test [-h] [-v] [-vv] [--quiet] [-m MODEL] [-s STORIES]                   [--max-stories MAX_STORIES] [--e2e] [--endpoints ENDPOINTS]                   [--fail-on-prediction-errors] [--url URL]                   [--evaluate-model-directory] [-u NLU] [--out OUT]                   [--report [REPORT]] [--successes [SUCCESSES]]                   [--errors ERRORS] [--histogram HISTOGRAM] [--confmat CONFMAT]                   [-c CONFIG [CONFIG ...]] [--cross-validation] [-f FOLDS]                   [-r RUNS] [-p PERCENTAGES [PERCENTAGES ...]]                   {core,nlu} ...    位置参数:   {core,nlu}      core        使用你的测试故事测试Rasa Core模型。      nlu         使用测试NLU数据测试Rasa NLU模型。    可选参数:   -h, --help     显示帮助消息并退出。   -m MODEL, --model MODEL                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)    Core测试参数:   -s STORIES, --stories STORIES                  包含测试故事的文件或文件夹。(默认:data)   --max-stories MAX_STORIES                  要测试的最大故事数。(默认:None)   --e2e, --end-to-end                  对联合操作和意图预测进行端到端评估。需要端到端的故事文件格式。(默认值:False)   -endpoints ENDPOINTS                  模型服务和连接器的配置文件为yml文件。(默认:None)   --fail-on-prediction-errors                  如果遇到预测错误,则会出现异常抛出。这可用于在测试期间验证故事。(默认值:False)   --url URL                  如果提供,则从URL下载故事文件并训练就可以了。通过发送GET请求到提供的URL获取数据。(默认:None)   --evaluate-model-directory                  通过`rasa train core --config <config-1> <config-2>`设置评估已训练的模型。所有在提供的目录中模型被评估和互相比较。(默认值:False)    NUL测试参数:   -u NLU, --nlu NLU                  包含NLU数据的文件或文件夹。(默认:data)   --out OUT                  在评估期间创建的任何文件的输出路径。(默认:results)     --report [REPORT]                    用于保存意图/实体度量报告的输出路径。(默认:None)   --successes [SUCCESSES]                  保存成功预测的输出路径。(默认:None)   --errors ERRORS                  保存模型错误的输出路径。(默认:errors.json)   --histogram HISTOGRAM                  置信直方图的输出路径。(默认:hist.png)   --confmat CONFMAT                  混淆矩阵图的输出路径。(默认:confmat.png)   -c CONFIG [CONFIG ...], --config CONFIG [CONFIG ...]                  模型配置文件。如果传递单个文件并选择交叉验证模式,交叉验证执行,如果传递多个配置或配置的文件夹,模型将直接被训练和比较。(默认:None)  

训练和测试数据拆分

要创建NLU数据的拆分,请运行:

rasa data split nlu  

你可以使用以下参数指定训练数据,百分比和输出目录:

用法: rasa data split nlu [-h] [-v] [-vv] [--quiet] [-u NLU]                             [--training-fraction TRAINING_FRACTION] [--out OUT]    可选参数:   -h, --help     显示帮助消息并退出。   -u NLU, --nlu NLU                  包含NLU数据的文件或文件夹。(默认:data)   --training-fraction TRAINING_FRACTION                  训练数据所占百分比。(默认值:0.8)   --out OUT                  存储拆分文件的目录。(默认值:train_test_split)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)  

此命令将尝试在训练和测试中保持意图的比例相同。

在Markdown和JSON之间转换数据

要将NLU数据从LUIS数据格式,WIT数据格式,Dialogflow数据格式,JSON或Markdown转换为JSON或Markdown,请运行:

rasa data convert nlu  

你可以使用以下参数指定输入文件,输出文件和输出格式:

用法: rasa data convert nlu [-h] [-v] [-vv] [--quiet] --data DATA --out OUT                               [-l LANGUAGE] -f {json,md}    可选参数:   -h, --help     显示帮助消息并退出。   --data DATA    包含Rasa NLU数据的文件或目录的路径。(默认 None)   --out OUT      保存Rasa格式的训练数据的文件。(默认 None)   -l LANGUAGE, --language LANGUAGE                  数据的语种。(默认: en)   -f {json,md}, --format {json,md}                  训练数据转换的输出格式。 (默认: None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)   ```     ### 启动Rasa X  Rasa X是一个工具,可帮助你构建,改进和部署由Rasa框架提供支持的AI助手。你可以在[此处]()找到有关它的更多信息。  

你可以通过执行下面的命令来本地启动Rasa X:

rasa x  

为了能够启动Rasa X,你需要安装Rasa X(可在此处,你需要进入一个Rasa项目。

注意 默认情况下,Rasa X在端口5002上运行。使用参数--rasa-x-port可以将其更改为任何其他端口。

以下参数可用于rasa x

用法: rasa x [-h] [-v] [-vv] [--quiet] [-m MODEL] [--data DATA] [--no-prompt]                [--production] [--rasa-x-port RASA_X_PORT] [--log-file LOG_FILE]                [--endpoints ENDPOINTS] [-p PORT] [-t AUTH_TOKEN]                [--cors [CORS [CORS ...]]] [--enable-api]                [--remote-storage REMOTE_STORAGE] [--credentials CREDENTIALS]                [--connector CONNECTOR] [--jwt-secret JWT_SECRET]                [--jwt-method JWT_METHOD]    可选参数:   -h, --help     显示帮助消息并退出。    -m MODEL, --model MODEL                  已训练的Rasa模型的路径。如果目录指定,它将使用目录中的最新的模型。(默认:None)   --data DATA [DATA ...]                  Core和NLU数据文件的路径。(默认:data)   --no-prompt    自动提示或默认选项提示和忽略警告。(默认: False)   --production   在生产环境中运行Rasa X。(默认:False)   --rasa-x-port RASA_X_PORT                  用于运行Rasa X服务的端口。(默认值:5002)   --log-file LOG_FILE                  将日志存储在指定文件中。(默认:None)  --endpoints ENDPOINTS                  模型服务和连接器的配置文件为yml文件。(默认:None)    Python日志选项:   -v, --verbose  详细输出。将日志记录级别设置为INFO。(默认:None)   -vv, --debug   打印大量的调试语句。设置日志记录级别为 DEBUG。(默认:None)   --quiet        将日志记录级别设置为WARNING。(默认:None)    服务设置:   -p PORT, --port PORT                  用于运行服务的端口。(默认值:5005)   -t AUTH_TOKEN, --auth-token AUTH_TOKEN                  启用基于令牌的身份验证,请求需要提供可被接受的令牌。(默认:None)    --cors [CORS [CORS ...]]                  为传递的来源启用CORS。使用`*`将所有来源添加到白名单。(默认:None)   --enable-api                  除输入渠道外,还启动Web服务API渠道。(默认值:False)   --remote-storage REMOTE_STORAGE                  设置Rasa模型所在的远程存储位置,例如在AWS上。(默认:None)    渠道(Channels):   --credentials CREDENTIALS                 连接器的身份验证凭据为yml文件。(默认:None)   --connector CONNECTOR                  连接的服务。 (默认: None)    JWT身份验证:   --jwt-secret JWT_SECRET                  非对称JWT方法的公钥或对称方法的共享机密。还请确保使用 --jwt-method 选择签名方法,否则这个参数将被忽略。(默认:None)  --jwt-method JWT_METHOD                  用于JWT的认证负载签名的方法。(默认:HS256)