如何使用 TFX 将官方 BERT 模型运行为基于Docker的RESTful服务

2020 年 2 月 16 日
筆記

如何使用 TFX 将官方 BERT 模型运行为基于Docker的RESTful服务

TFX即TensorFlow Extended是官方提供的部署方案（https://www.tensorflow.org/tfx）

它可以很方便的把已经保存了的TensorFlow有其实TF2的模型，转变为可用的服务，并提供一定的性能保障。

下文以如何将官方的中文BERT模型部署为RESTFul服务为例

下载官方bert分词器

$ wget https://raw.githubusercontent.com/tensorflow/models/master/official/nlp/bert/tokenization.py

下载官方中文bert模型（TF2版本）

$ wget -O 1.tar.gz https://tfhub.dev/tensorflow/bert_zh_L-12_H-768_A-12/1?tf-hub-format=compressed

解压模型到当前目录bert/1的路径

$ mkdir bert  $ mkdir bert/1  $ cd bert/1/  $ tar xvzf ../../1.tar.gz  $ cd ../..

启动Docker镜像，开启RESTful服务。

以下命令中：

-p 为将Docker内部的8501端口映射到主机的8500端口
-v 是把当前路径下的bert目录，映射为容器中的/models/bert陌路
-e 为设置一个环境变量，告诉TFX当前的模型名
-it 为一次性交互型运行，如果是服务可以写 -d

$ docker run     -p 8500:8501     -v ${PWD}/bert:/models/bert     -e MODEL_NAME=bert     -it tensorflow/serving

用CURL进行预测测试

$ curl -XPOST http://localhost:8500/v1/models/bert:predict     -H 'content-type: application/json'     -d '{    "instances": [      {        "input_word_ids": [1, 1, 1],        "input_mask": [1, 1, 1],        "input_type_ids": [0, 0, 0]        }    ]  }'

Python的测试

import requests  import numpy as np  import tensorflow_hub as hub  import tokenization    # 下面这部分主要是为了加载分词器  bert_layer = hub.KerasLayer('./bert/1')  vocab_file = bert_layer.resolved_object.vocab_file.asset_path.numpy()  do_lower_case = bert_layer.resolved_object.do_lower_case.numpy()  tokenizer = tokenization.FullTokenizer(vocab_file, do_lower_case)    # 句子转换  sent1 = tokenizer.convert_tokens_to_ids(tokenizer.tokenize('你好啊'))  sent2 = tokenizer.convert_tokens_to_ids(tokenizer.tokenize('奥嗷嗷'))    # RESTful调用  url = 'http://localhost:8500/v1/models/bert:predict'  data = {      "instances": [          {              "input_word_ids": sent1,              "input_mask": [1] * len(sent1),              "input_type_ids": [0] * len(sent1)          },          {              "input_word_ids": sent2,              "input_mask": [1] * len(sent2),              "input_type_ids": [0] * len(sent2)          },      ]  }  r = requests.post(url=url, json=data)    # pool 句子聚合的结果，即 [CLS] 的结果  # (2, 768)  r2 = [      x['bert_model']      for x in r.json().get('predictions')  ]    # sequence 句子序列的结果  # (2, 3, 768)  r1 = [      x['bert_model_1']      for x in r.json().get('predictions')  ]    r1 = np.array(r1)  r2 = np.array(r2)  print(r1.shape, r2.shape)

我的博客即将同步至腾讯云+社区，邀请大家一同入驻：腾讯云自媒体分享计划 – 云+社区 – 腾讯云

如何使用 TFX 将官方 BERT 模型运行为基于Docker的RESTful服务

如何使用 TFX 将官方 BERT 模型运行为基于Docker的RESTful服务

VirMach 便宜 VPS

QNews

如何使用 TFX 将官方 BERT 模型运行为基于Docker的RESTful服务

如何使用 TFX 将官方 BERT 模型运行为基于Docker的RESTful服务

分享此文：

Related Posts

周末我把HashMap源码又过了一遍

从单页应用(SPA)到服务器渲染(SSR)

Flink Context到底是什么？

【抗“疫”特别专题】《腾讯云TVP直播课-别人是怎么做的：数据中台行业案例剖析》

VirMach 便宜 VPS

QNews

熱門搜尋