手把手教你使用Flask輕鬆部署機器學習模型(附程式碼&鏈接) | CSDN博文精選
- 2019 年 11 月 12 日
- 筆記
翻譯 | 申利彬
校對 | 吳金笛
來源 | 數據派THU(ID:DatapiTHU)
本文旨在讓您把訓練好的機器學習模型通過Flask API 投入到生產環境 。
當數據科學或者機器學習工程師使用Scikit-learn、Tensorflow、Keras 、PyTorch等框架部署機器學習模型時,最終的目的都是使其投入生產。通常,我們在做機器學習項目的過程中,將注意力集中在數據分析,特徵工程,調整參數等方面。但是,我們往往會忘記主要目標,即從模型預測結果中獲得實際的價值。
部署機器學習模型或者將模型投入生產,意味著將模型提供給最終的用戶或系統使用。
然而機器學習模型部署具有一定的複雜性,本文可以讓你把訓練好的機器學習模型使用Flask API 投入生產環境。
我將使用線性回歸,通過利率和前兩個月的銷售額來預測第三個月的銷售額。
線性回歸是什麼?
線性回歸模型的目標是找出一個或多個特徵(自變數)和一個連續目標變數(因變數)之間的關係。如果只有一個特徵,則稱為單變數線性回歸;如果有多個特徵,則稱為多元線性回歸。
線性回歸的假設
線性回歸模型可以用下面的等式表示:



線性回歸圖解
為什麼使用Flask?
- 容易上手使用
- 內置開發工具和調試工具
- 集成單元測試功能
- 平穩的請求調度
- 詳盡的文檔
項目結構
這個項目分為四個部分:
1. model.py — 包含機器學習模型的程式碼,用於根據前兩個月的銷售額預測第三個月的銷售額。
2. app.py – 包含用於從圖形用戶介面(GUI)或者API調用獲得詳細銷售數據的Flask API,Flask API根據我們的模型計算預測值並返回。
3. request.py — 使用requests模組調用app.py中定義的API並顯示返回值。
4. HTML/CSS – 包含HTML模板和CSS風格程式碼,允許用戶輸入銷售細節並顯示第三個月的預測值。

部署機器學習模型的Pipeline
環境和工具
1. Scikit-learn
2. Pandas
3. Numpy
4. Flask
程式碼在哪裡呢?
從程式碼開始,完整的項目可以在github上找到(https://github.com/abhinavsagar/Machine-Learning-Deployment-Tutorials)。
我們使用HTML構建前端,讓用戶輸入數據。這裡有三個區域需要用戶去填寫—利率,第一個月的銷售額以及第二個月的銷售額。
<!DOCTYPE html> <html ><head> <meta charset="UTF-8"> <title>Deployment Tutorial 1</title> <link href='https://fonts.googleapis.com/css?family=Pacifico' rel='stylesheet' type='text/css'> <link href='https://fonts.googleapis.com/css?family=Arimo' rel='stylesheet' type='text/css'> <link href='https://fonts.googleapis.com/css?family=Hind:300' rel='stylesheet' type='text/css'> <link href='https://fonts.googleapis.com/css?family=Open+Sans+Condensed:300' rel='stylesheet' type='text/css'> <link rel="stylesheet" href="{{ url_for('static', filename='css/style.css') }}"></head><body style="background: #000;"> <div><h1>Sales Forecasting </h1> <!-- Main Input For Receiving Query to our ML --> <form action="{{ url_for('predict')}}"method="post"> <input type="text" name="rate" placeholder="rate" required="required" /> <input type="text" name="sales in first month" placeholder="sales in first month" required="required" /> <input type="text" name="sales in second month" placeholder="sales in second month" required="required" /> <button type="submit" class="btn btn-primary btn-block btn-large">Predict sales in third month</button> </form> <br> <br> {{ prediction_text }} </div> </body> </html>
接下來,使用CSS對輸入按鈕、登錄按鈕和背景進行了一些樣式設置。
@import url(https://fonts.googleapis.com/css?family=Open+Sans); html { width: 100%; height:100%; overflow:hidden; }body {width: 100%;height:100%;font-family: 'Helvetica';background: #000; color: #fff; font-size: 24px; text-align:center; letter-spacing:1.4px;}.login {position: absolute; top: 40%; left: 50%; margin: -150px 0 0 -150px; width:400px; height:400px;}
login h1 { color: #fff; text-shadow: 0 0 10px rgba(0,0,0,0.3); letter-spacing:1px; text-align:center; }input {width: 100%; margin-bottom: 10px; background: rgba(0,0,0,0.3); border: none; outline: none; padding: 10px; font-size: 13px; color: #fff; text-shadow: 1px 1px 1px rgba(0,0,0,0.3); border: 1px solid rgba(0,0,0,0.3); border-radius: 4px; box-shadow: inset 0 -5px 45px rgba(100,100,100,0.2), 0 1px 1px rgba(255,255,255,0.2); -webkit-transition: box-shadow .5s ease; -moz-transition: box-shadow .5s ease; -o-transition: box-shadow .5s ease; -ms-transition: box-shadow .5s ease; transition: box-shadow .5s ease; }
我為這個項目創建了一個訂製的銷售數據集,它有四列——利率、第一個月的銷售額、第二個月的銷售額和第三個月的銷售額。

我們現在構建一個機器學習模型來預測第三個月的銷售額。首先使用Pandas解決缺失值問題,當一項或多項指標沒有資訊時,就會有缺失值發生。使用0填充利率這一列的缺失值,平均值填充第一個月銷售額中的缺失值,採用線性回歸的機器學習演算法。
序列化和反序列化
簡而言之,序列化是一種在磁碟上寫入python對象的方法,該對象可以傳輸到任何地方,然後通過python腳本反序列化(讀)回去。

序列化 反序列化
使用Pickling將是python對象形式的模型轉為字元流形式,其思想是這個字元流中包含了在另一個python腳本中重建這個對象所需的所有資訊。
import numpy as np import matplotlib.pyplot as plt import pandas as pd import pickle dataset = pd.read_csv('sales.csv') dataset['rate'].fillna(0, inplace=True) dataset['sales_in_first_month'].fillna(dataset['sales_in_first_month'].mean(), inplace=True) X = dataset.iloc[:, :3] def convert_to_int(word): word_dict = {'one':1, 'two':2, 'three':3, 'four':4, 'five':5, 'six':6, 'seven':7, 'eight':8, 'nine':9, 'ten':10, 'eleven':11, 'twelve':12, 'zero':0, 0: 0} return word_dict[word] X['rate'] = X['rate'].apply(lambda x : convert_to_int(x)) y = dataset.iloc[:, -1] from sklearn.linear_model import LinearRegression regressor = LinearRegression() regressor.fit(X, y) pickle.dump(regressor, open('model.pkl','wb')) model = pickle.load(open('model.pkl','rb')) print(model.predict([[4, 300, 500]]))
下一部分是構建一個API,反序列化這個模型為python對象格式,並通過圖形用戶介面(GUI)獲取詳細銷售數據,根據模型計算預測值。我使用index.html設置主頁,並在使用POST請求方式提交表單數據時,獲取預測的銷售值。
可以通過另一個POST請求將結果發送給results並展示出來。它接收JSON格式的輸入,並使用訓練好的模型預測出可以被API端點接受的JSON格式的預測值。
import numpy as np from flask import Flask, request, jsonify, render_template import pickle app = Flask(__name__)model = pickle.load(open('model.pkl', 'rb')) @app.route('/') def home(): return render_template('index.html') @app.route('/predict',methods=['POST']) def predict(): int_features = [int(x) for x in request.form.values()] final_features = [np.array(int_features)] prediction = model.predict(final_features) output = round(prediction[0], 2) return render_template('index.html', prediction_text='Sales should be $ {}'.format(output)) @app.route('/results',methods=['POST']) def results(): data = request.get_json(force=True) prediction = model.predict([np.array(list(data.values()))]) output = prediction[0] return jsonify(output) if __name__ == "__main__": app.run(debug=True)
最後使用requests模組調用在app.py中定義的APIs,它的結果是第三個月銷售額的預測值。
import requests url = 'http://localhost:5000/results' r = requests.post(url,json={'rate':5, 'sales_in_first_month':200, 'sales_in_second_month':400}) print(r.json()) Results
使用下面的命令運行Web應用程式。
python app.py

在web瀏覽器中打開http://127.0.1:5000/,將顯示如下所示的GUI.
原文標題:
How to Easily Deploy Machine Learning Models Using Flask
原文鏈接:
https://www.kdnuggets.com/2019/10/easily-deploy-machine-learning-models-using-flask.html
編輯:王菁
校對:王欣