Azkaban3.81.x部署+坑
一、前提安裝
1.1 Java1.8環境搭建
1) 下載jdk1.8並解壓:
# tar -zxvf jdk-8u201-linux-i586.tar.gz -C /usr/local
2) 添加Java環境變數,在/etc/profile中添加:
export JAVA_HOME=/usr/local/jdk1.8.0_201
export PATH=$PATH:$JAVA_HOME/bin
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
3) 保存後刷新環境變數:
# source /etc/profile
4) 檢查Java是否配置成功,成功配置會有如下圖所示。
# java -version
1.2 MySQL安裝
Ubuntu可以參考我的MySQL安裝博文。
1.3 git安裝
# sudo apt-get install git
1.4 下載azkaban
從github選取版本下載azkaban:
https://github.com/azkaban/azkaban/releases
在這裡我選取了azkaban-3.18.4版本:
# wget https://github.com/azkaban/azkaban/archive/3.84.4.tar.gz
解壓:
# tar -zxvf azkaban-3.84.4.tar.gz -C /mnt/addDisk1/BigData/ # cd /mnt/addDisk1/BigData/azkaban-3.84.4
1.5 編譯
執行gradlew編譯命令,跳過測試:
# ./gradlew distTar -x test
它會一下編譯,直到編譯成功,運行之後會生成5個壓縮包,分別放在在azkaban-*/build/distributions/目錄下:
azkaban-db-3.47.0-10-gdd67b02.tar.gz azkaban-exec-server-3.47.0-10-gdd67b02.tar.gz azkaban-hadoop-security-plugin-3.47.0-10-gdd67b02.tar.gz azkaban-solo-server-3.47.0-10-gdd67b02.tar.gz azkaban-web-server-3.47.0-10-gdd67b02.tar.gz
接著把五個包分別解壓在另外的目錄下(/mnt/addDisk1/BigData/azkaban),並重命名:
cd /mnt/addDisk1/BigData tar -zxvf ./azkaban-3.81.4/azkaban-db/build/distributions/azkaban-db-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaban-3.81.4/azkaban-exec-server/build/distributions/azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaban-3.81.4/azkaban-hadoop-security-plugin/build/distributions/azkaban-hadoop-security-plugin-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaban-3.81.4/azkaban-solo-server/build/distributions/azkaban-solo-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ tar -zxvf ./azkaaban-3.81.4/azkaban-web-server/build/distributions/azkaban-web-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/ mv azkaban-solo-server-0.1.0-SNAPSHOT/ azkaban-solo-server mv azkaban-exec-server-0.1.0-SNAPSHOT/ azkaban-exec-server mv azkaban-web-server-0.1.0-SNAPSHOT/ azkaban-web-server mv azkaban-db-0.1.0-SNAPSHOT/ azkaban-db mv azkaban-hadoop-security-plugin-0.1.0-SNAPSHOT/ azkaban-hadoop-security-plugin
二、azkaban部署
2.1 在MySQL中創建azkaban資料庫:
create database azkaban; grant all privileges on azkaban.* to azkaban@'%' identified by 'azkaban'; flush privileges; use azkaban; # 將azkaban sql表結構導入mysql source /mnt/addDisk1/BigData/azkaban/azkaban-db/create-all-sql-0.1.0-SNAPSHOT.sql
2.2 創建SSL配置:
# keytool -keystore keystore -alias jetty -genkey -keyalg RSA 運行此命令後,會提示輸入當前生成 keystor的密碼及相應資訊,輸入的密碼請勞記,資訊如下: 輸入keystore密碼: 再次輸入新密碼: 您的名字與姓氏是什麼? [Unknown]: 您的組織單位名稱是什麼? [Unknown]: 您的組織名稱是什麼? [Unknown]: 您所在的城市或區域名稱是什麼? [Unknown]: 您所在的州或省份名稱是什麼? [Unknown]: 該單位的兩字母國家程式碼是什麼 [Unknown]: CN CN=Unknown, OU=Unknown, O=Unknown, L=Unknown, ST=Unknown, C=CN 正確嗎? [否]: y 密碼在此我輸入的是hadoop 輸入<jetty>的主密碼 (如果和 keystore 密碼相同,按回車): 再次輸入新密碼:
完成上述工作後,將在當前目錄生成 keystore 證書文件,將keystore 考貝到 azkaban web伺服器根目:
# sudo mv keystore azkaban/azkaban-web-server
2.3 部署 azkaban-web-server
# cd ./azkaban # sudo cp -r ./azkaban-solo-server/conf/ ./azkaban-web-server/ # cd ./azkaban-web-server/conf
配置azkaban.properties:
# 默認時區,已改為亞洲/上海 默認為美國 default.timezone.id=Asia/Shanghai database.type=mysql #資料庫類型 # h2.path=./h2 # h2.create.tables=true mysql.port=3306 #埠號 mysql.host=localhost #資料庫連接IP mysql.database=azkaban #資料庫實例名 mysql.user=root #資料庫用戶名 mysql.password=root #資料庫密碼 jetty.use.ssl=true jetty.maxThreads=25 #最大執行緒數 jetty.ssl.port=8443 #Jetty SSL埠 jetty.port=8081 #Jetty埠 jetty.keystore=keystore #SSL文件名 jetty.password=hadoop #SSL文件密碼 jetty.keypassword=hadoop #Jetty主密碼 與 keystore文件相同 jetty.truststore=keystore #SSL文件名 jetty.trustpassword=hadoop # SSL文件密碼 # 執行伺服器屬性 executor.port=12321 #執行伺服器埠 # 郵件設置 可不設計 mail.sender=xxxxxxxx@163.com #發送郵箱 mail.host=smtp.163.com #發送郵箱smtp地址 mail.user=xxxxxxxx #發送郵件時顯示的名稱 mail.password=********** #郵箱密碼 job.failure.email=xxxxxxxx@163.com #任務失敗時發送郵件的地址 job.success.email=xxxxxxxx@163.com #任務成功時發送郵件的地址 lockdown.create.projects=false # cache.directory=cache #快取目錄
配置log4j.properties(默認就可以了,如有其他需求可修改):
log4j.rootLogger=INFO, Console log4j.logger.azkaban=INFO, server log4j.appender.server=org.apache.log4j.RollingFileAppender log4j.appender.server.layout=org.apache.log4j.PatternLayout log4j.appender.server.File=logs/azkaban-webserver.log log4j.appender.server.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n log4j.appender.server.MaxFileSize=102400MB log4j.appender.server.MaxBackupIndex=2 log4j.appender.Console=org.apache.log4j.ConsoleAppender log4j.appender.Console.layout=org.apache.log4j.PatternLayout log4j.appender.Console.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n
添加管理員用戶:
# sudo vim azkaban-users.xml <azkaban-users> <user groups="azkaban" password="azkaban" roles="admin" username="azkaban"/> <user password="metrics" roles="metrics" username="metrics"/> <user username="admin" password="admin" roles="admin,metrics" /> <role name="admin" permissions="ADMIN"/> <role name="metrics" permissions="METRICS"/> </azkaban-users>
2.4 部署 azkaban-exec-server
# cd /mnt/addDisk1/BigData/azkaban # sudo cp -r ./azkaban-solo-server/conf/ ./azkaban-exec-server/ # cd ./azkaban-exec-server/conf
配置azkaban.properties:
# sudo vim azkaban.properties #Azkaban default.timezone.id=Asia/Shanghai #時區 # Azkaban JobTypes 插件配置 azkaban.jobtype.plugin.dir=plugins/jobtypes #jobtype 插件所在位置 #Loader for projects executor.global.properties=conf/global.properties azkaban.project.dir=projects #資料庫設置 database.type=mysql #資料庫類型(目前只支援mysql) mysql.port=3306 #資料庫埠號 mysql.host=localhost #資料庫IP地址 mysql.database=azkaban #資料庫實例名 mysql.user=azkaba #資料庫用戶名 mysql.password=azkaba #資料庫密碼 mysql.numconnections=100 #最大連接數 # 執行伺服器配置 executor.maxThreads=50 #最大執行緒數 executor.port=12321 #埠號(如修改,請與web服務中一致) executor.flow.threads=30 #執行緒數
在azkaban-exec-server和azkaban-web-server安裝目錄下創建extlib目錄,將lib目錄下的mysql-connector-java-5.1.28.jar包拷備這extlib目錄:
# cd /mnt/addDisk1/BigData/azkaban # sudo cp ./azkaban-web-server/lib/mysql-connector-java-5.1.28.jar ./azkaban-web-server/extlib/ # sudo cp ./azkaban-exec-server/lib/mysql-connector-java-5.1.28.jar ./azkaban-exec-server/extlib/
2.5 啟動web-server和exec-server
# ./azkaban-exec-server/bin/start-exec.sh # ./azkaban-web-server/bin/start-web.sh
2.6 訪問//ip:8443打開azkaban的web頁面
2.7 測試
三、遇到的問題
3.1、 找到guava-*.jar包版本過低,但在/lib/下的是0.21版本,不低了,根據排除可知找到系統中版本過低的而使用。
2019/12/20 14:25:34.573 +0800 ERROR [StdOutErrRedirect] [Azkaban] Exception in thread "main" 2019/12/20 14:25:34.574 +0800 ERROR [StdOutErrRedirect] [Azkaban] java.lang.NoSuchMethodError: com.google.common.collect.ImmutableMap.toImmutableMap(Ljava/util/function/Function;Ljava/util/function/Function;)Ljava/util/stream/Collector; 2019/12/20 14:25:34.574 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.Status.<clinit>(Status.java:40) 2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.FetchActiveFlowDao$FetchActiveExecutableFlows.<clinit>(FetchActiveFlowDao.java:177) 2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.FetchActiveFlowDao.fetchActiveFlows(FetchActiveFlowDao.java:148) 2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.JdbcExecutorLoader.fetchActiveFlows(JdbcExecutorLoader.java:102) 2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.loadRunningExecutions(ExecutorManager.java:384) 2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.initialize(ExecutorManager.java:136) 2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.start(ExecutorManager.java:149) 2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.launch(AzkabanWebServer.java:231) 2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.main(AzkabanWebServer.java:224)
解決方案: //blog.csdn.net/andyguan01_2/article/details/88353889
# vim /mnt/addDisk1/BigData/azkaban/azkaban-web-server/bin/internal/internal-start-web.sh
將如下: for file in $azkaban_dir/lib/*.jar; do CLASSPATH=$CLASSPATH:$file done 改為: for file in $azkaban_dir/lib/*.jar; do CLASSPATH=$file:$CLASSPATH done
# vim /mnt/addDisk1/BigData/azkaban/azkaban-exec-server/bin/internal/internal-start-executor.sh
將如下: for file in $azkaban_dir/lib/*.jar; do CLASSPATH=$CLASSPATH:$file done 改為: for file in $azkaban_dir/lib/*.jar; do CLASSPATH=$file:$CLASSPATH done
3.2 解決executor非active的問題
解決方案:
1)
# cd ./azkaban/azkaban-exec-server/ # curl -G "localhost:$(<./executor.port)/executor?action=activate" && echo
2)也可以通過在MySQL中修改://blog.csdn.net/JavaDestiny/article/details/90091118