數據分析高級教程(二)
- 2019 年 10 月 6 日
- 筆記
6 模塊開發——ETL
該項目的數據分析過程在hadoop集群上實現,主要應用hive數據倉庫工具,因此,採集並經過預處理後的數據,需要加載到hive數據倉庫中,以進行後續的挖掘分析。
6.1創建原始數據表
–在hive倉庫中建貼源數據表
drop table if exists ods_weblog_origin;create table ods_weblog_origin(valid string,remote_addr string,remote_user string,time_local string,request string,status string,body_bytes_sent string,http_referer string,http_user_agent string)partitioned by (datestr string)row format delimitedfields terminated by ' |
---|