大數據與雲計算技術周報(第141期)

  • 2020 年 2 月 26 日
  • 筆記

導語

「大數據」 三個字其實是個marketing語言,從技術角度看,包含範圍很廣,計算、存儲、網路都涉及,知識點廣、學習難度高。 本期會給大家奉獻上精彩的:Elasticsearch、hadoop 、Flink、MongoDB、推薦系統、SQl、DL。全是乾貨,希望大家喜歡!!!

1Elasticsearch

solr和es對比,值得看下

https://mp.weixin.qq.com/s/RSkmMo_9GENOLsCuE5YS1w

2Flink

本文講解Flink 1.10.1此次版本升級中的主要新特性及優化。

https://mp.weixin.qq.com/s/9zuHvyyPXwEZJLU1IsjIDA

3ORACLE

基於ORACLE RAC 雙活方案實施,難點在於遠距離光纖條件下的節點之間的數據交互,尤其因為仲裁的原因,導致出現的腦裂現象較多,我們應該盡量規避這個風險。

https://mp.weixin.qq.com/s/DVZ0NR-VEKikqtu28pHJfw

4MongoDB

本文通過兩個案例分別講述了MongoDB並發寫入的原子性問題及解決方案,並講述了Spring Data Mongo中的樂觀鎖如何巧妙地解決多並發原子性方面的問題。

https://mp.weixin.qq.com/s/Bd8bFiGE75MTVJzHn13ysw

5Elasticsearch

今天給大家分享"騰訊萬億級 Elasticsearch 技術解密"。

https://mp.weixin.qq.com/s/JOkfa9eQfxkINWqxTHug-Q

6Flink

Flink 1.10.0 正式宣告發布!作為 Flink 社區迄今為止規模最大的一次版本升級,Flink 1.10 容納了超過 200 位貢獻者對超過 1200 個 issue 的開發實現,包含對 Flink 作業的整體性能及穩定性的顯著優化、對原生 Kubernetes 的初步集成以及對 Python 支援(PyFlink)的重大優化

https://mp.weixin.qq.com/s/9zuHvyyPXwEZJLU1IsjIDA

7SQL

了解資料庫編譯器的特性,才能避規其短處,寫出高性能的SQL語句。程式設計師在設計數據模型以及編寫SQL語句時,要把演算法的思想或意識帶進來。

https://mp.weixin.qq.com/s/-NkJd4RN1sYMESN4l5tMcA

8Hadoop

後 Hadoop 世界中的大數據:考慮大數據的正確方式是,首先弄清楚你希望實現什麼樣的業務結果,然後從那裡開始著手構建。

https://www.infoq.cn/article/2Ry9DqDwMxqS5b7JdZJt

9推薦系統

這篇文章介紹了機器學習推薦系統在LinkedIn招聘系統中的應用,大家可以重點關注不同業務場景中推薦系統所關注的業務指標。

https://mp.weixin.qq.com/s/Cv1QS3UF3BRyl8Ahq_JyEQ

10Pandas

我們都難以有充足的數據來完成任務,要保證完美的完成任務,有兩件事情需要做好:(1)尋找更多的數據。(2)充分利用已有的數據進行數據增強,今天就來說說數據增強。

https://mp.weixin.qq.com/s/WqEfCnteMPmfWfC7Z_YocA

11開心一刻

* 親愛的程式設計師同志們:

* * 你是第(500)個程式設計師嘗試對這段程式碼優化

* * 浪費在這裡的總時間 為(3609)小時

* 後來者請自覺維護注釋中的兩個數字變數,請做好累加工作,以示後人謹慎操作