如何成為一個 AI 白痴?

  • 2020 年 2 月 21 日
  • 筆記

上周,你加入了 Bean 先生的冒險之旅(http://bit.ly/quaesita_mrbean),學習了關於訓練、驗證和測試的基礎知識。關於如何成為一個 AI 白痴的規則自然地遵循這些內容,但是讓我明確地為你闡明它們。

圖片來自 tenor

到目前為止的故事


在上一集中,你扮演了 Mr. Bean——你的 AI 的耐心教授。既然你越來越在行了,那就讓你堅持下去吧。我常說,避免應用人工智慧陷阱的最好方法是永遠不要忘記學習基本的知識,所以我暗地裡希望你永遠保持當 Bean 教授的思維方式。

永遠不要忘記學習和教學的基礎!

三個階段的快速提醒:

  • 訓練階段:Mr. Bean 從在課堂上看到的例子中尋找模式,然後將這些模式轉換成模型(食譜)。
  • 驗證階段:看看 Mr. Bean 的食譜在他沒有明確研究的例子上的表現。如果分數看起來不錯,就讓他去考試,否則就重新開啟訓練階段。
  • 考試階段:Mr. Bean 參加期末考試,成績決定是否允許他進行實際生產或換專業。

訓練階段相當簡單,你可以把例子推到學生身上(把數據推到機器學習演算法中),並且大多希望是最好的(我只是在開玩笑)。訪問以下網站進一步了解它在這裡的工作原理:http://bit.ly/quaesita_emperor

在我們列出成為 AI 白痴的方法之前,讓我們從你尊敬的教授的角度來談談更微妙的階段——驗證和測試。

驗證和測試之間的細微差別


如果你只關心掛掉那些成績較差學生,你不需要驗證階段,你只需要測試:可憐的 Mr. Bean 進行訓練,找到一個模式(這是一個愚蠢的模式),衝到你的考試中,結果考試不及格,並被踢出數學專業。你抓到並處決了一個無知的人,幹得好!

測試是用來把關的,只有有價值的人才會通過!測試使你免於發布壞的原型。

好老師幫助學生進步(圖源:GettyImages)

但你想幫助學生進步的願望在哪裡呢?你想幫助他們變得更好的承諾在哪裡?他們的救贖和自我完善的機會在哪裡?驗證,這就是答案。

驗證就是救贖,這是一個讓你振作起來再試一次的機會,驗證允許你迭代以獲得更好的原型。

如果你真的關心你的學生,當你發現他們看起來很愚蠢的時候,你會很難過的。期末考試的時候,你是老師還是劊子手?

如果你的最終目標是培養合格的學生,你將需要提供實踐問題(來自驗證數據集)來幫助你的學生在專業測試之前提高。

如何避免成為 AI 白痴?


雖然人工智慧項目的領導者可能不必知道他們的工程師和數據科學家所處理的數學問題,但他們沒有理由忘記學習和教學的基本知識。如果你曾經考慮過設置一個考試,你已經有了大多數常識性的工具,你需要防止一些主要的問題。這裡有幾個例子。

永遠不要忘記人工智慧就是用例子來解釋

如果你的例子不好,你應該感覺不好。如果你不給學生提供足夠高品質的例子來學習,你怎麼能指望他們有效地學習呢?哦,如果你給學生舉一些有偏見的例子,你會得到一個有偏見的學生。那是你的錯,教授。

從在測試數據上進行訓練

如果只需要背誦就能通過考試,那沒有任何好處。機器學習是為了在新的例子上取得成功——如果你關心的只是在舊的東西上表現良好的話,就可以跳過 ML/AI 的麻煩,使用一個查找表就好了。為了保證你評估的是正確的東西,而不是記憶舊數據的能力,確保你的學生從來沒有機會學習你的任何測試例子。

不要在期末考試中使用訓練或驗證數據,這隻會降低你正確測試學生能力的機會。

永遠不要把你的數據集弄混

如果在深入研究之前沒有仔細地整理和拆分數據,你將如何防止上述問題?數據拆分是最好的數據科學快速修復方法。在你開始教你的學生之前,一定要把測試的例子鎖在一個安全的地方。

在你確定考試標準之前,千萬不要開始考試

馬上就開始?住手!雖然這一點似乎太明顯了,但你會驚訝的發現,真正的項目團隊在領導能力薄弱的情況下,往往會進行測試,然後改變,這樣他們的學生的成績就足夠好。不管怎樣,別這樣。

從不復用測試數據

如果你想對那些堅持說你不能多次使用一個測試數據集的統計學家翻白眼,那麼讓我們試著用另一種方式來表達:「如果你給同一個學生兩次相同的期末考試,不要相信他們第二次的表現。」不要重複使用這些試題!

不要跳過測試

測試可以讓你免於災難,這是你防止發布有問題原型的保護措施。如果你真的不在乎它,那麼你有勇氣把你的要求的性能標準設置得很低嗎?如果不能,那就好好測試。

永遠不要太相信自己

還有一個薄弱環節,那就是你自己,教授。如果你沒有意識到你的考試設置得不好怎麼辦?比較少 最好的人也可能犯下這個錯誤。為了以防萬一,一定要建立一些安全網,以將你沒畢業的學生和外界隔絕。

如何成為 AI 白痴


當團隊缺乏熟練的人工智慧領導能力,或者當他們過於沉迷於工程的細節時,他們的常識可能會被忽略。他們可能會忽略基礎知識,最終發布真正糟糕的解決方案。幾乎我在現實生活中看到的每一個糟糕的 ML/ai 災難都可以追溯到上面列表中的一個條目,所以如果你在尋找 AI dunce 帽子,我給了你一個很好的錯誤列表供你選擇,請自便!

但是,如果你想建立一個好的,有用的,有效的人工智慧解決方案,那麼請時刻記住教授的觀點。關於機器學習教學,就這些了!

via:https://towardsdatascience.com/how-to-be-an-ai-idiot-8559c65d91a8