- 在線時間
- 75 小時
- 最後登錄
- 26-6-2
- 國民生產力
- 5506
- 附加生產力
- 13210
- 貢獻生產力
- 0
- 註冊時間
- 16-11-21
- 閱讀權限
- 10
- 帖子
- 5661
- 主題
- 22
- 精華
- 0
- 積分
- 24377
- UID
- 2356337
  
|
本帖最後由 twhkleung 於 26-4-22 11:15 編輯
ANChan59 發表於 26-4-21 06:56 
本帖最後由 ANChan59 於 26-4-21 07:54 編輯
會唔會係個街外Al model 太貪心,想包羅萬有,於是顧此失 ...
其實而家deploy咗嘅ai model, 同research嘅理論模型, 差別其實好大. AI Research Scientist 同 ML Engineer, 工作性質其實差好遠, 當ai scientist做咗個ai數學模型, 喺實驗proof咗ok, ML Engineer 去deploy 過model 去雲端, 其實係作了大量嘅修改, 修改到其實個ai scientist都唔知佢搞過啲乜, 因為呢啲都係engineering work, 最終出街嗰個model, 會有好多實際嘅日常運作技術需要.
係咪太貪心, 想包羅萬有, 於是顧此失彼? 咁呢個一定係啦! 正如有個人, 話畀你知, 文科, 理科, 工程科, 法律, 醫科, 甚至神學, 佢都係專家, 咁其實即係呢條友乜都唔識囉.
同樣要做一個ai model, 乜都識, 有好多training strategy要修改. 所以, 做一個vertical model, 係會簡單好多, 從數據收集, 到訓練, 都係相對容易控制.
其實, 我哋每天生活, 面對嘅問題, 基本上都唔會只係得一個答案係 work嘅, 亦都唔會只係得一個選擇, 所以就算每一個model, 佢come up咗同一個答案, 但係其實佢哋嘅datapath, 可能係完全唔同, 就算d models, 大家都係用一模一樣嘅training data, 中間個best match過程, 唔一樣嘅機會係非常非常大.
Multi-model, 或者準確啲應該叫ensemble model, 其實都係因為唔相信一個model就可以做出一個好嘅答案.
train一個financial model, 一個health model, 或者一個general purpose嘅model, 邊個會容易啲? 一定要分的話, vertical model當然會易啲. 但vertical model要求, 又會畀general model嚴謹好多, 例如health model, 容錯率要求非常低, 但general model, 好似我上面講嘅分享, 錯到七彩, 搞咗我兩日, 都只係搞個table咁, 同埋個chart, 如果係個health model, 病人可能已經死咗!
至於benchmark, 呢啲都係基本嘢, 大家圍內, agree一堆weighted parameters, 咁咪叫benchmark囉, 就好似大學排名咁, 當你知道個benchmark用乜嘢weighted parameters, 慢慢的二三線大學二三線researchers, 就會睇注意啲parameters 來做performance.
"因為有不少financial models ,如果MxM個matrix 會好大,好難追縱到邊度出錯。"
都唔係淨係因為大, 本身個model係冇Observability, 冇interpretability, 簡單啲講, 就係一個blackbox, 沒有任何tracing tools, debugging tools, 可以幫你明白佢係基於什麼, 而得著呢個結果.
而家大家都想盡方法, 希望可以睇透多啲, 佢嘅邏輯決段process, 係點樣樣嘅.
|
|