AI趨勢周報第196期:史丹佛研發陪審團學習方法,要解決標註者造成的ML偏差

史丹佛大學設計陪審團學習方法先訓練分類器來模擬不同身分標註者的貼標行為再以虛擬陪審團機制的組合來驗證效果。

 

史丹佛大學

重點新聞(0805~0811)

史丹佛大學     陪審團學習     偏差  

史丹佛研發陪審團學習方法要解決標註者分布不均造成的ML偏差問題

史丹佛大學團隊研發一種陪審團學習方法可控制ML模型輸出值的偏差(Bias)不受到標註者的身分背景影響例如因標註者的年齡、性別、教育程度、居住地不同而帶來的標註偏差。

他們先是訓練分類器來模擬不同標註者的標註行為如女性、黑人而不像常見的分類器只模擬一般標註者行為。這種分類器還能讓使用者依其所需產出特定標註者的標籤來對訓練資料貼標。

在實作上團隊利用社交平臺留言資料集來訓練分類器讓分類器模擬不同標註者對這些留言給出的惡意性評分。該資料集包含了17,280位標註者對留言的惡意性評分(0至4分)每位標註者也提供自己的年齡、性別、種族、教育水準、政黨派別以及是否為人父母和宗教信仰等特徵。接著團隊利用BERTweet模型來產生每條留言的表徵再將這些表徵集結起來作為Deep & Cross類神經網路的輸入值來產出不同標註者對留言的評分。在推論上團隊設置特定特徵組成的虛擬陪審團讓模型隨機挑選12合適的位標註者來預測評分並經多數決選出最佳標籤。團隊發現模型平均絕對誤差為0.61在預測不同種族標註者時模型也有一致的錯誤率如亞洲人0.62、黑人0.65、西班牙裔0.57、白人0.6。

AI專家吳恩達陪審團學習方法雖能減少一些偏差且能確保生成的標籤代表不同觀點但這個方法不會減少在人口群體中普遍存在的偏差。後者的問題需要另一種解法。

  招潮蟹     MIT     電腦視覺  

模擬招潮蟹!MIT專家打造出陸地水下都能看的360度人造眼

MIT電腦科學與人工智慧實驗室CSAIL聯手首爾國立大學打造一款可同時分辨陸地和水下景象的仿生人造眼系統外形有如一個黑色的小球透過混合材質來處理光線訊息視野不再只限於半球形而是近360度的全景視角。

團隊表示這款人造眼是受招潮蟹啟發因為招潮蟹有獨特的視覺系統平坦的角膜和漸變折射率處理能力可解決因外部環境變化而產生的散焦此外特殊的眼睛結構還讓招潮蟹具備3D全景視角。因此團隊將一系列具漸變折射率分布的平面微透鏡以及梳狀的柔性光電二極管陣列整合分布在一個3D球體上。

如此就算光線從多處射出也會聚集在圖像感測器的同一點上不論周遭折射率如何變化。為測試系統團隊將這個人造眼半浸於水中並在水陸和不同距離之處擺設5個物件。他們發現不論陸地還是水下系統可呈現一致的圖像品質也能呈現近乎360度的陸地和水下景象。

  Meta     聊天機器人     BlenderBot 3  

Meta開發新演算法Director要讓新一代Chatbot談吐更有禮貌

Meta以自家的語言模型OPT-175B為基礎開發出1750億參數的新一代聊天機器人BlenderBot 3效能比第二代要好31%再加上以58倍大的資料庫來訓練第三代的知識量是前一代的2倍錯誤率則降低47%。

為了讓BlenderBot 3不受有心人濫用、說出沒禮貌的回應Meta設計一款新學習演算法Director可利用語言建模和分類方法來產出BlenderBot 3給用戶的回應。其中的分類器可訓練來處罰低於標準、有害、矛盾或重複的言論團隊測試發現這種方法比獎勵學習機制、重新排名和傳統語言建模方法要好。

  電腦視覺    物件偵測       ViTDet  

Meta開源新電腦視覺模型可偵測更多不常見物件

Meta發表最新物件偵測模型ViTDet經LVIS資料集測試的表現比其他基於ViT的模型還要好。ViTDet不僅能偵測桌椅等標準物件還能找出如餵鳥器、花圈和甜甜圈等較不常見的物品。這項研究之所以重要是因為物件偵測是一項重要的電腦視覺任務而物件偵測要更有用就得辨識出更多不常見的物件或是在訓練資料中很少出現的物件。

掌握產品行銷策略,帶你認識商品包裝設計基本要素

包裝設計是兼具美感和實用、設計和製作印刷的精緻工藝。包裝設計包含了結構規劃、視覺設計、材質選定及後續的生產加工

臭氧機推薦

臭氧機、紫外線燈作水質淨化、殺菌設備,因臭氧機具強大氧化、殺菌、除臭能力,省電、無耗材費用,深受水處理業者採用

如何選購橡膠製品規格有哪些?

品質優益穩定,效率高成本低,並已獲得國內外大廠承認使用,品質合乎EIA國際標準, 此外也針對客戶端的需要代客Tape and Reel封裝服務。

好的茗茶,更需要密封性高的茶葉罐,才能留住香氣!

鴻和興精密工業股份有限公司,是由在台灣專業生產茶葉罐、奶粉罐具有領先地位的光華金屬所投資組織成立的一家專業製造包裝材料之馬口鐵罐製造廠,秉持的專業、品質、服務、效率為各大客戶服務。

有別於傳統方法Meta僅從單一尺度的特徵圖就可建構簡單的特徵金字塔不需用到過去常見的FPN設計直接用ViT最後一層特徵就可重建FPN這種作法更簡單直覺更不耗費記憶體訓練和推理的速度也更快。Meta現已開源ViTDet程式碼和訓練方法。

  牙周病     影像辨識     TFDA  

牙醫科技新創打造牙周病判讀AI今年拼TFDA取證

國產牙醫科技新創台灣牙e通(dentall)打造牙科影像判讀AI不只能判斷基本的口腔X光片牙位、分辨牙齒位置和牙肉還能預測蛀牙病灶和牙周病期別其中牙周病預測準確率達97%。

2019年他們與北醫聯手透過北醫提供去識別化且經標註的牙齒影像來訓練AI模型。第一階段他們先訓練模型辨識牙位比如上下左右排牙齒目前已能取代人力自動將散亂的影像自動排序。接著模型進一步學會辨識牙肉與牙齒位置有這些基礎後他們開始打造牙周病偵測AI根據牙肉和牙齒露出牙肉的比例以及美國牙周病學會標準來計算牙周病期別。今年他們準備申請衛福部食藥署智慧醫材SaMD認證下一步要整合保險給付比如模型判斷出第3期別需要牙周病再生治療就可整合保險端來簡化給付作業。

  Amazon     小樣本學習     Transformer  

Amazon小樣本學習模型勝過千億參數大模型

Amazon改良Alexa AI開發出200億參數的語言模型AlexaTM 20B只需少量人工輸入就能在不同語言間轉移已習得的知識。進一步來說AlexaTM 20B是以Transformer架構為基礎只需給幾個任務提示AlexaTM就能將已學習的知識或任務從一個語言轉移到另一個語言且不需要額外的人工標註。

AlexaTM 20B具200億參數在多種語言任務上優於上千億參數的大模型。有別於大部分Transformer架構的語言模型、只採用解碼器AlexaTM 20B採序列到序列(seq2seq)的編碼器-解碼器架構在翻譯和文本摘要的效果優於GPT-3還支援更多語言像是阿拉伯語、英語、法語、泰米爾語和泰盧固語等。由於AlexaTM 20B的參數數量較少再加上Amazon對訓練引擎的改進AlexaTM 20B在訓練期間的碳足跡只有GPT-3的五分之一。

  印度     即時監控     影像辨識  

印度導入AI強化邊境即時監控和社交平臺危險偵測

印度軍方近日宣布導入一套AI系統來即時監控北部和西部的邊境狀況以及偵測社交平臺活動來即時掌握危機狀況。進一步來說印度與中國、巴基斯坦接壤長年以來存在不少邊界衝突為此印度計畫重用AI來強化軍事能力。比如他們已採用人臉辨識、語言翻譯(中文到英文)、遠程武器操作站、探雷機器人和入侵偵測系統等來加強軍事防禦。

而這次導入的AI系統則搭配印度可疑車輛登記系統再加上可轉動視角的監視器和熱成像監視器來即時偵測可疑車輛並通知士兵阻攔。印度媒體稱該系統已於8區域上路。

圖片來源/MIT、Meta、Amazon

攝影 / 王若樸

  AI近期新聞 

1. 英國未來2年要建無人機專屬高速公路

2. CMU開源ML工具來解決時序事件問題

資料來源:iThome整理2022年8月

https://www.ithome.com.tw/news/152440

客製專屬滑鼠墊、可愛造型L夾L型資料夾、透明證件套、手提袋,專業印刷設計廠商!

通過SGS環保認證,無毒無害 環保材質符合歐盟RoHs、REACH認證

常見的貨櫃種類?

金誠貨櫃屋尺寸均依國際標準組織ISO (International Standardization Organization) 認定標準,並區分成鐵貨櫃、冷凍貨櫃和特殊貨櫃三種類型。

真空封口機該不該買?使用心得分享

各式封口機、包裝機械、客製化訂做、特殊改造

專業客製化禮物、贈品設計,辦公用品常見【L夾】搖身一變大受好評!

採用PVC0.2白色軟皮料印製,4色印刷加上表層防刮油墨,另也可選表層上亮膜。