以 GPT-4 語言模型技術為基礎的服務包括 ChatGPT 以及 Bing Chat 漸漸也發展成 MultiModal 多模態,提供可以「看到」世界,也就是分析圖像的能耐似乎也是能夠預想到的發展。不過當這項功能變得實用,且要真正融入了人類的生活之後。卻出現了很多意想不到的問題。繼續閱讀據報 OpenAI 因隱私疑慮暫緩推出 GPT-4 的影像辨識功能報導內文。
▲圖片來源:Be My Eyes
據報 OpenAI 因隱私疑慮暫緩推出GPT-4 的影像辨識功能
機器學習之所以叫機器學習,其能力的高低,自然與學習吸收分析資訊的能力息息相關 – 這好像是廢話?不過從最近,無論是微軟的 Bing Chat 又或者是該公司所投資的 OpenAI 的 GPT-4 大型語言模型技術,在影像分析能力方面意外造成的隱私等問題疑慮來說。好像就讓人對於所謂的 AI 的「學習能力」感到了莫名的恐懼…
▲圖片來源:OpenAI
其實以都具備有 AI 圖片生成技術能耐的 OpenAI 以及微軟來說。以人工智慧來分析影像的這件任務,應該算是基本功中的基本功。也許是因為如此,以 GPT-4 語言模型技術為基礎的服務包括 ChatGPT 以及 Bing Chat 漸漸也發展成 MultiModal 多模態,提供可以「看到」世界也就是分析接收到的圖像的能耐,似乎也是能夠預想到的發展。
不過當這項功能變得實用,且要真正融入了人類的生活之後。卻出現了很多意想不到的問題。
▲圖片來源:OpenAI
外媒《紐約時報》最近揭露了原本打算從協助視障應用 Be My Eyes app 開始利用 GPT-4 的影像辨識能耐來造福人類的 OpenAI,最近居然被發現默默移除了分辨出現在鏡頭前的人臉描述的功能。
原本對於 Be My Eyes 感到相當滿意,住在紐西蘭的視障者 Jonathan Mosen,認為其不僅能辨識包括飯店房間裡的物件,更能幫忙解說社群媒體還有圖片的內容。其中,更包含了能夠幫忙分析解說人臉資訊的能力。然而因為 Be My Eyes 突然喪失了人臉辨識功能,Jonathan Mosen 便向外媒提到了遇到這樣的困擾。
▲圖片來源:Be My Eyes
外媒也直接向 OpenAI 尋求答案。他們倒也很直接地表示,會有這樣的做法其實是因為突然考量到未經人同意便進行生物資訊辨識,在歐洲與美國部分州其實是有潛在性的隱私違規問題。除此之外,OpenAI 其實本來也有點擔心 AI 對於人臉的情緒等資訊會有錯誤解讀的問題發生(編按:其實連人都會對於「看臉色」發生失誤了,好像也不太能要求 AI 能 100% 準確?)。
也因為如此,OpenAI 才決定先下架關於人臉特徵辨識的相關功能。
是說,其實「給聊天機器人眼睛」這件事情會出的狀況還真的不只有隱私的問題。先前就有人發現了 Bing Chat 居然能夠解讀出 CAPTCHA 驗證圖片的英文字。據說也因此導致微軟暫緩了 GPT-4 圖片分析功能推送的時程(笑死)。
以筆者粗淺的想法來看,這種「文生圖」變成「圖生文」反向運作,可能有點像是要已經可以勉強達到與人類正常聊天的 AI,做一些基本的翻譯功能一樣,其實對於目前的技術水準來講應該是並不困難。但卻沒想到當這樣的功能變得實用之後,在生活之中也開始產生出意想不到的問題。
不過個人認為,隨著 AI 的發展這些問題也會逐漸調整獲得解決才是。但也希望至少對於身障人士,政府與品牌都可以先給出一個臨時的解套方案,才能讓他們盡快用到這種方便的功能囉。
▲圖片來源:Apple