今日 OpenAI 推出在回答問題前會先「Thinking」思考的 OpenAI o1 語言模型,根據官方提供的示範, OpenAI o1 在接收到問題後會先進行思考,思考後在回覆時會將想法與回應一併發出。雖說目前只有 ChatGPT Plus 與團隊版才能先行使用,不過我們還是可以先瞭解未來能夠用 OpenAI o1 做些什麼,今天整理了目前 OpenAI o1 確認能夠執行的動作。
ChatGPT 新模型:OpenAI o1 的邏輯推理與應用案例
繼能夠馬上做出思考和反應的 GPT-4o 後,今日 OpenAI 推出了一款與 GPT-4o 相反的「 OpenAI o1」, OpenAI o1 強調會在獲得問題後進行思考以提供使用者更具脈絡的邏輯推理回覆。有興趣瞭解更多有關 OpenAI o1 詳細內容的朋友可以前往閱讀相關報導,我們今天主要介紹 OpenAI o1 的實際運用。
根據 OpenAI 提供的 OpenAI o1 實際運用,因為 OpenAI o1 能夠進行思考,所以它能夠解決複雜的邏輯難題。譬如給了「A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess’s age was half the sum of their present age. 」的提問,詢問公主和王子現在各是幾歲? OpenAI o1 能夠通過一連串複雜的計算來算出合適的解答:
OpenAI o1 solves a complex logic puzzle. pic.twitter.com/rpJbh8FkAg
— OpenAI (@OpenAI) September 12, 2024
OpenAI o1 能夠只根據 prompt 就編寫出電動遊戲的代碼,給 OpenAI o1 「Squirrel Finder 」這款遊戲的簡單 code。OpenAI o1 收到問題後先進行了大概 21 秒的思考,思考時 OpenAI o1 先自己描述了一下遊戲,接著塑造遊戲,最後才開始製作遊戲。
OpenAI o1 codes a video game from a prompt. pic.twitter.com/aBEcehP0j8
— OpenAI (@OpenAI) September 12, 2024
OpenAI o1 能夠進行思考,因此回答對其他大型語言模型來說非常棘手的問題也是不在話下。詢問OpenAI o1 草莓(Strawberry) 裡面有幾個 r,它在經過幾秒鐘的思考後能夠正確回答出答案。大幅減少先前大語言模型經常出現幻覺或胡言亂語的情況。
OpenAI o1 answers a famously tricky question for large language models. pic.twitter.com/5ZlQIOBWEd
— OpenAI (@OpenAI) September 12, 2024
除了編輯程式以外,OpenAI o1 在數學方面也是頗有進展。OpenAI o1 現在可以回答數織(Nonogram)的題目:
除了上述提到的這些,其實 OpenAI o1 現在還能做到很多事情,研究遺傳學、量子物理、經濟學等等的專業知識回覆都有受到相當高的評價。OpenAI 官方也表示 OpenAI o1 可以推理出複雜任務並解決科學、程式編寫、數學等等以前的模型回答不出來的更困難的問題。雖說目前只有 ChatGPT Plus 與團隊版能夠先行使用 OpenAI o1 ,不過 OpenAI 表示稍晚一週也會提供企業與教育使用者,在耐心等候一下我們就可以自己體驗會思考的 ChatGPT 最新模型 o1 與 o1 mini。
不過大家還是先不要對 OpenAI o1 抱有太大的期望,因為經過網友測試,目前 OpenAI o1 對於很基本的問題還是有回答錯誤的情況。
这就是你们说的推理能力强了?博士级别?🤨 pic.twitter.com/XwonwB79P5
— 小互 (@imxiaohu) September 13, 2024
如果大家想更瞭解有關 OpenAI o1 的詳細內容可以點及下方連結前往閱讀相關報導:
會思考(Thinking)的 ChatGPT 最新模型 o1 與 o1 mini 來了,志在陪伴研究者脫離難題的「兔子洞」