您的位置: 首頁(yè) >要聞 >

OpenAI最新語(yǔ)言模型GPT-4“自我反思”,測(cè)試表現(xiàn)提升30%

2023-04-04 14:07:15 編輯:懷俊蓮 來(lái)源:
導(dǎo)讀 據(jù)IT之家4月4日?qǐng)?bào)道,OpenAI最新的語(yǔ)言模型GPT-4不僅能夠像人類(lèi)一樣生成各種文本,還能夠設(shè)計(jì)和執(zhí)行測(cè)試來(lái)評(píng)估和改進(jìn)自己的表現(xiàn),這種反思

據(jù)IT之家4月4日?qǐng)?bào)道,OpenAI最新的語(yǔ)言模型GPT-4不僅能夠像人類(lèi)一樣生成各種文本,還能夠設(shè)計(jì)和執(zhí)行測(cè)試來(lái)評(píng)估和改進(jìn)自己的表現(xiàn),這種“反思”技術(shù)讓GPT-4在多項(xiàng)難度較高的測(cè)試中都取得了顯著進(jìn)步,測(cè)試表現(xiàn)提升30%。
GPT-4是OpenAI推出的最先進(jìn)的系統(tǒng),也是目前最大的多模態(tài)模型,可以接受圖像和文本輸入,并輸出文本。它利用深度學(xué)習(xí)技術(shù),使用人工神經(jīng)網(wǎng)絡(luò)來(lái)模仿人類(lèi)的寫(xiě)作。

研究人員諾亞?辛恩(Noah Shinn)和阿什溫?戈平納特(Ashwin Gopinath)在論文中寫(xiě)道,他們開(kāi)發(fā)了一種新穎的技術(shù),讓AI代理能夠模擬人類(lèi)的自我反思,并評(píng)估自己的表現(xiàn)。GPT-4在完成各種測(cè)試時(shí),會(huì)增加一些額外的步驟,讓它能夠自己設(shè)計(jì)測(cè)試來(lái)檢查自己的答案,找出錯(cuò)誤和不足之處,然后根據(jù)發(fā)現(xiàn)來(lái)修改自己的解決方案。

在研究團(tuán)隊(duì)使用這種技術(shù)對(duì)GPT-4進(jìn)行的幾種不同性能測(cè)試中,GPT-4在解決從未見(jiàn)過(guò)的Python編程問(wèn)題的HumanEval測(cè)試中,原本準(zhǔn)確率為67%,使用反思技術(shù)后,準(zhǔn)確率提升至88%。在Alfworld測(cè)試中,GPT-4的準(zhǔn)確率從73%提高至97%。在HotPotQA測(cè)試中,GPT-4準(zhǔn)確率從34%提高至54%。

這項(xiàng)研究表明,AI問(wèn)題的解決方案有時(shí)候是依賴(lài)AI本身的。與生成對(duì)抗網(wǎng)絡(luò)類(lèi)似,GPT-4在寫(xiě)作和編輯時(shí)通過(guò)自我反思來(lái)改進(jìn)輸出質(zhì)量。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ   備案號(hào):

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。

郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)