日本女优北野望在线电影_91麻豆免费看_精品影院一区二区久久久_亚洲欧美区自拍先锋_欧美精品精品一区_含羞草激情视频_国产精品二线_国产一区二区影视

首頁 資訊 國內 聚焦 教育 關注 熱點 要聞 民生1+1 國內

您的位置:首頁>資訊 > 國內 >

多模態GPT-4被吹爆,但仍會“一本正經胡說八道”

來源:觀察者網    發布時間:2023-03-15 17:12:49

今年初以來,以AI大模型GPT3.5為基礎的聊天機器人ChatGPT引發大量關注,股市上相關概念遭到熱炒。正當ChatGPT的熱度有所下降時,微軟投資的OpenAI又推出了GPT-4,號稱功能比GPT3.5更強大。


【資料圖】

北京時間3月15日凌晨,OpenAI正式發布大型多模態模型GPT-4。據介紹,與ChatGPT只能接收文字不同,GPT-4能接收圖像和文本輸入來輸出文本內容;擴寫能力得到增強,能處理超過2.5萬個單詞的文本;更具創造力,回答準確性顯著提高;能夠生成歌詞、創意文本,實現風格變化;并且能夠處理更細微的指令。

“這是我們迄今為止功能最強大的模型!”OpenAI的高管和工程師在介紹視頻里直言:“GPT-4是世界第一款高體驗、強能力的先進AI系統,我們希望很快把它推向所有人。”

新的大模型一經發布,便受到網友們的熱捧。但仍然值得的一提的是,雖然GPT-4的功能進一步增強,但仍然不完全可靠。OpenAI坦言,GPT-4仍然會產生幻覺、生成錯誤答案,并出現推理錯誤。

自去年11月推出以來,ChatGPT已經能夠根據用戶提示生成原創文章、故事和歌詞,但它也引發了一些擔憂。最近幾周,人工智能聊天機器人(包括來自微軟和谷歌的工具)因情緒反應過激、犯事實錯誤和完全“幻覺”而受到指責。

GPT-4文字輸入限制提升至2.5萬個單詞

專業場景中接近人類水平

開發GPT大模型的OpenAI稱,GPT-4能接受圖像和文本輸入,輸出文本內容,雖然在許多現實場景中的能力不如人類,但在各種專業和學術基準測試中已做到人類水平的表現。

之前人們使用的ChatGPT只有處理文本的能力,GPT-4開始接受圖像作為輸入介質。比如,給它展示一張圖片,問它手套掉下午會發生什么,很快會得到“它會掉到木板上,并且球會被彈飛”的回答。

OpenAI還用一張“梗圖”演示了GPT-4的新功能。用戶提問:解釋下圖的笑點是什么,并對圖片中的每部分進行描述。GPT-4會分別對每張圖中的內容進行描述,并指出這幅圖把一個大而過時的VGA接口插入一個小而現代的智能手機充電端口,是荒謬的。

GPT-4也能簡練指出圖片的違和之處。用戶提問:“這張圖片有什么不尋常之處”時,GPT-4簡練地回答出“一名男子正在行駛中的出租車車頂上使用熨衣板熨燙衣服”。

不僅是圖像理解,它還可以閱讀圖片形式的論文。通過幾張論文的圖片,GPT-4可以總結內容,也可以對指定內容展開解釋。

除了在文本輸入的基礎上進一步接受了圖像輸入外,GPT-4還升級成為了一個“學霸”,基準測試表現遠遠優于現有模型。OpenAI表示,如果是隨意聊天,用戶可能不太能感受出GPT-3.5與GPT-4之間的區別。但當任務的復雜性達到足夠的閾值時,GPT-4將明顯比GPT-3.5更可靠、更有創意,并且能夠處理更細微的指令。“在我們的內部評估中,它產生正確回應的可能性比GPT-3.5高40%。”

根據測試,在“美國高考”SAT中,GPT-4的分數增加了150分,現在能拿到1600分中的1410分。它還通過了模擬律師考試,且分數在應試者的前10%左右;相比之下,GPT-3.5的得分在倒數10%左右。

此外,GPT-4對于英語以外的語種支持也得到了大大的優化。許多現有的機器學習基準測試都是用英語編寫的。為了初步了解GPT-4在其他語言中的性能,OpenAI使用Azure Translate將MMLU基準測試(一套涵蓋57個主題的14000個多項選擇題)翻譯成各種語言。在測試的26種語言中,有24種語言,GPT-4優于GPT-3.5和其他大語言模型的英語語言性能。

在API(應用程序編程接口)方面,GPT-4還開放了一個使用功能,允許修改“系統提示”。之前ChatGPT的回答總是冗長而平淡,這是因為系統提示中規定了“你只是一個語言模型……你的知識截止于2021年9月”。現在通過修改這句話,GPT-4就可以展現出更多樣的性格,比如扮演蘇格拉底。

OpenAI請GPT-4模型以蘇格拉底風格教學,絕對不能給學生答案;相反地,還要不斷提出好問題幫助學生思考。ChatGPT果真循循善誘,以提問代替直接回答。取自OpenAI官網

仍然不完全可靠

在體驗ChatGPT之時,不少用戶會發現ChatGPT時不時會“一本正經地胡說八道”,而GPT-4盡管號稱功能更全面,但會出現幻覺、胡說八道的毛病還是沒能完全改掉。

OpenAI介紹,盡管功能已經非常強大,但GPT-4仍與早期的GPT模型具有相似的局限性,其中最重要的一點是它仍然不完全可靠。GPT-4仍然會生成錯誤答案,并出現推理錯誤。

也就說,在GPT-4身上依然可以看到之前版本“一本正經地胡說八道”的情形。OpenAI強調,仍然推薦在使用它的時候要附加諸如人工審查、或者附加上下文,甚至在高風險情境中,要避免使用它。

不過OpenAI也提到,該系統已經接受了六個月的安全培訓,在內部對抗性真實性評估中,GPT-4的得分比最新的GPT-3.5高:“響應不允許內容的請求的可能性降低了82%,產生真實事實的可能性提高了40%,優于GPT-3.5。”

網傳GPT-3和GPT-4參數對比圖,但此次OpenAI沒有給出GPT-4參數量

“它仍然存在缺陷,仍然有限,但它有明顯的改進。它比以前的模型更有創意,它的幻覺明顯減少,而且它的偏見也更少。”OpenAI公司CEO奧特曼在Twitter上稱,GPT-4是其模型“最有能力且最符合”人類價值觀和意圖的模型。

這也意味著,相較之前的模型來說,GPT-4雖然仍可能“一本正經地胡說八道”,但頻率有所減小。

不過頻率的減小還是不能讓人們放松警惕。在GPT-4發布后,微軟營銷主管表示,“如果你在過去六周內的任何時候使用過新的Bing預覽版,你就已經提前了解了OpenAI最新模型的強大功能。”

這似乎可以理解為,微軟的新必應早就已經用上了GPT-4。而結合前段時間對新必應的爭議來看,已經用上了GPT-4的新必應還是出現了不少“發瘋”行為。

此外,與前一代一樣,GPT-4是基于2021年9月之前的數據訓練的,所以GPT-4對于2021年9月之后發生的事件仍然缺乏有效理解,也不會從其經驗中進行學習。OpenAI表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,例如社會偏見、幻覺和對抗性提示。”

本文系觀察者網獨家稿件,未經授權,不得轉載。

關鍵詞:

頻道精選

首頁 | 城市快報 | 國內新聞 | 教育播報 | 在線訪談 | 本網原創 | 娛樂看點

Copyright @2008-2018 經貿網 版權所有 皖ICP備2022009963號-11
本站點信息未經允許不得復制或鏡像 聯系郵箱:39 60 29 14 2 @qq.com

亚洲伊人伊成久久人综合网| 欧美福利一区| 亚洲第一二区| 欧美成人影院| 九色porny自拍视频在线播放 | 色欧美日韩亚洲| 午夜婷婷国产麻豆精品| 欧美tickling网站挠脚心| 国产人久久人人人人爽| 欧美久久久久久蜜桃| 亚洲国产精品嫩草影院| 亚洲美女淫视频| 欧美亚洲日本一区| h动漫在线视频| 日韩电影视频免费| 懂色aⅴ精品一区二区三区| 自拍偷自拍亚洲精品播放| 亚洲精品美女视频| 精品国产一区二区三区四区四| 欧美一激情一区二区三区| h网站久久久| 日韩欧美在线中字| 亚洲级视频在线观看免费1级| 精品美女在线视频| 亚洲美女在线视频| 久久影视一区| av电影资源| 超碰成人免费| 国产精品自在在线| 亚洲国产aⅴ成人精品无吗| 在线观看你懂| 一个色免费成人影院| 亚洲欧美国产77777| 欧美日韩国产一级片| av一卡二卡| 欧美日韩在线观看首页| 另类欧美日韩国产在线| 国精产品999国精产品官网| 天天免费亚洲黑人免费| 国产传媒久久文化传媒| 在线观看免费网站| 日本欧美在线| 国产一区二区三区亚洲综合| 国产成人精品免费看| 日韩欧美亚洲国产精品字幕久久久| 91中文字幕网| 久久米奇亚洲| 在线观看中文| 精品国产乱码一区二区三区| 精品国内亚洲2022精品成人| 美国一区二区| 日韩国产综合| 国产精品一卡二| 91福利免费| 亚洲二区免费| 亚洲欧洲在线免费| 久久久久国产精品午夜一区| 亚洲综合一区二区精品导航| 亚洲精品日韩丝袜精品| 高清精品视频| 婷婷综合在线观看| 亚洲综合在线电影| 欧美艳星介绍134位艳星| 国产精品久久久久久久久图文区| 岛国精品视频在线播放| 亚洲精品成人| 国产69精品久久app免费版| 欧美精品一卡| 精品少妇一区二区三区在线视频| 日韩欧美精品一区| 高清不卡一区二区在线| 精品国产精品自拍| 国产一区99| 精品女同一区二区| 老牛嫩草一区二区三区日本| 欧美freesex| 色播在线视频| 欧美视频成人| a国产在线视频| 蜜臀av性久久久久蜜臀av麻豆| 在线观看一级片| 免费在线观看精品| 在线成年人视频| 久久精品欧美日韩| 亚洲不卡系列| 精品精品国产高清一毛片一天堂| 久久久久久久欧美精品| 欧美日韩午夜精品| 国产精品xnxxcom| 亚洲三级免费观看| 中文久久精品| 精品一区在线| 亚洲欧美另类中文字幕| 国产成人免费高清| 91蜜桃臀久久一区二区| 日韩电视剧免费观看网站| 国精产品999国精产品官网| 久久久噜噜噜久久狠狠50岁| 肉体视频在线| 欧美日韩一区二区在线观看| 99热这里只有成人精品国产| 久久9999免费视频| 男插女视频久久久| 日本不卡免费播放| 精品久久久久久久久久国产| 一本一本久久| 亚洲欧洲自拍| 日韩成人激情在线| 日韩视频一区二区三区在线播放免费观看| 一级特黄特色的免费大片| 国产日韩欧美一区二区三区综合| 亚洲va欧美va人人爽成人影院| 欧美在线短视频| 亚洲影院天堂中文av色| 欧美性生活大片视频| 色综合综合网| 国产色播av在线| 亚洲成人福利| 91美女福利视频| 综合激情网...| 黄色毛片在线观看| 在线成人高清不卡| 在线视频日韩| 精品粉嫩aⅴ一区二区三区四区| 国产在线视频一区二区| av成人免费| 欧美xx网站| 日韩av最新在线| 亚洲国产99精品国自产| 欧美高清精品3d| 91精品国产综合久久精品app| 亚洲福利视频三区| 亚洲欧美国产77777| 成人激情黄色小说| 日韩www.| 欧美va在线观看| 精品无人国产偷自产在线| 日本一区二区三区在线观看| 99精品福利视频| 美女福利一区二区| 男同在线观看| 香港成人在线视频| 欧美日韩国产传媒| 丁香花在线观看完整版电影| 亚洲精品理论电影| 精品国产乱码久久久久久夜甘婷婷 | 欧美国产一级| av免费在线免费| 99re6热在线精品视频播放| 国产爆初菊在线观看免费视频网站| 亚洲美女视频网| 色老板视频在线观看| 欧美午夜电影一区二区三区| 可以在线观看的av网站| 电影在线一区| 天海翼一区二区三区四区在线观看| 精品国产一区久久| 91精品国产欧美一区二区成人| 精品一区二区三区视频在线观看 | 日日天天久久| 精品国产伦一区二区三区观看体验| 亚洲免费av高清| 国产宾馆实践打屁股91| 亚洲黄色三级| 欧美99在线视频观看| 亚洲一区日韩| 果冻天美麻豆一区二区国产| 欧美一级大黄| 国产成人精品123区免费视频| 青青影院在线观看| 日本高清视频网站www| 久草热8精品视频在线观看| 99国产精品免费视频观看| 久久99国内| 粉嫩一区二区三区在线观看| 国产91足控脚交在线观看| 尤物在线网址| 香港伦理在线| 999精品网| 欧美高清视频看片在线观看| 国产精品一区二区免费不卡 | 欧美丝袜美腿| 亚洲综合欧美| 亚洲一区二区精品视频| 欧美性猛交xxx| 97精品久久久久中文字幕| 精品一区免费av| 日本亚洲一区二区| 国产aⅴ精品一区二区三区色成熟| 香蕉精品999视频一区二区| 五月激激激综合网色播| 四虎国产精品免费观看| 国内精品久久久久久久影视蜜臀 | 国产综合色视频| 老色鬼久久亚洲一区二区| 国产日韩欧美精品电影三级在线| 欧美性猛交xxxx| 精品人在线二区三区| 黄色网页在线播放| 精品国产一区二区三区性色av|