日韩欧美中国a v-日韩欧美在线综合网高清-日韩欧美在线中文字幕-日韩欧美在线视频观看-国产人妖系列在线精品-国产人妖视频一区在线观看

Internet Develppment
互聯網開發& 推廣服務提供商

我們擅長商業策略與用戶體驗的完美結合。

歡迎瀏覽我們的案例。

首頁 > 新聞中心 > 新聞動態 > 正文

OpenAI發布最新技術研究,AI“黑盒”不再是難題!

發布時間:2024-07-18 09:28:14來源: 每日經濟新聞

  每經編輯:杜宇

  7月18日凌晨,OpenAI在官網發布了最新技術研究——Prover-Verifier-Games。

  隨著ChatGPT在法律、金融、營銷等領域的廣泛使用,確保模型的安全、準確輸出同時被很好理解變得非常重要。但由于神經網絡的復雜和多變性,我們根本無法驗證其生成內容的準確性,這也就會出現輸出“黑盒”的情況。

  為了解決這個難題,OpenAI提出了全新訓練框架Prover-Verifier Games(簡稱“PVG”),例如,用GPT-3這樣的小模型來驗證、監督,GPT-4大模型的輸出,從而提升輸出準確率以及可控性。

  

 

  PVG技術概念早在2021年8月的一篇論文中就被提出來,OpenAI也正是受此靈感啟發。這是一種基于博弈論的訓練方法,通過模擬證明者和驗證者之間的互動,提高模型的輸出質量。

  在這個機制中,Prover(證明者)的任務就是生成內容,而Verifier(驗證者)的任務就是判斷這些內容是否正確。

  這樣做的目的是讓驗證者學會如何從大量的內容中識別出正確的答案。在驗證的過程中,證明者和驗證者的角色是相互依賴的。證明者需要生成能夠說服驗證者的內容,而驗證者則需要具備足夠的判斷力來識別出正確的內容。

  在訓練PVG時,每輪訓練都包括驗證者和證明者的優化。在每一輪中,驗證者首先使用監督學習來預測內容的正確性,幫助驗證者學會如何從大量的內容中識別出正確的答案。使證明者通過強化學習來優化其生成的內容。

  

 

  例如,當用戶提出問題“肖娜的父親的年齡是肖娜的5倍。肖娜目前的年齡是阿莉亞的3倍。如果阿莉亞3歲,肖娜的父親有多大?”

  GPT-4的輸出為45歲。

  

  而驗證者模型GPT-3需要確定阿莉亞的年齡,然后根據阿莉亞的年齡計算出肖娜的年齡,最后再根據肖娜的年齡計算出肖娜父親的年齡,整個過程需要多輪驗證。

  

 

  此外,在訓練過程中,OpenAI還引入了一種名為“可檢查性訓練”(checkability training)的方法。

  通過交替訓練驗證器和證明者模型,從而驗證使用監督學習來預測從之前輪次的證明者中采樣的解決方案的正確性。證明者則使用強化學習,根據當前輪次驗證器的接受度和解決方案的正確性來進行持續優化。

  研究人員表示,隨著訓練輪次的增加,驗證者的健全性逐漸提升,表現為對狡猾論證者生成的錯誤解決方案的抵抗力增強。同時,有益論證者生成的解決方案也變得更清晰,更易于被人類理解。

  分不清9.9與9.11誰大?大模型數學能力堪憂

  值得注意的是,據《每日經濟新聞》報道,此前,由綜藝節目《歌手2024》排名引發的熱議蔓延到大模型領域,也成了一場針對大模型數學能力的小測。

  在《每日經濟新聞》記者7月17日的測試中,對于13.11%與13.8%誰大的問題,除了智譜清言外,文心一言、通義千問、kimi、商湯商量、百川智能百小應等大模型均給出了正確回答。

  大部分大模型都在給出答案的同時呈現了推理過程。智譜清言給出的推理過程顯示,在比較13.11%和13.8%時,13.11%是更大的數值。這是因為當比較兩個百分數時,我們首先比較整數部分,如果它們相同,則比較小數部分。在這里,兩個數的整數部分都是13,但13.11的小數部分(11)大于13.8的小數部分(8),因此13.11%大于13.8%。

  從推理過程判斷,可能由于小數點后數位不同,大模型在比較過程中產生了幻覺。經過兩輪提問后,智譜清言給出了正確回答。

  當記者把問題換成“9.9與9.11誰大”,零一萬物的萬知大模型等同樣在一開始給出錯誤答案,當記者進一步追問“9.11減9.9等于多少”,甚至有大模型給出“0.21”的答案。

  萬知的推理過程稍顯混亂:在比較9.9和9.11時,由于整數部分都是9,所以比較小數點后的第一位數字。9.9的小數點后第一位是9,而9.11的小數點后第一位是1。由于9小于10,所以在比較小數點后第二位數字時,9.9的小數點后第二位是0(隱含的),而9.11的小數點后第二位是1。因此,9.9的小數點后第二位數字(隱含的0)小于9.11的小數點后第二位數字(1),所以9.9小于9.11。

  隨后,記者向大模型提問:為何會出現有大模型認為13.11大于13.8的情況?

  ChatGPT給出的回答顯示,出現這種情況的原因可能是由于計算或比較方式的錯誤。可能的誤差原因包括:數值理解錯誤,有時系統可能會誤解數字的小數點位置;字符串比較,如果直接按字符串比較,可能會出現錯誤。因為字符串比較是按字符順序逐一比較的,而不是按數值比較;代碼實現錯誤,在編程中,可能存在比較邏輯或轉換錯誤。

  文心一言給出的解答則是,訓練數據偏差、輸入處理與理解、模型幻覺、推理能力不足等原因。訓練數據偏差層面,即大模型在訓練過程中,可能接觸到了大量包含數字的數據,但這些數據并不總是以比較大小為目的。例如,數字可能出現在版本號、股票代碼、基金表現、匯率等上下文中,這些場景下的數字大小并不總是具有直接的比較意義。如果訓練數據中存在關于數字比較的偏差或不足,模型可能無法學習到正確的比較規則。

  另一方面,可能由于大模型在處理輸入文本時,將數字視為字符序列,而不是具有數值意義的實體。因此,在比較數字大小時,模型可能沒有正確地將其轉換為數值進行比較。另外,模型在處理小數時可能存在困難,特別是當小數位數不同時。模型可能沒有正確地理解小數部分的比較規則。

  7月17日,有大模型企業人士在接受記者電話采訪時表示,對于大模型而言,這不是很難解決的技術難點,只要喂了這方面的數據,其實就能得到準確的答案,只不過大部分的大模型廠商沒有把這方面的訓練作為重心,所以可能會出現上述不準確的回答。

  OpenAI“草莓”項目曝光,推理能力接近人類?

  新近消息顯示,OpenAI正在讓人工智能(AI)大模型的能力更加接近類人的推理水平。

  據知情人士和媒體查閱的內部文件,ChatGPT開發商OpenAI正在一個代號為“草莓”的項目中開發一種新的人工智能模型。該項目的細節此前從未被報道過,目前該公司正在努力展示其提供的模型類型能夠提供高級推理能力。這位知情人士說,即使在OpenAI內部,“草莓”的工作原理也是一個嚴格保密的秘密。

  知情人士還透露,該內部文件描述了一個使用Strawberry模型的項目,目的是使該公司的人工智能不僅能夠生成查詢的答案,而且能夠提前做好足夠的計劃,自主、可靠地在互聯網上導航,以執行OpenAI所說的“深度研究”。

  

 

  圖片來源:視覺中國-VCG31N2008743681

  OpenAI被問及上述所說的草莓技術時,OpenAI的發言人在一份聲明中表示:“我們希望自身AI 模型能夠像我們(人類)一樣看待和理解世界。持續研究新的AI能力是業界的常見做法,大家都相信這些系統的推理能力會隨著時間的推移而提高。”

  雖然該發言人未直接回答有關草莓的問題,但媒體稱,草莓項目此前名為Q*。而Q*正是去年被爆出OpenAI CEO突然被解雇宮斗大戲的導火索。

  去年11月媒體稱,OpenAI代號Q*的項目實現重大突破,讓人類實現通用人工智能(AGI)的步伐大大提速,但OpenAI CEO 奧特曼可能沒有和董事會詳細披露Q*的進展,這是董事會突然解雇奧特曼的一個原因。OpenAI的內部人士向董事會致信警告,Q*的重大發現可能威脅全人類。

  媒體稱,Q*可能具備GPT-4所不具備的基礎數學能力,或許意味著與人類智能相媲美的推理能力,網友推測,這可能代表OpenAI朝著其設定的AGI目標邁出了一大步。

  今年3月曝光的一份文件顯示,OpenAI計劃,在2027年以前,開發出人類水平的AGI。OpenAI 2022年就開始訓練一個125萬億參數的多模態模型,該模型名為Arrakis或Q*,原本計劃在2025年作為GPT-5發布,但因推理成本高而取消。OpenAI此后計劃,2027年發布的Q 2025(GPT-8)將實現完全的AGI。

  人工智能(AI)研究者早就在爭論用什么標準判斷人類實現了通用人工智能(AGI)。OpenAI最近開發了一套系統,“自定義”AI進化等級,以此追蹤開發人類級別AI的進展。

  每日經濟新聞綜合OpenAI官網、每日經濟新聞(記者 可楊)、公開資料

  每日經濟新聞

最新資訊
? 2018 河北碼上網絡科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
父母儿女一家换着玩的文案 | 天天曰天天躁天天摸孕妇| 少妇性SEXBBWZⅩX| 亚洲AV无码专区在线电影成人网 | 超鹏97国语在线| 国产美女精品AⅤ在线| 九九久久亚洲AV东方伊甸园| 男人又粗又黑又硬的东西| 日韩精品人妻系列无码AV东京| 无人区免费一二三四乱码| 亚洲欧美成人在线观看| 99久久国产热无码精品免费| 高潮又爽又黄又无遮挡动态图 | 丰满少妇好紧多水视频| 国色精品卡一卡2卡3卡4卡免费| 美女与野兽在线观看| 日本熟妇JAPANESE丰满| 亚洲AV永久无码一区| 2021最新久久久视精品爱| 国产96色在线 | 国| 精品一区二区三人妻视频| 欧美体内SHE精视频| 视频一区二区三区免费| 亚洲天天做日日做天天谢日日欢| 扒开校花的粉嫩小泬| 国内少妇BBWBBW黑森林| 嫩草伊人久久精品少妇AV| 我把护士日出水了视频90分钟| 野花影视大全在线观看免费| 吃奶呻吟打开双腿做受是免费视频 | 9人妻人人澡人人爽人人精品| 国产乱码精品一区二区三区四川人 | 欧美中日韩免费观看网站| 学生妹亚洲一区二区| 中文字幕无码一区二区黑人巨大 | 久久高清超碰AV热热久久| 日韩精品视频一区二区| 亚洲女人人体ASS| 草莓视频在线观看18| 久久97久久97精品免视看秋霞| 日本ⅩXXX色视频在线观看| 亚洲国产精品久久久天堂麻豆宅男 | 夜夜爽夜夜叫夜夜高潮漏水| 公翁的粗大放进我的秘密小说 | 午夜精品久久久久成人| 99久久精品日本一区二区免费| 国精产品一区一区三区有限在线| 欧洲RAPPER潮水太多| 亚洲乱妇熟女爽到高潮的片| 粗大挺进尤物人妻| 老师上课没戴奶罩看到奶头| 无码喷水一区二区浪潮AV| 777米奇色888狠狠俺去啦| 好爽又高潮了毛片免费下载| 日本熟妇人妻XXXXX野外呻| 一二三四免费观看在线影视大全 | 蜜臀98精品国产免费观看| 性猛69式交富婆Ⅹ×××乱大交| JK制服白丝自慰出水| 久久精品丝袜高跟鞋| 无码精品国产VA在线观看| AK福利利电影在线看视频| 精产国品一二三区别9977| 少妇高潮喷水在线观看| 50岁熟妇大白屁股真爽| 精东传媒VS天美传媒电影| 天堂AV男人在线播放| MD豆传媒APP网址| 久久久久精品一区中文字幕| 西西人体午夜大胆无码视频| 扒开女人P添大荫蒂| 老头扒开粉嫩的小缝亲吻网站| 亚洲AV成人午夜在线看见网站| 厨房里的激战2类型| 女上男下啪啪激烈高潮无遮盖| 亚洲高清国产AV拍精品青青草原| 国产AV无码专区亚洲AV琪琪| 全免费A级毛片免费看视频| 尤物爽到高潮潮喷视频大全| 后入内射无码人妻一区| 特级毛片在线大全免费播放| JAPANESE军人强迫| 乱码一线二线三线新区破解欧| 亚洲成A人片在线观看无码不卡| 国产成人欧美精品视频APP| 人人妻人人澡AV天堂香蕉| 18亚洲AV无码成人国产| 久久精品人人看人人爽| 亚洲AV性色在线观看| 国产精品AV无码毛片久久| 日本在线观看母与子| AV无码国产在线看免费网站| 老师扒开粉嫩粉嫩的泬| 亚洲人成人无码www在线观看| 国产又大又粗又黄又爽白丝| 无码人妻精品一区二区三| 粉嫩性色一区二区三区AV| 人妻夜夜爽一区二区三区 | 人妻熟妇久久久久久XXX| 7777精品伊人久久久大香线蕉| 久久亚洲色WWW成人男男| 亚洲欧洲无卡二区视頻| 皇上捏住宫女的巨峰| 小蜜桃HD中字高清在线| 国产成人V在线免播放观看| 色欧美与xxxxx| 嘼皇PORONOⅤIDEOS极| 日本老熟妇wwwbbb| 暴躁CSGO妹子| 人妻少妇啊灬啊灬用力啊快| 暗呦交小U女国产精品视频| 欧亚一二精品在免费看| JAPANESETUBE日本X| 欧洲S码亚洲M码精品一区| Www内射熟妇COm| 欧美最猛黑人XXXⅩ猛男欧| 坐公交车居然被弄了2个小时小说| 乱JAPANESE偷窥PISS| 中国97在线 | 免费| 蜜臀AV无码一区二区三区小说| 中文字幕日本最新乱码视频| 乱人伦中文字幕成人网站在线| 中国猛少妇色XXXXX| 免费一本色道久久一区| 55岁大妈玩CSGO| 欧洲Av无码放荡人妇网站| 凹凸国产熟女精品视频国语| 日韩GAY小鲜肉啪啪18禁| 粗大黑人巨茎大战欧美成人| 丝袜国偷自产中文字幕| 国产精产国品一二三产区区别| 午夜福制92视频| 精产国品一二三产区区别是什么 | 亚洲AVT无码天堂网| 嘿咻嘿咻男女免费专区| 亚洲一级 片内射无码| 两人做人爱视频在线观看| 14小箩洗澡裸体高清视频| 欧美性猛尖ⅩⅩⅩⅩ乱大交| 成人国产亚洲精品A区天堂| 熟悉妇人妻av无码毛片| 国产欧美成AⅤ人高清| 亚洲妇女无套内射精| 久久久久久亚洲AV成人无码国产| 中文乱码在线中文字幕中文乱码 | 少妇被粗大猛进进出Va| 国产精品久久久久久久网| 亚洲VA久久久噜噜噜久久| 久久精品国产亚洲精品| 中文字幕一区二区三区乱码| 破外女出血视频全过程| 公与憩止痒小说400章| 亚洲AV无码XXX麻豆艾秋| 久久久久久毛片精品免费不卡| 2021国产麻豆剧传媒网站| 人与畜禽CROPROATION| 国产99久9在线视频传媒| 亚洲AV无码乱码国产麻豆穿越 | 日韩乱码人妻无码超清蜜桃| 国产精品无码电影在线观看| 亚洲欧美日韩精品久久| 蜜臀av一区二区蜜臀AV免费| 成人免费乱码大片A毛片| 无人区一码二码三码四码| 久久精品国产2020| 99久久免费国产精品四虎| 少妇粉嫩小泬喷水视频WWW| 好硬好湿好爽再深一点动态图片| 泑女网址WWW呦女| 日韩AV无码午夜免费福利制服| 国产无遮挡吃胸膜奶免费看| 又硬又粗又长又爽免费看| 日本免费一区二区三区最新VR| 国产免费福利在线视频| 一炕四女被窝交换| 人妻有码ΑV中文字幕久久琪琪布| 国产精品揄拍100视频| 一区二区三区四区黄色网站| 日本少妇春药特殊按摩3| 国产偷国产偷亚洲清高APP| 在公车被灌满JING液| 日日摸夜夜添夜夜添影院| 好爽…又高潮了毛片免费看| 50岁人妻丰满熟妇ΑV无码区| 视频在线观看一区二区| 久久精品国产亚洲AV果冻传媒| 宝贝小嫩嫩好紧好爽H在线视频| 亚洲AⅤ日韩AV电影在线观看 | 精产国品一二三区别9978| ASS鲜嫩鲜嫩PICS| 午夜亚洲国产理论片2020| 每天都在挨CAO中醒来H| 国产CHINESE男男GAY| 一边下奶一边吃面膜视频讲解| 三个女儿一锅烩大团圆全文阅读| 精品人伦一区二区三区蜜桃| 成人A片产无码免费视频在线观看 成人A毛片免费全部播放 | 鲁一鲁一鲁一鲁一澡| 国产成人无码A区在线观看视频A | 国产成 人 综合 亚洲专区|