日韩欧美中国a v-日韩欧美在线综合网高清-日韩欧美在线中文字幕-日韩欧美在线视频观看-国产人妖系列在线精品-国产人妖视频一区在线观看

Internet Develppment
互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

DeepSeek下一代技術(shù)提前曝光,梁文鋒署名論文獲ACL2025最佳論文

發(fā)布時(shí)間:2025-07-31 09:26:37來(lái)源: 量子位

  夢(mèng)晨 發(fā)自 凹非寺

  量子位 | 公眾號(hào) QbitAI

  在ACL 2025的頒獎(jiǎng)典禮上,由DeepSeek梁文鋒作為通訊作者、與北京大學(xué)等聯(lián)合發(fā)表的論文榮獲最佳論文獎(jiǎng)。

  這次ACL 2025規(guī)模空前,總投稿量達(dá)到8360篇,相較于去年的4407篇幾乎翻倍,競(jìng)爭(zhēng)異常激烈 。

  

 

  簡(jiǎn)單來(lái)說(shuō),他們提出的原生稀疏注意力(NSA)機(jī)制,通過(guò)算法與硬件的協(xié)同優(yōu)化,直接把長(zhǎng)文本處理速度提升了11倍。更厲害的是,性能不僅沒(méi)降反而還超越了傳統(tǒng)的全注意力模型。

  一作袁境陽(yáng)在會(huì)上發(fā)表演講,透露這項(xiàng)技術(shù)可以把上下文長(zhǎng)度擴(kuò)展到1百萬(wàn)tokens,將被應(yīng)用到下一個(gè)前沿模型中。

  結(jié)合論文發(fā)表于DeepSeek-R1推出之后,實(shí)驗(yàn)設(shè)置中也提到使用了DeepSeek-R1的蒸餾數(shù)據(jù)來(lái)微調(diào)了新的模型。

  大家紛紛猜測(cè),這項(xiàng)技術(shù)將被用于下一代DeepSeek-V4以及DeepSeek-R2。

  

 

  給注意力機(jī)制瘦身,速度狂飆11倍

  長(zhǎng)久以來(lái),大語(yǔ)言模型處理長(zhǎng)文本就像是戴著鐐銬跳舞。傳統(tǒng)的全注意力機(jī)制計(jì)算復(fù)雜度隨序列長(zhǎng)度呈平方級(jí)增長(zhǎng),處理64k長(zhǎng)度的文本時(shí),注意力計(jì)算竟然要占到總延遲的70-80%。

  這篇論文的解決思路很巧妙:既然不是所有詞之間的關(guān)系都同等重要,為什么不讓模型學(xué)會(huì)”抓重點(diǎn)”呢?

  NSA采用了一種動(dòng)態(tài)分層的稀疏策略,通過(guò)三條并行的注意力分支協(xié)同工作:

  壓縮注意力,負(fù)責(zé)捕捉粗粒度的全局信息模式,就像快速瀏覽全文抓住大意;

  選擇性注意力,則專注于序列中最重要的詞塊,相當(dāng)于精讀關(guān)鍵段落;

  滑動(dòng)注意力,負(fù)責(zé)獲取局部的上下文信息,確保細(xì)節(jié)不丟失。

  

 

  這種設(shè)計(jì)最精妙的地方在于,它不是簡(jiǎn)單地丟棄信息,而是通過(guò)精心設(shè)計(jì)的算法平衡了計(jì)算密度。

  更重要的是,整個(gè)架構(gòu)針對(duì)現(xiàn)代GPU硬件進(jìn)行了深度優(yōu)化,實(shí)現(xiàn)了端到端的原生可訓(xùn)練模式。

  

 

  在實(shí)際測(cè)試中,處理64k長(zhǎng)度序列時(shí),NSA在解碼、前向傳播和反向傳播的全生命周期中都展現(xiàn)出驚人的速度優(yōu)勢(shì)。

  解碼階段速度提升11.6倍,前向傳播提升9倍,反向傳播也有6倍的加速,無(wú)論是模型推理還是訓(xùn)練,都能獲得實(shí)實(shí)在在的效率提升。

  

 

  不僅快還更準(zhǔn),長(zhǎng)文本處理迎來(lái)新突破

  速度快只是NSA的一面,更讓人驚訝的是它在各項(xiàng)基準(zhǔn)測(cè)試中的表現(xiàn)。

  在通用基準(zhǔn)測(cè)試中,采用NSA預(yù)訓(xùn)練的27B參數(shù)模型在9個(gè)評(píng)測(cè)指標(biāo)中有7個(gè)超越了全注意力基線。特別是在推理相關(guān)的基準(zhǔn)測(cè)試上,DROP提升了0.042,GSM8K提升了0.034,顯示出稀疏注意力在強(qiáng)制模型聚焦關(guān)鍵信息方面的獨(dú)特優(yōu)勢(shì)。

  

 

  長(zhǎng)文本處理能力的測(cè)試結(jié)果更是亮眼。在64k上下文的”大海撈針”測(cè)試中,NSA在所有位置都實(shí)現(xiàn)了完美的檢索準(zhǔn)確率。在LongBench基準(zhǔn)測(cè)試上,NSA取得了0.469的平均分,不僅超越了全注意力基線(+0.032),更是大幅領(lǐng)先其他稀疏注意力方法。

  

 

  特別值得一提的是,在需要復(fù)雜推理的多跳問(wèn)答任務(wù)上,NSA相比全注意力分別提升了0.087(HPQ)和0.051(2Wiki);在代碼理解任務(wù)(LCC)上提升了0.069;在段落檢索任務(wù)(PassR-en)上提升了0.075。

  

 

  研究團(tuán)隊(duì)還進(jìn)行了一項(xiàng)有趣的實(shí)驗(yàn):

  他們用DeepSeek-R1的數(shù)學(xué)推理數(shù)據(jù)對(duì)模型進(jìn)行微調(diào),然后在美國(guó)數(shù)學(xué)邀請(qǐng)賽(AIME 24)上測(cè)試。

  結(jié)果顯示,NSA-R在8k上下文設(shè)置下的準(zhǔn)確率達(dá)到0.121,而全注意力模型只有0.046;即使在16k上下文下,NSA-R仍然保持0.146的準(zhǔn)確率,遠(yuǎn)超全注意力的0.092。

  

 

  這些結(jié)果充分證明了NSA不是通過(guò)犧牲性能來(lái)?yè)Q取速度,而是真正實(shí)現(xiàn)了效率和能力的雙贏。

  Three More Thing

  這次總共評(píng)選出4篇最佳論文,另外三篇包括:

  北大團(tuán)隊(duì)的《Language Models Resist Alignment: Evidence From Data Compression》

  研究了大型語(yǔ)言模型的“彈性”,指模型經(jīng)過(guò)對(duì)齊訓(xùn)練(讓模型符合人類價(jià)值觀、減少有害輸出)后,很容易因?yàn)楹罄m(xù)的微調(diào)而變回預(yù)訓(xùn)練時(shí)的狀態(tài),就像彈簧被拉伸后會(huì)反彈一樣。

  這意味著現(xiàn)有的對(duì)齊方法可能只是表面上改變了模型,不夠穩(wěn)固。未來(lái)需要更有效的對(duì)齊技術(shù),才能讓模型真正穩(wěn)定地符合人類需求,尤其是在開(kāi)源模型中,要避免惡意微調(diào)輕易破壞安全機(jī)制。

  

 

  斯坦福團(tuán)隊(duì)的《Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs》

  研究了大模型“公平性” 上的一個(gè)新視角 “差異感知”。簡(jiǎn)單來(lái)說(shuō),就是模型應(yīng)該在合適的場(chǎng)景下對(duì)不同群體做出區(qū)分,而不是一味地 一視同仁。

  研究發(fā)現(xiàn)那些在傳統(tǒng)公平性測(cè)試中表現(xiàn)好的模型,在 “差異感知” 上得分并不高;模型能力越強(qiáng)(比如 MMLU 分?jǐn)?shù)越高),情境感知能力越好,但差異感知能力未必提升;現(xiàn)有的 “去偏見(jiàn)” 方法(比如提示模型 “保持無(wú)偏見(jiàn)”)反而會(huì)讓模型更 無(wú)視差異,甚至把正確答案改錯(cuò)。

  

 

  亥姆霍茲信息安全中心等團(tuán)隊(duì)的《A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive》。

  這篇論文指出大模型生成回答時(shí)的采樣機(jī)制與人類決策類似,包含描述性成分(反映概念的統(tǒng)計(jì)常態(tài))和規(guī)定性成分(隱含的概念理想狀態(tài))。

  研究通過(guò)實(shí)驗(yàn)驗(yàn)證,無(wú)論是新創(chuàng)概念還是現(xiàn)有概念(涵蓋 10 個(gè)領(lǐng)域的 500 個(gè)概念),LLMs 生成的樣本都會(huì)偏離統(tǒng)計(jì)平均值,向其認(rèn)為的 “理想值” 偏移,且這種現(xiàn)象在 15 種不同模型中均顯著存在。案例研究顯示,這種偏向可能導(dǎo)致醫(yī)療等領(lǐng)域的有偏決策,引發(fā)倫理問(wèn)題。

  

 

  DeepSeek論文地址:

  https://arxiv.org/abs/2502.11089

  參考鏈接:

  [1]https://x.com/aclmeeting/status/1950572483637067786

  [2]https://x.com/casper_hansen_/status/1950649481617342803

最新資訊
? 2018 河北碼上網(wǎng)絡(luò)科技有限公司 版權(quán)所有 冀ICP備18021892號(hào)-1   
? 2018 河北碼上科技有限公司 版權(quán)所有.
国产午夜福利久久精品| 久久久久AV综合网成人| 免费看视频高清在线观看| 人与动人物XXXX毛片在线播放| 性色AV无码一区二区三区人妻| 中国成熟IPHONE| 国产AV无码专区影视| 久久精品国产色蜜蜜麻豆| 人人爽人人爽人人爽人人片AV| 亚洲AV永久无码精品水牛影视| ASS美女裸体洗澡PICS| 国产日产高清欧美一区| 欧美黑人性爱视频 | 久久精品这里热有精品| 日产乱码一二三区别免费下| 亚洲精品一卡2卡三卡4卡5卡| 啊哈~给我~啊(H)| 精品国产黑色丝袜高跟鞋| 日本十八禁免费看污网站| 亚洲精品亚洲人成在线| 成人国产亚洲精品A区天堂| 久久国产精品亚洲艾草网| 色综合亚洲一区二区小说性色AⅤ 色综合天天综合网天天小说 | 亚洲乱码无人区卡1卡2卡3| 变态SM无码凌虐视频网站| 久久精品国产99精品国产亚洲性| 少妇做爰XXXⅩ性XXXHD| 18禁美女黄网站色大片免费观看 | 中国少妇无码专区| 国产一区二区在线视频| 日本无人区一线影视| 岳打开双腿开始配合交换 | 国产成人精品一区二三区| 女女互磨互喷水高潮LES呻吟| 亚洲成A人片在线不卡一二三区| 成人午夜福利免费体验区| 美女裸体无遮挡免费视频网站| 亚洲AV无码乱码在线| 粉嫩被黑人两根粗大猛烈进出视频 | 亚洲成AV人片无码天堂下载| 二级毛片免费视频播放| 女朋友喊疼男生的心理活动知乎| 亚洲成A人片在线观看无码下载 | 东京热一区二区三区| 男人忍不住挺进去了怎么回事| 亚洲精品成人网线在线播放VA| 国产成人AV无码专区亚洲AV| 朋友的人妻的滋味BD高清中文| 伊人天天久大香线蕉AV色| 护士趴下光屁股翘臀被打的作文| 铜铜铜铜铜铜铜好-深色| 阿娇被躁120分钟视频| 鲁一鲁一鲁一鲁一澡| 亚洲乱妇熟女爽到高潮| 国产婷婷色综合AV蜜臀AV| 神里凌华被焯出白水视频| 凹凸在线无码免费视频| 妺妺窝人体色www婷婷| 亚洲熟妇无码AV在线少妇| 国精产品 自偷自偷| 玩肥熟老妇BBW视频| 成在线人午夜剧场免费无码| 欧美人妻精品一区二区三区| 中文字幕人妻互换激情| 久久久久久人妻一区二区三区| 亚洲成AⅤ人的天堂在线观看女人| 国产精品免费久久久久影院仙踪林 | BBwBBw高潮喷水日本少妇自| 猛猛操逼xxxxx| 一边下奶一边吃面膜视频讲解| 精品卡一卡2卡三卡四卡乱码 | 丰满乳乱亲伦小说| 日本人妻熟妇BBBBB| JK浴室自慰到不停喷水尿失禁| 免费真人视频APP| 永久免费的啪啪免费网址| 久久不见久久见中文字幕免费| 亚洲成A∧人片在线播放黑人| 国精品无码一区二区三区在线| 小12国产萝裸体视频福利| 国产精品三级AV三级AV三级 | 蜜桃AV无码免费看永久| 一本久道综合在线无码88| 久久精品国产99国产精品亚洲 | 浪潮AV一区二区三区| 一个添下面两个吃奶| 久久AⅤ无码AV高潮AV喷吹| 亚洲欧美乱日韩乱国产| 精品久久久久久中文字幕无码软件| 亚洲AV片不卡无码一| 国内精品人妻无码久久久影院导航| 午夜精品久久久久久| 国产男男激情VIDEOSGAY| 小怡的暴露耻辱系列小说| 国产裸模视频免费区无码| 午夜免费无码福利视频网址| 国产免费一区二区三区免费视频| 午夜毛片精彩毛片| 国精产品一品二品国精日本 | 久久久久黑人强伦姧人妻| 亚洲中文在线精品国产| 久久伊人五月丁香狠狠色| 又色又爽又黄18禁美女裸身无遮 | 18禁美女黄网站色大片在线 | 亚洲一区二区三区香蕉| 久久午夜夜伦鲁鲁片免费无码影院| 尤物精品国产第一福利网站| 妺妺窝人体色WWW写真| OM老熟女DHXⅩXXX69| 日本高清视频色WWW色| 丰满妇女强高潮18ⅩXXX小说| 天天爱天天做天天做天天吃中文| 国产精品亚洲片在线观看不卡| 亚洲AV永久爆乳无码5区| 久久18禁高潮出水呻吟娇喘| 用力挺进她的花苞| 欧美人伦禁忌DVD| 动漫高H纯肉无码视频在线观看| 挽起裙子迈开腿坐上MBA| 国产一区二区H无遮挡| 亚洲日韩欧美一区二区三区| 美国ZOOM人与ZOOM视频| JAPANESE熟睡侵犯| 色综合视频一区中文字幕| 国产日产欧产精品精品首页| 亚洲精品无码一区二区AⅤ污| 乱子伦农村XXXXBBB| WINDOWS乱码的乱码大全| 少妇厨房愉情理伦片BD在线观看 | 邻居少妇张开腿让我爽了在线观看 | 日韩精品视频一区二区三区| 国产精品免费观看调教网| 亚洲精品国产精品乱码不卡√| 六个人玩我一个人| 99V久久综合狠狠综合久久| 色噜噜狠狠色综合网| 国精产品一区一区三区糖心| 一二三四免费观看在线6| 欧美在线一区二区三区| 国产成人婷婷丁香在线| 亚洲精品无码久久久久秋霞| 免费人成在线观看视频无码| 成人无码区免费AⅤ片丝瓜视频| 午夜福利国产成人无码GIF动图| 久久精品A亚洲国产V高清不卡| 99在线精品一区二区三区| 上课忘穿内裤被老师摸到高潮| 好大好深好猛好爽视频免费| √天堂中文官网在线| 少妇久久久被弄到高潮| 娇妻当着我的面被4P| 2022一本久道久久综合狂躁| 丝瓜草莓榴莲向日葵秋葵| 精品国产性色无码AV网站| 1—36集电视剧免费观看36集| 少妇被黑人到高潮喷出白浆 | 中文亚洲爆乳AV无码专区| 日韩av在线一区二区| 护士趴下光屁股翘臀被打的作文| 97超碰精品成人国产| 婷婷五月综合色中文字幕| 久久精品午夜亚洲AV无码少妇| 啊灬啊灬啊灬快灬高潮了I| 性猛交富婆Ⅹ×××乱大交| 免费看含羞草AV片成人网址| 国产XXXX做受视频国语对白L| 亚洲一二三四2021不卡 | 主人给我戴上奶牛榨乳器调教 | 免费无码午夜福利片| 国产刺激一区二区| 一区适合晚上一个人看B站| 少妇伦子伦精品无码STYLES| 久久精品AⅤ无码中文字字幕蜜桃 久久精品AⅤ无码中文字字幕 | 日日麻批免费40分钟无码| 精品一线二线三线区别大吗| 扒开两腿中间缝流白浆在线看| 亚洲国产精品成人久久 | 国产AV一区二区三区传媒| 伊人色综合一区二区三区影院视频 | 铜铜铜铜铜铜铜好大好深色板| 么公的粗大挺进了我的密道| 国产精品成人一区二区三区| 中文字幕日本乱码仑区在线| 无码人妻精品一区二区三区在线| 久久综合亚洲鲁鲁九月天| 国产SM调教视频在线观看| 在糖心VLOG唐伯虎女主角是谁| 污污网站18禁在线永久免费观看 | BGMBGM浓毛老太太| 亚洲AV无码专区亚洲AV手机版| 强被迫伦姧在线观看无码| 精品午夜人成一区| 国产A1A2A3| 88国产精品视频一区二区三区| 亚洲AV无码一区二区二三区下载| 日本高清XXXXXXXXXX| 老师掀起裙子让我挺进| 国产三级A三级三级| 被老头侵犯的人妻| 又粗又大又爽又舒服日产|