少妇流白浆普通话对白,亚洲成人片高澎,男女进式猛XⅩ〇〇,99人妻无码一区二区三区免费

<nobr id="t3mgm"></nobr>

<center id="t3mgm"><label id="t3mgm"><tt id="t3mgm"></tt></label></center>

<fieldset id="t3mgm"><optgroup id="t3mgm"></optgroup></fieldset>

每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

全球最新排名：DeepSeek-V3奪開源模型第一！是“新瓶裝舊酒”還是實質(zhì)性突破？業(yè)內(nèi)人士詳解

每日經(jīng)濟新聞 2025-01-06 18:42:39

2024年12月26日，AI大模型DeepSeek-V3發(fā)布并同步開源，全球刷屏。DeepSeek-V3在聊天機器人競技場中排名第七，是前十名中唯一的開源國產(chǎn)模型，且被評為性價比最高的模型。技術(shù)報告揭示其融合了FP8、MLA、MoE三項創(chuàng)新技術(shù)，大幅提升了性能和效率。業(yè)內(nèi)人士認為，這些技術(shù)的應(yīng)用標志著實質(zhì)性突破。

每經(jīng)記者｜鄭雨航每經(jīng)實習記者｜岳楚鵬每經(jīng)編輯｜高涵

2024年12月26日，深度求索（DeepSeek）發(fā)布了其最新人工智能（AI）大模型DeepSeek-V3，并同步開源，刷屏中外AI圈。DeepSeek在兩年內(nèi)就成功開發(fā)出一款性能比肩國際頂尖的AI模型，成本僅為557萬美元，與OpenAI 7800萬美元的GPT-4訓練成本形成鮮明對比。

聊天機器人競技場（Chatbot Arena）最新數(shù)據(jù)顯示，DeepSeek-V3排名全模型第七，開源模型第一。競技場官方表示，DeepSeek-V3是全球前十中性價比最高的模型。在風格控制下表現(xiàn)穩(wěn)健，在復雜問題和代碼領(lǐng)域表現(xiàn)均位列前三。

在長達55頁的技術(shù)報告背后，DeepSeek將它的技術(shù)路線完整地展示給公眾。有人稱贊它是一次真正的技術(shù)突破，但也有人質(zhì)疑它只是現(xiàn)有優(yōu)化技術(shù)的集成而已，本質(zhì)上是新瓶裝舊酒。

對此，有業(yè)內(nèi)人士告訴《每日經(jīng)濟新聞》記者，DeepSeek-V3是首個創(chuàng)新融合使用了FP8、MLA、MoE三項技術(shù)的大模型，可以看作是實質(zhì)性的突破。

聊天機器人競技場：DeepSeek-V3位列總排名第七、開源模型第一

最新的聊天機器人競技場（Chatbot Arena）數(shù)據(jù)顯示，DeepSeek-V3排名第七，成為前十名中唯一的開源國產(chǎn)模型。

圖片來源：聊天機器人競技場

DeepSeek-V3模型被評價為國產(chǎn)第一，并且也是全球前十中性價比最高的模型。DeepSeek-V3在風格控制下表現(xiàn)穩(wěn)健，在復雜問題和代碼領(lǐng)域沖進了前三名。

聊天機器人競技場是目前最知名的大模型評比榜單，用戶在平臺上同時與兩個匿名模型進行對話，提出相同問題，比較它們的回答。根據(jù)模型的回答質(zhì)量，用戶選擇自己偏好的答案，或選擇平局或都不滿意。根據(jù)用戶投票結(jié)果，平臺使用Elo評分系統(tǒng)更新模型的分數(shù)。相比較于其他基準測試，這一評分標準更能反映出真人用戶對于大模型的偏好。

AI智能體與大語言模型集成平臺Composio也從推理、數(shù)學、編程和創(chuàng)意寫作四個維度將DeepSeek-V3和目前最流行的兩個大模型Claude 3.5 Sonnet和GPT-4o進行了比較。

在推理方面，DeepSeek-V3與Claude 3.5 Sonnet、GPT-4o平分秋色，在個別特定問題上還要表現(xiàn)得更好一點。

在數(shù)學方面，DeepSeek-V3比Claude 3.5 Sonnet和GPT-4o要好得多。測試者使用了Gilbert Strang的線性代數(shù)（MIT的線性代數(shù)入門教材）中的一道題作為測試問題。GPT-4o和Claude 3.5 Sonnet都只能找到一個可能的頂點，而DeepSeek-V3能找出三個頂點。

在編程方面，DeepSeek-V3非常接近GPT-4o的編碼能力，但Claude 3.5 Sonnet是表現(xiàn)最好的模型。不過，DeepSeek-V3的定價卻極具吸引力。考慮到性價比，如果只是一般使用的話，Composio認為DeepSeek-V3會是更好的選擇。

在創(chuàng)意寫作方面，Claude 3.5 Sonnet更佳，GPT-4o與DeepSeek-V3相差不大。

但是，DeepSeek現(xiàn)在API的輸入價格僅為每百萬Token0.1元人民幣，而Claude3.5 Sonnet API輸入價格為每百萬Token 3美元。Composio站在使用者的角度判斷，如果用戶想要在大模型之上構(gòu)建應(yīng)用程序，那么Deepseek-V3是明智之選。DeepSeek-V3的性價比讓它成為構(gòu)建面向客戶的AI應(yīng)用程序的理想選擇。

圖片來源：X

新瓶裝舊酒？業(yè)內(nèi)人士：DeepSeek-V3有實質(zhì)突破，融合三項創(chuàng)新技術(shù)

DeepSeek刷屏的另一大焦點便是：它的價格為何那么便宜？

DeepSeek在它長達55頁的技術(shù)報告里給出了答案:DeepSeek-V3利用混合專家 (MoE)架構(gòu)來優(yōu)化性能，在每次處理過程中僅激活6710億個參數(shù)中的370億個。同時還融合使用了多頭潛在注意力(MLA)、FP8混合精度和多token預測等技術(shù)進一步提高了其效率和有效性。

有人質(zhì)疑稱，這些技術(shù)在很早之前就已經(jīng)提出過，DeepSeek只是將這些優(yōu)化技術(shù)集成在一起而已。

對此，資深業(yè)內(nèi)人士、技術(shù)交流平臺北京城市開發(fā)者社區(qū)主理人貓頭虎告訴《每日經(jīng)濟新聞》記者，DeepSeek-V3有實質(zhì)突破。他認為，作為首個綜合實力匹敵Meta的Llama3.1-405B的國產(chǎn)開源大模型，DeepSeek-V3創(chuàng)新性地同時使用了FP8、MLA和MoE三種技術(shù)手段。

據(jù)悉，F(xiàn)P8是一種新的數(shù)值表示方式，用于深度學習的計算加速。相比傳統(tǒng)的FP32和FP16，F(xiàn)P8進一步壓縮了數(shù)據(jù)位數(shù)，極大地提升了硬件計算效率。雖然FP8是由英偉達提出的技術(shù)，但DeepSeek-V3是全球首家在超大規(guī)模模型上驗證了其有效性的模型。

貓頭虎進一步向每經(jīng)記者表示，這一技術(shù)（FP8）至少將顯存消耗降低了30%。

Midjourney的AI研究員Finbarr也表示，Deepseek的FP8設(shè)置看上去很棒。

此外，相較于其他模型使用的MoE模型，DeepSeek-V3使用的MoE模型更為精簡有效。該架構(gòu)使用更具細粒度的專家并將一些專家隔離為共享專家，使得每次只需要占用很小比例的子集專家參數(shù)就可以完成計算。這一架構(gòu)的更新是2024年1月DeepSeek團隊提出的。

圖片來源：arXiv

AI研究人員馬克·貝克在文章中認為DeepSeek的MoE是一個突破性的MoE語言模型架構(gòu)，它通過創(chuàng)新策略，包括細粒度專家細分和共享專家隔離，實現(xiàn)了比現(xiàn)有MoE架構(gòu)更高的專家專業(yè)化和性能。

但是最令人驚訝的是MLA機制，這一機制也完全由DeepSeek團隊自主提出，并最早作為核心機制引入了DeepSeek-V2模型上，極大地降低了緩存使用。不過，DeepSeek-V2模型當時并沒有激起什么討論的熱度，只有很少一部分技術(shù)人員注意到了這一成果。

圖片來源：arXiv

當時，開源平臺huggingface的技術(shù)主管Pjillipp Schmid還在社交平臺上為DeepSeek鳴不平：“為什么沒有更多的人討論MLA（多頭潛在注意力）機制？ MLA被引入DeepSeek-V2中，并幫助將KV-cache的內(nèi)存減少了93.3%。”

編者注：多頭潛在注意力（MLA）是DeepSeek-V2的核心創(chuàng)新，它不僅僅停留在低秩投影的概念上，而是通過更精細的變換設(shè)計，實現(xiàn)了在保持推理時KV Cache與GQA相當?shù)耐瑫r，增強模型的表達能力。MLA的關(guān)鍵在于其推理階段的恒等變換技巧，允許模型在不增加KV Cache大小的情況下，利用不同的投影矩陣增強每個頭的能力。

圖片來源：X

貓頭虎向每經(jīng)記者表示，FP8、MLA和MoE的融合，是AI技術(shù)向更高效率、更低成本發(fā)展的典型案例，尤其在DeepSeek-V3的推動下，這些技術(shù)展現(xiàn)出了寬闊的應(yīng)用前景。

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

DeepSeek 模型創(chuàng)新酒

上一篇文章

庚星股份：擬在香港設(shè)立全資子公司香港庚星能源有限公司

返回每經(jīng)網(wǎng)首頁

下一篇文章

中國廣核：2024年核電機組總發(fā)電量同比增長6.08%

相關(guān)文章

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關(guān)注我們
辟謠專區(qū)

Copyright ? 2025 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

国产精品喷水视频| 亚洲成AV人片女在线观看| 久久久精品韩国日本国产| 在线日韩无| 日韩中文字幕一区二区三区| 亚洲国产精品无码一线岛国AV| 亚洲av不卡一区二区三区| 日本久久官网| 最新国产精品亚洲二区| 免费精品视频在线| 三月婷婷色一二三区| 中国农村少妇XXXX视频| 国产精品黄色三级| 精品成人欧美久久久| 亚洲中文字幕啪啪| 麻豆精品影视| 黄PAA免费视频| 中日美女孕妇,毛片| 97超级碰碰碰久久久观看| 极品少妇XXXX精品少妇| 婷婷亚洲七月| A V伊人久久| 成人在线网址| 可以免费观看的黄视频网站| 内日韩无码一本大道| 欧美日韩啊| 精品国产免费AV二区二区| 一级无码毛片免费视频| 欧美一性一交一人叫| ww47亚洲精品| 激情无码综合区| 欧美日韩人妻在线一区| 两个人啪啪免费视频| 日本aaa在线| 天天精品狠狠| 九九九九国产精品| 25啪啪视频免费| 亚洲欧美一区二区综合| 亚洲AV无码成人精品区在线观看 | 日韩欧美久久久一区二区三区| 日韩看人人肉肉日日|

<samp id="f84m2"></samp>