少妇流白浆普通话对白,亚洲成人片高澎,男女进式猛XⅩ〇〇,99人妻无码一区二区三区免费

每日經濟新聞

每經網首頁丨
宏觀丨
金融丨
公司丨
視頻丨
券商丨
IPO丨
基金丨
汽車丨
房產丨
新文化丨
未來商業(yè)丨
文創(chuàng)通丨
城市丨
每經商學院

要聞

每經網首頁 > 要聞 > 正文

比GPT-3.5 Turbo便宜超60% OpenAI推出小模型卷性價比

每日經濟新聞 2024-07-22 14:51:09

◎按照設想，OpenAI希望未來能夠將一個模型無縫集成到每個應用程序和每個網站中，而GPT-4o mini正在為開發(fā)者更高效和更經濟地構建和擴展強大的AI應用程序鋪平道路。

◎相同智能水平的模型，每8個月其參數規(guī)模將減少一半，這與摩爾定律具有一定的相似性。在同等性能下，參數規(guī)模減小，說明大模型的知識密度在不斷提高。

每經記者｜可楊每經編輯｜梁梟

7月18日，OpenAI正式推出新一代入門級別人工智能模型“GPT-4o mini”，稱這款新模型是“功能最強、性價比最高的小參數模型”。

從OpenAI官網的介紹來看，GPT-4o mini在文本智能和多模態(tài)推理方面的基準性能超越了GPT-3.5 Turbo，在LMSYS（指聊天機器人對戰(zhàn)）排行榜上還超過GPT-4。而價格層面，GPT-4o mini相比GPT-3.5 Turbo便宜了超過60%。

在“大力出奇跡”的Scaling Law（尺度定律）之外，如何做好小模型正在成為大模型廠家的新考題。

OpenAI入局小模型賽場

OpenAI表示，預計GPT-4o mini將通過大幅降低智能的成本，顯著擴展AI應用的范圍。據官網介紹，GPT-4o mini的優(yōu)勢在于低成本和低延遲，支持廣泛的任務，例如串聯或并行多個模型調用的應用程序（例如調用多個API）；向模型傳遞大量上下文（例如完整代碼庫或對話歷史）；或通過快速、實時的文本響應與客戶互動（例如聊天機器人）。

目前，GPT-4o mini在API中支持文本和視覺功能，未來將支持文本、圖像、視頻和音頻的輸入和輸出。該模型具有128K Token的上下文窗口，數據更新至2023年10月。

性能方面，OpenAI稱，GPT-4o mini在涉及文本和視覺的推理任務中優(yōu)于其他小模型，在MMLU（文本智能和推理基準測試）中得分為82.0%，相比之下，Gemini Flash為77.9%，Claude Haiku為73.8%。

在數學推理和編碼任務方面，GPT-4o mini超過了市場大部分小模型。在MGSM（數學推理評估）中，GPT-4o mini得分為87.0%，而谷歌發(fā)布的Gemini Flash為75.5%；在HumanEval（編碼性能評估）中，GPT-4o mini得分為87.2%，而Gemini Flash為71.5%。

價格方面，GPT-4o mini每百萬個輸入Token為15美分（約合人民幣1.09元），每百萬個輸出Token為60美分（約合人民幣4.36元）。OpenAI表示，這一價格相較GPT-3.5 Turbo便宜超60%。

OpenAI表示，在過去幾年中，人們見證了AI的顯著進步和成本的大幅降低。例如，自2022年推出文本模型Text-Davinci-003以來，GPT-4o mini的每個Token成本已經下降了99%。

按照設想，OpenAI希望未來能夠將一個模型無縫集成到每個應用程序和每個網站中，而GPT-4o mini正在為開發(fā)者更高效和更經濟地構建和擴展強大的AI應用程序鋪平道路。

不過，在小模型賽場中，OpenAI的各家競爭對手已經早早就位。例如谷歌推出的Gemini Flash，Anthropic旗下的Claude Haike等。近日，Mitral AI與英偉達推出的小模型Mistral Nemo上線，聲稱性能趕超Meta推出的Llama-3 8B。

大模型越卷越“小”

這一年來，“降本增效”已經成為大部分大模型公司的共識。

平安證券研報認為，OpenAI新模型GPT-4o mini兼具性能與性價比，有望加速大模型應用落地。當前全球范圍內的大模型逐漸呈現由單方面的性能角逐，轉向性能與實用性并重的發(fā)展趨勢。大模型能力達到一定水平時必然會走向應用，大模型廠商通過提升其產品性價比，助推下游應用端的推廣部署，有望加速大模型產業(yè)鏈商業(yè)閉環(huán)的形成。

一方面，上半年開打的大模型價格戰(zhàn)不斷蔓延，從兩家海外AI巨頭OpenAI和谷歌開始，到國內字節(jié)跳動、阿里、百度、智譜AI、科大訊飛等企業(yè)，入局者不斷增加。從OpenAI此舉來看，這場價格戰(zhàn)還將持續(xù)。

IDC中國研究經理程蔭此前在接受《每日經濟新聞》記者采訪時就談到，從短期的發(fā)展來看，大模型能力更新迭代后將會走向趨同，無論是國內還是國外的技術供應商都不能建立起長久的護城河。一些技術供應商選擇直接砍掉大模型成本上的門檻，除了出于促進大模型落地應用，也有增加曝光度，爭搶用戶、防止用戶流失的動因。

另一方面，通過“小模型”，以更低的成本，垂直覆蓋更多的應用場景，以推動端側應用的落地同樣成為行業(yè)趨勢。同時，隨著以蘋果為代表的各大手機廠商加速發(fā)力AI手機，端側大模型正在成為新的競爭焦點。

專注端側模型的面壁智能CEO李大海此前在接受包括《每日經濟新聞》在內的記者采訪時就談到，相同智能水平的模型，每8個月其參數規(guī)模將減少一半，這與摩爾定律具有一定的相似性。在同等性能下，參數規(guī)模減小，說明大模型的知識密度在不斷提高。李大海表示，隨著大模型知識密度的提升和端側算力的增強，兩個因素疊加，有信心在2026年年底前研發(fā)出達到GPT-4水平的端側模型，當端側模型能夠實現GPT-4水平時，很多端側的產品會更快落地。

李大海認為，當端側模型可以應用，其成本會更低，且可靠性更高，不需要依賴網絡。例如，在用戶需求交流時，基于端側模型的陪伴機器人能夠迅速作出反應。這種比較優(yōu)勢使得在適用端側模型的場景中，大家會更傾向于選擇端側解決方案。

今年3月，百度也發(fā)布ERNIESpeed、ERNIE Lite、ERNIE Tiny三個輕量模型。百度集團董事長李彥宏在今年4月的一場公開演講中也談到，MoE、小模型和智能體是值得關注的三個方向。“通過大模型，壓縮蒸餾出來一個基礎模型，然后再用數據去訓練，這比從頭開始訓小模型效果要好很多，比基于開源模型訓出來的模型效果更好、速度更快、成本更低。”李彥宏表示。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

模型 Ai OpenAI

上一篇文章

工業(yè)母機概念翹尾，沈陽機床漲停

返回每經網首頁

下一篇文章

潤建股份：公司利潤率情況處于正常范圍

相關文章

熱文精選

點擊排行

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區(qū)

Copyright ? 2025 每日經濟新聞報社版權所有，未經許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網絡社會征信網

兒童色情信息舉報專區(qū)

成都市互聯網不良與違法信息舉報中心

四川省互聯網舉報中心

中國互聯網舉報中心

每日經濟新聞互聯網不良與違法信息舉報中心

互聯網新聞信息服務許可證：51120190017 網站備案號：蜀ICP備19004508號-3 川公網安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

亚洲老熟妇自慰| 香蕉精品偷在线观看| 国产精品小视频一区两区| 日本久久88综合| 精品自拍网| 一女三黑人玩4P惨叫| 成人色图视频在线| 日本黄色成人网站免费| 日本A级免费大片| 日韩一区二区三区久久久| 亚瑟影院久久精品| 一级黄片黄片| 国产在线精品成人一区二区三区| 视频一区二区风间由美| 无码专区国产精品第一| 会理县| 综合图区亚洲欧美自拍| 婷婷五月深深久久精品| AAAA亚洲精品视频| 国产搡片| 国产大屁股无码av在线播放| 深夜A级毛片免费无码久久| 一本一道AV无码中文字幕麻豆| 色五月亚洲图库| 色中色AV网址| av纯肉| 欧美日韩中文字幕小说| 日韩精品人妻av一区二区三区| 奇米国产精品| 日韩免费高清视频| 男人j漫女人j下面的视频| 久久夜精品一区| 女同久久精品国产99国| 亚洲天堂看电影无码| 亚洲一极黄色带| 亚洲国产中文成人精品福利无码| 国产精品久久久毛片AV| www.亚洲无码| 亚洲中文字幕三区| 国产欧美乱伦| 白虎骚穴视频免费观看网站 |