對于教育應用場景來說,迎來更好的機會。
多知5月21日消息,繼上周字節(jié)跳動的大模型喊出比行業(yè)便宜99.3%之后,今天阿里云也宣布大模型降價了,緊跟著,百度智能云宣布文心大模型兩大主力模型全面免費,立即生效。
5月15日上午,字節(jié)跳動旗下云服務平臺火山引擎總裁譚待在發(fā)布會上正式宣布,字節(jié)跳動自研豆包大模型對外提供服務。
譚待稱,經(jīng)過一年時間的迭代和市場驗證,豆包大模型正成為國內(nèi)使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。
根據(jù)在發(fā)布會披露數(shù)據(jù),豆包用戶規(guī)模在快速增長,月活用戶數(shù)已達2600萬,被創(chuàng)建智能體達800多萬個。
在定價方面,字節(jié)是第一家降價的大廠,譚待在發(fā)布會上宣布,豆包通用模型pro-32k版模型推理輸入價格僅為0.0008元/千Tokens,比行業(yè)低99.3%。
一元錢就能買到豆包主力模型的125萬Tokens,大約是200萬個漢字,豆包稱,200萬個漢字相當于3本《三國演義》。
緊跟著,5月21日,阿里云宣布,通義千問GPT-4級主力模型Qwen-Long,API(應用程序編程接口)輸入價格從0.02元/千tokens降至0.0005元/千tokens,降價幅度高達97%。
這意味著,1元錢可以買200萬tokens。阿里云稱,200萬個漢字相當于5本《新華字典》的文字量。這款模型最高支持1千萬tokens長文本輸入。
而百度智能云直接在官方賬號宣布,文心大模型兩大主力模型ENIRESpeed、ENIRELite將全面免費全面免費,上下文長度為8K、128K。
值得注意的是, 百度 文心大模型系列包括:旗艦版的ERNIE3.5和4.0,和輕量版的ERNIE Speed、Lite、Tiny等。也就是說,百度宣布免費的是小尺寸的模型ENIRESpeed和ENIRELite。
具體來看,ERNIE Speed是百度在2024年發(fā)布的自研高性能大語言模型,通用能力優(yōu)異,適合作為基座模型進行精調(diào),更好地處理特定場景問題,同時具備極佳的推理性能;ERNIE Lite則是百度自研的輕量級大語言模型,兼顧優(yōu)異的模型效果與推理性能,適合低算力 AI 加速卡推理使用。
但小尺寸的模型可能對于不少創(chuàng)業(yè)公司已經(jīng)夠用。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在Create 2024百度AI開發(fā)者大會上曾解釋: “小模型推理成本低,響應速度快,在一些特定場景中,經(jīng)過SFT(監(jiān)督)精調(diào)后的小模型,它的使用效果可以媲美大模型。這就是我們發(fā)布ERNIE Speed、Lite、Tiny三個輕量模型的原因。”
不但是大廠降價了, 最近,大模型初創(chuàng)公司智譜AI將旗下入門級大模型GLM-3-Turbo(128K上下文)的價格從0.005元/千tokens降低到0.001元/千tokens,降幅達80%。私募巨頭幻方量化旗下的大模型DeepSeek-V2(32K上下文)價格降至每千tokens輸入0.001元、輸出0.002元。
對比國外,國外廠商GPT-4、Gemini1.5 Pro及Claude 3 Sonnet每千tokens輸入價格分別為0.22元、0.025元及0.022元,均遠高于國內(nèi)的價格。
可以看到,大廠們讓大模型價格“卷”起來了,預示著大模型的商業(yè)化更進一步,但也讓一些直接研發(fā)大模型的創(chuàng)業(yè)公司面臨更殘酷的競爭,同時,也預示著應用端即將崛起。
有“教育+AI Agent”項目創(chuàng)始人向多知提到:“對于我們這些初創(chuàng)公司而言,在調(diào)用大模型的時候非常注重價格,價格低的產(chǎn)品對我們更有吸引力。尤其是AI Agent,需要調(diào)用不同的大模型。”
不過也有業(yè)內(nèi)人士提到:“大模型的應用,不僅要看價格,還要看應用效果和響應速度。”
不論如何,對于教育應用場景來說,迎來更好的機會,未來將有更多大模型應用落地。(多知 王上)