6月11日,字節(jié)跳動旗下火山引擎舉辦Force原動力大會,發(fā)布豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型,并升級了Agent開發(fā)平臺等AI云原生服務(wù)。e公司記者全程參加了這次大會。
會上,字節(jié)跳動CEO梁汝波表示:“字節(jié)跳動致力成為優(yōu)秀的創(chuàng)新科技公司,會堅定長期投入,追求智能突破,服務(wù)產(chǎn)業(yè)應(yīng)用。通過火山引擎,持續(xù)把新模型、新技術(shù)開放給企業(yè)客戶。”
隨著AIGC的發(fā)展,大廠大模型加速滌蕩。一方面是百度等先發(fā)者的掉隊,另一方面則是部分后來者的快速搶跑。
據(jù)悉,豆包大模型已經(jīng)全線邁入全球第一梯隊。在會上,豆包1.6模型披露多項權(quán)威測評成績。在復(fù)雜推理、競賽級數(shù)學(xué)、多輪對話和指令遵循等測試集上,豆包1.6-thinking的表現(xiàn)已躋身全球前列。
據(jù)火山引擎總裁譚待介紹,豆包1.6系列模型支持多模態(tài)理解和圖形界面操作,能夠理解和處理真實世界問題。此前,豆包1.5的多模態(tài)能力在60個公開評測基準中取得38項最佳成績,已廣泛應(yīng)用在電商識圖、自動駕駛數(shù)據(jù)標注、門店巡檢等場景。圖形界面操作能力則讓豆包1.6進一步具備“行動力”。演示案例顯示,豆包1.6可自動操作瀏覽器完成酒店預(yù)定,識別購物小票并整理成Excel表格等任務(wù)。
豆包視頻生成模型Seedance 1.0 pro也在火山引擎Force大會亮相。該模型支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質(zhì)視頻,主體運動穩(wěn)定性與畫面自然度較高。
在國際知名評測榜單 Artificial Analysis 上,Seedance在文生視頻、圖生視頻兩項任務(wù)上均排名首位,超越Veo3、可靈2.0等優(yōu)秀模型。
目前,豆包大模型已涵蓋多模態(tài)、視頻、圖像、語音、音樂等模型品類,全方位推進智能提升和應(yīng)用落地。在行業(yè)應(yīng)用上,豆包大模型服務(wù)著全球TOP10手機廠商中的9家、八成主流汽車品牌、70%的系統(tǒng)重要性銀行及超五成985高校。
數(shù)據(jù)顯示,豆包大模型日均tokens使用量超過16.4萬億,較去年5月首次發(fā)布時增長137倍。另據(jù)IDC報告,豆包大模型在中國公有云大模型市場份額排名第一,占比高達46.4%。
今年市場普遍預(yù)期,將成為Agent元年,規(guī)模化應(yīng)用提速成為一致判斷。在譚待看來,深度思考、多模態(tài)和工具調(diào)用等模型能力提升,是構(gòu)建Agent的關(guān)鍵要素。同時,由于Agent每次執(zhí)行任務(wù)都會消耗大量tokens,模型使用成本也要降下來,才能推動Agent的規(guī)?;瘧?yīng)用。
通過技術(shù)和商業(yè)的雙重創(chuàng)新,豆包1.6首創(chuàng)按“輸入長度”區(qū)間定價,深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價格。在企業(yè)使用量最大的0—32K輸入?yún)^(qū)間,豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為行業(yè)最低。
為了更好地支持Agent開發(fā)與應(yīng)用,火山引擎AI云原生全棧服務(wù)升級,發(fā)布了火山引擎MCP服務(wù)、PromptPilot 智能提示工具、AI知識管理系統(tǒng)、veRL強化學(xué)習(xí)框架等產(chǎn)品,并推出多模態(tài)數(shù)據(jù)湖、AICC私密計算、大模型應(yīng)用防火墻,以及一系列AI Infra套件。
字節(jié)跳動技術(shù)副總裁洪定坤認為,隨著模型能力的持續(xù)進步,AI有機會成為調(diào)度者,通過調(diào)用不同的 Agent 和工具,讓軟件開發(fā)“all in one”,更大幅度地降低開發(fā)門檻,提升開發(fā)效率。洪定坤表示,豆包1.6模型在編程能力上進步很大,已經(jīng)接入字節(jié)的AI編程產(chǎn)品TRAE內(nèi)測,新模型將很快推送給用戶。
據(jù)洪定坤透露,在字節(jié)內(nèi)部,超過80%的工程師在使用TRAE輔助開發(fā)。TRAE 的整體月活用戶已經(jīng)超過了100萬。
譚待認為,技術(shù)主體經(jīng)歷了三個時代變化,AI時代會推動開發(fā)范式與技術(shù)架構(gòu)全面升級。他說:“PC時代主體是Web,移動時代是APP,AI時代則是Agent。Agent能夠自主感知、規(guī)劃和反思,完成復(fù)雜任務(wù)。從被動工具轉(zhuǎn)變?yōu)橹鲃訄?zhí)行者。豆包大模型和AI云原生將持續(xù)迭代,助力企業(yè)構(gòu)建和大規(guī)模應(yīng)用Agent?!?/p>