字節內部AI“賽馬”結束,大模型全跟豆包姓,一出手就點名阿裡百度


聲明:本文來自於微信公眾號矽星GenAI(ID:gh_e06235300f0d),作者:Yoky,授權站長之傢轉載發佈。

過去一年,圍繞著字節AI的幾個謎團,終於都在今天被揭開。

5 月 15 日火山引擎Force原動力大會上,字節大模型進行全系列更名,從雲雀大模型升級為豆包大模型傢族,一口氣發佈 9 個豆包模型,其中包括通用模型pro版、通用模型lite版以及各個領域的垂類模型,並宣佈正式對外服務。

這是一次很有意思的更名,我們甚至可以把它理解為是一場“豆包的勝仗”。

而且一出手,直接“點名”阿裡百度,火山引擎總裁譚待在宣佈豆包大模型價格時直言:“很遺憾阿裡和百度還沒有128k可精調的模型,但我期待他們的更新。”

去年在百度和阿裡率先發佈大模型之後,字節遲遲未動。矽星人解到:彼時字節內部不同的部門都在進行AI探索,抖音、剪映團隊各自為戰,“豆包”隻是基於雲雀大模型開發的AI產品,並成立新部門Flow,發力AI應用層。

在技術發展的早期,將不同的產品投向市場,交給用戶檢驗的路子,我們並不陌生。經過一年的時間,“豆包”從一眾大模型產品中脫穎而出,也給字節大模型賺一波“印象分”。

從 2023 年底,“豆包”用戶量一路狂奔,QuestMobil2024 最新的報告中顯示, 2024 年 3 月,“豆包”App月活用戶為2328. 2 萬,在AIGC類應用中排名第一

此次全面更名,揭開整個字節大模型內部戰略的第一個謎團:未來可能將豆包團隊作為主力軍,著重培養。

而朱駿作為字節跳動戰略和產品副總裁在原理大會上的亮相,似乎也回答關鍵領導人的問題。

現場,字節旗下AI bot開發平臺“扣子”的一位工作人員告訴我們:“目前字節AI基本在火山引擎之下,產品戰略由朱駿負責”。

找到方向也確定領隊,由此可見,字節AI是真的想“開”。

1

豆包傢族,組團應戰

Grace改名為豆包的時候,字節沒少被人笑話。

但就是這個接地氣的名字,如今站上字節大模型傢族的C位。

“為什麼叫豆包?”朱駿在現場分享道:“很多人來問我,為什麼起這個名字?我認為一定要擬人化、首先確定下來產品起名的通用原則是,簡單、好讀、好記。”

會上,譚待宣佈從雲雀升級為豆包大模型傢族,我們根據他們不同的功能,將 9 個模型分為三大族群:

第一類是兩個通用模型:豆包通用模型pro(專業版)及豆包通用模型lite(輕量版),專業版上下文窗口尺寸最大128K,適配場景更加通用和全面,而輕量版則更具性價比,中小企業友好,對比pro版本千tokens成本節省84%。

譚待介紹,像汽車的座艙模型、終端模型就更加適合lite版本,更輕量。通過豆包lite,汽車廠商可以在低延遲下實現對話,支持閑聊、搜索、娛樂、導航、車控等多個座艙智能助手場景,效果要比傳統語音處理高達50%以上,幫助用戶獲得新一代的智能化駕駛體驗,讓汽車變得更“聰明”。

第二類是五個垂類模型:分別包括角色扮演模型(Agent)、語音合成模型、聲音復刻模型(多語種的遷移復刻)、語音識別模型、文生圖模型,除視頻生成模型外,基本涵蓋目前模型的使用場景,且源於雲雀語音大模型的技術,很明顯在語音模型上更為細分。

目前基於角色扮演模型,打造出貓箱產品,可以打造單一的角色交互,也可以多角色之間交互發生故事,類似於星野。

第三類則是工具類模型:針對於更專業的調試領域,Function Call模型和向量化模型。可根據不同的輸入指令和情景,選擇不同的函數和算法來執行相關任務,也是當前支持扣子的主力模型。

之所以經歷這樣的分類,譚待講道:“表面上看這是技術的分型,但是實際上我們是根據企業用戶的需求進行選擇,參考過去企業對於模型的調用量,這是很真實的數據。”

不僅豆包增加多個“影分身”,字節的產品包也開始從“豆包”開始,出現貓箱、星繪、河馬愛學、即夢等等。

朱駿在經歷抖音前身Musical.ly、TikTok等多個明星產品打造,帶著豐富經驗的他開始操刀字節大模型的產品。

技術如何落地在產品當中?從目前的產品矩陣中,字節的大模型產品思路也逐漸浮出水面。

“和AI時代之前做產品設計比較,我的個人感受是既有共性又有很大的差異。共性是用戶的核心需求還是那些,差異點是,以前是在成熟的技術上想應用,隻要用同理心去理解用戶的需求和使用體驗,就能做出一個還不錯的產品。”朱駿講道,在AI時代,他們設計產品時的變與不變。

比如讓自己變好看點的需求,社交娛樂和教育學習的需求等等,都沒有變,這些其實是用戶場景的通用性,但滿足用戶需求的手段變,滿足產品的技術在快速演進,每隔三個月、半年都會發生很大的變化。而且它的能力改進往往不是線性的,隔一段時間可能就會出現一個躍遷。

在現場,我們對字節新的產品箱進行測試,負責“貓箱”的產品人員告訴矽星人:“目前貓箱是一個Agent+文生圖+文本能力一個綜合技術能力集成的產品,但是本質上是一個UGC的平臺,需要用戶自己創造Agent和劇本。”

上述負責人講道:“通過前期的用戶調查,發現這是一塊新的需求,因此打造貓箱。”

朱駿也講道:“為讓豆包在這種移動場景裡交互更方便,像一個隨身攜帶的百事通,我們很早投入很大力度優化語音交互體驗,包括基於大模型的ASR和超自然的TTS音色,盡量做到類似和一個真人對話的感受。”

1

字節AI,變“厚”

由單點向外擴散,字節的大模型生態開始變厚。而除模型本身和產品外,更重要的一點是譚待所強調的,這是豆包大模型第一次對外提供服務。

也就是說,豆包大模型傢族全面To B。

坦白講,以前的字節並沒有To B基因。火山引擎、飛書通過對字節本身長板能力的外化,在前幾年積累一定的客戶,但是對於整個企業市場而言,它依舊很年輕。

在幾天前的阿裡雲AI智領者峰會上,阿裡雲也強調大模型和千行百業的結合,這意味著火山引擎要在阿裡雲的優勢戰場上與其交鋒。

唯一的變量,就是大模型帶來的全新的AI時代。火山引擎準備如何用大模型服務客戶?在譚待發言的最後半段,其實放三個大招。

第一個是低價。做企業市場,痛點永遠是第一驅動力,而對於當下的企業而言,算力成本、推理成本高昂,就是最核心的痛點。在阿裡雲掀起雲市場的“價格戰”之後,火山引擎對比目前主流模型token價格,以低價為鉤子,進入企業市場。

會上,譚待公佈豆包通用模型pro-32k和128k的價格,如圖所示,在32k型號價格比行業低99.3%、128k型號比行業價格低95.8%。

第一我們能做到,第二點是我們需要這麼做。”譚待講道。“技術上我們需要非常多的手段,比如模型結構優化的技巧、工程上從單機推理到分佈式推理,再比如混合調度,本身我們自己的調度量非常大;第二就是推進生態繁榮,促進應用的爆發,市場有很大需求,但創新的風險很高,面臨不確定性,我們必須把試錯的成本降到非常低,市場的呼聲就是更低的成本更好的模型。”

數字對於普通用戶而言,或許沒有那麼形象。譚待舉個例子:“今天如果你通過火山引擎、通過豆包大模型 1 塊錢就能獲得 125 萬個token,這是什麼概念?《三國演義》很多人都讀過,一共隻有 75 萬字,所以隻需要 1 塊錢就能處理 3 本《三國演義》的文字量。”

To B的價格戰並不稀奇,隻不過沒想到,這次是由火山引擎先發起的。

不過譚待講道:“To B的業務要求長期的定力,用虧損換收入是不可持續的,未來我們也會持續通過技術降低成本以降低價格。”

價格是驅動市場的因素,但更難的是,未來大模型將以什麼樣的形式落地行業?

火山引擎將這個連接器的角色,賦能給火山方舟2.0。

會上,譚待宣佈火山方舟進行全面升級,這是去年火山方舟面世以來第一次迭代。

在2. 0 生態裡,火山引擎根據過去一年的客戶服務經驗,著重升級插件生態。

“不要讓用戶來找我們,要讓我們去找用戶。”朱駿講道。

插件是相互連接的第一道門。比如聯網插件可以連接抖音頭條搜索技術,實時聯網信源、多模態交互等等,使用聯網插件,模型一秒變“Kimi”,也在某種程度上替代搜索的能力。

更有抖音特色的是內容插件,提供海量豐富的內容、視頻理解和交互,並支持內容策略定制。內容、流量是抖音的看傢本領,對於內容產品的打造是字節的一個巨大的優勢,而插件就能把這樣的能力對外提供服務。

RAG知識庫插件,內置大規模高性能向量檢索能力,百億級別數據可以實現毫秒級檢索,也內置豆包向量化模型,提供更好的搜索相關能力。同時RAG也能保證企業數據安全的同時,為大模型提供一個外腦,讓大模型在行業場景裡更加專業。

插件是連接的一種形式,重點在於火山引擎正在積極通過打造底層生態和基礎能力,為行業大模型落體提供基礎的土壤。

當然,除傳統行業和大型企業,火山引擎也針對開發者群體,打造“扣子”企業專業版,開發者可免費在“扣子”平臺上打造自己的Bot,無論是以純軟件的形式、外嵌飛書、微信等平臺或者以API的形式連接終端硬件。

矽星人簡單嘗試用扣子平臺操縱機器狗,幾乎隻需要自然語言給到一些指令,就可以讓機器狗在聽到指令時“舞獅”,解決調試時間和技術門檻。

基本上我們可以確定,在經歷一年的混亂、整理、明確的過程後,字節AI的生態版圖已經出現,從基座大模型到模型產品,從垂類大模型到開發平臺,字節AI或許從今日起,才算正式啟程。


相關推薦

2024-05-21

。競速大模型商業化雲廠商亮劍觀察下來,阿裡、騰訊、字節的商業化路徑基本趨同,即“迭代通用模型的能力+構建完整的生態+研發創新型AI產品”,但也有不同的側重點。持續迭代大模型能力,是大模型商業化的前提。去年

2024-05-31

之嫌。事實是,和陳林當初負責教育業務一樣,張楠在為字節攻克新高地。一位剪映內部人士告訴新莓daybreak,其實張楠一直在負責剪映,隻是現在全人力投入,在組織架構層面做出不小的調整,包括精簡組織,高管調動。差不

2024-11-01

國首富誕生。10月29日,2024胡潤百富榜發佈,1983年出生的字節跳動創始人張一鳴登頂榜單,財富總額高達3500億元,相比去年增長1050億元。排名前十的富豪中,41歲的張一鳴最年輕,退休時間卻比大多數人更早。今年70歲、排名第

2024-09-20

如果都算上,一年的成本有幾個億”,他補充道。一位在字節跳動做C端大模型產品的員工告訴Tech星球,C端產品付費率太低,推廣很難。但如果不收費,用的越多,虧的越多。一位雲服務廠商中層也證實上述研發人員的觀點。他

2024-09-27

網公司一次加入果鏈的機會。近期,據晚點LatePost爆料,字節正在探索將大模型與硬件結合,既自己開發AI硬件,也會與外部硬件公司合作,其中相關部門負責人正在推動豆包大模型與其他手機廠商的智能助手合作,類似OpenAI與

2023-05-11

討論。為更好地推動內部創業、引領創新,阿裡、騰訊、字節等頭部大廠,都曾設立過專門的部門或團隊。作為大廠中鼓勵內部創業最為積極的代表之一,阿裡於2019年成立創新業務事業群,由朱順炎擔任總裁,直接向阿裡集團

2024-09-29

新知,作者丨蕭維編輯丨蕨影,授權站長之傢轉載發佈。字節跳動以性價比策略切入市場,掀起價格競爭,但高性能模型仍保持付費門檻。B端市場對豆包視頻大模型的接納度有待觀察,其商業變現與用戶場景適配性成為主要考

2024-03-13

效果不及預期等,屢被用戶投訴。總體活躍用戶數也已被字節跳動旗下的豆包超越。桌面搜索引擎,優勢失守從2013年百度開始佈局AI至今,在經歷長達十年的苦熬,累計投資1462億元之後,百度終於在剛過去的2023年迎來“春天”

2024-06-25

快科技6月24日消息,有傳聞稱,字節跳動正在與美國芯片制造商博通合作開發先進的AI處理器。據說,這款AI處理器將采用5nm工藝制造,由臺積電負責生產,盡管設計工作進展順利,但目前尚未開始流片”階段,即設計階段結束

2022-08-06

北京美中宜和醫療管理(集團)有限公司發生工商變更,字節跳動旗下小荷健康完成增持,對美中宜和全資控股。2021年9月,小荷健康首次投資美中宜和,持股17.5748%。今年6月,小荷健康旗下小荷香港增持美中宜和41.49%股權。本

2024-08-29

t精靈#5的智能科技配置尤為引人註目,它是全球首款搭載字節跳動自研豆包AI大模型”的量產車,配備AMD V2000桌面級高算力芯片。這些尖端技術的結合,確保車輛擁有直觀生動的視覺效果和流暢的用戶體驗。車內配備25.6英寸AR增

2024-07-11

MF(產品市場契合點)。2023年是國產大模型元年,騰訊、字節、百度等眾多大模型進入市場,正式開啟對外服務,月之暗面、智譜AI等創業公司也形成“五小虎”的格局。迭代發展一年後,大模型選手們都已走向臺前,給AI行業

2024-09-25

快科技9月24日消息,據媒體報道,字節跳動正式宣告進軍AI視頻生成。發佈豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型發佈,面向企業市場開啟邀測。豆包視頻生成”大模型憑借其卓越的語義理解能力、對復雜交互畫

2024-08-06

、瘋狂內卷。而內卷方向,一邊是以chatGPT、文心一言、字節豆包為代表的大模型產品,面向C端用戶提供賽前、賽中與賽後更豐富的服務,如熱點體育智能體、AI搜索、AI解讀等。另一邊則是以阿裡巴巴為代表的大模型廠商,借力