字節內部AI“賽馬”結束,大模型全跟豆包姓,一出手就點名阿裡百度


聲明:本文來自於微信公眾號矽星GenAI(ID:gh_e06235300f0d),作者:Yoky,授權站長之傢轉載發佈。

過去一年,圍繞著字節AI的幾個謎團,終於都在今天被揭開。

5 月 15 日火山引擎Force原動力大會上,字節大模型進行全系列更名,從雲雀大模型升級為豆包大模型傢族,一口氣發佈 9 個豆包模型,其中包括通用模型pro版、通用模型lite版以及各個領域的垂類模型,並宣佈正式對外服務。

這是一次很有意思的更名,我們甚至可以把它理解為是一場“豆包的勝仗”。

而且一出手,直接“點名”阿裡百度,火山引擎總裁譚待在宣佈豆包大模型價格時直言:“很遺憾阿裡和百度還沒有128k可精調的模型,但我期待他們的更新。”

去年在百度和阿裡率先發佈大模型之後,字節遲遲未動。矽星人解到:彼時字節內部不同的部門都在進行AI探索,抖音、剪映團隊各自為戰,“豆包”隻是基於雲雀大模型開發的AI產品,並成立新部門Flow,發力AI應用層。

在技術發展的早期,將不同的產品投向市場,交給用戶檢驗的路子,我們並不陌生。經過一年的時間,“豆包”從一眾大模型產品中脫穎而出,也給字節大模型賺一波“印象分”。

從 2023 年底,“豆包”用戶量一路狂奔,QuestMobil2024 最新的報告中顯示, 2024 年 3 月,“豆包”App月活用戶為2328. 2 萬,在AIGC類應用中排名第一

此次全面更名,揭開整個字節大模型內部戰略的第一個謎團:未來可能將豆包團隊作為主力軍,著重培養。

而朱駿作為字節跳動戰略和產品副總裁在原理大會上的亮相,似乎也回答關鍵領導人的問題。

現場,字節旗下AI bot開發平臺“扣子”的一位工作人員告訴我們:“目前字節AI基本在火山引擎之下,產品戰略由朱駿負責”。

找到方向也確定領隊,由此可見,字節AI是真的想“開”。

1

豆包傢族,組團應戰

Grace改名為豆包的時候,字節沒少被人笑話。

但就是這個接地氣的名字,如今站上字節大模型傢族的C位。

“為什麼叫豆包?”朱駿在現場分享道:“很多人來問我,為什麼起這個名字?我認為一定要擬人化、首先確定下來產品起名的通用原則是,簡單、好讀、好記。”

會上,譚待宣佈從雲雀升級為豆包大模型傢族,我們根據他們不同的功能,將 9 個模型分為三大族群:

第一類是兩個通用模型:豆包通用模型pro(專業版)及豆包通用模型lite(輕量版),專業版上下文窗口尺寸最大128K,適配場景更加通用和全面,而輕量版則更具性價比,中小企業友好,對比pro版本千tokens成本節省84%。

譚待介紹,像汽車的座艙模型、終端模型就更加適合lite版本,更輕量。通過豆包lite,汽車廠商可以在低延遲下實現對話,支持閑聊、搜索、娛樂、導航、車控等多個座艙智能助手場景,效果要比傳統語音處理高達50%以上,幫助用戶獲得新一代的智能化駕駛體驗,讓汽車變得更“聰明”。

第二類是五個垂類模型:分別包括角色扮演模型(Agent)、語音合成模型、聲音復刻模型(多語種的遷移復刻)、語音識別模型、文生圖模型,除視頻生成模型外,基本涵蓋目前模型的使用場景,且源於雲雀語音大模型的技術,很明顯在語音模型上更為細分。

目前基於角色扮演模型,打造出貓箱產品,可以打造單一的角色交互,也可以多角色之間交互發生故事,類似於星野。

第三類則是工具類模型:針對於更專業的調試領域,Function Call模型和向量化模型。可根據不同的輸入指令和情景,選擇不同的函數和算法來執行相關任務,也是當前支持扣子的主力模型。

之所以經歷這樣的分類,譚待講道:“表面上看這是技術的分型,但是實際上我們是根據企業用戶的需求進行選擇,參考過去企業對於模型的調用量,這是很真實的數據。”

不僅豆包增加多個“影分身”,字節的產品包也開始從“豆包”開始,出現貓箱、星繪、河馬愛學、即夢等等。

朱駿在經歷抖音前身Musical.ly、TikTok等多個明星產品打造,帶著豐富經驗的他開始操刀字節大模型的產品。

技術如何落地在產品當中?從目前的產品矩陣中,字節的大模型產品思路也逐漸浮出水面。

“和AI時代之前做產品設計比較,我的個人感受是既有共性又有很大的差異。共性是用戶的核心需求還是那些,差異點是,以前是在成熟的技術上想應用,隻要用同理心去理解用戶的需求和使用體驗,就能做出一個還不錯的產品。”朱駿講道,在AI時代,他們設計產品時的變與不變。

比如讓自己變好看點的需求,社交娛樂和教育學習的需求等等,都沒有變,這些其實是用戶場景的通用性,但滿足用戶需求的手段變,滿足產品的技術在快速演進,每隔三個月、半年都會發生很大的變化。而且它的能力改進往往不是線性的,隔一段時間可能就會出現一個躍遷。

在現場,我們對字節新的產品箱進行測試,負責“貓箱”的產品人員告訴矽星人:“目前貓箱是一個Agent+文生圖+文本能力一個綜合技術能力集成的產品,但是本質上是一個UGC的平臺,需要用戶自己創造Agent和劇本。”

上述負責人講道:“通過前期的用戶調查,發現這是一塊新的需求,因此打造貓箱。”

朱駿也講道:“為讓豆包在這種移動場景裡交互更方便,像一個隨身攜帶的百事通,我們很早投入很大力度優化語音交互體驗,包括基於大模型的ASR和超自然的TTS音色,盡量做到類似和一個真人對話的感受。”

1

字節AI,變“厚”

由單點向外擴散,字節的大模型生態開始變厚。而除模型本身和產品外,更重要的一點是譚待所強調的,這是豆包大模型第一次對外提供服務。

也就是說,豆包大模型傢族全面To B。

坦白講,以前的字節並沒有To B基因。火山引擎、飛書通過對字節本身長板能力的外化,在前幾年積累一定的客戶,但是對於整個企業市場而言,它依舊很年輕。

在幾天前的阿裡雲AI智領者峰會上,阿裡雲也強調大模型和千行百業的結合,這意味著火山引擎要在阿裡雲的優勢戰場上與其交鋒。

唯一的變量,就是大模型帶來的全新的AI時代。火山引擎準備如何用大模型服務客戶?在譚待發言的最後半段,其實放三個大招。

第一個是低價。做企業市場,痛點永遠是第一驅動力,而對於當下的企業而言,算力成本、推理成本高昂,就是最核心的痛點。在阿裡雲掀起雲市場的“價格戰”之後,火山引擎對比目前主流模型token價格,以低價為鉤子,進入企業市場。

會上,譚待公佈豆包通用模型pro-32k和128k的價格,如圖所示,在32k型號價格比行業低99.3%、128k型號比行業價格低95.8%。

第一我們能做到,第二點是我們需要這麼做。”譚待講道。“技術上我們需要非常多的手段,比如模型結構優化的技巧、工程上從單機推理到分佈式推理,再比如混合調度,本身我們自己的調度量非常大;第二就是推進生態繁榮,促進應用的爆發,市場有很大需求,但創新的風險很高,面臨不確定性,我們必須把試錯的成本降到非常低,市場的呼聲就是更低的成本更好的模型。”

數字對於普通用戶而言,或許沒有那麼形象。譚待舉個例子:“今天如果你通過火山引擎、通過豆包大模型 1 塊錢就能獲得 125 萬個token,這是什麼概念?《三國演義》很多人都讀過,一共隻有 75 萬字,所以隻需要 1 塊錢就能處理 3 本《三國演義》的文字量。”

To B的價格戰並不稀奇,隻不過沒想到,這次是由火山引擎先發起的。

不過譚待講道:“To B的業務要求長期的定力,用虧損換收入是不可持續的,未來我們也會持續通過技術降低成本以降低價格。”

價格是驅動市場的因素,但更難的是,未來大模型將以什麼樣的形式落地行業?

火山引擎將這個連接器的角色,賦能給火山方舟2.0。

會上,譚待宣佈火山方舟進行全面升級,這是去年火山方舟面世以來第一次迭代。

在2. 0 生態裡,火山引擎根據過去一年的客戶服務經驗,著重升級插件生態。

“不要讓用戶來找我們,要讓我們去找用戶。”朱駿講道。

插件是相互連接的第一道門。比如聯網插件可以連接抖音頭條搜索技術,實時聯網信源、多模態交互等等,使用聯網插件,模型一秒變“Kimi”,也在某種程度上替代搜索的能力。

更有抖音特色的是內容插件,提供海量豐富的內容、視頻理解和交互,並支持內容策略定制。內容、流量是抖音的看傢本領,對於內容產品的打造是字節的一個巨大的優勢,而插件就能把這樣的能力對外提供服務。

RAG知識庫插件,內置大規模高性能向量檢索能力,百億級別數據可以實現毫秒級檢索,也內置豆包向量化模型,提供更好的搜索相關能力。同時RAG也能保證企業數據安全的同時,為大模型提供一個外腦,讓大模型在行業場景裡更加專業。

插件是連接的一種形式,重點在於火山引擎正在積極通過打造底層生態和基礎能力,為行業大模型落體提供基礎的土壤。

當然,除傳統行業和大型企業,火山引擎也針對開發者群體,打造“扣子”企業專業版,開發者可免費在“扣子”平臺上打造自己的Bot,無論是以純軟件的形式、外嵌飛書、微信等平臺或者以API的形式連接終端硬件。

矽星人簡單嘗試用扣子平臺操縱機器狗,幾乎隻需要自然語言給到一些指令,就可以讓機器狗在聽到指令時“舞獅”,解決調試時間和技術門檻。

基本上我們可以確定,在經歷一年的混亂、整理、明確的過程後,字節AI的生態版圖已經出現,從基座大模型到模型產品,從垂類大模型到開發平臺,字節AI或許從今日起,才算正式啟程。


相關推薦

2024-05-21

。競速大模型商業化雲廠商亮劍觀察下來,阿裡、騰訊、字節的商業化路徑基本趨同,即“迭代通用模型的能力+構建完整的生態+研發創新型AI產品”,但也有不同的側重點。持續迭代大模型能力,是大模型商業化的前提。去年

2024-05-31

之嫌。事實是,和陳林當初負責教育業務一樣,張楠在為字節攻克新高地。一位剪映內部人士告訴新莓daybreak,其實張楠一直在負責剪映,隻是現在全人力投入,在組織架構層面做出不小的調整,包括精簡組織,高管調動。差不

2023-05-11

討論。為更好地推動內部創業、引領創新,阿裡、騰訊、字節等頭部大廠,都曾設立過專門的部門或團隊。作為大廠中鼓勵內部創業最為積極的代表之一,阿裡於2019年成立創新業務事業群,由朱順炎擔任總裁,直接向阿裡集團

2024-03-13

效果不及預期等,屢被用戶投訴。總體活躍用戶數也已被字節跳動旗下的豆包超越。桌面搜索引擎,優勢失守從2013年百度開始佈局AI至今,在經歷長達十年的苦熬,累計投資1462億元之後,百度終於在剛過去的2023年迎來“春天”

2024-06-25

快科技6月24日消息,有傳聞稱,字節跳動正在與美國芯片制造商博通合作開發先進的AI處理器。據說,這款AI處理器將采用5nm工藝制造,由臺積電負責生產,盡管設計工作進展順利,但目前尚未開始流片”階段,即設計階段結束

2022-08-06

北京美中宜和醫療管理(集團)有限公司發生工商變更,字節跳動旗下小荷健康完成增持,對美中宜和全資控股。2021年9月,小荷健康首次投資美中宜和,持股17.5748%。今年6月,小荷健康旗下小荷香港增持美中宜和41.49%股權。本

2024-08-29

t精靈#5的智能科技配置尤為引人註目,它是全球首款搭載字節跳動自研豆包AI大模型”的量產車,配備AMD V2000桌面級高算力芯片。這些尖端技術的結合,確保車輛擁有直觀生動的視覺效果和流暢的用戶體驗。車內配備25.6英寸AR增

2024-07-11

MF(產品市場契合點)。2023年是國產大模型元年,騰訊、字節、百度等眾多大模型進入市場,正式開啟對外服務,月之暗面、智譜AI等創業公司也形成“五小虎”的格局。迭代發展一年後,大模型選手們都已走向臺前,給AI行業

2024-05-10

的 Perplexity、微軟的 Copilot,國內除秘塔 AI 搜索,豆包(字節跳動旗下)、Kimi 也都支持 AI 搜索。圖/秘塔 AI 搜索、豆包、Kimi下周,搜索引擎領域的“老大哥”Google還要舉辦一年一度的 I/O 開發者大會,Gemini 和搜索都會是外界關

2024-08-06

、瘋狂內卷。而內卷方向,一邊是以chatGPT、文心一言、字節豆包為代表的大模型產品,面向C端用戶提供賽前、賽中與賽後更豐富的服務,如熱點體育智能體、AI搜索、AI解讀等。另一邊則是以阿裡巴巴為代表的大模型廠商,借力

2023-04-16

以前搜狗團隊為基礎,快速融合來自百度、華為、微軟、字節、騰訊等知名科技公司以及其他創業公司核心成員在內的數十位頂尖AI人才。值得一提的是,近日,王小川與百度副總裁肖陽就國內大模型發展與OpenAI之間的差距問題

2024-06-20

關閉的業務線專輯(主要看從2021年至今),聊聊那些在字節、百度、騰訊、京東、小米、阿裡等大廠裡面,我們可能不知道或者遺忘的歷史產品。其實,每一個新業務、新產品的開啟背後都代表大廠們的雄心和野心,它有賽馬

2023-04-20

少需要5000萬美元,其中的2000萬美元就是用來購買算力的;字節跳動旗下的火山引擎雖然不做大模型,但也發佈大模型訓練雲平臺占位基建;百度、阿裡、華為、商湯等大公司,以及以MiniMax為代表的創業公司,都已經在大模型領域

2023-04-25

市場先機。投行伯恩斯坦分析師表示,騰訊、阿裡巴巴、字節跳動、百度和商湯科技是ChatGPT在AI領域的前五大競爭對手。伯恩斯坦高級分析師羅斌朱(Robin Zhu)稱:“對於希望從這項技術的發展中獲得經濟回報的投資者來說,我