SamAltman又出手。這次他投資一個隻有5個人的RPA早期團隊InducedAI,兩位聯合創始人AryanSharma和AyushPathak,一個18歲,一個19歲。不隻是SamAltman,SignalFire、PeakXV、SVAngel等機構共同參與InducedAI這一輪230萬美金的種子輪融資。
此次融資,科技加速器AI Grant的兩位創始人Nat Friedman和Daniel Gross也加入Induced AI的團隊。這兩位在科技界的大名如雷貫耳,Nat曾任Github的CEO,Daniel創立的搜索引擎公司Cue則被蘋果收購。
這支團隊及其產品有何過人之處,為何能夠吸引眾多大佬的橄欖枝呢?
RPA 3.0:打開瀏覽器,讓AI完成所有工作
Induced AI的兩位創始人——Aryan和Ayush——別看年齡小,創業經歷卻相當豐富。這兩位年輕程序員的創業履歷遍及醫療、廣告、教育、區塊鏈、web3等領域,甚至還發起過創業社群和類似孵化器的組織。
此次創立的Induced AI則是一款釋放企業員工生產力的“RPA 3.0”。用戶隻需用簡單的英語輸入工作流程和錄屏視頻,Induced AI就能將其實時轉換為偽代碼,並調取多種相關工具,來執行大量重復性任務。
兩位創始人|圖源:Linkedln
RPA(Robotic Process Automation,機器人流程自動化)並非新鮮概念,普通人在日常生活中也隨處可見,例如Excel中的“宏”,或者很多人用來搶演唱會門票的小工具“按鍵精靈”,都可以看做RPA的前身。傳統的RPA定義上,軟件記錄人的操作,比如點擊鼠標、鍵盤輸入、打開文件夾、發送郵件等,並將這些操作固定下來形成規則和套路,批量地自動執行,從而節省人的時間,提升工作效率。隨著AI技術進步,機器識別圖像、理解語言、邏輯思考的能力不斷提升,這些技術也與RPA結合到一起,釋放更大的能量。
正如RPA概念所定義的,迄今為止,市面上的RPA工具需要人工制定好明確的規則,而復雜任務的規則也會耗費大量人力。Induced AI則借助大語言模型的能力,讓工具有邏輯推理和判斷的能力。用戶隻需要說出他的需求,比如“給我建個Jira的ticket”,或者“幫我篩選一波簡歷,給候選人發面試邀請”,Induced AI就可以對要做哪些事情進行實時判斷和拆解,並自動調取相關的工具來完成整個流程。
以篩選簡歷這個任務為例,常規的人工操作流程包括:登錄你的領英賬號、搜索簡歷、評估簡歷、下載簡歷、發送邀請等。如果領英沒有提供官方的API接口,過去的RPA很可能就卡在登錄這一步,甚至可能被判定為惡意機器人。Induced AI在Chromium上構建一個瀏覽器環境,它有自己的內存、文件系統和身份驗證憑據(電子郵件、電話號碼)來執行復雜的流程,因此可以自動完成登錄、填寫驗證碼、文件下載、存儲和重復使用數據等動作,沒有開放API的軟件也攔不住Induced AI。
一波AI Agent正在襲來
讓工具,特別是有智能的工具替人類幹活,是從我們的老祖宗開始就產生的夢想。從木牛流馬到Siri,人們始終覺得這些“助手”還欠點兒火候。直到ChatGPT和AutoGPT橫空出世,AI Agent似乎即將成為可能。
OpenAI的研究員Lilian Weng撰文定義基於大語言模型的AI Agent:大語言模型、記憶、任務規劃、使用工具,四個模塊缺一不可。盡管Induced AI團隊將自己定位成“RPA 3.0”,但從其產品特性上來看,他們更像一個AI Agent,這也是為什麼Sam Altman等AI大佬一致看好這個年輕的團隊。
當前的AI熱潮下,Induced AI不是第一個、也絕不是最後一個AI Agent團隊。
暫且不提那些訂票、點外賣的小而美Agent,或者AutoGPT、HuggingGPT等幾乎人盡皆知的項目,與Induced AI有同樣打造AI員工野心的團隊就有不少。
例如今年三月完成3.5億美元B輪融資的Adept,自己訓練一個ACT-1,這個模型專門用來在計算機上響應用戶的自然語言指令並執行操作。它可以使用現有的所有軟件工具、API和網站。ACT-1同樣基於瀏覽器工作,用戶可以在和AI的聊天框裡輸入自己的命令,例如在Salesforce裡創建一條銷售線索,或者在GoogleSheet裡計算一些數據。
Adept的ACT-1|圖源:Brigade Web
無獨有偶,科技公司Rabbit也研發自己的大模型LAM(Large Action Model),並基於它推出一套完整的“個人操作系統Rabbit OS”解決方案。LAM能夠觀察人機交互的界面,形成“概念藍圖”,從而在用戶的自然語言指令不那麼明確的時候理解並實現人類的潛在意圖。基於LAM,Rabbit還專門設計一套軟件平臺,使其Agent能夠更人性化地完成任務。今年10月,Rabbit獲得Khosla Ventures領投、老股東跟投的2000萬美元融資。
未來已來嗎?
當然,除創業團隊,傳統的RPA、低代碼、無代碼等公司,幾乎無一不在擁抱大語言模型和AI Agent,畢竟在今天,隻要一提這兩個概念就能讓投資人和客戶眼前一亮,忍不住多看一眼。
今年以來,AI Agent的幾個爆款應用和幾次出圈,讓人工智能的呼聲一次次被推向高潮。可我們仍然不禁要問,未來已來嗎?眼前的熱鬧是變革還是泡沫?
如果拿自動駕駛來做個比喻,我們更為熟悉的Copilot和Midjourney這樣的產品類似L3級別的自動駕駛,即機器是人類的“助手”和“副駕”,而Agent對應著L4級別的自動駕駛,人類隻需設定目標、監督結果,機器自己完成決策和執行。今天,L3級別的AI副駕仍然處於落地應用的早期,無論是技術能力還是商業價值,尚有大量值得探討的問題,未能全面推廣。
以此看來,L4級別的AI Agent大規模應用可能就更遙遠。那麼,當前的AI熱又是一波割韭菜的炒作嗎?它是否會想幾年前的區塊鏈、VR、元宇宙一樣,隻是曇花一現?
Adept的ACT-1|圖源:DEV
可以肯定的是,生成式AI以及相關的概念熱度正在消退。
無論是媒體關註還是市場反應都已經暗暗證實這一點。Gartner今年發佈的技術成熟度曲線上,生成式AI和AI增強的軟件工程都放在膨脹期,意味著這兩項技術在未來2-5年都即將進入幻滅期低谷——一如曾經的自動駕駛和上述技術概念。不過,正是在熱度衰減、噪聲安靜的幻滅期,才有更多有意義的經驗和知識沉淀下來,為接下來的啟蒙期奠定基礎。
在變革性技術的發展歷程中,每一次波峰波谷都有意義。
從圖靈機到IBM的超級計算機深藍,從機器學習到神經網絡,從AlphaGo到ChatGPT,每一個裡程碑之間都充滿失望、懷疑和寒冬,將視線拉長,人類走到今天已經取得長足的進步。無論是否有泡沫,未來永遠是樂觀者和實幹者創造的。