微軟這麼快就集成GPT-4,如何做到的?項目組甚至周末加班


4月6日消息,微軟已將OpenAI的GPT-4集成到Microsoft365生產力應用套件中,這是一項非常艱巨的任務,但公司一直希望能夠盡快完成。因此,微軟動員數百名員工,讓他們長時間加班工作,一起頭腦風暴產品方案,基於一個統一的設計框架,開發出三種人工智能助手的工作模式。


以下是翻譯內容:

“3-16”

過去幾個月裡,這是在微軟的會議室和走廊裡被無數次提及的一個詞。它指的是3月16日,當天微軟宣佈將與OpenAI共同開發的生成式AI模型引入Microsoft 365生產力應用套件中。通過集成GPT-4,包括Outlook、Word和Teams在內的每個生產力應用程序都將擁有基於生成式人工智能的Copilot(智能副駕駛)。目前,20多個微軟客戶正在對這項技術進行測試。

將人工智能助手集成到如此多的應用程序中是一項艱巨的任務,但微軟希望盡快完成。去年11月,OpenAI發佈的ChatGPT引發全球轟動,掀起一場人工智能競賽,各傢企業都在爭分奪秒地推出新的人工智能產品和功能,以搶占市場先機。即使是已經與OpenAI合作和投資過的微軟也不例外

微軟設計總監喬恩·弗裡德曼(Jon Friedman)負責Microsoft 365中的Copilot產品設計。他表示這個項目需要數百名微軟員工的長時間工作,包括設計師、工程師、產品經理、營銷人員、數據科學傢以及道德倫理團隊等等,整個項目要持續幾個月時間,甚至需要在周末加班。弗裡德曼說,這個計劃還需要人們克制自我,共同努力,才能在如此短的時間內建成如此大的項目,讓大傢都感到他們必須放下自我,團結一致。

弗裡德曼說:“我們可以一起做一些真正大膽而重大的事情,這讓人很興奮。雖然我們在人工智能方面擁有很多經驗,但這種特殊的生成式人工智能更強大,所以我認為每個人都在抱著學習的心態工作。”

全新的用戶體驗

弗裡德曼認為,Copilot是一種“對話式用戶體驗”的新形式,它可以調用更多豐富的資源。他表示,Copilot是一款辦公助手,代表“用戶界面設計的新前沿,就像第一代觸屏設備一樣改變既定模式”。據悉,Copilot是基於GPT-4大型語言模型開發,預訓練大量互聯網內容,並可以訪問微軟Graph中的業務數據,從而自動生成電子郵件和會議要點等內容。

設計Copilot這種用戶界面的挑戰在於,在人們通常使用Word和Powerpoint等應用程序進行工作時,如何以及何時展示這個全新的人工智能助手。

弗裡德曼表示,最初設計這種可以通過各種生產力應用程序調用的人工智能助手隻是“一個模糊的想法”。但隨著設計團隊對人工智能助手在實際業務中的應用有更深入的解,這種想法開始逐漸明確。首先,設計團隊需要發現人工智能在實際應用中可以明顯節省用戶時間或以某種方式激發創造力等具體用例,這是用戶體驗設計過程的第一步。

最解相關用例的人包括每個生產力應用程序的工程師、產品經理、設計師和計算機科學傢。弗裡德曼的設計團隊與他們通力合作。在Copilot項目啟動時,他要求所有產品團隊共同頭腦風暴,探討如何利用生成式人工智能來提升生產力應用程序的功能。接著,弗裡德曼成立一個特殊的橫向設計團隊,與所有應用程序團隊合作,以在每個應用程序中展示Copilot的效果。

弗裡德曼表示,隨著各個應用程序團隊開始制定用例,橫向設計團隊開始註意到這些用例之間的共性,即與多個應用程序相關的人工智能用例。

弗裡德曼回憶起當時的頭腦風暴過程時說:“我們的討論非常有價值……我們討論的是Copilot具體的功能需求,例如新的生成式語言模型如何幫助我們更好地完成寫郵件摘要的任務?”

隨著跨應用用例變得越來越清晰,橫向設計團隊開始認為,每個應用程序的人工智能助手功能並不需要各自不同。

弗裡德曼表示:“因為你有很多人……試著觀察各個場景,能夠大致做出這種判斷,比如說‘啊,也有這個東西出現’。”

因此,他們開始構思一個設計框架,讓一個通用助手以幾種不同的可預見方式在各個應用程序中工作。

三個層次的Copilot

弗裡德曼領導的設計團隊創建一個深度文檔庫,旨在幫助整個項目的設計師在給定的應用程序中為人工智能創建切入點。他們指導設計師根據用戶可能參與的不同任務確定如何調用Copilot。弗裡德曼說:“有這樣一個觀念,Copilot應該在正確的層次出現,完成正確的工作。”

設計框架規定,Copilot在應用程序用戶界面中可以有三種展示方式。

第一種是身臨其境的用戶體驗,讓人工智能助手專註於具體業務項目,而不是某個特定的應用程序,這樣實際上可以從多個應用程序中提取數據或要點,服務於手頭的工作。例如,Copilot可能會從團隊會議、幻燈片或電子郵件內容中收集項目裡程碑或風險點,然後在項目計劃文檔中進行總結和歸納。

“沉浸式”體驗模式是Copilot在生產力應用套件中最強大的功能,也可能是最有影響力的。市場咨詢公司恩德勒集團(Enderle Group)首席分析師鮑勃·恩德勒(Rob Enderle)認為,這也可能有助於解決Microsoft生產力套件長期以來存在的問題——各個應用程序之間的集成不夠緊密。 恩德勒說,原因可能是最初微軟是從其他公司相繼收購這些應用程序,彼此之間並沒有共用代碼庫。但Copilot可以覆蓋到所有應用程序,至少能讓用戶感覺到這些應用程序能在某些任務中協同工作。

弗裡德曼說,第二種展示方式是“輔助”,這意味著Copilot就像挎鬥三輪摩托車的“邊鬥”,在特定的應用程序中幫助用戶最大限度地調用應用程序功能。例如,在PowerPoint中,Copilot可以向用戶展示應用程序的深層圖形功能如何用於描述復雜數據集;在Outlook中,Copilot可以幫助用戶理解電子郵件中最重要的內容;在Word中,Copilot可以提供有關如何更好編寫文檔、貼合特定寫作風格的反饋意見。

此外,在Copilot的“嵌入式”展示方式中,人工智能可以在應用程序中發揮生成式和創造性能力。例如,Copilot可能會出現在Word文檔的彈窗中。“這就像是一種隨機體驗。” 弗裡德曼說,“當你全身心投入工作時,Copilot可以幫助你解決寫作瓶頸,或者自動用文本內容幫助你開始做幻燈片。”

弗裡德曼表示,Copilot的橫向設計團隊開始采用“三個層次”的概念來描述這項工作,各個應用程序團隊的成員也逐漸接受這個框架。

他說,“我們已經與首席執行官納德拉和公司高管團隊的其他成員分享這個框架,並且基本上得到所有人的認可。這種想法可以適用於三個不同的工作層次。”

Copilot這個名字不是專門為Microsoft 365而設立的。微軟旗下的GitHub在2021年曾使用這個名字來稱呼編程助手,其中部分功能也采用OpenAI的大型語言模型。而微軟正在創建一個具有一致性的Copilot助手,能夠在不同的生產力應用套件中執行某些標準化功能。對於長期使用生產力應用程序的用戶,這項新工作很可能會減少他們在新版Microsoft 365正式推出時所遇到的生疏感。通過使用統一的助手,用戶可以更方便地使用不同的應用程序,從而提高工作效率。

隨著生成式人工智能進一步融入微軟的消費級和企業級產品,Copilot品牌和概念可能會擴展到Windows操作系統甚至LinkedIn等微軟其他產品。

“納德拉非常喜歡這個名字,因為它恰如其分地描述人工智能助手的工作,”弗裡德曼說。“它的存在是為幫助你,在許多任務中指引你的方向……”(辰辰)


相關推薦

2024-03-27

GPT-5還未發佈,GPT-6已經在路上?微軟工程師曝出,為GPT-6搭建10萬個H100訓練集群,整個電網卻被搞崩。通往AGI大關,還需要破解電力難題。GPT-6也被電力卡脖子——部署十萬個H100時,整個電網發生崩潰!就在剛剛,微軟工程師爆

2024-03-03

AI 這小子,違背造福全人類的非營利性的創立協議,成給微軟賺錢的工具。“ 尋求開源技術以造福公眾 ”這個目標,不僅僅是奧特曼給馬斯克的口頭承諾。更被寫在 OpenAI 的公司註冊證裡。不僅要專註人類利益,做到非營利,

2023-03-15

Card不僅如此,傳聞的“必應早就用上GPT-4”在今天也得到微軟方面的證實:沒錯,確實是這樣的!不得不說,自打ChatGPT問世以來,微軟和Google之間打響的數輪科技戰役,微軟這次又雙叒叕贏麻。甚至這一次,不少網友都發出“

2022-11-13

有穩定的調薪和晉升,但現在,漲薪和晉升的速度都沒那麼快,人員流動的速度也相對比較慢。以前一個項目周期短則兩三個月,長則半年,但在這裡可能需要一兩年、兩三年,工作節奏相較在大廠時會慢一些。不過因為剛到一

2023-02-20

微軟的必應搜索引擎嵌入ChatGPT後,它的智能程度震驚世人。一夜之間,人們似乎都在期待,智能搜索引擎會怎樣幹掉以谷歌和百度為代表的傳統搜索引擎?ChatGPT火好一陣,各種消息還是層出不窮。有人讓它幫自己寫文案,有人

2023-03-15

類,但在各種專業和學術基準上表現出人類水平的表現。微軟在GPT-4發佈後第一時間表示,新的必應(Bing)已經基於GPT-4 技術運行,這是為搜索產品量身定制的模型產品。“如果你在過去五周內的任何時候使用過新的Bing預覽版

2023-11-14

業龍頭、美國AI技術初創公司OpenAI計劃從其最大的投資者微軟公司處獲得更多的資金支持,用以創造相當於人類智慧程度的AI——通用人工智能(AGI)。OpenAI聯合創始人兼首席執行官山姆·阿爾特曼(SamAltman)最新在采訪時表示,

2023-03-10

最近,微軟是喜訊連連。昨天,微軟德國CTO在活動中透露,GPT-4將在下周發佈,將提供多模態模型。毫無疑問,微軟要搞個大的——GPT-4將轉向多模態,Kosmos-1也是多模態,微軟亞研院3月8日提出的VisualChatGPT,也把視覺基礎模型整

2023-03-16

方”。“全球大廠中,百度是第一個發佈的,大傢都知道微軟是直接調用OpenAI,其它的大廠現在都沒有真正發佈同類型、同級別的產品。百度是第一個。”李彥宏說,文心一言這樣的大語言模型,會成為每個人必不可少的生產力

2023-03-17

至於監管後的結果如何,是值得拭目以待的。發現三:與微軟高層想法背道而馳接下來的發現,是根據論文第57頁中的這句話:One concern of particular importance to OpenAI is the risk of racing dynamics leading to a decline in safety standards, the diffusion

2023-12-03

來說,卻很不受用。後來,這場為期五天的動亂,被部分微軟員工稱為“Turkey-Shoot Clusterfuck”(壓倒性的大規模混亂)。彼時,納德拉已經和Altman密切合作四年,對他越來越信任。大爆款ChatGPT塞進Office Copilots後,微軟的核心生

2023-03-27

在通往AGI的路上我們還有多遠?微軟豪華作者團隊發佈的154頁論文指出,GPT-4已經初具通用人工智能的雛形。GPT-4會演變為通用人工智能嗎?Meta首席人工智能科學傢、圖靈獎得主YannLeCun對此表示質疑。在他看來,大模型對於數據

2023-03-24

訂航班和酒店!這個瀏覽功能,使用的是必應的搜索API,微軟在兩方面下大功夫:(1)保證信息來源的可靠性和真實性; (2)開啟“安全模式”,防止檢索不適當的內容。插件在一個孤立的服務中運行,因此ChatGPT的瀏覽活動

2023-11-20

)對這一事件的評估。阿克曼還說:“馬斯克的魯莽評論這麼快就招來全世界的攻擊,真是令人驚訝。馬斯克並不完美,但世界因為他而變得更加美好。”今年10月初,阿克曼曾表達與馬斯克的X公司進行接觸的興趣,考慮在一項