NVIDIA發佈工具包 使基於文本生成的AI更安全


對於所有的大肆宣傳,像OpenAI的GPT-4這樣的文本生成人工智能模型會犯很多錯誤--其中一些是有害的。這些模型背後的公司說,他們正在采取措施解決這些問題,比如實施過濾器和人類版主團隊來糾正被標記的問題。但沒有一個正確的解決方案。即使是今天最好的模型,也容易受到偏見、毒性和惡意攻擊的影響。

f6597d45-nvidia-image-nemo-guardrails-1280x680-1-1024x544.jpg

為追求"更安全"的文本生成模型,NVIDIA今天發佈NeMo Guardrails,這是一個開源工具包,旨在使人工智能驅動的應用程序更加"準確、適當、符合主題和安全"。

NVIDIA的應用研究副總裁Jonathan Cohen說,該公司已經在Guardrails的底層系統上工作"多年",但就在大約一年前意識到它很適合GPT-4和ChatGPT這樣的模型。

"從那時起,我們一直在朝著NeMo Guardrails的這個版本發展,"Cohen通過電子郵件表示。"人工智能模型安全工具對於為企業用例部署模型至關重要。"

Guardrails包括代碼、示例和文檔,用於為生成文本和語音的AI應用"增加安全性"。NVIDIA聲稱,該工具包旨在與大多數生成性語言模型配合使用,允許開發人員使用幾行代碼創建規則。

41a30f86-nvidia_guardrails.png

具體而言,Guardrails可用於防止--或至少試圖防止模型偏離主題,用不準確的信息或有毒的語言進行回應,以及與"不安全"的外部來源建立聯系。例如,可以考慮不讓客戶服務助理回答關於天氣的問題,或者不讓搜索引擎聊天機器人鏈接到不值得信賴的學術期刊。

Cohen說:"最終,開發者通過Guardrails控制他們的應用程序的界限,"他說。"他們可能會開發出過於寬泛的護欄,或者反過來說,對於他們的用例來說過於狹窄。"

對語言模型的缺點進行普遍修復,聽起來好得不像真的--事實上也是如此。雖然像Zapier這樣的公司正在使用Guardrails為他們的生成模型增加一層安全保障,但NVIDIA承認,這個工具包並非不完美;換句話說,它不會抓住一切不對勁的地方。

960x0.jpg

Cohen還指出,Guardrails與那些"足夠擅長遵循指令"的模型配合得最好,比如ChatGPT,以及使用流行的LangChain框架來構建AI驅動的應用程序。這使一些開源的選擇失去資格。

而且,撇開技術的有效性不談,必須強調的是,NVIDIA不一定是出於善意而發佈Guardrails的。它是該公司NeMo框架的一部分,可通過NVIDIA的企業AI軟件套件及其NeMo完全管理的雲服務獲得。任何公司都可以實施Guardrails的開源版本,但NVIDIA肯定更希望他們為托管版本付費。


相關推薦

2022-10-05

醫療機構實施人工智能的最常見痛點。影像實驗室提供對NVIDIA公司和Monai創建的現成的基於人工智能的註釋工具的訪問,這些工具可以執行重復性的手工任務,如標記醫療圖像。Google的BigQuery和Looker服務也在其中,可用於搜索和

2023-03-22

算服務DGX Cloud、加速企業創建大模型和生成式AI的雲服務NVIDIA AI Foundations等,並宣佈與日本三菱聯合打造日本第一臺用於加速藥研的生成式AI超級計算機。英偉達也發佈一系列面向元宇宙、汽車、量子計算領域的新進展,包括PaaS

2024-03-23

NVIDIA AI Workbench。AI Workbench是一款面向AI大模型開發人員的工具包,可以幫助開發人員消除很多繁瑣、復雜的部署、開發流程。無論你的技術水平如何,開發人員都可以體驗快速可靠的 GPU 環境設置以及跨異構平臺工作、管理和協

2023-08-10

機圖形學頂會SIGGRAPH上,老黃宣佈英偉達最新的超級芯片NVIDIADGXGH200GraceHopper。這塊芯片搭載全球最快的內存,不僅帶寬每秒5TB,內存容量更是暴增接近50%來到141GB,“任何大語言模型都能運行”。同時,英偉達還宣佈和Hugging Face

2024-02-27

過預置的Colab和Kaggle notebooks,以及與Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,用戶可以輕松開始探索Gemma。- Gemma模型既可以在個人筆記本電腦和工作站上運行,也可以在Google Cloud上部署,支持在Vertex AI和Google Ku

2023-03-23

英偉達、Adobe在內的全球多傢科技巨頭公司都不約而同地發佈或開放生成式AI新技術,其中微軟和Adobe發佈與圖像生成相關的新應用。然而,AI不僅可以幫助人類,也會被利用來戲弄人類。例如,近日互聯網上流傳著美國前總統特

2023-04-14

洞並提出補救建議。亞馬遜CEO安迪·賈西(Andy Jassy)周四發佈2022年度股東信稱:“我可以為LLM(大語言模型)和生成式AI專門寫一封信,因為我認為它們將具有革命性,對我們的客戶、股東和亞馬遜來說將是一件大事。”這封信

2024-02-18

業的未來遊戲規則。Google新模式性能完勝周四,Google突然發佈新一代多模態大模型Gemini 1.5 Pro,在與OpenAI的大模型之戰中加速超越。這是業界迄今最強的大語言模型,最高可支持10,000K Token上下文,直接將性能提升到百萬級別,

2023-02-21

很低,一篇論文隻要0.50美元不到。Greene和Pividori在1月23日發佈的預印本論文中描述這個助理,它不是一個人,而是一個AI算法,名叫GPT-3,2020年首次問世。這是一個當下很火的生成式AI對話工具,能生成通順流暢的文本,無論是

2024-01-31

出一款新的生成式人工智能工具Lumiere,它將幫助你通過基於文本的命令創建更逼真的圖像和視頻。Lumiere的一大亮點是,它能夠制作出看起來逼真的動作,而且不會出現不連貫的情況。之所以能做到這一點,是因為該軟件能在同

2024-03-19

Blackwell做準備。同時英偉達將持續基於AI強化生態,比如NVIDIA Omniverse Cloud將可以連接到蘋果公司混合頭顯Vision Pro、加強模型與通用機器人生態等。黃仁勛還介紹人形機器人基礎模型Project GR00T、新款人形機器人計算機Jetson Thor,

2023-08-10

概括來說,AI Workbench為開發者提供一個統一且易於使用的工具包,能夠快速在PC或工作站上創建、測試和微調模型,並無縫擴展到幾乎任何數據中心、公有雲或NVIDIA DGX Cloud上。具體而言,AI Workbench的優勢如下:-易於使用AI Workbenc

2023-01-16

據預印本平臺bioRxiv12月底發佈的一份預印報告顯示,一篇由人工智能(AI)聊天機器人寫出的研究論文摘要,甚至最終能騙過專傢審核。這一報告一經發出就受到人們的廣泛關註,研究人員對該AI機器人的影響力有著巨大爭議。

2023-04-06

詳細介紹其確保AI安全的方法,包括進行安全評估、改進發佈後的保障措施、保護兒童以及尊重隱私等。該公司表示,確保AI系統的構建、部署和安全使用對實現其使命至關重要。以下是OpenAI帖子的全文:OpenAI致力於確保強大的AI