完全免費!星火開源-13B發佈:首個基於全國產化算力平臺”飛星一號”的開源大模型


快科技1月30日消息,今天訊飛正式發佈星火開源-13B,這是首個基於全國產化算力平臺”飛星一號”的開源大模型。

目前,華為昇思開源社區已正式上架星火大模型開源版-13B,面對學術、企業研究完全免費,增進學術合作的同時,增進產業探索。

據解,本次開源擁有130億稠密參數(13B),包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat,開源微調工具iFlytekSpark-13B-Lora、人設定制工具iFlytekSpark-13B-Charater。學術企業研究可以基於全棧自主可控的星火優化套件,更便利地訓練自己的專用大模型。

劉慶峰透露,星火開源大模型在技術上形成差異化優勢。星火開源-13B在多項知名公開評測任務中名列前茅。

在文本生成、語言理解、文本改寫、行業問答、機器翻譯等企業典型場景中,通過對學習輔助、語言理解等領域的深入研究和優化,實用性大幅提升,在處理復雜的自然語言任務時更加得心應手。

基於飛星一號”訓練,星火開源大模型全棧國產適配優化,簡單易用,場景應用效果領先,訓練策略針對昇騰算力極致優化,訓練效率達A100的90%。

科大訊飛表示,不僅是對昇騰AI硬件的進一步深度優化,也展示國產算力在追趕國際先進水平方面的決心和能力。


相關推薦

2024-04-22

適配國產算力平臺,130億參數的iFlytekSpark-13B,證明中國完全可以靠自研踏踏實實地走出自己的大模型發展之路。

2024-03-28

飛計劃在今年6月,正式發佈對標GPT-4(Turbo)當前能力的星火大模型V4.0版本。”劉聰還透露,訊飛星火大模型V4.0目前正在訓練中。訊飛星火大模型從去年5月6日首次發佈以來,已迭代到V3.5,在語言理解、數學能力、語音交互能

2024-06-27

快科技6月27日消息,在今天下午舉辦的訊飛星火V4.0發佈會上,訊飛首次展示復雜場景下三人同時語音轉寫,效果震撼全場。在現場演示中,三位工作人員在嘈雜的環境中同時說話,每個人的語音都被訊飛星火準確識別,且同步

2023-11-09

目前大傢還都在探索。”在陳冉看來,國內的大語言模型完全原創的較少,有些是在transformer架構上做一個整體調優,本質是在算子上做調優,而沒有本質上的改變。還有一些走開源路線的廠商,更多是在中文方面深入研究。大

2024-06-27

場主題為懂你的AI助手”的發佈會,正式推出全新的訊飛星火大模型V4.0,並展示其在醫療、教育、商業等多個領域的人工智能應用。據劉慶峰介紹,星火大模型V4.0的訓練依托於國內首個國產萬卡算力集群飛星一號”,實現七大

2024-06-25

公司將於2024年6月27日在北京國傢會議中心如期發佈訊飛星火大模型的最新進展。據悉,本次發佈會以懂你的AI助手”為主題,發佈訊飛星火大模型V4.0及相關落地應用。全面提升大模型底座七大核心能力,對標GPT-4Turbo,並發佈多

2024-02-27

完整的工具鏈,支持模型推理和監督式微調(SFT),並且完全兼容最新的Keras 3.0。- 通過預置的Colab和Kaggle notebooks,以及與Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,用戶可以輕松開始探索Gemma。- Gemma模型既可以

2024-03-21

開發者跳雙人舞的“社區遊戲”,但Grok這個“舞伴”,完全不是普通開發者所能掌控的。在Grok-1之前,很多開源大語言模型(LLM)的參數量隻有70億,LLaMA-2開源的最大參數量也隻有700億。而馬斯克直接開源自傢尺寸最大的3140億

2024-09-18

去商業化,而是幫助開發者,開源的策略與阿裡雲的初心完全一致。”在他看來,要在AI創新技術與模型層出不窮的當下,開源是“最佳也是唯一的途徑”。Part.2開源VS閉源,誰是贏傢?在大模型時代開啟之時,開源和閉源就一直

2024-02-22

如果模型生成的後續 50 個 token 與文本中的真實後續文本完全匹配,則將該文本分類為已記憶。圖 2 將評估結果與同等規模的 PaLM 和 PaLM 2 模型進行比較,結果如下所示。隱私數據對大模型來說,隱私數據被記住的可能性是一件

2024-02-22

le連續放出三個大招,先是9日宣佈其最強大模型Gemini Ultra免費用,又在16日放出大模型“核彈”Gemini 1.5,再是21日突然放出開源模型Gemma,動作之密集、行動之迅速,似乎在向搶自己風頭的OpenAI宣戰。Gemma具體強在哪兒?它在哪些

2023-11-10

千問140億參數模型Qwen-14B及其對話模型Qwen-14B-Chat,並且可免費商用。吳泳銘還表示,以大模型為代表的AI技術驅動的發展加速度將遠遠超過我們的想象,將對對生產力和生產關系、數字世界和現實世界產生全面的深遠影響。而在A

2023-12-23

據悉,本次通過評測的首批大模型中,通義千問是唯一的開源模型,在全球擁有廣泛的開發者用戶和企業客戶,其性能表現及安全性得到大范圍的公開檢驗。12月1日開源後,通義千問72B在10個權威基準評測中創下開源模型最優成

2024-03-28

美國當地時間周三,企業軟件公司Databricks宣佈推出新的開源人工智能模型DBRX,聲稱這一模型在開源人工智能領域的效率和性能上樹立新的行業標準。Databricks宣稱,DBRX模型擁有1320億個參數,在語言理解、編程和數學技能等關鍵