千億開胃菜 中國電信開源12B星辰大模型:性能提升30%


快科技4月17日消息,中國電信近期宣佈開源其12B參數規模的巨型AI模型TeleChat-12B,此舉標志著國內大模型技術發展的又一重要進展。

與1月份發佈的7B參數版本相比,TeleChat-12B在內容理解、性能表現和應用場景等方面實現約30%的整體提升,特別是在多輪對話推理和安全相關領域的能力上,提高超過40%。

此外,有消息稱,中國電信計劃在今年內推出參數規模達到千億級的超大型AI模型

為確保模型的高效能,TeleChat-12B將訓練數據量從7B版本的1.5TB增加至3TB,顯著提高數據的質量和模型的性能。

TeleChat-12B還利用電信用戶的實際交互數據,對獎勵模型和強化學習模型進行優化,有效提升模型在問答場景中的表現。

目前,星辰大模型已經被應用於多種實際場景,包括文本創作、編程、網絡故障分析和業務經營分析等。以文本創作為例,該模型平均生成的文本長度超過1500字,且有效采納率高達85.7%。

在對外服務的企事業單位客戶中,星辰大模型支持企業經營分析、政務咨詢、民生訴求響應等多樣化場景,能夠涵蓋95%的實際業務需求,並且在多輪對話理解中的準確率達到90%。

除在傳統行業中的應用,星辰大模型也在積極探索更多前沿領域的應用,例如在無人機智能編排和輕量化建設方面取得新的進展。


相關推薦

2024-05-26

快科技5月26日消息,日前,中國電信人工智能研究院發佈業內首個支持30種方言自由混說的語音識別大模型星辰超多方言語音識別大模型。該大模型解決單一模型隻能識別特定單一方言的痛點,能同時識別理解粵語、上海話、四

2024-06-19

快科技6月19日消息,據中國電信”官微發文,中國電信人工智能研究院(TeleAI)聯合北京智源人工智能研究院發佈全球首個單體稠密萬億參數語義模型Tele-FLM-1T,成為國內首批發佈稠密萬億參數大模型的機構。面對大模型訓練過

2024-07-19

持續進階,為用戶帶來科技與時尚兼具的絕妙體驗。作為中國電信首款自主品牌AI手機終端,麥芒30 5G首次搭載星辰大模型,為用戶帶來前所未有的智能體驗;便捷X鍵,日常使用操作方便,多種功能快人一步。麥芒30 5G采用閃耀

2024-04-01

發佈,並同步開源4000億參數MoE超級模型。這一模型采用4千億級參數MoE混合專傢模型,是全球模型參數最大、性能最強的MoE模型之一。相較於上一代天工2.0”MoE大模型,天工3.0在多個領域均展現驚人的性能提升。其在模型語義理

2024-07-11

2:萬億參數的 MoE 模型,目前還需要申請才能體驗;Step-1.5V:千億參數多模態模型,除圖片理解能力提升外,也支持視頻理解;Step-1X:圖像生成模型,DiT 架構,600M、2B、8B 三種不同的參數量。不過一個疑問是,靠這三個模型還有出路

2024-05-21

1億參數對應訓練成本在1.5到3萬人民幣之間。因此,一個千億級參數的模型單次訓練成本預估在三千萬至五千萬人民幣之間。Anthropic的首席執行官Dario Amodei也預測過,未來兩年內模型成本將達到100億美元。顯然,API調用和研發的

2023-11-14

練,該計算機提供512個AMD Instinct MI250X GPU,能夠提供74拍千億次的計算能力。Sarlin表示,Poro的設計目的是解決為歐洲低資源語言(如芬蘭語)訓練性能卓越的核心挑戰。通過利用跨語言訓練方法,模型能夠利用來自高資源語言(如

2024-04-09

能技術的發展,並已推出Step系列通用大模型,包括Step-1千億參數語言大模型、Step-1V千億參數多模態大模型,以及Step-2萬億參數MoE語言大模型的預覽版,並基於這些模型開發產品效率工具躍問和A特別值得一提的是,這兩款產品都

2024-04-19

媲美 Gemini 1.5 Pro、全面超越 Claude 大杯以上還隻是 Meta 的開胃小菜,真正的大餐還在後頭。在未來幾個月,Meta 將陸續推出一系列具備多模態、多語言對話、更長上下文窗口等能力的新模型。其中,超 400B 的重量級選手更是有望

2023-03-15

LM(alpha內測版:QAGLM),這是一個初具問答和對話功能的千億中英語言模型, 並針對中文進行優化,現已開啟邀請制內測,後續還會逐步擴大內測范圍。與此同時,繼開源 GLM-130B 千億基座模型之後,我們正式開源最新的中英雙

2023-07-08

發佈80多個大模型產品。接下來,京東將在7月13日發佈的千億級言犀大模型”,中國移動將於近期發佈九天”1 N大模型。10月24日,科大訊飛將發佈通用大模型,全面對標ChatGPT。到今年下半年,預計市面上的大模型將超過百款,

2023-10-31

2023杭州雲棲大會上,阿裡雲首席技術官周靖人正式發佈千億級參數大模型通義千問2.0。在10個權威測評中,通義千問2.0綜合性能超過GPT-3.5,正在加速追趕GPT-4。當天,通義千問APP在各大手機應用市場正式上線,所有人都可通過APP

2023-11-10

璀璨計劃”等,並成立天翼雲圖空間計算產業生態聯盟。中國電信副總經理唐珂致辭,中國電信及相關合作夥伴發表主旨演講。唐珂認為渠道“三化升級”,構建以客戶為中心的新型渠道銷售服務體系,打造全場景、全流程、全

2022-06-27

半場則是全面賦能數智社會,讓整個行業走向萬兆體驗和千億連接。具體而言,“第一,5G下行將會達到泛在的10Gbps,速率相對於5G再提升10倍;第二,上行泛在體驗從當前的10M左右提升近100倍,尤其是To B行業,上行需要大幅度