深度求索下月推出AI大模型DeepSeek-R2
時間:2025-04-30
來源:18183新聞
责任编辑:夏雨星梦
【4月29日訊息,據國內媒體報導稱,深度求索可能會在下個月有所動作,推出下一代AI大模型DeepSeek-R2。
據報導,DeepSeek-R2將採用一種更先進的混合專家模型(MoE),並結合了更加智慧的門控網絡層(Gating Network)來優化高負載推理任務的效能。此舉預計將大幅提升模型對於複雜任務的處理能力。
分析師指出,DeepSeek-R2的定價可能遠低於OpenAI同類產品,這或許會顛覆現有的AI服務定價模式。此外,有消息透露DeepSeek-R2的成本相較於GPT-4下降了97%,並且是在昇騰卡上進行訓練,強調了一種全方面產業鏈自主可控的特點。
相關人士透露,DeepSeek-R2的總參數量可能會達到1.2兆,這是DeepSeek-R1的6,710億參數的大約兩倍之多。該模型基於華為昇騰910B(Ascend 910B)芯片群集進行訓練,在FP16精度下實現512PetaFLOPS的計算能力,且芯片使用效率達到了82%。
根據華為實驗室的數據顯示,這樣的性能相當於NVIDIA前一代A100訓練集群的91%左右。儘管這些數據還需要進一步驗證,但看來確實展現出更強大和更高自主性的特徵。】
免責聲明:文中圖文均來自網絡,如有侵權請聯系刪除,18183新遊發布此文僅為傳遞信息,不代表18183認同其觀點或證實其描述。
用戶評論
深度求索下月推出AI大模型DeepSeek-R2
大阪世博會文明之森因倒塌風險封閉
微軟將推出多款新型Xbox控制器
高德發布五一假期出行預測報告
《龍石戰爭》亮相騰訊遊戲發布會,革新SLG策略體驗
五一連假熱門城市與景區排行榜出爐
GameStop強制綁定銷售Switch 2引發爭議
德里克·羅斯現身成都,引爆NBA 2K手遊籃球盛會
《百日戰紀 -最終防衛學園-》小高和剛親自推薦
Bethesda 應在《上古卷軸 6》中回歸經典 RPG 設計
《光與影:33號遠征隊》全面售罄
《最後生還者2》喬爾之死引熱議
《全面戰爭:三國》Steam 2.5折新史低折扣
《明末:淵虛之羽》公布2025年7月24日發售日期
《暗喻幻想:ReFantazio》主角可動模型2025年10月上市
BANDAI SPIRITS將於2025年發售超級賽亞人孫悟空模型
聯想推出 ThinkPad T14p 2025 系列新品
GSC推出《賽馬娘Pretty Derby》L尺寸POP UP PARADE模型