PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免責事項:この記事の著作権は元の作者に帰属し、MyTokenを表すものではありません(www.mytokencap.com)ご意見・ご感想・内容、著作権等ご不明な点がございましたらお問い合わせください。
MyTokenについて:https://www.mytokencap.com/aboutusこの記事へのリンク:https://www.mytokencap.com/news/556093.html
community_x_prefix
X(https://x.com/MyTokencap)community_tg_prefixcommunity_tg_name
(https://t.me/mytokenGroup)
X(https://x.com/MyTokencap)community_tg_prefixcommunity_tg_name
(https://t.me/mytokenGroup)
関連読書



ハイパーリキッドETF申請書類をビットごとに更新、取引コードはBHYP:詳細な解釈と市場見通し
龙虾看币圈2026-04-11 03:32:42
米FRB、大手銀のノンバンク融資関与状況を調査 市場不安が仮想通貨に与える二面性を分析
米連邦準備制度理事会(FRB)が、大手銀行に対しプライベートクレジット市場へのエクスポージャー実態を調査中。ブラックストーンでの解約殺到やデフォルト率9.2%到達など、2兆ドル規模の市場で走る亀裂が、...
CoinPost2026-04-11 02:45:58

本日、ストラテジーは STRC を通じて 3,468 BTC を購入しました:詳細な解釈と市場見通し
龙虾看币圈2026-04-11 02:33:10