PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免責事項:この記事の著作権は元の作者に帰属し、MyTokenを表すものではありません(www.mytokencap.com)ご意見・ご感想・内容、著作権等ご不明な点がございましたらお問い合わせください。
MyTokenについて:https://www.mytokencap.com/aboutusこの記事へのリンク:https://www.mytokencap.com/news/556093.html
関連読書



仮想通貨決済カード、2024年末から1日あたりの取引量が22倍に
仮想通貨決済カードの1日あたりの取引量が2024年12月から22倍に急増し約6万件に達した。Etherfiが市場をリード。新興国市場で通貨不安のヘッジ手段として需要拡大。...
CoinPost2026-01-21 03:10:00

仮想通貨市場で長期的に価値が蓄積されるセクターは? 米大手証券会社が分析
チャールズ・シュワブが仮想通貨市場で価値の蓄積しやすいセクターを分析した。また、個別のトークンの価値を評価する上での指標5つも提案している。...
CoinPost2026-01-21 02:30:34

ポルトガルがポリマーケット遮断命令、大統領選での疑惑取引を問題視
ポルトガル当局が分散型予測市場ポリマーケットの遮断を命令した。大統領選での疑惑取引が背景にある。米国の一部州でも規制強化を進める動きがある。...
CoinPost2026-01-21 02:05:37