PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读


体育预测交易平台PRED完成250万美元种子轮融资,Accel领投
体育预测交易平台PRED已完成由Accel领投的250万美元种子轮融资,其它参投方还有Coinbase Ventures旗下的Base Ecosystem Fund (BEF)以及Reverie等。...
PANews2026-02-17 15:15:00
Wintermute:BTC在200周均线找到支撑,重启上行需宏观明朗
对加密而言,回到上行轨道的关键仍取决于宏观清晰度。200 周均线仍在守住,而且市场并未出现结构性损伤,这意味着一旦宏观不确定性消退,修复的速度可能会比当前情绪暗示的更快。短期我们处于区间震荡、偏下行的...
PANews2026-02-17 14:33:00
加密货币交易所 Gemini 三位高管在 IPO 数月后集体离职
加密货币交易所 Gemini Space Station Inc. 在周二宣布,公司首席运营官、首席财务官和首席法务官将立即离职。值得注意的是,同时担任 Gemini 董事会成员的 Marshall ...
PANews2026-02-17 14:16:00