ETNet 新聞 【AI】梁文鋒署名DeepSeek新論文,提出mHC新架構優化大模型性能 Future Wealths 2 1 月, 2026 One Min Read 4 Views 0 Comments 《經濟通通訊社2日專訊》DeepSeek團隊發布新論文,提出了一種名為mHC(流 形約束超連接)的新架構,旨在解決傳統超連接在大規模模型訓練中的不穩定性問題,同時保持 其顯著的性能增益。DeepSeek創始人梁文鋒也在作者名單中。 論文公布了DeepSeek-V3在訓練和推理過程中,如何解決「硬件瓶頸」的方法 :mHC通過將傳統Transformer的單一殘差流擴展為多流並行架構,並利 原文 Last Update: 2 1 月, 2026