ETNet 新聞 【AI】華為將發布AI推理創新技術UCM提升推理體驗 Future Wealths 12 8 月, 2025 One Min Read 6 Views 0 Comments 《經濟通通訊社12日專訊》2025金融AI推理應用落地與發展論壇上,華為將發布 AI推理創新技術UCM(推理記憶數據管理器)。該推理加速套件以KVCache為中心 、融合了多類型緩存加速算法工具,能夠分級管理推理過程中產生的KVCache記憶數據 ,擴大推理上下文窗口,以實現高吞吐、低時延的推理體驗,降低每Token的推理成本。 據介紹,推理體驗直接關係到用戶與AI交互時的感受,包括回 原文 Last Update: 12 8 月, 2025