小米公司近日宣布,其自研的大模型MiLM已實現從一代到二代的升級,新模型MiLM2在多項關鍵技術上取得顯著突破,進一步提升了模型性能和應用場景。
據了解,MiLM2在模型參數規模上進行了大幅擴充,同時優化了數據品質和訓練策略。新模型不僅支持云邊端結合,參數尺寸也更為靈活,最小為0.3B,最大可達30B,滿足了不同場景下的需求。
在能力維度上,MiLM2相較于一代模型平均提升了超過45%。特別是在指令跟隨、翻譯和閑聊等關鍵能力上,新模型的表現處于業界前列。這一進步對于小米推進“人車家全生態”戰略具有重要意義,有助于提升智能生態系統的整體性能。
MiLM2在端側部署上也取得了新的突破。新模型支持三種推理加速方案,包括大小模型投機、BiTA和Medusa。通過自研量化方案,相較于業界標準,量化損失降低了78%。同時,新模型還支持更長的窗口長度,最長可達200k,進一步提升了長文本處理的效果。
小米大模型團隊還構建了通用的能力評測集Mi-LLMBM2.0,對MiLM2進行了全面評估。評測結果顯示,新模型在生成、腦暴、對話、問答等多個應用場景下均表現出色。
隨著二代大模型的迭代更新,小米在端側部署技術上也取得了新的進展。新的4B模型已成功在端側落地應用,進一步提升了端側大模型的性能。同時,云端也新增了30B模型,以滿足更為復雜和多樣化的任務需求。
據悉,小米第二代自研大模型的進步和成果已經開始滲透到真實的業務場景中。新模型不僅助力集團內部解決多樣化業務需求、實現工作提效,還已在澎湃OS、小愛同學、智能座艙和智能客服等領域開始應用落地。