賽輪思(Cerence)近日宣布,其與英偉達的合作將進一步深化,旨在提升其CaLLM系列語言模型的能力,這一系列包括云端部署的賽輪思汽車大語言模型(CaLLM)以及嵌入式小語言模型CaLLM Edge。
此次攜手合作,CaLLM系列語言模型將借助NVIDIA AI Enterprise這一端到端的云原生軟件平臺獲得技術支持,而CaLLM Edge的某些功能則將通過NVIDIA DRIVE AGX Orin來強化。
具體而言,賽輪思的人工智能部門——Cerence AI,將通過NVIDIA AI Enterprise軟件平臺,包括NVIDIA TensorRT-LLM和NVIDIA NeMo框架,來加速CaLLM系列模型的開發與部署。NVIDIA NeMo是一個全面的框架,專為構建、定制和將生成式AI應用推向生產環境而設計。
借助這些先進技術,Cerence AI已經對其CaLLM系列模型進行了優化和定制,旨在:
在NVIDIA的加速計算和SoC平臺上,提供更為迅速的車載助手性能。
開發汽車專用的NVIDIA NeMo Guardrails實現方案,確保Cerence驅動的系統能夠精準捕捉并應對車載交互的微妙變化。
通過NVIDIA DRIVE AGX Orin,在CaLLM Edge上實施和優化代理架構,推動下一代車載用戶體驗的實現。