近日,Mistral AI 公司正式揭曉了其最新的多模態(tài)人工智能模型——Pixtral Large。這一模型在11月18日的官方公告中首次亮相,憑借1240億參數的龐大體量,專為文本與圖像的處理任務而設計。
Pixtral Large 目前已面向研究、教育及商業(yè)領域開放,用戶可通過Mistral提供的研究許可證和商業(yè)許可證進行訪問和使用。這一舉措無疑為各領域的研究者和實踐者提供了強大的工具支持。
作為Mistral AI多模態(tài)模型家族的新成員,Pixtral Large在多個標準基準測試中展現出了卓越的性能。特別是在MathVista測試中,Pixtral Large以69.4%的準確率脫穎而出,超越了所有同行競爭對手,彰顯了其在復雜數學問題解決方面的優(yōu)勢。
不僅如此,Pixtral Large在ChartQA和DocVQA等測試中同樣表現出色,超越了GPT-4o和Gemini-1.5 Pro等業(yè)界知名模型。這些測試結果進一步證明了Pixtral Large在處理圖表、文檔及視覺問答等任務時的強大能力。
Pixtral Large的技術架構同樣令人矚目。該模型配備了123B的多模態(tài)解碼器和1B的視覺編碼器,支持高達128K的上下文窗口,能夠輕松處理至少30張高分辨率圖像。這一設計使得Pixtral Large在處理視覺數據、復雜推理以及圖表理解等方面均展現出了非凡的實力。
隨著Pixtral Large的推出,Mistral AI進一步鞏固了其在多模態(tài)人工智能領域的領先地位。這一創(chuàng)新成果不僅為研究者提供了強大的工具支持,也為商業(yè)應用開辟了更加廣闊的前景。