大型语言模型(LLM)作为生成式AI工具发展的核心技术,其未来方向或将聚焦地理细分。总部位于巴黎的初创公司Mistral近日发布了一款名为Mistral Saba的定制模型,旨在挑战美国AI巨头如Anthropic和OpenAI。这款模型专为阿拉伯语国家设计,力求在阿拉伯语交互中实现卓越表现。

Mistral Saba拥有240亿个参数,规模相对较小,与其通用模型Mistral Small 3相当。参数减少通常带来更低的延迟和更高的效率,而Mistral的测试显示,Saba在处理阿拉伯语内容时远超Mistral Small 3。此外,因中东与南亚的文化交融,Saba对印度起源语言尤其是泰米尔语和马拉雅拉姆语也表现出色,展现了意外的广泛适用性。
此举标志着Mistral对中东市场的战略倾斜。公司预计Saba将提升其在该地区的客户吸引力。作为现成解决方案,Saba可用于生成自然且贴合语境的阿拉伯语对话或内容,还能微调支持企业内部需求。上周的AI Action峰会上,Mistral展现了其商业雄心。尽管已获Lightspeed Venture Partners、Andreessen Horowitz等美国投资者支持,地缘政治变化可能促使其在下一轮融资中引入中东资本。这不仅有助于维持技术竞争力,还可定位Mistral为美中AI企业的全球替代选项,Saba或为此增添筹码。
Saba通过Mistral API提供服务,并支持本地部署,对能源、金融及医疗等敏感行业颇具吸引力。依托欧洲背景,Mistral自开源Mistral 7B发布以来始终强调多语言支持,Saba延续了这一承诺。公司透露,未来将进一步开发其他区域语言模型。