据《金融时报》报道,Meta计划在其下一代“开放”AI模型Llama 4中引入增强的语音功能,预计该模型将在“几周内”发布。报道称,Meta特别专注于开发允许用户在语音对话中中断模型的功能,类似于OpenAI的ChatGPT语音模式和谷歌的Gemini Live体验。
在本周的摩根士丹利会议上,Meta首席产品官Chris Cox表示,Llama 4将是一个“全能”模型,能够本地处理语音、文本及其他类型的数据。这一升级将使Llama 4在语音交互领域具备更强的竞争力。
Llama 4的开发部分受到中国AI实验室DeepSeek的开放模型的启发。DeepSeek的模型在性能和成本效益方面表现出色,甚至优于Meta的Llama系列。据报道,Meta为此成立了专门团队,研究DeepSeek如何降低模型运行和部署成本,以提升自身模型的竞争力。