1月22日,阿里千问团队宣布其最新研发成果Qwen3-TTS正式开源上线。

Qwen3-TTS由Qwen团队精心打造,具备多项先进功能,包括音色克隆、音色创造、拟人化语音生成以及基于自然语言描述的语音控制。这些功能使得Qwen3-TTS在语音生成领域表现出色,能够满足不同场景下的多样化需求。此次开源的多码本全系列模型,涵盖了1.7B和0.6B两种尺寸,既保证了模型的性能,又兼顾了计算资源的消耗。更为引人注目的是,Qwen3-TTS模型覆盖了10种主流语言,包括中文、英文、日语、韩语等,以及多种方言音色。









