LLM

关于AI-Vtuber的新奇玩意儿

"为Sunny Project做准备"

Posted by Summer on February 3, 2026

Mini-Omni

一个开源的多模态大型语言模型,可以边听边说边思考。具有实时端到端语音输入和流式音频输出会话功能。Mini-Omni2 具备了图像识别功能。

Github仓库

几个缺陷:输出只有英文,不过可以听懂中文但是只会说英文。不能在云端服务器部署,一方面也是因为云端服务器没有麦克风(误)。

Luna AI