语音AI本周大事件:ElevenLabs 印度战略、AI Agent 保险、NPR主持人起诉Google声音克隆
🎙️ 2026年2月16-18日
语音AI本周大事件
ElevenLabs CEO 亲赴印度布局、推出AI Agent保险;NPR主持人起诉Google声音克隆;Gnani.ai发布多语言语音模型
在2026年2月18日举办的印度 AI Impact Summit 上,ElevenLabs 联合创始人兼CEO Mati Staniszewski 发表了重磅观点:语音将超越文本和屏幕,成为人与AI交互的主导界面。
Staniszewski 表示,印度将成为全球首批大规模部署语音AI的国家之一。ElevenLabs 还计划在班加罗尔设立办公室,并探索与印度名人的合作伙伴关系。
同样在本周,ElevenLabs 宣布推出一项创新服务——AI Agent 保险,专门针对企业客户对AI工具可能失败或产生不良效果的担忧。
2月15日,美国公共广播电台(NPR)资深主持人 David Greene 正式起诉 Google,指控其 NotebookLM 工具在未经许可的情况下复制了他的声音。
这起诉讼再次将AI语音克隆的版权和伦理问题推上风口浪尖。值得注意的是,ElevenLabs 的「No-Go Voices」机制正是为了避免此类争议而设计的。
2月18日,印度AI创业公司 Gnani.ai 在 AI Impact Summit 上发布了两款重磅语音模型:
| 模型 | 类型 | 核心能力 |
|---|---|---|
| Vachana STT | 语音转文字 | 基于100万+小时真实语音数据训练,覆盖1,056个领域,支持多种印度语言 |
| Vachana TTS | 文字转语音 | 可在12种印度语言中克隆声音,生成类人语音 |
Gnani.ai CEO Ganesh Gopalan 表示:「印度的语音识别不是本地化问题,而是基础系统问题。Vachana STT 是作为核心基础设施构建的,基于印度人真实的说话方式训练。」
Prosus 和 BCG 联合发布的最新报告指出,在 Agentic AI 之后,机器语音将成为AI进化的下一个重大转变。音频输入/输出模型——使用语音进行输入输出、语音转文字再转回语音——将「降低延迟并增强情感成熟度」。
| 事件 | 日期 | 类型 |
|---|---|---|
| ElevenLabs CEO 出席印度AI峰会 | 2月18日 | 战略布局 |
| ElevenLabs 推出AI Agent保险 | 2月18日 | 产品发布 |
| David Greene 起诉Google声音克隆 | 2月15日 | 法律诉讼 |
| Gnani.ai 发布 Vachana STT/TTS | 2月18日 | 模型发布 |
| Prosus/BCG 语音AI趋势报告 | 2月18日 | 行业报告 |
本周的语音AI领域可以用一个词概括:「加速」。ElevenLabs 从技术公司转型为平台型企业(保险服务、印度本地化),Google 的声音克隆争议推动行业伦理讨论,而印度正在成为语音AI创新的全球试验场。
特别值得关注的是 ElevenLabs 的「No-Go Voices」机制与 David Greene 诉讼案的对比——前者主动设防,后者被动维权。这两种路径的碰撞,将深刻影响语音AI行业未来的发展方向。