xAI开放Grok语音技术API 推动AI语音交互革新

2026-04-18 09:05:07未知 作者:徽声在线

北京时间4月17日晚间消息,人工智能创新企业xAI正式对外发布了Grok平台的两项核心语音技术API——语音转文本(Speech-to-Text, STT)与文本转语音(Text-to-Speech, TTS)。此次技术升级聚焦于通过深度学习模型实现更精准的语音识别与更自然的语音合成效果,开发者可借此在智能客服、语音助手、教育互动等场景中构建低延迟、高保真的实时语音交互系统。

据官方技术文档披露,Grok的STT API支持超过80种语言的实时转录,在嘈杂环境下的识别准确率较前代提升37%,同时将端到端延迟控制在200毫秒以内。TTS方面则采用新一代神经网络声码器,可生成包含情感起伏的拟人化语音,并支持自定义音色克隆功能。目前该API已开放企业级开发者申请测试,提供每分钟免费调用额度的阶梯式定价方案。

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
12万级首搭激光雷达!埃安N60预售引爆智能SUV市场12万级首搭激光雷达!埃安N60预售引爆智能SUV市场 21.98万起售!零跑旗舰SUV上市 朱江明:规模扩张比短期盈利更关键21.98万起售!零跑旗舰SUV上市 朱江明:规模扩张比短期盈利更关键 “德系智能新势力”与众08登场,能否撼动小鹏G9市场地位?“德系智能新势力”与众08登场,能否撼动小鹏G9市场地位? 美国AI领域新动向:为何推行“实名制”?美国AI领域新动向:为何推行“实名制”? InfoComm 2026深度观察:AI赋能视听产品,国产厂商商显市场崛起InfoComm 2026深度观察:AI赋能视听产品,国产厂商商显市场崛起 阿里云5月20日调整国内短信服务价格,市场迎来新变化阿里云5月20日调整国内短信服务价格,市场迎来新变化