本文作者是Bramble Intelligence的人工智能研究员,参与了《2025年人工智能现状报告》(State of AI Report 2025)的编写
直到最近,构建一个能进行逼真的电话交谈的人工智能系统仍是一项艰巨的任务。开发者必须将语音识别、语言处理和语音合成等相互独立的工具整合在一起,并通过脆弱的电话通讯软件把它们连接起来。
如今情况已不同。随着实时原生语音AI模型的出现——例如OpenAI去年推出的RealTime API——曾经需要多个组件才能构建的系统,如今只需数分钟即可完成创建。
您已阅读19%(252字),剩余81%(1072字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。