我现在有个需求就是,对于给定的语音文件,像四六级听力或者名人演讲之类的英文语音,怎么能够实现,自动转文字,以及自动断句,截取时间点? 有没有现成的api可以调用?