rtasr_java_demo_wss(实时语音转写demo).zip
2021-03-27 20:11:45 966KB 实时语音转写
1
appid := "************" apikey := "***********88" curtime := strconv.FormatInt(time.Now().Unix(), 10) param := make(map[string]string) param["engine_type"] = "sms16k" param["aue"] = "raw" tt, _ := json.Marshal(param) base64_param := base64.StdEncoding.EncodeToString(tt) w := md5.New() io.WriteString(w, apikey+curtime+base64_param) checksum := fmt.Sprintf("%x", w.Sum(nil)) body, _ := ioutil.ReadFile("./ceshi.pcm") base64_audio := base64.StdEncoding.EncodeToString(body) data := url.Values{} data.Add("audio", string(base64_audio)) res_body := data.Encode() client := &http.Client{} req, _ := http.NewRequest("POST", "http://api.xfyun.cn/v1/service/v1/iat", strings.NewReader(res_body)) req.Header.Set("X-Appid", appid) req.Header.Set("Content-Type", "application/x-www-form-urlencoded") req.Header.Set("X-Param", base64_param) req.Header.Set("X-CheckSum", checksum) req.Header.Set("X-Curtime", curtime) response, _ := client.Do(req) defer response.Body.Close() resp_body, _ := ioutil.ReadAll(response.Body) fmt.Print(string(resp_body))
2021-03-02 17:02:03 1KB 科大讯飞 go语言 语音转写
1
# 输入讯飞开放平台的appid,secret_key和待转写的文件路径 if __name__ == '__main__': api = RequestApi(appid="", secret_key="", upload_file_path=r"") api.all_api_request()
2021-03-02 17:02:01 7KB python 语音转写 科大讯飞
1
讯飞语音,识别真的很准确。 讯飞语音转写,实时的贵,不实时的慢。。。 今天尝试了用讯飞听写通过流的方式实现实时转写。 主要思路是这样。首先确认pcm文件的保存路径。 然后创建一个线程不断读写pcm内的内容变化。 每次读取1024*1024字节调用 mIat.writeAudio(byte[] var1, int var2, int var3)方法,等待回调结果。 记录每次的回调结果,拼接字符串。 部分代码如下,下面代码是完整pcm文件的转写的代码。准确率和讯飞网页的识别率相差无几。 实现了之后发现。讯飞听写接口认证后才20000/天,没有认证500/天。可能讯飞也知道这个漏洞才加的限制吧
2021-03-02 17:01:56 37KB 讯飞语音 实时语音转写
1
基于Springboot微服务,引用科大讯飞Msc.jar实现对语音的听写与识别
1