安装百度语音sdk,从官网下载或者使用npm安装

npm install baidu-aip-sdk
复制代码

在开发中要需要几个配置文件,在登陆百度云后点击->百度语音 - 应用列表-创建应用,填报好相应内容后得到后续配置所需的如下内容

// 设置APPID/AK/SK var APP_ID = "你的 App ID"; var API_KEY = "你的 Api Key"; var SECRET_KEY = "你的 Secret Key";

1、获取token

第一步请求在观察httpClient文件中request 通过ID key 密钥返回生成的token,并返回转吗所需client;

const AipSpeechClient = require("baidu-aip-sdk").speech;
const fs = require('fs');
const path = require("path");
// 设置APPID/AK/SK
var APP_ID = "你的 App ID";
var API_KEY = "你的 Api Key";
var SECRET_KEY = "你的 Secret Key";

// 新建一个对象,建议只保存一个对象调用服务接口
var client = new AipSpeechClient(APP_ID, API_KEY, SECRET_KEY);

var HttpClient = require("baidu-aip-sdk").HttpClient;

// 设置request库的一些参数,例如代理服务地址,超时时间等
// request参数请参考 https://github.com/request/request#requestoptions-callback
HttpClient.setRequestOptions({timeout: 5000});

// 也可以设置拦截每次请求(设置拦截后,调用的setRequestOptions设置的参数将不生效),
// 可以按需修改request参数(无论是否修改,必须返回函数调用参数)
// request参数请参考 https://github.com/request/request#requestoptions-callback
HttpClient.setRequestInterceptor(function(requestOptions) {
    // 查看参数
    console.log(requestOptions)
    // 修改参数
    requestOptions.timeout = 5000;
    // 返回参数
    return requestOptions;
});
复制代码

2、获取本地录音并转文字

转换需要获取语音转buffer,client.recognize参数为 1、语音buffer 2、语音类型,string (强类型) 3、采样率 , int (强类型) 4、 { dev_pid:"1537" , //string 语言类型普通话或简单英语,参看api cuid:"string" , //string 用户id,随意设置字符串 }

let voice = fs.readFileSync(path.resolve(__dirname,'./Playtemp_69427412-730c-4593-8e2f-acee8a01d33d.wav'));
let voiceBuffer = new Buffer(voice);

// 识别本地文件,附带参数
client.recognize(voiceBuffer, 'wav', 8000, {dev_pid: '1537', cuid:"15001307"}).then(function (result) {
  console.log('<recognize>: ' + JSON.stringify(result));
 //  console.log(result);
}, function(err) {
    console.log(err);
});
复制代码

https请求及源码跟踪 最终发送请求文件为node_modules/baidu-aip-sdk/src/http/httpClient.js, 源码为

req(options) {
        // 首先处理设置INTERCEPTOR的情况
        if (objectTools.isFunction(HttpClient.REQUEST_INTERCEPTOR)) {
            options = HttpClient.REQUEST_INTERCEPTOR(options);
        // 其次设置全局request options的
        } else if (objectTools.isObject(HttpClient.REQUEST_GLOBAL_OPTIONS)) {
            options = objectTools.merge(HttpClient.REQUEST_GLOBAL_OPTIONS, options);
        }

        return new Promise(function(resolve, reject) {
            request(options, function(error, response, body) {
                if (error === null) {
                    try {
                        resolve(JSON.parse(body));
                    } catch (e) {
                        // 无法解析json请求,就返回原始body
                        resolve(body);
                    }
                } else {
                    reject(error);
                }
            });
        });
    }
复制代码

转换共发送请求两次 1、 发送三个key 返回token

//发送
request({
form:{
    client_id:"你的 API_KEY",
    client_secret:"你的 SECRET_KEY",
    grant_type:"client_credentials"
},
method:"post",
url:"https://aip.baidubce.com/oauth/2.0/token"
})

复制代码

返回内容:重点是需要access_token

{"refresh_token":"25.ac58af3ae3860f61431e3b3009446641.315360000.1860652752.282335-15001307","expires_in":2592000,"session_key":"9mzdCuKObdoovJYJ4qS9w1jJxRXbTfAZgGc4OEGsBRr9UWnGic5Zy70IjCCvH7ebIaHW1kQRfIWKP8fpSGmBlZ4F4bmzTQ==","access_token":"24.1f5c1dfebfae9768b31f6c39156e2466.2592000.1547884752.282335-15001307","scope":"audio_voice_assistant_get audio_tts_post public brain_all_scope wise_adapt lebo_resource_base lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian ApsMisTest_Test\u6743\u9650 vis-classify_flower lpq_\u5f00\u653e cop_helloScope ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey smartapp_swanid_verify","session_secret":"cced641eda376083be3566f33e2c1f43"}

2、二次请求

二次请求,应该带第一次请求到的access_token ,但是在nodejs的sdk中的二次请求数据中并未跟踪到,只有如下请求。

request({
body:{
"dev_pid":1537,
"cuid":"15001307",
"speech":"你的语音文件buffer"
encoding:null
headers:{Host: "vop.baidu.com", Content-Type: "application/json"}
method:"POST"
timeout:5000
url:"https://vop.baidu.com/server_api"
})
复制代码

二次请求加强版

请求类型必须为application/json, body channel ,len,rate值必须为int类型 ,其他为string类型,注意buffer转为base64格式字符串,跟上一个还是有很大差别的,亲测可用。

var options = { 
  method: 'POST',
  url: 'https://vop.baidu.com/server_api',
  headers: 
   { 
      "Content-Type": "application/json",
    },
    body:{ 
         channel: 1,  
        cuid: '15001307',
        dev_pid: 1537,
        format: 'wav',
        len: 54768,
        rate: 8000,
        token:'第一次请求返回的access_token',
        speech: `语音文件buffer`
    },
    json: true 
  };

request(options, function (error, response, body) {
  if (error) throw new Error(error);

  console.log(body);
});
~~复制代码