第一次写AI,写得不怎么样,还望大佬们能赏脸看看,不足的地方,请多多指教!!
实现目的:借助百度AI的语音识别和语音合成,以及图灵机器人来实现智能语音聊天机器人


文章目录

  • 1.图灵机器人的创建
  • 2.录音功能的实现
  • 3.百度AI接口创建
  • 4.语音合成技术的实现
  • 5.如何将合成的语音在python环境中播放出来
  • 6.语音识别技术的实现
  • 7.图灵API自动回复
  • 8.代码汇总
  • 9.结果显示
  • 10.总结


1.图灵机器人的创建

图灵机器人 创建属于自己的图灵机器人

Python 真人语音 python 语音聊天_Python 真人语音


注意:密钥一定要关闭,不然结果会出现加密方式错误!!!!!

Python 真人语音 python 语音聊天_自然语言处理_02


在这里,我们可以对它进行人物设置,把它打造成我们想要的机器人……

Python 真人语音 python 语音聊天_百度_03

2.录音功能的实现

在百度AI中语音合成比语音识别技术要简单些,因为语音识别会有一些噪音的干扰等,无法识别,所以我们就要对噪音进行处理,处理方法在录音功能中实现

import pyaudio
import wave
def record(seconds,filename):
    RATE=8000#采样率
    CHANNELS=2#采样管道数
    FORMAT=pyaudio.paInt16#量化位数
    SECONDS=seconds#录音时长
    p = pyaudio.PyAudio()
    stream=p.open(rate=RATE,channels=CHANNELS,format=FORMAT,input=True)
    frames=[]#存储所有读取到的数据
    print("录音开始,还有",seconds,"秒")
    data=stream.read(RATE*SECONDS)
    frames.append(data)
    stream.stop_stream()
    print("录音结束!!!")
    stream.close()
    p.terminate()   #关闭会话
    wf=wave.open(filename,"wb")
    wf.setnchannels(CHANNELS)
    wf.setframerate(RATE)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.writeframes(b''.join(frames))
    wf.close()
    return filename
record(5,'F:\\auido.wav')

3.百度AI接口创建

百度AI官网

Python 真人语音 python 语音聊天_百度_04


Python 真人语音 python 语音聊天_Python 真人语音_05


然后创建应用,获取想要的API和密码

Python 真人语音 python 语音聊天_自然语言处理_06

4.语音合成技术的实现

在使用百度AI的时候要学会看技术文档

Python 真人语音 python 语音聊天_自然语言处理_07


Python 真人语音 python 语音聊天_自然语言处理_08

""" 你的 APPID AK SK """
APP_ID = '您的APP_ID'
API_KEY = '您的API_KEY'
SECRET_KEY = '您的SECRET_KEY'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result  = client.synthesis(mm, 'zh', 1, {
    'vol': 5, 'spd':4, 'per':1
})
if not isinstance(result, dict):
    with open('F:\\auido.mp3', 'wb') as f:
        f.write(result)

5.如何将合成的语音在python环境中播放出来

首先需要导入pygame模块,用pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pygame来下载速度会快些

import pygame
import time
filename="F:\\auido.mp3"
pygame.mixer.init()
pygame.mixer.music.load(filename)
pygame.mixer.music.play()
time.sleep(5)

6.语音识别技术的实现

from aip import AipSpeech
import pyaudio
import wave
import time
def record(seconds,filename):
    RATE=8000#采样率
    CHANNELS=2#采样管道数
    FORMAT=pyaudio.paInt16#量化位数
    SECONDS=seconds#录音时长
    p = pyaudio.PyAudio()
    stream=p.open(rate=RATE,channels=CHANNELS,format=FORMAT,input=True)
    frames=[]#存储所有读取到的数据
    print("录音开始,还有",seconds,"秒")
    data=stream.read(RATE*SECONDS)
    frames.append(data)
    stream.stop_stream()
    print("录音结束!!!")
    stream.close()
    p.terminate()   #关闭会话
    wf=wave.open(filename,"wb")
    wf.setnchannels(CHANNELS)
    wf.setframerate(RATE)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.writeframes(b''.join(frames))
    wf.close()
    return filename
record(5,'F:\\auido.wav')
""" 你的 APPID AK SK """
APP_ID = '20178217'
API_KEY = 'DXpGC2WesUxvGpzcqFuk55de'
SECRET_KEY = 'ILPB25e9GSOAnxlokVSu4yWVVik2qtz9'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 语音识别
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 识别本地文件
result=client.asr(get_file_content('F:\\auido.wav'), 'wav', 16000, {
    'dev_pid': 1537,
})
mm=result['result'][0]

7.图灵API自动回复

urls = 'http://openapi.tuling123.com/openapi/api/v2'    # 图灵接口的url
api_key = "输入您的apiKey"
# 回复
def Turing(data,n):
    data_dict = {
        "reqType": 0,
        "perception": {
            "inputText": {
                "text": data
            },
        },
        "userInfo": {
            "apiKey": api_key,
            "userId": "输入用户ID"
        }
    }
    result = requests.post(urls, json=data_dict)
    content = result.text
    # print(content)
    ans = json.loads(content)
    text = ans['results'][0]['values']['text']
    print('Niubility:',text)  # 机器人取名就叫Niubility

8.代码汇总

import requests
import json
from aip import AipSpeech
import wave
import pyaudio
import pygame
import time
urls = 'http://openapi.tuling123.com/openapi/api/v2'   # 图灵接口的url
api_key = "38a0a09b87424c948d5ad92e7964e3db"

count = 1  # 用来计数输入的次数
def record(seconds,filename):
    RATE=8000#采样率
    CHANNELS=2#采样管道数
    FORMAT=pyaudio.paInt16#量化位数
    SECONDS=seconds#录音时长
    #第一步:创建PyAudio的实例对象
    p = pyaudio.PyAudio()
    #第二步:调用PyAudio实例对象的open方法创建流Stream
    stream=p.open(rate=RATE,channels=CHANNELS,format=FORMAT,input=True)
    frames=[]#存储所有读取到的数据
    print("录音开始,还有",seconds,"秒")
    #第三步:根据需求,调用Stream的write或者read方法
    data=stream.read(RATE*SECONDS)
    frames.append(data)
    #第四步:调用Stream的stop方法停止播放音频或者是录制音频
    stream.stop_stream()
    print("录音结束!!!")
    #第五步:调用Stream的close方法,关闭流
    stream.close()
    #第六步:调用pyaudio.PyAudio.terminate() 关闭会话
    p.terminate()
    #写入到wav文件里面
    wf=wave.open(filename,"wb")
    wf.setnchannels(CHANNELS)
    wf.setframerate(RATE)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.writeframes(b''.join(frames))
    wf.close()
    return filename
""" 你的 APPID AK SK """
APP_ID = '20178217'
API_KEY = 'DXpGC2WesUxvGpzcqFuk55de'
SECRET_KEY = 'ILPB25e9GSOAnxlokVSu4yWVVik2qtz9'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 语音识别
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 回复
def Turing(data,n):
    data_dict = {
        "reqType": 0,
        "perception": {
            "inputText": {
                "text": data
            },
        },
        "userInfo": {
            "apiKey": api_key,
            "userId": "630194"
        }
    }
    result = requests.post(urls, json=data_dict)
    content = result.text
    # print(content)
    ans = json.loads(content)
    text = ans['results'][0]['values']['text']
    print('Niubility:',text)  # 机器人取名就叫Niubility
    result2 = client.synthesis(text, 'zh', 1, {
        'vol': 5, 'spd': 4, 'per': 1
    })
    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码
    if not isinstance(result2, dict):
        with open('F:\\auido{}.mp3'.format(n), 'wb') as f:
            f.write(result2)
    pygame.mixer.init()
    pygame.mixer.music.load("F:\\auido{}.mp3".format(n))
    pygame.mixer.music.play()
    time.sleep(10)
    f.close()
if __name__ == "__main__":
    print("Niubility:主人您好,我是Niubility,爱你哦~")
    for n in range(1,51):
        record(5,'F:\\auido.wav')
        result = client.asr(get_file_content('F:\\auido.wav'), 'wav', 16000, {
            'dev_pid': 1537,
        })
        mm = result['result'][0]
        data = input('{}//你:'.format(count)+mm)  # 输入对话内容
        Turing(mm,n)
        count+=1

9.结果显示

Python 真人语音 python 语音聊天_自然语言处理_09

10.总结

做实验遇到的问题:
(1)结果出现错误信息:加密方式不正确,解决:把密钥关闭,再次运行
(2)出现[Errno 13] Permission denied: ‘audio.mp3’……解决:写入到不同的mp3文件

简单的智能聊天机器人终于做出来了,心里还是有点小激动哈哈哈哈哈