github地址:https://github.com/netease-youdao/EmotiVoice
1.环境安装
#拉取代码
git clone https://github.com/netease-youdao/EmotiVoice
#进入根目录安装虚拟环境
cd EmotiVoice
conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict
#如果是mac就安装
在 Conda 环境中安装 CFFI
conda install cffi
MAC ffmpeg安装方式
#在Mac上安装FFmpeg,你可以使用Homebrew包管理器。如果你还没有安装Homebrew,请先在终端中运行以下命令来安装它:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
#安装Homebrew后,运行以下命令来安装FFmpeg:
brew install ffmpeg
#安装完成后,你可以通过运行以下命令来检查FFmpeg是否正确安装并且可用:
ffmpeg -version
#如果安装成功,这个命令会输出FFmpeg的版本信息。
2.准备模型文件
#在根目录下载需要的两个模型
git clone https://www.modelscope.cn/syq163/outputs.git
git lfs install
git lfs clone https://huggingface.co/WangZeJun/simbert-base-chinese WangZeJun/simbert-base-chinese
3.调用API进行推理
pip install fastapi pydub uvicorn[standard] pyrubberband
uvicorn openaiapi:app --reload --port 6006 --host 0.0.0.0