文本转音频(TTS),已经深受视频创作者的喜爱,离不开这技术了。声音的克隆更是把这门技术发挥到极致,博主们再也不用每次录音,录一次克隆之后,下次根据文案,就可以生成音频。
这其实在此之前介绍过本地部署GPT-SoVITS,这个克隆声音也是很真实,但是这在本地部署需要GPU,而且操作有点麻烦。
GPT-SoVITS的操作界面
今天我来介绍另外一款在线的声音克隆工具Fish Audio,也是很真实、很自然地生成声音。下面我们一起来看看工具的特点以及两个核心功能的使用教程。
工具的特点:
(1)样本只要30秒就够了。
(2)生成速度很快,500字10秒内就能生成。
(3)每天有100次免费生成的机会。
(4)声音效果很不错,很逼真。
(5)可以使用其他人上传的声音。
功能一:克隆声音
要生成期待中的音频,需要先克隆生成自己的声音,这里称为训练新声音。
点击首页的构建声音,弹出下面界面:
(1)选择类型,是否公开,如果是自己的声音,建议设置为私有。
(2)上传封面图,便于以后好认,因为以后可能会传很多声音上来。
(3)声音名称、声音描述、标签,这几个参数根据实际情况填写,便于后续管理。
(4)上传声音,官方推荐30秒左右的声音格式。如果是克隆自己的声音,可以马上在电脑上录制音频,即点红色小圆圈就行。
设置好了,点击创建,大概几秒就完成了。现在可以进行下一步,语音合成。
功能二:语音合成
输入待转语音的文本,这里一次只能转500个字符,如果超过部分,可以分成多次。
选择语音声音,点击加号,弹出选择语音的界面,此时点击我的语音标签可以看到上一步创建的声音,点击使用声音,就可以了。
最后点击创建,等几秒就可以看到右侧生成的音频,试听看效果如何,如果不错,在三个点的位置点击下载就完成了。
最后,如果你觉得这个工具真不错,也可以把它部署在本地,因为它也开源了。
在线地址:https://fish.audio/
github地址:https://github.com/fishaudio
微信公众号『王牌客栈』
第一时间了解最新网络动态
扫码关注不迷路~
更多AI工具、AI变现项目,请访问:AI客
加微信:860056696,围观朋友圈实操项目