你的位置:女同做爱 > 美女写真 >

色色王国 7款少有东谈主知的语音转翰墨黑科技软件,开源免费雄壮!

发布日期:2025-03-18 05:03    点击次数:159

色色王国 7款少有东谈主知的语音转翰墨黑科技软件,开源免费雄壮!

女同视频

图片色色王国

编订/排版:卒見

当今咱们责任会议的时,齐会用到灌音转翰墨器具,我个东谈主也会在责任和文娱的时分用到这些器具,这里就给公共共享几款不雷同的语音转翰墨器具,齐是免费、开源名目!

01

Voice-Pro

AI 语音调遣和多说话翻译器具

Voice-Pro 是一款由AI驱动的Web开源诳骗次第,旨在透澈更正多媒体践诺惩处。

图片

它集转录、翻译和翰墨转语音为一体,提供简约直不雅的可视化操作界面,维持及时转录和翻译,以及批量惩处样式。

图片

它具有 YouTube 视频下载、语音别离、语音识别、翻译和文本转语音的全面功能。

图片

Voice-Pro 装置。

①脱手configure.bat 并start.bat

②克隆或下载最新版块(源代码 zip)GitHub 版块

git clone https://github.com/abus-aikorea/voice-pro.git

③脱手configure.bat,在 Windows 上装置 git、ffmpeg 和 CUDA

④会聚互联网,这个流程可能需要一个多小时,看系统情况。

⑤在装置流程中,请勿关闭 Windows-Command 窗口。

图片

⑥启动 Voice-Pro。Web-UI 将自动脱手。

初度脱手时,请先装置 Voice-Pro。

要是在装置流程中出现问题,请删除 installer_files 文献夹并再次脱手 start.bat。

图片

该名目是用于音频惩处的概述 Gradio WebUI,具有 Voice Changer、零样本语音克隆(E2、F5-TTS)、YouTube 下载、语音阻遏 (UVR5)、文本转语音 (Edge-TTS) 和多说话翻译。适用于践诺创建者和开采东谈主员。

Voice-Pro源代码:

https://pan.quark.cn/s/ccbde0108f7f

开源地址:

https://github.com/abus-aikorea/voice-pro

02

PodCastLM

PDF 生成华文播客!

一款开源免费的器具,不错将 PDF 践诺滚动为合适音频播客的当然对话,并输出为 MP3 文献。

操作很简便:

①咱们不错径直将需要调遣的践诺上传到操作页面,这里可上传1M以内的PDF文献;

图片

②然后诞生口吻、时长等,生成播客,你不错稽查到文本转头践诺,以及整理后的剧本践诺!

图片

③点击底部音频按钮,即可播放现时整理好的践诺!

图片

开源地址:

https://github.com/YOYZHANG/PodCastLM

在线地址:https://ai.podcastlm.fun

03

video-srt-windows

自动识别视频语音生成字幕文献的器具

video-srt-windows是一个不错识别视频语音自动生成字幕SRT文献的开源 Windows-GUI 软件器具。

图片

它接受 Go+walk 开采,仅维持 Windows 系统。基础旨趣是申请在线语音转翰墨的工作,超出免费额度需付费。另外还加入了导出字幕文献和翻译功能。

VideoSrt下载:

https://pan.quark.cn/s/ebd97ead46e3

开源地址:

https://github.com/wxbool/video-srt-windows

https://gitcode.com/gh_mirrors/vi/video-srt-windows

04

buzz

音频转录与翻译器具,不错在你的个东谈主猜测机上离线转录和翻译音频工作。

图片

该名目是基于 Whisper 的音频转录和翻译器具,开箱即用、操作简便,维持语音转翰墨、音频翻译、多种说话和离线使用!

图片

Mac 原生版块的 Buzz,具有更简约的外不雅、音频播放、拖放导入、转录文本编订、搜索等功能。它同期适用于Windows 和 Linux 平台。

图片

功能维持:

①导入音频和视频文献并将转录文本导出为 TXT、SRT 和 VTT(演示)

②从猜测机的麦克风转录和翻译为文本

图片

③维持Whisper、Whisper.cpp、Faster Whisper、Whisper兼容的 Hugging Face 模子,以及 OpenAI Whisper API

④号召行界面

图片

Buzz v1.2.0下载:

https://pan.quark.cn/s/8c08670cfe56

开源地址:

https://github.com/chidiwilliams/buzz

05

ChatTTS

SOTA 开源 TTS,雄壮的对话式文本转语音模子,成心为对话场景野心,维持中、英双语。生成较短的语音恶果很好,无机械感!

图片

它主要用于 LLM 助手对话任务、对话语音以及视频先容等,维持中英文夹杂文本合谚语音,音色发挥强,能达到真假难辨进度。

图片

它不仅或者生成当然、携带的语音,还能箝制和添加笑声、停顿和口吻词等。

ChatTTS源代码:

https://pan.quark.cn/s/48101f70fc83

开源地址:

https://github.com/2noise/ChatTTS

06

fish-speech

整个东谈主齐能用的开源语音合成模子

该名目是由 Fish Audio 开采的基于 VQGAN+Llama 的文本转语音模子,它仅需 4GB 显存即可在个东谈主开采上松驰脱手和微调(16GB),维持中英日语和音颜色整,语音合成恶果出色。

图片

fish-speech源代码:

https://pan.quark.cn/s/cf829869e7f0

开源地址:

https://github.com/fishaudio/fish-speech

07

GPT-SoVITS

少样本语音调遣和合成器具

雄壮的少样本语音调遣和语音合成 WebUI 器具,输入 5 秒的声息样本就能体验文本到语音调遣。维持少样本 TTS、英语、日语和华文,集成了声息伴奏别离、华文自动语音识别和文本标注等功能。

图片

特点功能:

零点TTS:输入5秒的东谈主声样本并体验即时文本到语音调遣。

少发TTS:只需1分钟的磨练数据即可微调模子,以普及语音相似度和着实感。

图片

跨说话维持:使用与磨练数据集不同的说话进行推理,面前维持英语、日语、韩语、粤语和华文。

WebUI 器具:集成器具包括语音伴奏别离、自动磨练集分割、华文 ASR 和文本标注,匡助入门者创建磨练数据集和 GPT/SoVITS 模子。

图片

开源地址:

https://github.com/RVC-Boss/GPT-SoVITS

kua链:

https://pan.quark.cn/s/cf509d794f54

du链:

https://pan.baidu.com/s/1AQwPg3B60RlozShq97h4_g?pwd=gecp

索要码: gecp

Ok,本期的共享就到这里了,但愿以上语音转翰墨、翰墨转语音的器具不错匡助你,岂论是在糊口上,已经在责任中,普及效用!

❶5款鲜有东谈主知的编订黑科技app

❷5款号称神器的黑科技软件

❸利弊推选4款Windows器具神器色色王国

本站仅提供存储工作,整个践诺均由用户发布,如发现存害或侵权践诺,请点击举报。

上一篇:文爱 电报 240062    下一篇:好利来 丝袜 塑顺眼膜买哪个牌子好?推选你6款高性价比的口碑家具共享!