Balabolka是一款专业的文本转语音软件。Balabolka能够轻松把文本转语音解放双眼。Balabolka可以使用系统上安装的所有计算机语言。可以使用Balabolka顶部附近工具栏上的标准播放,暂停和停止按钮来控制语音。该程序可以读取剪贴板的内容,查看文档中的文本,自定义字体和背景色以及控制从系统任务栏或全局热键的读取。支持的文件格式:AZW,AZW3,CHM,DjVu,DOC,DOCX,EML,EPUB,FB2,FB3,HTML,LIT,MOBI,ODP,ODS,ODS,ODT,PDB,PDF,PPT,PPTX,PRC,RTF,TCR, WPD,XLS,XLSX。 IFilter接口可用于扩展名未知的文件。通过从“文件”菜单中选择“文件,保存音频文件”或“文件,分割并转换为音频文件”,可以将屏幕上的文本另存为WAV,MP3,MP4,OGG或WMA文件。 Balabolka可以将同步文本保存在外部LRC文件或音频文件中的MP3标签中。在计算机或现代数字音频播放器上播放音频文件时,文本会同步显示(与歌曲的歌词相同)。该程序可以使用各种版本的Microsoft Speech API(SAPI)和Microsoft Speech Platform,它允许更改声音的参数,包括速率和音调,并且用户可以应用特殊的替换列表来提高语音清晰度当您想要更改时该功能在拼写单词或分割声音时非常有用。
安装方式:
1.找到下载的压缩包并解压缩,然后双击“ setup.exe”应用程序进入安装步骤。
2.选择软件的显示语言。建议选择中文(简体)。完成选择后,单击[下一步]继续。
3.安装向导将指导您在计算机上安装此程序,单击[下一步]继续,或单击[取消]退出安装程序。
4.如果要更改程序的存储位置,请单击[浏览]并选择目标文件夹,然后单击[下一步]继续。
5.选择其他任务,用户可以根据自己的需要判断是否创建桌面图标并锁定任务栏选项,选择后单击[下一步]继续。
6.等待安装过程。安装可以在大约五秒钟内完成。
7.安装后,单击[完成]退出安装向导并默认打开软件。
软件特色:
操作简单,无需任何复杂的操作步骤
支持语言更改,例如简体中文,英文等。
支持调整文本到语音阅读的速度和语调
支持在文本中查找某个字节或字段
支持快捷键操作,例如
Ctrl + L文本格式
Ctrl + M查找对等同义词
Ctrl + G文字替换编号
Ctrl + Alt + F外语词汇
Ctrl + Alt + D直接引用
Ctrl + Alt + Ins插入音频片段
Ctrl + Alt + X插入XML标签
Ctrl + Alt + M删除所有XMl标签
F4拼写检查
F5大声朗读
F6暂停
F7停止
F8阅读所选文字
F9阅读剪贴板
嗯...
可更换的音频输出设备
您可以设置诸如文本发音,保存文档,程序启动等功能。
可以设置系统托盘,全屏浏览,显示浮动小窗口等。
支持自定义句子之间的暂停秒数和段落之间的暂停秒数
支持文件分割和合并,或文件的批量转换
在文本中插入书签以便于查找
更换规则
词典组
应用程序该应用程序允许使用带有替换规则的特殊文本文件(“字典”)来改善单词的发音。文件的每一行都包含一个替换规则。规则可以是正则表达式(扩展名为* .rex的文件名)或模板(扩展名为* .dic的文件名)。扩展名为* .bxd的文件结合了其他两种格式的选项。
用户当用户告诉程序大声朗读文本时,Balabolka会检查字典中文本中的哪些单词需要更正发音
并在字典中应用相应的替换规则。更改后的文本将发送到计算机语音剪贴板,并大声读取文本。
要查看程序使用的词典列表,请选择菜单项“查看|显示|词典面板”或按F11。在主窗口的右侧,显示文件名列表。它分为两个部分:
包含替换列表的顶级文件;
底文件,带有同义词列表(同义词)。
不同的计算机声音可以使用不同的替换列表。用户可以从列表中选择必要的文件。
要创建新词典,请右键单击词典面板,从上下文菜单中选择“新建”,然后键入新词典的文件名。该文件将在磁盘上创建,其名称将显示在面板的列表中。
用户如果用户要修改替换列表,则应从列表中选择一个文件名,然后单击“编辑”。这将打开一个用于编辑替换列表的窗口。要添加新的替换规则,您必须填写“阅读此:”和“喜欢此:”字段,然后单击“添加”。编辑过程完成后,单击保存”并退出编辑器。
一般规则清单
如果您在列表中选择了多个文件名,则应用程序会自动将这些词典中的规则合并到存储在计算机内存中的单个列表中。要查看此列表,请右键单击词典面板,然后从弹出菜单中选择“显示列表”。
当来自不同文件的规则合并到共享列表中时,它将发生以下情况:
的* .bxd文件中的规则按词汇表的顺序一一添加;文件按字母顺序处理;
相同* .rex文件中的处理规则顺序相同;
* .dic文件的所有规则都以这种方式排序:首先将大小写敏感的规则,然后是不区分大小写的规则,然后再根据具有最长符号模式的模板长度规则再次对规则进行排序,使其更靠近顶部。
顺序如果可以将多个规则应用于文本中的同一单词,则列表中规则的顺序很重要。 Balabolka按顺序执行替换,即第二条规则将应用于已由列表中第一条规则修改的文本。在这种情况下,规则的顺序很重要。
带有* .rex扩展名的文件中的规则将首先应用。要检查应用于当前文档的规则的结果,请使用主菜单项“选项” |“选项”。发音纠正|查看修改后的文本和选项发音纠正|替换统计信息。
其他工具
要查找影响同一文本的一对规则,请选择菜单项“选项” |“选项”。发音纠正|查找规则对。这样可以查找从未使用过的规则:另一个规则已在文本中修改了此表达式。
人们的名字,地名,动物昵称,组织名称等的发音需要经常纠正。通过主菜单项“选项|发音校正|查找姓名”,可以在当前文档中轻松搜索这些单词。在文本“。Balabolka中,您可以看到找到的三个单词的列表:
名称(当前文件中始终以大写字母开头的单词);
所有单词都用大写字母表示;
在文文本中找到所有单词。
当您浏览单词列表时,应用程序将自动读取单词。如果单词阅读不正确,则可以更正发音并向字典添加新规则。找到的名称列表可以按字母顺序或按文本中使用的单词的频率排序。另外,您可以禁用多次出现在文本中的单词;这样可以加快检查当前文档中找到的名称列表的速度。
介绍
面板设置的当前状态可以存储为“配置文件”。要创建和编辑配置文件,请使用菜单项“选项” |“设置”。发音纠正|轮廓。
常见问题:
问题我收到错误消息“ OLE错误80045042”。这意味着什么?
回答此错误意味着:“ XML解析器由于语法错误而失败。”您必须验证文本中XML标记的语法。或者,文本的某些部分看起来像XML标记的开头,并混淆了SAPI。如果您不想使用XML标记,请从文本中删除符号“ <”和“>”(或将其替换为“小于”和“大于”)。
问题我在哪里可以得到SAPI 4?
回答要使用SAPI 4语音,请下载并安装可重新分发的Microsoft Speech API文件(824 KB)。此外,您可以下载并安装Microsoft语音控制面板(840 KB);语音控制面板将在控制面板上添加一个图标,使您能够列出系统上安装的兼容的文本到语音引擎,并自定义其设置以供您使用。
问题我在哪里可以得到SAPI 5?
Windows XP(及更高版本)随附SAPI 5。
问题我如何知道计算机上安装了哪种文本转语音?
回答您可以按照控制面板->语音->语音属性->文本到语音->语音选择来查看计算机上所有可用的语音。
问题如何执行Balabolka的静默安装?
要在无对话框的无提示模式下安装Balabolka,可以使用无提示安装。使用-silent命令行开关进行静默安装。
问题我打开一个DjVu文件,但是该程序不显示任何文本。发生了什么?
Answer DjVu格式旨在存储扫描的文档。 DjVu文件包含来自书籍,杂志等的页面图像。此外,DjVu可包含OCR文本层。
Balabolka只能从DjVu的文本层提取数据。如果没有这样的图层,则获取文本的唯一方法是使用文本识别系统(例如FineReader)。
问题我的计算机包含两个声卡。如何选择音频设备进行文本到语音的播放?
回答可以在Windows的“控制面板”中选择“语音”,然后在“语音属性”对话框中单击“音频输出”按钮。另外,Balabolka包含主菜单项“选项|音频输出”。
问题我的计算机正在运行Windows的64位版本。我已经为Microsoft语音平台和英语语音安装了64位运行时程序包。但是可用声音列表仍然为空。问题出在哪里?
Answer Balabolka是32位应用程序。您还需要为Microsoft Speech Platform安装32位运行时程序包。
问题每当文本包含不间断空格(ALT + 0160)时,语音将显示“空格”。如何解决这个问题呢?
在阅读过程中,答案程序可以自动将不间断空格替换为常规空格。选择主菜单项。设置并选中“设置”窗口(“阅读”选项卡)中的“阅读时忽略字符”框。在可忽略的符号列表中添加不间断空格:按ALT并在数字键盘上键入“ 0160”。
问题如何删除段落开头的破折号?
答案是您应该使用主菜单项“编辑|替换”。在“查找内容”框中键入^ p-,在“替换为”框中键入^ p。您可以在此处找到有关特殊代码的更多信息。
问题什么是Google文字转语音?
在Google翻译中,您可以找到一个“听”按钮,可将文本转换为语音。按下此按钮后,浏览器开始下载MP3文件。该服务支持将语音文本转换为不超过100个符号。 Balabolka允许在小部件上分割大文本,为每个小部件创建音频文件并将它们合并在一起(支持WAV,MP3和OGG格式)。
问题我使用声音eSpeak将字幕转换为音频文件。但是生成的音频文件包含没有暂停的语音。问题出在哪里?
回答我强烈建议不要使用eSpeak进行字幕转换。这些声音不支持XML标签“ silence”。在某些其他声音的旧版本中,也会出现相同的问题。建议使用最新版本的商业软件(Cepstral,CereProc,IVONA等)。
问题我对Balabolka如何从PDF文件提取文本不满意。我可以用其他方式处理PDF吗?
从PDF文件提取文本的过程非常复杂,因为PDF文件不包含纯文本。您可以使用外部命令林
用于文本提取的实用程序:例如,Xpdf项目中的程序pdftotext.exe。 将pdftotext.exe复制到Balabolka文件夹中的子文件夹“ utils”,选择主菜单项“ Options | Text Import”,选项卡“ Custom Text Import”,然后单击Add按钮。 使用pdftotext.exe定义命令:
%BFolder%\ utils \ pdftotext.exe -q -nopgbrk -enc UTF-8%输入%%输出%
定义转换器的名称(例如,“ Xpdf Converter”),文件扩展名(“ PDF”)和输出编码(“ UTF-8”)。 激活选项“使用”而不是默认Extrac
软件功能:
声音
语音应用程序编程接口或SAPI由Microsoft开发,用于允许Windows应用程序中的语音合成。有两个主要的SAPI版本(SAPI 4和SAPI 5),它们彼此不兼容。
SAPI 5(Microsoft Speech API 5.x)
无RHVoice和开源语音合成器(它支持英语,世界语,格鲁吉亚语,俄语,乌克兰语,吉尔吉斯语和S语):
RHVoice
Yaroslav Kozak(乌克兰利沃夫)创建的UkrVox-乌克兰语语音:
UkrVox Igor
无Ekho的TTS引擎(它支持粤语,普通话和六安客家):
回声(中文)
为了获得更好的语音质量,您可以购买Acapela Group,Cepstral或IVONA Voice。它们是使用大型语音数据库的下一代TTS引擎,因此语音质量出色。
音频片段
Balabolka允许将指向外部音频文件(音频剪辑)的链接插入文档文本中。使用主菜单项“文本|音频剪辑”选择音频文件名。支持的格式:WAV,MP3,OGG。
拼写检查
Balabolka实现了拼写检查引擎Common Speller API(CSAPI)进行拼写检查。 CSAPI适用于所有包含拼写检查的Microsoft应用程序
更改-用从“建议”字段中获取的正确单词替换当前单词。
更改全部替换用在“建议”字段中获取的正确单词替换描述中所有出现的所选单词。
忽略跳过当前单词而不更改它,然后移至下一个拼错的单词。
忽略全部-跳过描述中当前出现的所有单词而不更改它,并继续到下一个拼错的单词。在当前的Balabolka会话中,该单词的拼写正确。
添加-将当前单词添加到用户词典。
查找并替换文字
该程序允许在当前文档中搜索文本并将其替换为其他文本。非打印字符支持Microsoft Word中的大多数特殊代码:
使用说明:
上下文标记定义(SAPI 5)
XML CONTEXT标记指定文本块的规范化。该规范定义了CONTEXT标签的SAPI预定义属性(ID)。这些ID是字符串。 SAPI不会对传递给引擎的字符串执行任何参数验证,因此应用程序可以为引擎指定引擎特定的标准化ID。引擎特定的字符串以引擎供应商的名称开头,以避免引擎之间的混淆。
例如:
本
这些值中某些值的确切实现取决于SAPI 5中使用的引擎。要强制某种标准化,应用程序开发人员可以选择标准化文本,或使用其他SAPI标签或引擎特定的ID。每个上下文标记可以包含多个字符串。
例如:
99/12/21/99 11/21/99 10/21/99
将被标准化为“ 1999年11月29日至11月29日至1999年10月29日以及1999年”。
支持以下预定义的上下文类型:
日期
时间
数
网页
电子邮件
地址
日期
例如,此上下文指定传递给引擎的数字为日期。日期通常采用数字[分隔符]数字[分隔符]数字或数字[分隔符]数字的格式,分隔符可以为'。 ','/'Or'-',通常在01到12个月之间,以及01到31天之间。一年通常是两位或四位数。
以下是有效的字符串类型:
这将标准化日期,以便第一组数字是月份,第二组数字是日期,第三组数字是年份。如果年份是两位数,则引擎会将其读取为两位数或四位数字。
例如:
99/12/21
将标准化为“ 99年12月29日”
或“ 12月21日九十九”
1999年12月21日
将被标准化为“ 1999年12月21日”
这将标准化日期,以便第一组数字是日期,第二组数字是月份,而第三组是年份。如果年份是两位数,则引擎会将其读取为两位数。如果将年份表示为四位数的数字,则将其表示为四位数的年份。
例如:
99.12.99
将标准化为“ 99年12月29日”
或“ 12月21日九十九”
1999年12月21日
将被标准化为“ 1999年12月21日”
Date_ymd
这将准化日期,以便第一组数字是年份,第二组数字是月份,第三组数字是日期。如果年份是两位数,则引擎会将其读取为两位数。如果将年份表示为四位数的数字,则将其表示为四位数的年份。
例如:
99-12-21
将标准化为“ 99年12月29日”
或“ 12月21日九十九”
1999.12.21
将被标准化为“ 1999年12月21日”
Date_ym
这将标准化日期,以便第一组数字是年份,第二组数字是月份
服务。如果年份是两位数,则引擎会将其读取为两位数。如果将年份表示为四位数的数字,则将其表示为四位数的年份。
例如:
9
将被标准化为“十二月九十九
或“ 99年12月”
1999.12
将被标准化为“十二月九十九”
Date_my
这将标准化日期,以便第一组数字是月份,第二组数字是年份。如果年份是两位数,则引擎会将其读取为两位数。如果将年份表示为四位数的数字,则将其表示为四位数的年份。
例如:
12/99
将被标准化为“十二月九十九”
或“ 99年12月”
12/1999
将被标准化为“十二月九十九”
Date_dm
这将标准化日期,以便第一组数字是日期,第二组数字是月份。
例如:
21.12
将被标准化为“ 12月21日”
Date_md
这将使日期标准化,以便第一组数字是月份,第二组数字是日期。
例如:
12/21
将被标准化为“ 12月21日”
Date_year
这将使日期标准化,以便将数字读取为一年。
例如:
1999年
正常化
XML标记(SAPI 5)
APISAPI 5综合标记是将可扩展标记语言(XML)标记插入文本中以修改该文本的语音合成的集合。这些提供了音量控制和单词强调等功能的XML标签将插入文本中。默认情况下,SAPI XML解析器会自动检测XML。在无效的XML结构的情况下,程序可能会返回语音错误。
每个XML元素都包含一个开始标签和一个结束标签,其中包含不区分大小写的标签名称以及这些标签之间的内容。如果素为空,则没有内容,并且开始和结束标签可能相同。
所有XML元素必须正确地相互嵌套。
错误的:
文本
正确:
文本
由于元素是在元素内部打开的,因此必须在元素内部关闭。
使用主菜单项“文本|插入XML标签”将标签添加到所选文本。开始标记插入在所选文本的开头,结束标记插入在文本的结尾。
SAPI文本到语音(TTS)XML标签分为几类。
语音状态控制
直接插入物品
语音环境控制
语音选择
自定义发音
语音状态控制标签
SAPI TTS XML支持五个用于控制当前语音状态的标签:音量,速率,音调,发声和拼写。
体积
音量标签控制语音音量。标签可以是空的,在这种情况下它适用于所有后续文本,或者可以包含内容,在这种情况下,它仅适用于该内容。
音量标签具有一个必需的属性:级别。此属性的值应为0到100之间的整数。超出此范围的值将被截断。
文本该文本的音量应该为50。该文本的音量级别应该为100。
所有以下所有文字应在80级左右讲。
一百表示语音的默认音量。较低的值表示此默认值的百分比。即,50相当于总量的50%。
率
速率标签控制语音速率。标签可以是空的,在这种情况下它适用于所有后续文本,或者可以包含内容,在这种情况下,它仅适用于该内容。
费率标签具有两个属性,即Speed和AbsSpeed,其中之一必须存在。这两个属性的值应为负10到10之间的整数。超出此范围的值可能会被引擎截断(但不会被SAPI截断)。 AbsSpeed属性控制语音的绝对速率,因此10的值始终对应于10的值,而5的值始终对应于5的值。
这篇文章应该讲五分。该文字的否定率为5。
所有下面所有的文字都应以十分之一的速度说出来。
速度“速度”属性控制相对语速。通过将每个Speed与当前绝对值相加来找到绝对值。
该文本应以五等速率朗读。该文本应以零率讲。
零表示默认语音速率。正值更快,负值更慢。
混凝土沥青
音高标签控制声音的音高。标签可以是空的,在这种情况下它适用于所有后续文本,或者可以包含内容,在这种情况下,它仅适用于该内容。
Pitch标签具有两个属性,Middle和AbsMiddle,其中之一必须存在。这两个属性的值应为负10到10之间的整数。超出此范围的值可能会被引擎截断(但不会被SAPI截断)。
AbsMiddle属性控制语音的绝对音高,因此,值10始终对应于值10,而值5始终对应于值5。
这篇文章应该在第五档中讲。此文寿
ld表示为负数5。
所有下所有文字均应在第十声音中说出。
Middle属性控制语音的相对音高。通过将每个“中”加到当前的绝对值来找到绝对值。
这篇文章应该用第五种语调来讲。这段文字应以零间距讲。
零表示语音的默认中间音高,具有较高的正值和较低的负值。
紧急医疗队
Emph标签指示语音强调的单词或部分文本。 Emph标签不能为空。应强调以下几句话。
强调方法可能因声音而异。