❶ 单片机开发板能不能与语音芯片连用
你好!
1、开发板可以和语音芯片连接,然后通过编程控制语音芯片;
2、开发板上有按键,可以编程实现语音芯片分段语音录放等;
3、拓展功能,可以增加无线控制语音芯片。
4、具体实现功能,可以,私,信,说明
❷ 使用单片机+语音芯片实现语音通信
你说的是声音数据的传输,看你的采集速度,要音质好,51单片机的运行速度估计挺吃力(另:长距离传输必须使用串行方式,更加减缓了速度),如果你要做,可能也行,实时比较难,主要是从录音芯片那读取数据挺麻烦,然后就是串行传输了。
其实我觉得这种工作更适合DSP做,因为主要就是处理数据流:录音芯片输出→转换为通信信号→转换为声音信号→喇叭播放,主要做的都是信号处理,你好好看看DSP的资料吧,它比较适合你的任务,就是可能要多学点知识。希望我能帮助到你。
❸ 文字转语音芯片(单片机用)
45Microcontrollers & Embedded Systems2002.12
新器件新技术 NEW PRODUCT & TECH
用EP7211实现传呼信息实时语音合成和播放
■ 郑州解放军信息工程大学 胡泽明 王鹏
摘 要
关键词
阐述在一款集成传呼功能的二合一PDA系统中,使用嵌入式处理器EP7211实现个人传呼信
息的实时语音合成和播放的功能,主要包括字符语音库的建立,字符语音合成算法和Codec
语音中断服务例程等3部分.
PDA G.729 语音库 语音合成
引 言
PDA(Personal Digital Assitant,个人数字助理)
是近年来继寻呼机和移动电话之后,在国内市场迅
速崛起的便携式电子产品.就其扩展意义来讲,它
能够集成移动计算,电话和网络等多种功能.根据
不同的应用需求,它可以管理个人信息,提供名片
存储和日程安排,也可以接收各种寻呼信息(如股
市,天气预报等).如果是集成通信模块,还可以
作为移动电话使用,进行无线网络互联.广义的
PDA包括简单的电子记事本,电子辞典和功能强大
的掌上电脑,它们的主要区别表现在操作系统,存
储能力,运算速度和数据交换能力等方面.
目前国内传统PDA产品经过几年的高速发展
后,市场基本饱和,销售额出现负增长.不过由于
PDA产品的灵活性,有针对性的行业应用作为一个
新亮点,开始为人们所关注.经过行业应用改造后
的PDA产品,已经在国内市场大显身手.文曲星
展现超强的语言翻译能力,比较适合于大学生和语
言翻译者使用;蓝火系列能实时接收股市信息和
专家点评,适合工薪阶层的炒股者.国家信息产业
部已经鼓励PDA产品在交通,警务,保险等领域
的行业应用和推广.
分析市场需求,我们研发了集成传呼功能的,
专门面向铁路交通行业应用的铁路交通信息系统
PDA.本PDA系统除了具备传统PDA的个人名片
管理和辞典检索等功能外,同时提供交通行业应用
的民航航班查询,铁路列车时刻表查询等功能.
本PDA的寻呼系统实现如下功能:能够通过寻
呼对列车时刻表,列车晚点信息,列车剩余票额,
股道信息等行业数据进行动态更新.作为另一个特
色,当接收到个人寻呼时,能够将寻呼内容实时地
转换成语音并播放.
下面重点介绍本PDA系统中使用嵌入式处理
器EP7211实现个人寻呼内容的实时语音转换和播
放.该功能的实现包含前后相关的3个部分:字符
语音库的建立,字符的语音合成算法和Codec语音
中断服务例程.
1实现条件和要求
PDA属于嵌入式应用系统,其同一般PC机有
很大差别.硬件方面,嵌入式处理器基于RISC体
系结构,一般工作频率在几十MHz,甚至更低;系
统内存容量一般在几百KB~几MB之间;一般使用
容量小的ROM或者Flash作为硬盘来存储可执行程
序和数据.软件方面,PDA系统一般有专用的嵌入
式操作系统和软件开发调试移植环境.
个人传呼信息的特点是单条传呼信息长度变化
较大,20~50个字符不等.最为常见的是"请回电
话***";传呼信息涉及到的字符数量较大,字符
语音合成时运算量大,单字符合成后语音数据占用
的存储空间多;需要事先建立字符语音库等.
由于具体硬件环境的限制,传呼信息的特点和
语音合成的要求,该功能能够实现的前提有:语音
库占用的空间小;字符合成时速度要快;采用前台
进行字符语音合成时,以后台中断方式进行合成语
音的播放来保证其实时性和连续性.
2具体实现
下面分别介绍字符语音库的建立,字符语音合成
算法,本PDA系统的框架结构和语音中断服务例程.
2.1建立字符语音库
我们选用G.729语音压缩编码标准来建立语音
库.该标准采用的算法是共轭结构的代数码激励线
462002.12
新器件新技术 NEW PRODUCT & TECH
性预测(CS-ACELP),是基于CELP(码激励线性预
测)编码模型的算法.这种编码规范的严格性使性
能达到或超过了32 Kbps的G.726 ADPCM编码,具
有很高的语音质量;同时,它是在语音信号8 KHz
取样的基础上得到16 bit线性PCM后进行编码的,
压缩后的数据速率仅为8 Kbps,具有相当于8:1的
高压缩率.其算法延迟少于16 ms.由于G.729编解
码器能够实现很高的语音质量和很低的算法延时,
因此被广泛地应用.
字符语音库是一个单字发音语音数据的集合,
各段数据之间相互独立,不具有相关性.语音库包
含了国标一,二级字库中的所有6763个汉字,10个
阿拉伯数字和26个英文字符的标准普通话语音数
据.每个汉字或字符发音时长为0.65 s,采用8 KHz
抽样频率,使用了G.729A语音编码算法对上述的语
音数据进行压缩,压缩后的数据速率为8 Kbps,相
当于具有8:1的高压缩率.在汉字中,同音字占了
相当大的比例,而在语音合成中对于同音字的处理
是没有区别的,故近7000个汉字,我们只存储1123
个不同的发音.经过同音字处理和采用G.729A标准
压缩字符语音数据,则最终建立的语音库文件大小
为729 950字节,完全符合本PDA系统的数据存储
要求;否则,语音库数据量太大,本PDA系统不
能接受!
建立一个语音压缩数据库的具体步骤如下:
◇ 将数字和常用汉字的标准发音独立地录入到
数据文件中,作为基础数据.使用cooledit2000软
件完成语音的录入.
◇ 对于输入数据,按照每帧10 ms(80个样点)
的长度,将A_law语音通过简单换算变成16 bit PCM
数据,作为编码算法的输入.
◇ 按照G.729A算法标准,对数据进行编码.
◇ 将编码后的数据转换为二进制比特流,写
入语音库文件中.压缩后数据速率为8 Kbps,具有
相当于8:1的高压缩率.
用C语言实现这一过程的程序流程如图1所示.
字符语音库的建立是在Windows平台及Visual
C++编程环境下实现的,最终压缩处理后数据量的
大小为729 950字节,每个字符语音数据的大小是
650字节.
2.2语音合成
当收到个人传呼信息时,语音合成程序首先从
指定位置获取传呼信息数据,然后在语音库中查找
每个汉字,阿拉伯数字或者英文字符的发音,重组
一个数据文件.解码程序对该文件进行解码并且输
出原始语音.语音合成流程如图2所示.
语音合成过程首先是当前字符在语音库的定
位.对于10个阿拉伯数字和26个英文字符,将其
放在语音库开头.这些字符的查找比较方便.汉字
是2字节存储,我们依据其区位码来作为语音库中
的定位索引.字符语音库检索结束后的语音压缩数
头文件,全局变量,函数原型的说明
输入语音文件及压缩后的码文件名
初始化编码器,包括滤波器状态的初始
化及语音,激励等缓冲区的初始化
语音文件是否结束
读1帧语音(80点)(A_Law)
转换成16bit线性PCM
将参数码字转成串行码
流,再转成码字codeword
写文件
结束
编码主函数Coder_ld8a()
Y
N
图1 字符语音库的建立流程图
查找语音库,将寻呼文字信
息替换为压缩语音文件
解码器初始化
码文件是否结束
读取1帧数据,并
转换成二进制码流
解码主函数
输出数据变为A_LAW信号
语音播放
结束
Y
N
图2 语音合成流程图
47Microcontrollers & Embedded Systems2002.12
新器件新技术 NEW PRODUCT & TECH
据作为该字符解码过程的输入.
数据解码过程可以分为参数解码和重构信号后
处理2部分.首先要从输入的数据中提取参数符
号,对这些符号解码之后,可以获得相应于10 ms
话音帧的编码器参数.这些参数包括线性预测系
数,自适应码本矢量,固定码本矢量以及它们的增
益.解码之后的参数用来计算重建语音信号.得到
重构语音信号只有通过后处理过程来对该信号进行
放大,包括后向滤波,高通滤波以及按比例因子扩
大,最后得到原始的语音数据.
字符解码器原理如图3所示.
2.3PDA系统的体系结构
PDA系统的硬件体系结构如图4所示.
PDA系统中嵌入式处理器EP7211进行数据处
理,传呼解码芯片接收传呼信息并进行解码, LCD
提供数据输出显示,触摸屏提供用户输入接口,
Flash用来存储应用程序和数据,SRAM为程序运行
提供内存空间,电源电路为嵌入式处理器和外围设
备提供所需要的工作电压.
嵌入式处理器EP7211是Cirrus Logic公司专门为
低成本,超低功耗的嵌入式应用设计的,包含
ARM7TDMI处理器内核和丰富的外围接口.外围接
口有CODEC音频接口,SPI串行A/D接口,单色LCD
接口,DRAM接口,红外接口,2个PWM接口,实
时时钟RTC以及电源检测接口.EP7211的内核电路
工作在2.5 V,而外围电路工作在3.3 V;可根据具
体情况对内核的
时钟进行动态编
程控制,可工作
在18,36,49和74
MHz.另外EP7211
还有3种基本供
电模式:正常操
作(operating),
空闲(idle)和等
待(standby).在
等待模式,主时
钟被关断,整个
CPU及相关外围
(除中断和RTC)
也关断,但可通
过中断或按钮来
唤醒.
系统软件开发平台采用了我们自主开发研制
的,专门面向嵌入式应用系统开发的XGW平台.
XGW开发平台采用消息驱动机制,是C语言开发.
它功能强大,模块化设计,扩展性强,产品升级容
易,总体框架如图5所示.
图5全面反应了XGW开发平台的体系结构,包
括事件消息驱动机制,内存管理,字符和图形显示
输出,图形组件库等.图形组件库中的编辑框,列
表框,按钮等为用户应用程序开发提供了系统应用
编程接口API.不过,XGW平台对于系统硬件的中
断响应没有提供统一的入口和出口,需要开发人员
单独处理.XGW开发平台的消息分为鼠标消息,键
盘消息和定时器消息等3类.
2.4语音中断服务例程
嵌入式处理器EP7211本身提供的外设语音录放
Codec(coder/decoder)芯片可以实现语音的录入和
适应码
向量解码
增益解码
固定码
向量解码
结构激励
MA码增
益预测
11
,GBGA
22
,GBGA
)(nv
间隔延时
p
g^
^
c
g^
11
,CS
22
,CS
)(zP
)(nc
编码序号
LP综合
滤波器
)(nu
后滤波器
)(^ns
高通上标定
)(nfs
LSP解码内插值)(^zALSF
LSP序号
3210
,,,LLLL
每帧
每子帧
210
,,PPP
图3 字符解码原理框图
天线
LCD
触摸屏
时钟,复
位,唤醒射频输入
FlashSRAM电源管理
串行口
红外口
传呼解
码芯片嵌入式
处理器
EP7211
收音设备
语音录放电路
图4 硬件结构
482002.12
新器件新技术 NEW PRODUCT & TECH
播放功能.该模块提供2个独立的16字节长的数据
发送和接收缓冲区(FIFO),其为全双工模式,数
据收发速率是64 kbps.芯片自身提供工作时钟,定
时脉冲以及数据的串/并和并/串转换功能.编程
人员通过设置EP7211相应的控制寄存器使能这些项
功能,则每当数据收发缓冲区半慢或者半空时(8
字节),芯片自身就会产生一次中断信号供外部处
理.理论计算芯片中断速率是1 ms/次.
语音播放中断服务例程主要完成的工作是,当
产生语音中断时,仍然有数据需要播放,则向语音
数据发送缓冲区FIFO中写入指定数据,剩下的工
作由Codec芯片本身来完成.中断服务例程ISR的
伪代码如下(因为具体实现代码没有通用性,故此
处用伪码描述):
void IRQ_Codec_Handler(void)
{
while(检测系统状态寄存器,发现语音芯片数据发送缓
冲区FIFO非满)
{
if(已经播放过的语音数据长度 = 给定的需要播
放的语音数据长度) //结束
{
禁止数据发送缓冲区中断;
复位各相关的全局变量;
程序返回;
}
}
else
{
向语音芯片发送数据缓冲区FIFO写入默认数据
系统调用
通用开
发控件字符输出图形输出
内存管理用户自
定义控件
事件消息驱动
硬件中断
执行
ISR
中断返回
硬件中断
执行
ISR
中断返回
用户级应用程序
图5 XGW平台的软件体系结构
0XFF;
}
}
}3试验结果和分析
由于在设计阶段充分考虑过语音合成算法的
大运算量和系统的实时性要求,故我们在具体实
现的时候也采取了一些措施,比较突出的有:用
ARM汇编语言来实现关键性的函数代码;语音合
成时提高处理器EP7211的工作频率(处理器正常
工作频率是18 MHz);对于一些常用的三角函数计
算,采用查表的方式等来加快程序执行速度.在
PDA样机测试中,单字符合成时间在650 ms左右,
基本上能够满足实际应用需求.数据语音库经过
处理之后,占用了729 560字节也能够满足本PDA
系统的存储要求.
当PDA系统收到1条个人传呼信息时,在语音
库的支持下,立刻启动语音合成算法,逐个进行字
符语音合成.当第1个字符语音合成结束后,立刻
启动语音中断服务例程进行语音播放.这样收到的
个人传呼信息,在前台逐个字符解码时,其后台语
音播放也在进行.根据实际测试参数,基本上满足
了系统的实时性要求.
从一定角度看,单字符650 ms的语音合成时间
基本能够满足实际应用需要,但还是希望能够进一
步减小这个值.这由于我们对ARM处理器的使用
还处在研究阶段.ARM本身提供了16位的Thumb
指令集和32位的ARM指令集,而且两者在某些方
面表现出较大差别.一般来讲,Thumb代码长度是
ARM代码长度的65%,而执行效率要比后者高出
60%.但在某些方面,32位的ARM指令集也会表
现出其优于16位Thumb指令集的强大功能;同时
该处理器系统支持ARM指令集和Thumb指令集混
合编程模式.随着对二者差别和各自优势的深入理
解,结合本系统的硬件体系结构,采用有效的指令
集混合编程模式将会使程序执行效率进一步提高,
从而使实时性得到进一步加强.
参考文献
1Cirrus Logic公司. EP7211数据手册
2马忠梅. ARM嵌入式处理器结构与应用基
础. 北京:北京航空航天大学出版社,2002
3Gibson Jerry D,等. 多媒体数字压缩原理与
标准. 李煜晖等译. 北京:电子工业出版社,2000
❹ 51单片机如何实现语音功能
单片机需要增加语音功能,要么选择功能强大stm32之类的芯片,用内部的dac来模拟输出,要么就外挂一个语音芯片
语音芯片的作用
1、顾名思义,就在是产品上增加语音播报的功能,实现的也就是把语音播放出来
2、常见的如:停车场报金额、电梯报站、货车报“左转弯,请注意”等等,应用非常的广泛
语音芯片的种类,不过主要的分类基本也就大致三种
1、第一种,称之为OTP,就是那种SOP8封装的语音芯片,内置几段常用的语音,出厂之后就固话死了,不可修改
2、第二种,称之为flash语音芯片,通常是一个主控芯片外挂一个spiflash,主控芯片是不变的,而flash则是可以重复烧录的,但是语音往往只支持wav,所以音质会压缩的很差。代表的如WT588D
3、第三种,就是现在最优秀的KT404A芯片,他是支持MP3解码,比前面的两种在技术上是一个跨越,将MP3这种优秀的技术应用于语音芯片上,同时他强大的usb直接虚拟flash成为U盘,这样更新语音非常方便
您选的单片机有4个串口,随便拿一个出来控制KT404A就好了
KT404A外挂一个spiflash,通过usb直接更新语音
❺ 单片机实现语音功能需要语音芯片吗语音芯片的功能表是怎么样的
NVD 系列语音芯片具有多种按键触发方式,且可以输出多种形式的电平信号,可以设定按语音的起伏节奏变化。另外 NVD 支持主控 MCU 一线串口控制,可以任意控制多段语音触发,是市面上唯一 8 脚芯片支持 223 段声音的语音芯片,封装形式有:SOP8、COB 等,外围电路仅需一电源耦合电容即可, 工作稳定,宽泛的工作电压,超低的待机功耗以及宽耐温性能都使NVD 系列语音芯片在广泛的应用领域中拥有一流的性价比优势。
NVD语音芯片功能特点 :
1.OTP 存储格式,生产周期快,最快仅需一天,下单无最小量限制;
2. 灵活的多种按键操作模式以及电平输出方式供选择(边沿按键触发、电平触发、随机按键播放、顺序按键 播放);
3. 简单方便的一线 MCU 串口以及控制方式,用户主控 MCU 可控制任意段语音的触发播放及停止;
4. 语音时长 40 秒,80 秒、170 秒、340 秒; 内置一组 PWM 输出器可直推 0.5W 喇叭;
5. 支持 16 级音量调节,支持循环播放等多种功能; 灵活的放音操作,通过组合可节省语音空间,最多可播放 220 个语音组合;
6. 音质优美,性能稳定,物美价廉,静态电流小于 2uA; 内置 LVR 自复位电路,保证芯片正常工作;
7. SOP8 以及 COB 封装可供选择,使用方便,应用灵活;
8. 支持 4 和弦 MIDI 播放,音质非常优美;
9. 外围电路简单,仅需一耦合电容; 工作电压范围:2V~5.5V;
10. IO 口丰富,内置 MCU,可以定制各种特殊功能。
❻ 单片机控制系统中,什么语音芯片最好用,顺便给个C例子,谢谢了!
NVD系列八脚语音芯片是广州九芯电子科技最新推出的一款适合工厂量产型的工业级OTP语音芯片,具有音量调节功能,连码播报,音质高,控制方便,电路简单,多种实用的封装形式等诸多显着优点,可以任意控制多段语音触发,是市面上唯一8脚芯片支持220段声音的语音芯片。
适合多种型号的单片机
❼ 单片机控制语音芯片播报数字
NVC系列八脚语音芯片是广州九芯电子科技最新推出的一款适合工厂量产型的工业级OTP语音芯片,它可外接DAC电路,具有音量调节功能、音质高,控制方便,电路简单,多种实用的封装形式等诸多显着优点,可以任意控制多段语音触发,是市面上唯一8脚芯片支持220段声音的语音芯片。
❽ 请问语音芯片与单片机的关系,谢谢!
语音芯片定义:将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。
普通语音芯片放音功能实质上是一个DAC过程,而ADC过程资料是由电脑完成,其中包括对语音信号的采样、压缩、EQ等处理。
单片机:单片机是一种集成在电路芯片,是采用超大规模集成电路技术把具有数据处理能力的中央处理器CPU随机存储器RAM、只读存储器ROM、多种I/O口和中断系统、定时器/计时器等功能(可能还包括显示驱动电路、脉宽调制电路、模拟多路转换器、A/D转换器等电路)集成到一块硅片上构成的一个小而完善的计算机系统。
也就是说 语音芯片 是具有某种特定功能的的芯片,而单片机好比一台计算机,在它的基础上,你可以实现很多功能。其实,单片机就是一台计算机,只是可能功能比我们平常见到的PC机更专一,也没PC那么强大。也就是说,你可以在单片机的基础上实现语音芯片~~
❾ 基于单片机的语音芯片控制
直接用语音芯片比如lsd1760,可以录音60妙,我当时用它做了语音门铃和公交车报站系统,可以用定点放音功能,可以实现对于不同的输入输出不同的声音,具体的你都可以到我文库中看,我那儿有资料,我手机上网给你发不了,要是你全身心投入来作的话,估计十三天就没多大问题,如果你编程不好则另说了
❿ 单片机如何控制语音芯片,
APR9600(语音录放)
台湾公司最新推出的APR9600语音录放芯片,是继美国ISD公司以后采用模拟存储技术的又一款音质好、噪音低、不怕断电、
复录放的新型语音电路,单片电路可录放32-60秒,串行控制时可分256段以上,并行控制时最大可分8段。与ISD同类芯片
它具有:价格便宜,有多种手动控制方式,分段管理方便、多段控制时电路简单、采样速度及录放音时间可调、每个单键均有
停止循环多种功能等特点,同时保留了ISD2500芯片的一些特点,都是DIP28双列直插塑料封装,在管脚排列上也基本相同。
图一是APR9600的全功能使用电路图,图二是APR9600的管脚排列图。表(一)为管脚功能说明。一、并行控制模式
在ISD芯片中要实现某键对某段的多段并行控制是十分复杂的,一般需要大量的二极管译码阵或单片机来辅助实现,另外在分
段录音时也存在很多困难。而在APR9300芯片中却十分简单,每段都有对应的键控制,按哪一键就录、放哪一段,而且可以方便地
对任意一段重新录音不影响其它段、对任意一段循环放音等。只是每段录音的最大时间是等分的,而且最多只能分八段。下面
以需要分四段为例说明:
并行四段控制需要将芯片的MSEL1端置1(高电平)、MSEL2端置0(低电平)、/M8端任意。模式置好后开始录音,置RE
端为0,压住/M1即听到“嘀”一声BUSY指示灯亮起即开始录音第一段,松键时又听到“嘀”一声BUSY指示灯熄灭即录音停止。
/M2、/M3、/M4分别录其他三段。录音时可以不按顺序,先录任意一段均可,不满意可重新录音。每段的最大时间为15秒(以全
片60秒录音计),录满时指示灯熄灭并响“嘀嘀”两声,当然实际每段录音可以长短不一。置RE端为1即是放音状态,按一下/M1
即放音第一段,放音期间再按一下/M1即停止放音,如果压住/M1键不放即循环放音第一段直到松键。/M2、/M3、/M4均分别控制第二、三、四段。/CE键为停止键,放音期间按一下它也能停止放音。
其它并行二段、八段的控制使用方式相同。
二、串行控制模式
串行控制方式用到的键要少得多,它仅需要一、二个键来控制所有的语音段录放,而且段数可以足够多,每段也没有时间限制。
只是在选段上没有并行控制模式方便。
置MSEL1、MSEL2均为0,在录音时/M8置1。置/RE端为0为录音状态,按住/M1即开始录第一段,松键即停止。再按住/M1
即录第二段,如此一直分段录音,直到芯片溢出。
在放音时(/RE=1)有两种状态,/M8置1为串行顺序控制方式,按一下/M1即放音第一段,再按一下即放第二段,如此顺序
逐段放音,到最后一段结束时即停止放音,必须按一下CE键复位,然后再按/M1键就可以又从第一段放音。这种方式下的段不可选
择只能按录音的顺序播放,适合走马灯、流程控制等电路使用;/M8置0为串行选段控制方式,按一下/M1只能放音第一段,再按
还是放音第一段。这时的/M2有效成为快进选段键,每按一下/M2即向后移动一段,例如现在按了三下/M2,再按/M1就放音第四段。
因此可以实现选段放音。按/CE键复位为第一段。
APR9600芯片还有其它几种控制方式,用户可根据需要自行实验设计。
APR9600的电性能参数:电源电压4.5-6.5V,静态电流1uA,工作电流25mA。其外接振荡电阻与采样率、语音频带、录放
时间的关系见表(三),该电阻可以根据用户需要的时间和音质效果无级调节。
单片机接M1-M8就行了