导航:首页 > 编程语言 > python识别音频音高

python识别音频音高

发布时间:2023-02-09 04:59:53

1. python中音频图像识别和网页相关的库合集!

1、OpenCV

OpenCV是最常用的图像和视频识别库。毫不夸张地说,OpenCV能让Python在图像和视频识别领域完全替代Matlab。

OpenCV提供各种应用程序接口,同时它不仅支持Python,还支持Java和Matlab。OpenCV出色的处理能力使其在计算机产业和学术研究中都广受好评。

2、Librosa

Librosa是一个非常强大的音频和声音处理Python库。Librosa可以用来从音频段中提取各个部分,例如韵律,节奏以及节拍。

像Laplacia分割这样极度复杂的算法,在使用了Librosa之后只需几行代码就能轻而易举的运用。

Python在被广泛运用于数据科学领域前,曾经可是网页开发领域的宠儿。因此也有很多用于网页开发的库。

3、Django

要想使用Python来开发一个网页服务后端,Django一直都是不二之选。Django的设计理念便是,能用几行代码就建立一个网站的高级框架。

Django直接与大多数知名数据库相连,这样使用者就可以省下建立连接和数据模型开发的时间。Django的使用者只需专注于业务逻辑而不需担心受创建、更新、读取和删除(Create,update,retrieve and delete, CURD)的操控,因为Django是一个由数据库驱动的框架。

4、Flask

Flask是一个用于Python的轻量级网页开发框架。其最宝贵的特点是能够轻而易举地进行能够满足任何需求的定制化处理。

有很多提供网站UI的知名Python库和Python工具都是使用Flask构建的,例如Plotly Dash和Airflow。这些网站之所以使用Flask,正是由于其轻量级的特点。

诚然,还有许多优秀的Python库应当被提及,但上述这些库就足够你研究好一阵子了。人生苦短,及时Python!

更多python知识,请关注python视频教程!!

2. Python中怎样实现离线音乐识别

Python中实现离线音乐识别方法:
1.先安装PyAudio python -m pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl
2.安装语音识别 pip install SpeechRecognition
3.安装离线语音识别 python -m pip install pocketsphinx-0.1.15-cp37-cp37m-win_amd64.whl
4.无普通话库 下载地址https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/选 Mandarin文件夹 Mandarin->cmusphinx-zh-cn-5.2.tar.gz。

3. Python pyb音频处理

Pyb可以让你用简单的方式处理音频。

Pyb提供了简洁的高层接口,极大的扩展了python处理音频文件的能力。

GitHub链接: pyb-github

GitHub:

pyb的使用必须安装对应的依赖软件 ffmpeg 或 avconv

验证是否安装成功:

Open a WAV file

Open a mp3 file

Open a other file

切割音频

分贝操作
分贝(decibel)是量度两个相同单位之数量比例的计量单位,主要用于度量声音强度,常用dB表示。

音频链接
将一个文件添加到另一个文件的末尾

音频长度

淡入淡出

重复音频

再次淡入淡出

直接保存
所有ffmpeg支持的都支持

用标签保存结果(元数据)

实例:

将mp3文件转换成wav文件:

Python音频处理库 pyb

4. 有人在用python开发程序时使用到语音识别相关的东西吗

调用网络语言识别API的

# -*- coding=utf-8 -*-

import base64
import urllib2
import urllib
import json
import wave

def get_token():
URL = 'http://openapi..com/oauth/2.0/token'
_params = urllib.urlencode({'grant_type': 'client_credentials',
'client_id': 'yours',#改成你自己的
'client_secret': 'yours'})#改成你自己的
_res = urllib2.Request(URL, _params)
_response = urllib2.urlopen(_res)
_data = _response.read()
_data = json.loads(_data)
return _data['access_token']


def wav_to_text(wav_file):
try:
wav_file = open(wav_file, 'rb')
except IOError:
print u'文件错误啊,亲'
return
wav_file = wave.open(wav_file)
n_frames = wav_file.getnframes()
frame_rate = wav_file.getframerate()
if n_frames != 1 or frame_rate not in (8000, 16000):
print u'不符合格式'
return
audio = wav_file.readframes(n_frames)
seconds = n_frames/frame_rate+1
minute = seconds/60 + 1
for i in range(0, minute):
sub_audio = audio[i*60*frame_rate:(i+1)*60*frame_rate]
base_data = base64.b64encode(sub_audio)
data = {"format": "wav",
"token": get_token(),
"len": len(sub_audio),
"rate": frame_rate,
"speech": base_data,
"cuid": "B8-AC-6F-2D-7A-94",
"channel": 1}
data = json.mps(data)
res = urllib2.Request('http://vop..com/server_api',
data,
{'content-type': 'application/json'})
response = urllib2.urlopen(res)
res_data = json.loads(response.read())
print res_data['result'][0]

if __name__ == '__main__':
wav_to_text('demo.wav')


5. 如何用PYTHON代码写出音乐

什么是MIDI

说到用代码写曲子,有一个东西大家一定要了解就是MIDI。MIDI是一种乐器数字接口,是编曲界最广泛的音乐标准格式。MIDI并不是真正意义上的音乐文件,大家可以把它理解成乐谱,需要有环境编译MIDI文件,才可以生成音乐。这个关系有点像代码和编译器的关系。市面上可以解析MIDI文件的软件有很多种,本文将用到MuseScore2的软件,以下就是这个软件的截图,界面中的五线谱就是MIDI文件的呈现。这个乐谱是可以播放的,并且可以导出为MP3格式的音乐文件。

下面我们就介绍下生成MIDI文件所使用的Python库。
python-midi库介绍
市面上差不多有十多种python库可以编写MIDI格式的文件,本文会推荐大家使用PYTHON-MIDI。我觉得python-midi的优势是不光可以自己写程序生成MIDI,而且还可以对MIDI文件进行解析。这样的功能配合机器学习算法,或许可以帮助我们实现机器的自动编曲,当然这是后话。先来看下如何安装python-midi。
1.首先进入,将整个项目克隆下来。
2.在程序目录下执行以下命令安装,
python setup.py install11

3.如果想执行某个以mid为后缀的MIDI文件,只要执行以下命令即可:
midimp.py test.mid11

接下来介绍下如何写代码生成midi文件。
实操
在python-midi库中,每个乐谱用Pattern对象表示,乐谱中的每个音轨(通常音乐都有很多轨道组成,每种乐器是一个轨道)用Track对象表示。每个音符的开端用midi.NoteOnEvent表示,结束用midi.NoteOffEvent表示,可以在参数中定义每个字符的音长和音高。示例代码如下:

生成的是一个简单的音阶:

6. Python语音识别,调用的是哪个客户端接口函数

调用腾讯云的语音识别(一句话识别)接口-Python版。
安装语音识别,语音识别器编码,处理Ubuntu服务器,处理WSL。
要运行我们代码的语音识别库,我们首先需要安装语音识别,然后还必须安装PyAudio。首先,我们从主包开始:sudo pip3 install SpeechRecognition安装应该遵循完全相同的格式,但我似乎缺少了让它正常工作的软件包,试图安装PyAudio会出错。这些软件包应该删除该错误。那时我不需要更新apt,但先更新它并不坏处。sudo apt-get install libasound-dev portaudio19-dev libportaudio2libportaudiocpp0有了它,您应该可以安装PyAudio:sudo pip3 install PyAudio语音识别器编码。
运行WSL(Linux版Windows子系统)的Windows机器。它也使用了Ubuntu 16.04,所以安装过程是一样的。不过说到使用麦克风,WSL并不那么简单。为了通过Ubuntu终端应用程序控制麦克风,需要安装PulseAudio。

7. 怎么通过程序(如python)判断一个音频文件(如wav、mp3等格式)的声音清晰度

我用wpf画过wav的频谱图和语谱图,这里有个参考http://www.codeproject.com/Articles/488655/Visualizing-Sound
波形图应该更简单吧 计算声音强度就好了 至于mp3我想应该先解码成pcm

8. 如何用python调用百度语音识别

1、首先需要打开网络AI语音系统,开始编写代码,如图所示,编写好回车。

阅读全文

与python识别音频音高相关的资料

热点内容
加密锁厂家联系方式 浏览:469
怎么执行脚本语言不用编译 浏览:432
目前使用方舟编译的程序 浏览:311
无牙仔电影有几部 浏览:57
外国电影,男人在外星流浪, 浏览:722
用plc编程时基本思路 浏览:474
my是什么app的缩写 浏览:102
性迷宫类似电影 浏览:446
都市警察异能小说主角母女全收 浏览:724
阿甘的英文名 浏览:263
美女情趣体验师 一条震动内裤引发的韩国电影 浏览:673
一女多男主现代小说有哪些 浏览:42
李采谭所有电影 浏览:478
杀破狼2结局都死了吗 浏览:437
主角叫陆宇的小说排行榜 浏览:944
程序员害怕去酒吧 浏览:121
有部很肉的写大学的小说 浏览:421
鬼习班 浏览:699
十四路末班车鬼片电影完整版免费 浏览:349
日本电影 网站 浏览:357