All Projects → KuangDD → Aukit

KuangDD / Aukit

audio toolkit. 好用的语音处理工具箱,包含语音降噪、音频格式转换、特征频谱生成等模块。

Programming Languages

python
139335 projects - #7 most used programming language

Projects that are alternatives of or similar to Aukit

Chromaprint
C library for generating audio fingerprints used by AcoustID
Stars: ✭ 553 (+426.67%)
Mutual labels:  audio, audio-processing, audio-analysis
Guitard
Node based multi effects audio processor
Stars: ✭ 31 (-70.48%)
Mutual labels:  audio, audio-processing
Audio Snr
Mixing an audio file with a noise file at any Signal-to-Noise Ratio (SNR)
Stars: ✭ 100 (-4.76%)
Mutual labels:  audio, audio-processing
Keras Sincnet
Keras (tensorflow) implementation of SincNet (Mirco Ravanelli, Yoshua Bengio - https://github.com/mravanelli/SincNet)
Stars: ✭ 47 (-55.24%)
Mutual labels:  audio, audio-processing
Mad Twinnet
The code for the MaD TwinNet. Demo page:
Stars: ✭ 99 (-5.71%)
Mutual labels:  audio, audio-processing
Mlt
MLT Multimedia Framework
Stars: ✭ 836 (+696.19%)
Mutual labels:  audio, audio-processing
Ebur128
Implementation of the EBU R128 loudness standard
Stars: ✭ 43 (-59.05%)
Mutual labels:  audio, audio-analysis
Tracktion engine
Tracktion Engine module
Stars: ✭ 587 (+459.05%)
Mutual labels:  audio, audio-processing
Audio Pretrained Model
A collection of Audio and Speech pre-trained models.
Stars: ✭ 61 (-41.9%)
Mutual labels:  audio, audio-processing
Beep
A little package that brings sound to any Go application. Suitable for playback and audio-processing.
Stars: ✭ 1,168 (+1012.38%)
Mutual labels:  audio, audio-processing
Awesome Web Audio
A list of resources and projects to help learn about audio
Stars: ✭ 73 (-30.48%)
Mutual labels:  audio, audio-processing
Sincnet
SincNet is a neural architecture for efficiently processing raw audio samples.
Stars: ✭ 764 (+627.62%)
Mutual labels:  audio, audio-processing
Ffmediaelement
FFME: The Advanced WPF MediaElement (based on FFmpeg)
Stars: ✭ 733 (+598.1%)
Mutual labels:  audio, audio-processing
Giada
Your Hardcore Loop Machine.
Stars: ✭ 903 (+760%)
Mutual labels:  audio, audio-processing
Beethoven
🎸 A maestro of pitch detection.
Stars: ✭ 601 (+472.38%)
Mutual labels:  audio, audio-processing
Kfr
Fast, modern C++ DSP framework, FFT, Sample Rate Conversion, FIR/IIR/Biquad Filters (SSE, AVX, AVX-512, ARM NEON)
Stars: ✭ 985 (+838.1%)
Mutual labels:  audio, audio-processing
Machinehearing
Machine Learning applied to sound
Stars: ✭ 83 (-20.95%)
Mutual labels:  audio-processing, audio-analysis
Soundfingerprinting
Open source audio fingerprinting in .NET. An efficient algorithm for acoustic fingerprinting written purely in C#.
Stars: ✭ 554 (+427.62%)
Mutual labels:  audio, audio-processing
Audio Visualizer Android
🎵 [Android Library] A light-weight and easy-to-use Audio Visualizer for Android.
Stars: ✭ 581 (+453.33%)
Mutual labels:  audio, audio-processing
Bpm
Library and tool for dealing with beats per second detection
Stars: ✭ 57 (-45.71%)
Mutual labels:  audio, audio-analysis

aukit

aukit

audio toolkit: 语音和频谱处理的工具箱。

安装


pip install -U aukit

  • 注意

    • 可能需另外安装的依赖包:tensorflow, pyaudio, sounddevice。

    • tensorflow<=1.13.1

    • pyaudio暂不支持python37以上版本直接pip安装,需要下载whl文件安装,下载路径:https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio

    • sounddevice依赖pyaudio。

    • aukit的默认音频采样率为16k。

版本

v1.4.4

audio_cli

命令行,播放音频,去除背景噪声,音频格式转换。

支持递归处理文件夹内的全部音频。

命令行

说明
  • 用位置参数来控制。

  • 名称说明

    • inpath:输入音频路径或目录。

    • outpath:输出音频路径或目录,如果为目录,则输出的子目录按照inpath的子目录格式输出。

    • sr:音频采样率,默认16000或自动识别采样率。

    • in_format:输入音频格式,主要用以限制为指定后缀名的文件,如果不设置,则处理目录的全部文件。

    • out_format:输出音频格式,主要用以音频格式转换,设置输出音频的后缀名。

  • 中括号【[]】里面的是可选参数。

工具

  • auplay: 播放音频

auplay inpath [sr] [in_format]

  • aunoise: 语音降噪

aunoise inpath outpath [in_format]

  • auformat: 音频格式转换

auformat inpath outpath out_format [in_format]

audio_changer

变声器,变高低音,变语速,变萝莉音,回声。

audio_editor

语音编辑,切分音频,去除语音中的较长静音,去除语音首尾静音,设置采样率,设置通道数。

音频格式相互转换,例如wav格式转为mp3格式。

切分音频,去除静音,去除首尾静音输入输出都支持wav格式。

语音编辑功能基于pydub的方法,增加了数据格式支持。

audio_griffinlim

griffinlim声码器,线性频谱转语音,梅尔频谱转语音,TensorFlow版本转语音,梅尔频谱和线性频谱相互转换。

audio_io

语音IO,语音保存、读取,支持wav和mp3格式,语音形式转换(np.array,bytes,io.BytesIO),支持【.】操作符的字典。

audio_noise_remover

语音降噪,降低环境噪声。

audio_normalizer

语音正则化,去除音量低的音频段(去除静音),调节音量。

语音正则化方法基于VAD的方法。

audio_player

语音播放,传入文件名播放,播放wave数据,播放bytes数据。

audio_spectrogram

语音频谱,语音转线性频谱,语音转梅尔频谱。

audio_tuner

语音调整,调整语速,调整音高。

audio_world

world声码器,提取语音的基频、频谱包络和非周期信号,频谱转为语音。调音高,调机器人音。

历史版本

v1.4.4

  • Dict2Obj方法增加parse方法。

v1.4.3

  • 修正Dict2Obj的get方法达不到预期的bug。

  • 修正world声码器变声静音报错的bug。

v1.4.1

  • 修正安装依赖报错的bugs。

  • set系列改为convert系列,如set_sample_rate改为convert_sample_rate。

  • Dict2Obj用dotmap模块的DotMap代替。

v1.4.0

  • 增加音频格式转换方法。

  • 命令行批量处理语音,支持音频播放、语音降噪、音频格式转换。

  • 增加命令行工具:auplay, aunoise, auformat。

  • 调整日志输出方法。

v1.3.12

  • 减少不必要的依赖,最低依赖只保留pydub, scipy, numpy, librosa。
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].