HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks

Last update: Dec 27, 2022

HiFiGAN Denoiser

This is a Unofficial Pytorch implementation of the paper HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks.

Citations

@misc{su2020hifigan,
      title={HiFi-GAN: High-Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks}, 
      author={Jiaqi Su and Zeyu Jin and Adam Finkelstein},
      year={2020},
      eprint={2006.05694},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
}

Requirement

Tested on Python 3.6

pip install -r requirements.txt

Train & Tensorboard

python train.py -c [config yaml file]
tensorboard --logdir log_dir

Inference

python inference.py -p [checkpoint path] -i [input wav path]

Checkpoint :

References

HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks
Denoising Wavenet Generator
StarGAN VC Discriminator
Melgan Multi-Scale Discriminator
Parallel Wavegan
HiFi GAN vocoder's MSD and multi-gpu training code

HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks

Related tags

Overview

HiFiGAN Denoiser

Citations

Requirement

Train & Tensorboard

Inference

Checkpoint :

References

Owner

Rishikesh (ऋषिकेश)

A no-BS, dead-simple training visualizer for tf-keras

Locally cache assets that are normally streamed in POPULATION: ONE

Tools to create pixel-wise object masks, bounding box labels (2D and 3D) and 3D object model (PLY triangle mesh) for object sequences filmed with an RGB-D camera.

Definition of a business problem according to Wilson Lower Bound Score and Time Based Average Rating

내가 보려고 정리한 <프로그래밍 기초 Ⅰ> / organized for me

TextureGAN in Pytorch

Real-Time Social Distance Monitoring tool using Computer Vision

AutoML library for deep learning

PyTorch experiments with the Zalando fashion-mnist dataset

Generate image analogies using neural matching and blending

Hierarchical Few-Shot Generative Models

Code for the Active Speakers in Context Paper (CVPR2020)

Learning Features with Parameter-Free Layers (ICLR 2022)

3D ResNet Video Classification accelerated by TensorRT

This is implementation of AlexNet(2012) with 3D Convolution on TensorFlow (AlexNet 3D).

Dungeons and Dragons randomized content generator

Offical implementation of Shunted Self-Attention via Multi-Scale Token Aggregation

Lorien: A Unified Infrastructure for Efficient Deep Learning Workloads Delivery

This tool converts a Nondeterministic Finite Automata (NFA) into a Deterministic Finite Automata (DFA)

Wider-Yolo Kütüphanesi ile Yüz Tespit Uygulamanı Yap