CS1430 Final Project - Parrotfish

Team Members

Rayhan Meghji
Matthew McQuistion

Description

Our project combines audio source separation targeting timbral differences with visual speaker identification, where both methods employ the Discrete Wavelet Transform.

Usage

Our model can be used on Hugging Face Spaces to process video and audio files either separately or together, or locally with:

python src/main.py for audio
python src/vision/main_vision.py for video.

Name		Name	Last commit message	Last commit date
Latest commit History 169 Commits
src		src
.DS_Store		.DS_Store
.gitignore		.gitignore
ParrotfishFinalProjectReport.pdf		ParrotfishFinalProjectReport.pdf
README.md		README.md
parrotfish.ipynb		parrotfish.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CS1430 Final Project - Parrotfish

Team Members

Description

Usage

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

rmeghji/parrotfish

Folders and files

Latest commit

History

Repository files navigation

CS1430 Final Project - Parrotfish

Team Members

Description

Usage

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages