Vladimir Iashin

Results 7 repositories owned by


                                            Vladimir Iashin

BMT

223

Stars

Forks

Watchers

Source code for "Bi-modal Transformer for Dense Video Captioning" (BMVC 2020)

v-iashin

activitynet-captions

audio

bi-modal-encoder

bi-modal-transformer

CS231n

Stars

Forks

Watchers

PyTorch/Tensorflow solutions for Stanford's CS231n: "CNNs for Visual Recognition"

v-iashin

adam-optimizer

assignment

backpropagation

computer-vision

MDVC

138

Stars

Forks

Watchers

PyTorch implementation of Multi-modal Dense Video Captioning (CVPR 2020 Workshops)

v-iashin

activitynet-captions

audio

cvpr-workshop

dense-video-captioning

SpecVQGAN

323

Stars

Forks

Watchers

Source code for "Taming Visually Guided Sound Generation" (Oral at the BMVC 2021)

v-iashin

audio

audio-generation

bmvc

evaluation-metrics

video_features

504

Stars

Forks

Watchers

Extract video features from raw videos using multiple GPUs. We support RAFT flow frames as well as S3D, I3D, R(2+1)D, VGGish, CLIP, and TIMM models.

v-iashin

audio-features

feature-extraction

i3d

ig65m

WebsiteYOLO

Stars

Forks

Watchers

The back-end for the YOLOv3 object detector running as a webapp

v-iashin

flask

object-detection

python

pytorch

SparseSync

Stars

Forks

Watchers

Source code for "Sparse in Space and Time: Audio-visual Synchronisation with Trainable Selectors." (Spotlight at the BMVC 2022)

v-iashin

audio-visual

bmvc

lrs

multi-modal