webvid

  • opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.

  • Automatyczne buforowanie ( dokumentacja ): Nieznane

  • Podziały :

Podział Przykłady
  • Struktura funkcji :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
podpis Tekst strunowy
ID Tekst strunowy
adres URL Tekst strunowy
wideo Wideo (obraz) (Brak, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.

  • Automatyczne buforowanie ( dokumentacja ): Nieznane

  • Podziały :

Podział Przykłady
  • Struktura funkcji :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
podpis Tekst strunowy
ID Tekst strunowy
adres URL Tekst strunowy
wideo Wideo (obraz) (Brak, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}