tao

  • Keterangan :

Dataset TAO merupakan dataset deteksi objek video berukuran besar yang terdiri dari 2.907 video resolusi tinggi dan 833 kategori objek. Perlu diperhatikan bahwa kumpulan data ini memerlukan setidaknya 300 GB ruang kosong untuk disimpan.

Unduh data ini dan pindahkan file .zip yang dihasilkan ke ~/tensorflow_datasets/downloads/manual/

Jika data yang memerlukan pengunduhan manual tidak ada, data tersebut akan dilewati dan hanya data yang tidak memerlukan pengunduhan manual yang akan digunakan.

  • Cache otomatis ( dokumentasi ): Tidak diketahui

  • Perpecahan :

Membelah Contoh
@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (konfigurasi default)

  • Deskripsi konfigurasi : Semua gambar diubah ukurannya secara bilinear menjadi 480 X 640

  • Struktur fitur :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
metadata FiturDict
metadata/kumpulan data Tensor rangkaian
metadata/tinggi Tensor int32
metadata/neg_category_ids Tensor (Tidak ada,) int32
metadata/not_exhaustive_category_ids Tensor (Tidak ada,) int32
metadata/num_frames Tensor int32
metadata/nama_video Tensor rangkaian
metadata/lebar Tensor int32
trek Urutan
trek/bbox Urutan (Fitur BBox) (Tidak ada, 4) float32
trek/kategori Label Kelas int64
trek/bingkai Urutan (Tensor) (Tidak ada,) int32
trek/is_crowd Tensor bodoh
trek/skala_kategori Tensor rangkaian
trek/track_id Tensor int32
video Video (Gambar) (Tidak ada, 480, 640, 3) uint8

tao/resolusi_penuh

  • Deskripsi konfigurasi : Versi resolusi penuh dari kumpulan data.

  • Struktur fitur :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
metadata FiturDict
metadata/kumpulan data Tensor rangkaian
metadata/tinggi Tensor int32
metadata/neg_category_ids Tensor (Tidak ada,) int32
metadata/not_exhaustive_category_ids Tensor (Tidak ada,) int32
metadata/num_frames Tensor int32
metadata/nama_video Tensor rangkaian
metadata/lebar Tensor int32
trek Urutan
trek/bbox Urutan (Fitur BBox) (Tidak ada, 4) float32
trek/kategori Label Kelas int64
trek/bingkai Urutan (Tensor) (Tidak ada,) int32
trek/is_crowd Tensor bodoh
trek/skala_kategori Tensor rangkaian
trek/track_id Tensor int32
video Video (Gambar) (Tidak ada, tidak ada, tidak ada, 3) uint8