Egocentric-10K - Build AI开源的第一人称视角机器人数据集
Egocentric-10K 是大规模的第一人称视角(egocentric)工厂操作视频数据集,由 build.ai 团队开源。数据集包含 10,000 小时的视频,总帧数达 10.8 亿帧,涉及 2,138 名工人,平均每人贡献约 4.68 小时的视频内容。数据集共有 192,900 个视频片段,每个片段中位长度为 180 秒,存储大小为 16.4 TB,采用 H.265/MP4 格式,分辨率为 1080p,帧率为 30fps。特点在于高密度的操作场景和高频率的手部可见性,相比以往的野外数据集有显著提升。