MMDetection3D：NuScenes数据集加载

闲鱼 · 发表于 2023-1-17 03:33:48

一、创建流程

mmdet3d将nuscenes数据加载的流程进一步进行了标准化，以前的各类模型(e.g. CRFNet CenterFusion)等对于nuscenes数据集处理各不相同，就导致我们使用时需要重复造轮子，尤其是在进行多相机视图，多帧雷达点云融合时，各种各样的坐标转换等工作会增加前期工作难度。MMDetection3D对于数据的加载有以下优点：可修改性强、数据加载流程标准、源码书写规范，基于以上原因，深入源码阅读并总结数据加载的方式。
首先，数据通过一行命令完成转换，这个过程中做了以下工作： 1. 将数据信息读入并将其转换为pkl格式方便mmcv.load读取 2. 在读取过程中完成多视图图像的整合、多帧雷达的融合等工作 3. 将保存的pkl文件生成json的annotation文件
python tools/create_data.py nuscenes --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes其中，tools/create_data.py完成了数据的格式转换工作
二、主干部分：create_data.py文件

工作流： 1. nuscenes_converter是mmdet3d定义的一系列基于官方提供的NuScenes接口改进的数据操作接口； 2. create_nuscenes_infos()完成从原始的官方数据格式到pkl数据格式的转换，过程中完成数据的规格化工作(e.g.坐标矩阵对齐、多帧雷达数据对齐、多视角的图像数据对齐等) 3. export_2d_annotation()读取pkl数据并生成 &#39;.json‘ 格式的标注数据 4. create_ground_truth_database()
按照这三个函数的顺序逐步拆解create_data.py的数据转换流程
def nuscenes_data_prep(root_path,
                     info_prefix,
                     version,
                     dataset_name,
                     out_dir,
                     max_sweeps=10):
&#39;&#39;&#39;
root_path:./your_dir_name/data/nuscenes
info_prefix:自定义的数据集前缀:nuscenes
version:v1.0-trainval
max_sweeps:合并的过去雷达帧数
&#39;&#39;&#39;
# 读入原始数据并生成.pkl文件
nuscenes_converter.create_nuscenes_infos(
      root_path, info_prefix, version=version, max_sweeps=max_sweeps)

if version == &#39;v1.0-test&#39;:
      info_test_path = osp.join(root_path, f&#39;{info_prefix}_infos_test.pkl&#39;)
      nuscenes_converter.export_2d_annotation(
         root_path, info_test_path, version=version)
      return

info_train_path = osp.join(root_path, f&#39;{info_prefix}_infos_train.pkl&#39;)
info_val_path = osp.join(root_path, f&#39;{info_prefix}_infos_val.pkl&#39;)
# export annotation &#39;.json&#39; files separately
nuscenes_converter.export_2d_annotation(
      root_path, info_train_path, version=version)
nuscenes_converter.export_2d_annotation(
      root_path, info_val_path, version=version)
create_groundtruth_database(dataset_name, root_path, info_prefix,
                              f&#39;{out_dir}/{info_prefix}_infos_train.pkl&#39;)2.1 nuscenes_converter.py：create_nuscenes_infos()生成规格化数据

def create_nuscenes_infos(root_path,
                        info_prefix,
                        version=&#39;v1.0-trainval&#39;,
                        max_sweeps=10):
from nuscenes.nuscenes import NuScenes
# return nuscenes devkit
nusc = NuScenes(version=version, dataroot=root_path, verbose=True)
# split dataset return index of scenes in NusScenes separately
from nuscenes.utils import splits
available_vers = [&#39;v1.0-trainval&#39;, &#39;v1.0-test&#39;, &#39;v1.0-mini&#39;]
# 选择有效的scenes index token：train_scenes, val_scenes, test
# 根据上一步的scenes index生成所有场景的数据以dict列表返回
train_nusc_infos, val_nusc_infos = _fill_trainval_infos(
      nusc, train_scenes, val_scenes, test, max_sweeps=max_sweeps)

metadata = dict(version=version)
if test:
      print(&#39;test sample: {}&#39;.format(len(train_nusc_infos)))
      data = dict(infos=train_nusc_infos, metadata=metadata)
      info_path = osp.join(root_path,
                           &#39;{}_infos_test.pkl&#39;.format(info_prefix))
      mmcv.dump(data, info_path)
else:
      print(&#39;train sample: {}, val sample: {}&#39;.format(
         len(train_nusc_infos), len(val_nusc_infos)))
      data = dict(infos=train_nusc_infos, metadata=metadata)
      info_path = osp.join(root_path,
                           &#39;{}_infos_train.pkl&#39;.format(info_prefix))
      mmcv.dump(data, info_path)
      data[&#39;infos&#39;] = val_nusc_infos
      info_val_path = osp.join(root_path,
                              &#39;{}_infos_val.pkl&#39;.format(info_prefix))
      mmcv.dump(data, info_val_path)其中，保存的train_nusc_infos信息如下，其中所有的传感器坐标以lidar为中心计算之间的转移矩阵：
info = {
         &#39;lidar_path&#39;: lidar_path,
         &#39;token&#39;: sample[&#39;token&#39;],
         &#39;sweeps&#39;: [], # 上n帧的lidar到当前帧的转换矩阵
         &#39;cams&#39;: dict(), # 每个相机到lidar的转换矩阵
         &#39;lidar2ego_translation&#39;: cs_record[&#39;translation&#39;],
         &#39;lidar2ego_rotation&#39;: cs_record[&#39;rotation&#39;],
         &#39;ego2global_translation&#39;: pose_record[&#39;translation&#39;],
         &#39;ego2global_rotation&#39;: pose_record[&#39;rotation&#39;],
         &#39;timestamp&#39;: sample[&#39;timestamp&#39;],
      }经过以上步骤，mmcv.dump()把规格化的数据转化成pkl格式的文件。但是，这里没有加载radar数据。
2.2 nuscenes_converter.py：export_2d_annotation规格化标注数据

参数传入：info_train_path是上一步生成的pkl数据规格化文件
nuscenes_converter.export_2d_annotation(
      root_path, info_train_path, version=version)具体介绍： 1. 标注格式，以coco的数据格式存储
coco_2d_dict = dict(annotations=[], images=[], categories=cat2Ids)

标注流程

def export_2d_annotation(root_path, info_path, version, mono3d=True):

camera_types = [
      &#39;CAM_FRONT&#39;,
      &#39;CAM_FRONT_RIGHT&#39;,
      &#39;CAM_FRONT_LEFT&#39;,
      &#39;CAM_BACK&#39;,
      &#39;CAM_BACK_LEFT&#39;,
      &#39;CAM_BACK_RIGHT&#39;,
]
# 加载上一步生成的pkl文件
nusc_infos = mmcv.load(info_path)[&#39;infos&#39;]
nusc = NuScenes(version=version, dataroot=root_path, verbose=True)
# category & index的转化
cat2Ids = [
      dict(id=nus_categories.index(cat_name), name=cat_name)
      for cat_name in nus_categories
]
coco_ann_id = 0
coco_2d_dict = dict(annotations=[], images=[], categories=cat2Ids)
# 每个info对应一个sample也就是关键帧
for info in mmcv.track_iter_progress(nusc_infos):
      # 遍历每个sample的六个相机
      for cam in camera_types:
         cam_info = info[&#39;cams&#39;][cam]
         coco_infos = get_2d_boxes(
            nusc,
            cam_info[&#39;sample_data_token&#39;],
            visibilities=[&#39;&#39;, &#39;1&#39;, &#39;2&#39;, &#39;3&#39;, &#39;4&#39;],
            mono3d=mono3d)
         (height, width, _) = mmcv.imread(cam_info[&#39;data_path&#39;]).shape
         coco_2d_dict[&#39;images&#39;].append(
            dict(
                  file_name=cam_info[&#39;data_path&#39;].split(&#39;data/nuscenes/&#39;)[-1],
                  id=cam_info[&#39;sample_data_token&#39;],
                  token=info[&#39;token&#39;],
                  cam2ego_rotation=cam_info[&#39;sensor2ego_rotation&#39;],
                  cam2ego_translation=cam_info[&#39;sensor2ego_translation&#39;],
                  ego2global_rotation=info[&#39;ego2global_rotation&#39;],
                  ego2global_translation=info[&#39;ego2global_translation&#39;],
                  cam_intrinsic=cam_info[&#39;cam_intrinsic&#39;],
                  width=width,
                  height=height))
         for coco_info in coco_infos:
            if coco_info is None:
                  continue
            # add an empty key for coco format
            coco_info[&#39;segmentation&#39;] = []
            coco_info[&#39;id&#39;] = coco_ann_id
            coco_2d_dict[&#39;annotations&#39;].append(coco_info)
            coco_ann_id += 1
if mono3d:
      json_prefix = f&#39;{info_path[:-4]}_mono3d&#39;
else:
      json_prefix = f&#39;{info_path[:-4]}&#39;
mmcv.dump(coco_2d_dict, f&#39;{json_prefix}.coco.json&#39;)

		自动登录	找回密码
密码			立即注册

MMDetection3D：NuScenes数据集加载

浏览过的版块