检测算法

最近更新时间:2020-04-16 17:40:37

上传数据

以下处理过程中,基于如下组织的原始数据(非必须) 检测算法 即以PascalVOC开源数据的结构进行组织。JPEGImages文件夹中全为图片,Annotations文件夹中全为XML标注文件。关系在于图片和XML文件名称是一一对应的(图片如果是IMG_20180129_163826.jpg,那么对应的标注文件的名称是IMG_20180129_163826.xml)。 最后使用zip压缩后上传即可(注意:根目录不能有中文,只能是大小写字母,数字和中划线下划线)

处理数据

构建处理上述数据的Pipeline 检测算法

  1. 节点:水果检测数据集 数据节点。该数据即为上述上传的数据。 数据为: 检测算法
  2. 节点: 正则提取 对数据进行处理,将数据的path路径进行正则提取,创建两个新字段:typeid 例:如数据图片path为root/JPEGImages/IMG_20180129_163826.jpg,解析完成后,type=JPEGImages, id=IMG_20180129_163826。如此解析的目的为使用type区分是数据图片还是标注XML,最后使用id将数据图片和标注XML进行JOIN一一对应起来。 节点参数: 检测算法 输出数据: 检测算法

  3. 节点: SELECT 对正则解析后的数据进行过滤操作,将数据图片和标注XML分开。 节点参数: 选取数据图片的SELECT 检测算法 选取标注XML的SELECT 检测算法 输出数据: 选取数据图片的SELECT 检测算法 选取标注XML的SELECT 检测算法

  4. 节点:解析XML 解析XML中记录的Bounding Box信息。 节点参数 检测算法

输出数据 检测算法

  1. 节点:LEFT JOIN 根据第一步正则提取出来的id字段,将数据图片和解析出来的object一一对应,两者构成一个完整的训练样本。 节点参数: 检测算法 输出数据: 检测算法

  2. 节点:保存数据集 将最后得到的输出持久化为数据集,便于在后续流程中使用。

训练等

可以构建如下Pipeline,使用上述处理完保存的数据集作为输入 检测算法

  1. 节点:算法训练 点击训练节点,可设置算法训练参数,如迭代次数,GPU数量等。参数种类和命名均与具体算法开发者提供的算法相关,以下供参考。 检测算法

分类算法重点review参数:

  • 类别名称列表(与选择的数据集有关),在训练、测试、API部署等中,注意不要更改
  • 迭代次数或epoch大小 检测算法
  1. 节点:算法API部署 类似训练

  2. 节点:保存模型 为了下次再次使用该训练输出的模型进行测试或其他,最好将模型进行保存,以便进行管理。

  3. 通过API查看效果 在API部署中找到刚刚部署的API。上传测试数据。 检测算法

金山云,开启您的云计算之旅

免费注册