检测算法

最近更新时间:2020-04-16 17:40:37

查看PDF

上传数据

以下处理过程中,基于如下组织的原始数据(非必须)
检测1.png
即以PascalVOC开源数据的结构进行组织。JPEGImages文件夹中全为图片,Annotations文件夹中全为XML标注文件。关系在于图片和XML文件名称是一一对应的(图片如果是IMG_20180129_163826.jpg,那么对应的标注文件的名称是IMG_20180129_163826.xml)。
最后使用zip压缩后上传即可(注意:根目录不能有中文,只能是大小写字母,数字和中划线下划线)

处理数据

构建处理上述数据的Pipeline
检测2.png

  1. 节点:水果检测数据集
    数据节点。该数据即为上述上传的数据。
    数据为:
    检测3.png

  2. 节点: 正则提取
    对数据进行处理,将数据的path路径进行正则提取,创建两个新字段:typeid
    例:如数据图片path为root/JPEGImages/IMG_20180129_163826.jpg,解析完成后,type=JPEGImages, id=IMG_20180129_163826。如此解析的目的为使用type区分是数据图片还是标注XML,最后使用id将数据图片和标注XML进行JOIN一一对应起来。
    节点参数:
    检测4.png
    输出数据:
    检测5.png

  3. 节点: SELECT
    对正则解析后的数据进行过滤操作,将数据图片和标注XML分开。
    节点参数:
    选取数据图片的SELECT
    检测6.png
    选取标注XML的SELECT
    检测7.png
    输出数据:
    选取数据图片的SELECT
    检测8.png
    选取标注XML的SELECT
    检测9.png

  4. 节点:解析XML
    解析XML中记录的Bounding Box信息。
    节点参数
    检测10.png

输出数据
检测11.png

  1. 节点:LEFT JOIN
    根据第一步正则提取出来的id字段,将数据图片和解析出来的object一一对应,两者构成一个完整的训练样本。
    节点参数:
    检测12.png
    输出数据:
    检测13.png

  2. 节点:保存数据集
    将最后得到的输出持久化为数据集,便于在后续流程中使用。

训练等

可以构建如下Pipeline,使用上述处理完保存的数据集作为输入
检测14.png

  1. 节点:算法训练
    点击训练节点,可设置算法训练参数,如迭代次数,GPU数量等。参数种类和命名均与具体算法开发者提供的算法相关,以下供参考。
    检测15.png

分类算法重点review参数:

  • 类别名称列表(与选择的数据集有关),在训练、测试、API部署等中,注意不要更改
  • 迭代次数或epoch大小
    检测16.png
  1. 节点:算法API部署
    类似训练

  2. 节点:保存模型
    为了下次再次使用该训练输出的模型进行测试或其他,最好将模型进行保存,以便进行管理。

  3. 通过API查看效果
    在API部署中找到刚刚部署的API。上传测试数据。
    检测17.png

文档内容是否对您有帮助?

根本没帮助
文档较差
文档一般
文档不错
文档很好

在文档使用中是否遇到以下问题

内容不全,不深入
内容更新不及时
描述不清晰,比较混乱
系统或功能太复杂,缺乏足够的引导
内容冗长

更多建议

0/200

评价建议不能为空

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

问题反馈