分类识别算法

最近更新时间:2020-04-16 17:40:37

查看PDF

上传数据

以下处理过程中,基于如下组织的原始数据(非必须)
分类1.png
每一类的图片以不同的文件夹存放。
图片示例:
分类2.png
最后使用zip压缩后上传即可(注意:根目录不能有中文,只能是大小写字母,数字和中划线下划线)

处理数据

构建处理上述数据的Pipeline
分类3.png

  1. 节点:水果分类数据集
    数据节点。该数据即为上述上传的数据。
    数据为:
    分类4.png

  2. 节点: 正则提取
    对数据进行处理,将数据的path路径进行正则提取,创建两个新字段:typeid
    例:如数据图片path为root/JPEGImages/IMG_20180129_163826.jpg,解析完成后,type=JPEGImages, id=IMG_20180129_163826。如此解析的目的为使用type区分是数据图片还是mask图片,使用id将数据图片和mask图片进行JOIN一一对应起来。
    节点参数:
    分类5.png
    输出数据:
    分类6.png

  3. 节点: 生成标签ID
    根据正则提取出来的文件夹名称(也就是类别名称)生成ID(从0开始生成)
    节点参数:
    分类7.png
    输出数据:
    分类8.png

  4. 节点:保存数据集
    将最后得到的输出持久化为数据集,便于在后续流程中使用。

训练等

可以构建如下Pipeline,使用上述处理完保存的数据集作为输入
分类9.png

  1. 节点:算法训练
    点击训练节点,可设置算法训练参数,如迭代次数,GPU数量等。参数种类和命名均与具体算法开发者提供的算法相关,以下供参考。
    分类10.png

分类算法重点review参数:

  • 类别数量(与选择的数据集有关)
  • 迭代次数或epoch大小
    分类11.png
  1. 节点:算法API部署
    类似训练

  2. 节点:保存模型
    为了下次再次使用该训练输出的模型进行测试或其他,最好将模型进行保存,以便进行管理。

  3. 通过API查看效果
    在API部署中找到刚刚部署的API。上传测试数据。
    分类12.png

文档内容是否对您有帮助?

根本没帮助
文档较差
文档一般
文档不错
文档很好

在文档使用中是否遇到以下问题

内容不全,不深入
内容更新不及时
描述不清晰,比较混乱
系统或功能太复杂,缺乏足够的引导
内容冗长

更多建议

0/200

评价建议不能为空

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

问题反馈