Loading...
出处:Paddle文档平台 - 模型压缩1. 为什么需要模型压缩理论上来说,深度神经网络模型越深,非线性程度也就越大,相应的对现实问题的表达能力越强,但相...
出处:Paddle文档平台 - ViT( Vision Transformer)1. ViT模型介绍在计算机视觉领域中,多数算法都是保持CNN整体结构不变...
出处:Paddle文档平台 - Transformer1. Transformer 介绍Transformer 网络架构架构由 Ashish Vaswan...
出处:Paddle文档平台 - TSM1. TSM 简介视频流的爆炸性增长为以高精度和低成本执行视频理解任务带来了挑战。传统的2D CNN计算成本低,但无...
出处:Paddle文档平台 - OCR1. OCR综述1.1. 什么是OCROCR(Optical Character Recognition,光学字符识...
出处:Paddle文档平台 - 图像增广1. 数据增广在图像分类任务中,图像数据的增广是一种常用的正则化方法,主要用于增加训练数据集,让数据集尽可能的多样...
出处:Paddle文档平台 - 非极大值抑制在实际的目标检测过程中,不管是用什么方式获取候选区域,都会存在一个通用的问题,那就是网络对同一个目标可能会进行...
出处:Paddle文档平台 - IoU(交并比)在目标检测任务中,通常会使用交并比(Intersection of Union,IoU)作为衡量指标,来衡...
出处:Paddle文档平台 - 边界框(bounding box)1. 边界框(bounding box)在检测任务中,需要同时预测物体的类别和位置,因此...
出处:Paddle文档平台 - 目标检测对计算机而言,能够“看到”的是图像被编码之后的数字,它很难理解高层语义概念,比如图像或者视频帧中出现的目标是人还是...