Segmentation in Image

Kyrie Chen 2022-05-27

图像分割任务是将一张图中的像素按其语义或实例归属加以区分并赋予标签,本质上可视为一种“像素级分类”。分割常见两类:语义分割(Semantic Segmentation)与实例分割(Instance Segmentation)。语义分割为同类目标赋予相同类别;实例分割则需区分同类中的不同实例。深度学习之前,常见方法包括阈值化、直方图、区域生长、K‑均值、分水岭,及更复杂的活动轮廓、图割(Graph‑based)、马尔可夫随机场与稀疏模型等。

Read More

CornerNet and CenterNet on Detection

Kyrie Chen 2022-01-04

随着锚框(anchor)在检测算法中的广泛应用,无论是从 R-CNN 系列演进来的两阶段(two-stage)检测器,还是以 YOLO 和 SSD 为代表的单阶段(one-stage)模型,其核心策略都是在图像上密集地铺设大量预设尺寸和长宽比的锚框,以期覆盖所有可能的目标。然而,这种 anchor-based 的范式虽然取得了巨大成功,却也存在着一些固有的、难以回避的弊端:

Read More

Batch Normalization Survey

Kyrie Chen 2021-10-06

Batch Normalization(以下用 BN 简称)旨在缓解深度网络中的“Internal Covariate Shift(内部协变量移位)”,对同一 mini‑batch 的特征做标准化,使得训练可使用更大的学习率并加快收敛,同时降低对初始化的敏感性。所谓内部协变量移位,是指随着层数加深、参数更新导致每层输入分布不断变化,进而增加优化难度。

Read More

论恒大的倒下和中国足球

Kyrie Chen 2021-09-15

我确实是没想到,以恒大为代表的一批一线房产商会在中国房地产市场崩溃前先行崩溃。恒大也好华夏也好,这些不在浙江房产基本盘内的房企最初在我这被熟知可能真得感谢中国足球。

Read More

Moco基于势能更新的自监督学习方法

Kyrie Chen 2021-05-28

2019年时,在NLP领域,以transformer为代表的一系列革新被应用于非监督学习中,并且衍变生成之后大名鼎鼎的BERT和GPT系列模型。而在CV领域,则没有能与之对应的更新。这时候FAIR的Kaiming He团队提出了Moco v1的构想,一举横扫了包括PASCAL VOC和COCO在内的7大数据集,至此,CV拉开了Self-Supervised的新篇章,与Transformer联手成为了深度学习炙手可热的研究方向。

Read More

Attention on Detection

Kyrie Chen 2021-01-10

注意力机制在NLP领域和机器翻译领域已取得了巨大成就,因此在引入视觉领域时,也是颇受期待。注意力机制可以理解为模仿人类观察画面的方式,会主要关注一些局部重要的信息来增进其对整体画面信息的理解能力。整体而言可以概括为两个方面:

Read More