人生有梦,各自精彩
去年的全年总结里我写过,希望新一年能成功跳槽,终于在这周我兑现了这个承诺,结束了在H家工作的4年时间。
去年的全年总结里我写过,希望新一年能成功跳槽,终于在这周我兑现了这个承诺,结束了在H家工作的4年时间。
如果将光学字符识别(OCR)技术应用于一些自然场景的图片,从而达到识别图片中文本文字的目的,通常会是一个 two-stage(双阶段) 的过程:
图像分割任务是将一张图中的像素按其语义或实例归属加以区分并赋予标签,本质上可视为一种“像素级分类”。分割常见两类:语义分割(Semantic Segmentation)与实例分割(Instance Segmentation)。语义分割为同类目标赋予相同类别;实例分割则需区分同类中的不同实例。深度学习之前,常见方法包括阈值化、直方图、区域生长、K‑均值、分水岭,及更复杂的活动轮廓、图割(Graph‑based)、马尔可夫随机场与稀疏模型等。
随着锚框(anchor)在检测算法中的广泛应用,无论是从 R-CNN 系列演进来的两阶段(two-stage)检测器,还是以 YOLO 和 SSD 为代表的单阶段(one-stage)模型,其核心策略都是在图像上密集地铺设大量预设尺寸和长宽比的锚框,以期覆盖所有可能的目标。然而,这种 anchor-based 的范式虽然取得了巨大成功,却也存在着一些固有的、难以回避的弊端:
随着 Deep Neural Networks(DNNs)的广泛落地,如果始终使用体量巨大的模型,会对算力与存储提出很高要求。因此,围绕“压缩与加速”的系统化方法被广泛采用,尤其是在端侧/边缘推理中,带来如下优势:
Batch Normalization(以下用 BN 简称)旨在缓解深度网络中的“Internal Covariate Shift(内部协变量移位)”,对同一 mini‑batch 的特征做标准化,使得训练可使用更大的学习率并加快收敛,同时降低对初始化的敏感性。所谓内部协变量移位,是指随着层数加深、参数更新导致每层输入分布不断变化,进而增加优化难度。
我确实是没想到,以恒大为代表的一批一线房产商会在中国房地产市场崩溃前先行崩溃。恒大也好华夏也好,这些不在浙江房产基本盘内的房企最初在我这被熟知可能真得感谢中国足球。