首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

CTPN论文翻译——中文版

这使得CTPN可以探索丰富的图像上下文信息,使其能够检测极其模糊的文本。CTPN在多尺度和多语言文本上可靠地工作,而不需要进一步的后处理,脱离了以前的自底向上需要多步后过滤的方法。...我们利用强深度卷积特性和共享计算机制的优点,提出了如图1所示的CTPN架构。主要贡献如下: ? 图1:(a)连接文本提议网络(CTPN)的架构。...图3:上:没有RNN的CTPN。下:有RNN连接的CTPN。 受到这项工作的启发,我们认为这种上下文信息对于我们的检测任务也很重要。...通过使用单个GPU,我们的CTPN(用于整个检测处理)的执行时间为每张图像大约0.14s,固定短边为600。没有RNN连接的CTPN每张图像GPU时间大约需要0.13s。...结论 我们提出了连接文本提议网络(CTPN)—— 一种可端到端训练的高效文本检测器。CTPN直接在卷积映射的一系列细粒度文本提议中检测文本行。

1.3K10
您找到你想要的搜索结果了吗?
是的
没有找到

深度解析文本检测网络CTPN

不同于网上千篇一律讲解CTPN的文章,本文将使用大量可视化过程来帮助大家理解CTPN,完整重现CTPN所有细节。 先用一张动图过一遍CTPN全过程,接下来开始我们的讲解。 ?...我们来看一下用一般目标检测算法(Faster-RCNN)跟用CTPN效果对比,很明显通用的目标检测算法的检测框会大很多(更不精确) ?...接下来我们开始讲解CTPN具体原理,本文默认读者了解Faster-RCNN以及LSTM原理,如果不懂的可以移步我前几篇文章。 CTPN总体结构 ?...以上就是CTPN的架构,看不懂没关系,接下来我会可视化每个过程帮你了解。...这里要注意,CTPN在实际当中对一些倾斜样本的鲁棒性还是略显不足的。 损失函数 ?

1.6K20

论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network

论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network [Paper] [Code-Caffe...CTPN(Connectionist Text Proposal Network),end-to-end 框架: 类似于 Faster R-CNN,对 VGG16 网络输出(conv5)的卷积 feature...相同点: 均需要采用全卷积网络,允许任意尺寸的输入图片; 不同点: CTPN 通过对卷积特征图根据小窗口平滑,检测文本行;输出细尺度(如,固定宽度为 16-pixel)的文本 proposals 序列...CTPN,垂直 anchor 机制,同时预测 文本/非文本 score 和每个细尺度 proposal 的 y-轴位置: 文本 proposal 的宽度固定设定为 16 pixels(对应输入图片尺寸)...上:CTPN without RNN; 下:CTPN with RNN.

93520

【文本检测与识别-白皮书-3.1】第三节:算法模型 2

CTPN直接在卷积特征映射中检测一系列精细比例的文本建议中的文本行。CTPN开发了一个垂直锚定机制,可以联合预测每个固定宽度提案的位置和文本/非文本得分,大大提高了定位精度。...图片CTPN以非常深的16层vggNet(VGG16)为例来描述方法,它很容易适用于其他深度模型。CTPN的体系结构如图1....为此,CTPN建议在conv5上设计一个RNN层。图片Side-refinement:CTPN可以准确、可靠地检测到精细尺度的文本建议。...实验将CTPN和最近公布的几种方法进行了比较。如表1和表2所示, CTPN在所有五个数据集上都达到了最佳性能。在SWT上,CTPN在召回率和F-measure上都有显著的改进,在精确度上略有提高。...CTPN的检测器在多语言上对TextFlow表现良好,这表明CTPN的方法可以很好地推广到各种语言。

43520

深度学习应用篇-计算机视觉-OCR光学字符识别:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景

深度学习应用篇-计算机视觉-OCR光学字符识别7:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景 1.OCR综述 OCR(Optical Character Recognition...图片 2.OCR检测方法 2.1 CTPN CTPN(Connectionist Text Proposal Network)1是目标检测算法Faster R-CNN 的改进算法,...2.1.1CTPN模型结构 CTPN采用的方法是将文本行分割成一个个小块(长度是固定的),然后去检测这些小块,最后使用一种文本行构造法将所有块连起来,如 图1 所示。...图片 图1 CTPN 序列特征 CTPN网络结构如 图2 所示: 图片 图2 CTPN网络结构示意图</center...但是对于竖直方向的文本,或者多方向的文本,CTPN检测就很差。

2.1K00

【深度学习】光学字符识别(OCR)

CTPN(2016) 1)概述 CTPN全称Detecting Text in Natural Image with Connectionist Text Proposal Network(基于连接文本提议网络的自然图像文本检测...2)具体步骤 CTPN主要包含以下几个步骤: 检测文本。...3)网络结构 VGG16+Conv5:CTPN的基础网络使用了VGG16用于特征提取,在VGG的最后一个卷积层Conv5,CTPN用了3×3的卷积核来对该feature map做卷积,这个Conv5...5)性能 ① 时间性能 使用单个GPU,CTPN(用于整个检测处理)的执行时间为每张图像大约0.14s。没有RNN连接的CTPN每张图像GPU时间大约需要0.13s。...② 准确率 CTPN在自然环境下的文字检测中取得了优异的效果。如下图所示: CTPN在五个基准数据集上进行了全面评估。

6.1K10

干货 | OCR技术在携程业务中的应用

由于受控场景的文字受诸多先验的约束条件约束,本身的文本复杂度较低(水平文本,文本偏转角度小等),我们选择选择通用的文本检测模型CTPN[7]进行文本框的检测。...3.1.1 受控场景的文本检测 对于受控场景,我们直接使用文本检测模型CTPN对用户上传的证件进行文本框的检测。 ?...图3 基于CTPN模型的文本框检测结构[7] 除对模型的输入进行前期处理之外,还在CTPN模型的训练过程上进行改进,考虑到人工去标定样本的成本是很高的,同时为了让模型在真实环境中表现出较好的性能,我们采用由糙到精的训练步骤...将CTPN模型运用在对营业执照的文字检测上,目前F1分数值能够达到89%。...我们将该文本识别模型与CTPN模型整合,对营业执照重要字段文本内容进行识别,目前在印章,反光等多种因素干扰情况下,对统一社会信用编码等的全字段识别精度能达到85%。

1.6K50

OCR光学字符识别方法汇总

目前已经有很多文字检测方法,包括:EAST/CTPN/SegLink/PixelLink/TextBoxes/TextBoxes++/TextSnake/MSR/......,具体来说: 2.1.1 CTPN [1] CTPN是ECCV 2016提出的一种文字检测算法,由Faster RCNN改进而来,结合了CNN与LSTM深度网络,其支持任意尺寸的图像输入,并能够直接在卷积层中定位文本行...CTPN由检测小尺度文本框、循环连接文本框、文本行边细化三个部分组成,具体实现流程为: 1、使用VGG16网络提取特征,得到conv5_3的特征图; 2、在所得特征图上使用3*3滑动窗口进行滑动,得到相应的特征向量...CTPN是基于Anchor的算法,在检测横向分布的文字时能得到较好的效果。此外,BLSTM的加入也进一步提高了其检测能力。

1.7K30
领券
http://www.vxiaotou.com