当前位置：主页 > 查看内容

NLP/CV模型跨界，视觉Transformer赶超CNN?

发布时间：2021-08-06 00:00| 有位朋友查看

简介：在计算机视觉领域中，卷积神经网络（CNN）一直占据主流地位。不过，不断有研究者尝试将 NLP 领域的 Transformer 进行跨界研究，有的还实现了相当不错的结果。近日，一篇匿名的 ICLR 2021 投稿论文将标准 Transformer 直接应用于图像，提出了一个新的 Vision……

在计算机视觉领域中，卷积神经网络（CNN）一直占据主流地位。不过，不断有研究者尝试将 NLP 领域的 Transformer 进行跨界研究，有的还实现了相当不错的结果。近日，一篇匿名的 ICLR 2021 投稿论文将标准 Transformer 直接应用于图像，提出了一个新的 Vision Transformer 模型，并在多个图像识别基准上实现了接近甚至优于当前 SOTA 方法的性能。

10 月 2 日，深度学习领域顶级会议 ICLR 2021 论文投稿结束，一篇将 Transformer 应用于图像识别的论文引起了广泛关注。

特斯拉 AI 负责人 Andrej Karpathy 转发了该论文，并表示「乐见计算机视觉和 NLP 领域日益融合」。

本文转载自网络，原文链接：https://www.toutiao.com/i6880133192209138180/
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：54%中国NeurIPS作者流入美国：剑桥AI全景报告出炉 下一篇：没有了

随机推荐

人工智能治理如何上升到顶层

人工智能(AI)技术如今正在广泛应用。人工智能治理之所以重要，是因为人工智能可...
无人机将在未来的智慧城市中扮演重要角色

尽管智能城市的概念已经存在了几十年，但它最新的一次迭代是优先考虑技术，比如...
试试这几个技巧，让 iPhone 自带地图应用

苹果为 iOS/iPadOS/watchOS/macOS 提供了各种自带应用，既覆盖了备忘录、提醒事...
无线网络联盟：Wi-Fi 6E是二十年来最重大

随着移动设备的飞速发展，无线网络联盟也宣布了 20 年来的最重大的一次升级，它...
三大趋势预测：为什么疫情将让AI在2021年

2021年人工智能将如何改变药物研发、在家办公和边缘计算? 什么是近现代史中的黄...
APP界面布局"小经验"

APP界面布局设计是APP设计中非常重要的一环，合理的运用APP界面布局会让APP的界...
Dell’Oro：中国服务提供商在5G核心网部

自去年6月，工信部正式向四家基础电信运营商发放5G牌照以来，无论是行业、资本市...
关于5G手机的那些谣言，相信你就输了！

5G频段之争，你需要知道这些。进入2020年，手机厂商们对于5G手机的商用推动突然...
遇到没？用户吐槽升级iOS 13.2后：iPhone

10月底，苹果发布了iOS 13.2正式版，主要变化包括开启相机的Deep Fusion功能、允...
SD-WAN行业理解：从广域网云化看SD-WAN

1 概述全文分成四部分：通过「行业背景」看行业本质;通过「行业玩家」看行业生...

NLP/CV模型跨界，视觉Transformer赶超CNN?

推荐图文

微软为什么要推出一款 Android 手机？

2019，为什么是“折叠屏元年”？

企业如何为5G做好准备

QQ收集用户信息被工信部通告：腾讯回应已调整优化

美媒：中国有望主导人工智能市场

64万人已集齐五福快速集五福攻略在此

随机推荐

人工智能治理如何上升到顶层

无人机将在未来的智慧城市中扮演重要角色

试试这几个技巧，让 iPhone 自带地图应用

无线网络联盟：Wi-Fi 6E是二十年来最重大

三大趋势预测：为什么疫情将让AI在2021年

APP界面布局"小经验"

Dell’Oro：中国服务提供商在5G核心网部

关于5G手机的那些谣言，相信你就输了！

遇到没？用户吐槽升级iOS 13.2后：iPhone

SD-WAN行业理解：从广域网云化看SD-WAN

关于我们