CVPR 2020商汤斩获3冠!62篇论文入选,“算法工厂
Original
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
“视觉实力秀”,CVPR 2020 正在线上举办中。
本届 CVPR 号称十年来最难的一届,共接收 6656 篇论文,中选 1470 篇,录用率仅为 22%,为十年来最低的一次。
不过,中国军团依然表现亮眼。学术界清华领衔,商汤则以 62 篇论文入选的成绩,领跑产业界。
成绩亮眼,却有些见怪不怪。毕竟,这已经不是商汤第一次在顶会上“一骑绝尘”。
此前的 ICCV 2019 上,商汤及其联合实验室就曾以入选 57 篇论文的成绩引来瞩目。
而这一次的 CVPR,在入选论文数上,商汤持续超越微软、Facebook 等科技巨头。
并且,又拿下了 CVPR 2020 ActivityNet 时空动作定位赛道、动作分类赛道,以及 CVPR 2020 NTIRE 竞赛等 3 项世界冠军。
至此,成立 6 年以来,商汤已经在各种重要赛事中,斩获了 60+ 个世界第一。
那么,问题来了,商汤凭什么?
62篇论文 + 3项世界冠军,实现多领域技术突破
先来看看,商汤的 CVPR 2020 成绩单背后,是怎样的技术进展。
三项比赛中,ActivityNet 是视频动作识别领域的重要实力检验竞赛。
该项竞赛历年由 Google、Facebook、UC Berkeley 等顶尖院校与研究机构主办,相关技术在视频分析、活体检测等多项实际应用中具有重要价值。
在 AVA-Kinetics 时空动作定位比赛中,依托自研技术对象-场景-对象推理网络(ACAR-Net)和自有的深度学习超算平台,商汤研究院和 X-Lab 及香港中文大学-商汤联合实验室团队以绝对优势夺得第一。
39.62mAP的成绩,大幅领先今年的第二名 6.71 mAP。
在动作分类竞赛中,商汤研究院和 X-Lab 及联合实验室团队依托自有的深度学习超算平台,在短时间内训练了多个具有超深网络的视频分类模型。在多模型融合阶段,商汤自研的时空交错网路(TIN)同样发挥重要作用。
由此,与 Google Cloud AI 拿下该项竞赛的并列第一。
而 NTIRE(New Trends in Image Restoration and Enhancement)作为全球最全面的 low-level 视觉大赛之一,能够直观地反映出 low-level 视觉这一热门领域中研究进展和突破。
商汤研究团队在 CVPR 2020 NTIRE 的真实图像(Real World RGB Images)光谱重建(HS Reconsturction)赛道中,凭借一种新的 4 级网络结构,在增大感受野的同时,在不同级子网中做特征提取,从而成功卫冕冠军。
论文方面,商汤今年入选的 62 篇论文,同样分布多个领域,包括:对抗式生成模型、三维点云理解与分析、训练加速与模型量化、视频理解与分析、网络结构搜索等。
例如,商汤入选 CVPR 2020 的论文《用于加速卷积神经网络训练过程INT8训练技术》,就针对如何提升深度学习训练速度的问题,提出了用于加速卷积神经网络训练过程的 INT8 训练技术,采用 8 比特数值训练模型,可以极大地提升训练速度,减少计算损耗,而且训练精度几乎无损。
所以,商汤的秘诀是什么?
答案还要从商汤自身的定位中寻找。
AI时代的“算法工厂”
据悉,目前商汤一共有约 4000 名员工,其中有 2500 多人都是算法和产品研发人员,超过总员工数的一半。
而商汤的路线,是依托这样的技术力量,以“算法工厂”的模式,完成科研到产品的转化。
什么叫“算法工厂”?
商汤科技联合创始人徐冰在公开演讲中谈到,现在,如何批量地生产针对不同物体和场景的模型,已经成为驱动 AI 增长、下一代技术演进的关键问题。
而成熟的深度学习训练平台,是能够推动大规模新模型生成的。这也就促成了“算法工厂”概念的形成。