独家|高文院士:杭州是打造“中国视谷”最合适的地方
2021-08-04


碧波西湖水,悠悠抚人心。

千年文化在湖中缓缓流淌,群峦美景在湖面碧波荡漾。千百年来,西湖一直以独有的魅力,令杭州散发着璀璨的光芒。如今,使杭州出彩的不只西湖,视觉智能产业的崛起更为杭州增添了耀眼的一束光。

今年,杭州制定了以数字安防产业为基点,向视觉智能产业跃升的集群发展主线,谋划建设以视觉产业为主导的中国视谷经济新地标,着力打造视觉智能第一城

此刻,与美丽西湖浪漫邂逅的,是中国工程院院士、北京大学信息技术高等研究院院长、鹏城实验室主任高文。他是计算机视觉、模式识别与图像处理、多媒体数据压缩等研究领域的领军人物,一言一行在业内都有着巨大的影响力。此次会面,他提出,杭州的经济实力、产业实力、技术实力并驱,是发展视觉智能产业,打造中国视谷最合适的地方。

西湖与院士,一幅人文与科技交融的生动画面似乎马上就要跃湖而出。波光粼粼中,荡漾开来的西湖水,正变幻成不断外延的数字涟漪,犹如酷炫的代码,将杭州编写成一座充满未来感的视觉智能之城。


数字安防视觉智能跃升

七月盛夏,高文院士来杭行程满满,一系列重要会面在即,不过他还是将行程的第一站安排给了杭州视觉智能产业集群融媒体中心的专访。

杭州的经济实力首屈一指,视觉智能产业实力和技术积累雄厚,杭州可以说是谋划建设中国视谷,打造视觉智能第一城最合适的地方,各方力量应该好好推一推。

数字安防视觉智能,高文院士认为,简单的名词转换背后实则有其深刻的启示和意义。

早期的安防与监控密不可分,主要包括摄像机网络和监控存储系统。智能安防则增加了机器智能,上升了一个层次。高文院士表示,现在的视觉智能其实和监控、安防并无直接关联,是偏向应用场景的概念。对比文字智能、语音智能,视觉智能更加复杂,将图像、视频跃升到了一个更高层面的研究,实现更为直观的理解。

为了让深奥的科学更通俗易懂,高文院士向记者解释,从人工智能的角度,智能一般是指能够进行理解。比如一篇文章,人能理解这篇文章是什么意思,那怎么证明计算机也理解这篇文章呢?通过图灵测试我们可以检验机器是否能表现出与人相同的或无法区分的智能。但是,如果计算机只能理解文字特征,不能理解图像和视频特征,那么这种智能就有很大的局限性。

他进一步说明,从现实生活的角度,我们在与世界的交互中,眼睛看到的文字只占很小一部分,大部分是图像和视频。所以视觉理解不仅包含文字的理解,还包含图像和视频特征的理解,比文字、语音的研究更复杂,范围更广。比如监控场景只局限于人、物、事件,但是视觉智能还能理解美不美、冷不冷,这显然已经不是一个具体事物,而是上升到对现象的理解与分析。可以预见,视觉智能未来的应用充满了想象空间。

数字视网膜赋能城市大脑2.0”

高文院士望向窗外,路上车水马龙但秩序井然。很难想象,几年前这条马路还因为紧挨着西湖,随时可能会堵上几百米。

2016年,高文院士的好友,中国工程院院士、阿里云创始人王坚调侃,世界上最遥远的距离是红绿灯跟交通监控摄像头的距离,它们都在一根杆子上,但是从来就没有被连接过。随后,城市大脑在杭州首创,城市的治理能力开始大幅提升。

但是,城市大脑也有一定瓶颈和缺陷。早期视频监控系统中,摄像头只是简单地识别,粗暴地将视频压缩回传,云端重新解压之后再大海捞针识别有用信息,不仅耗费了巨量算力,占据存储空间,而且造成了大量的数据浪费。

如果能在摄像头设计视频编码等系统时,直接把数据中有用的信息抽取、挖掘并分析,是不是更高效、更节省储存空间?

高文院士长期从事计算机智能算法与系统研究,2017年正式提出了数字视网膜理论与模型,并将其赋能于城市大脑

有人一听数字视网膜,马上想到的是把视网膜数字化。高文院士会心一笑,当然不是,数字视网膜其实是一个模型。他表示,自然界提供了一个非常好的参照,那就是人的视觉系统。这套模型比较接近人的视觉系统处理信息的方式,因此命名数字视网膜。人通过眼睛看事物,但真正传输到大脑的只有很小一部分有用的、关键的信息,大部分不相干的内容被过滤掉了,如果计算机系统也能做到这样就非常理想。

他分析,城市大脑是整个智慧城市的中枢系统,在中枢系统中,有计算部分,还有感知部分。数字视网膜能为城市大脑的感知系统提供一个新的高效节能的解决方案,可以从根本上颠覆传统的监控系统模式。具体来说,在摄像机端对视频进行高质量视频编码和特征编码,对压缩编码后的视频流进行本地存储的同时按需上传到云端,而所有的紧凑特征流实时同步到云端。这个过程不仅能减轻网络带宽压力,保证高效的存储,还能大幅提升视频处理与应用的实时性和有效性,便捷地支撑大数据查询分析。

数字视网膜技术也将成为城市大脑2.0”的核心驱动力。“‘城市大脑1.0’是以云为中心的简单连接,而2.0版本是边端云分工协调的混合系统架构,可以在编码方面节省50%的存储和带宽,在云资源的耗费上,可以节省90%以上的云计算的算力资源。高文院士表示,“‘城市大脑1.0’只有超大城市能做,随着算力迭代、技术发展和成本下降,到了2.0版本中等城市也能做了,预计到了3.0版本所有城市都有望实现应用。

发展视觉智能产业恰逢其时

数字视网膜从正式提出至今,4年来概念不断升级更新,技术框架不断完善改进,一旦大范围落地应用,其影响将是颠覆性的。

高院士指出,数字视网膜是产业升级、产业革新的一个很重要的机遇,如果杭州正在谋划建设的中国视谷能够抓住这个机遇,推动整个产业生态更加规范标准、创新迭代,相当于整个视觉智能产业的主要基地就在杭州了。高文院士对杭州发展视觉智能产业寄予厚望。

当然,这并不意味着需要马上重建一套视频监控系统。每座城市前期早已投入巨额资金,无论在大街小巷还是商场、写字楼、园区等场所,各类摄像头星罗棋布。高文院士表示,可以在已有的摄像头里加装一个装置进行视频编码和特征提取,或在云端存储前做好技术处理再存储。如果是新建系统,则可以直接嵌入数字视网膜模型,通过一定时间的更新迭代,新型智慧城市将相继问世。

那么在数字视网膜的加持下,视觉智能产业的上下游企业该如何更好地竞争与合作?

高文院士表示,海康威视、大华、宇视等行业龙头都有相应的系统研究与产业布局,只不过存在一定的各自为战、相对封闭的情况,而数字视网膜是一整套更完备的从前端到后端、从软件到硬件的视觉计算架构,可以推动行业更加规范标准。技术标准化带来的好处是,头部企业可以降低成本,吸收更多新技术;中小企业可以更好地创新与成长。上下游企业协同合作,共同促进产业生态良性发展。

高文院士也提出了发展视觉智能产业的三大要点。

他特别强调,第一点企业必须摈弃以低成本、低质量抢市场的老方法。早先低成本策略的确能快速抢占市场,但反过来说,如果为了便宜就减配了很多部件与功能,将带来无尽的安全隐患。从数字安防到视觉智能,企业需重新定义商业理念、重塑商业模式,从以价取胜转变为以质取胜,走高质量发展道路。

高文院士表示,第二点必须要把人工智能和安全要素加进去。当前,全球都对智能监控摄像头的隐私性关注度越来越高,大数据时代的隐私保护已刻不容缓。除了遵纪守法,遵守各国各地的规则,技术上也要积极突破,出具不同的安全对策。比如有些场景在视频使用之前,通过AI技术处理形成人眼无法识辨,只有机器能理解的资料,或者有些场景需要人机协同参与的,要提前做好技术加密处理,这样就能解决很多实际问题。高文院士介绍。

高文院士进一步提到,这中间也需要凝聚政府力量,比如政策倾斜、创业投资的扶持,或者给予中小企业市场优先导入支持。政府、企业以及技术相互促进,打造健康发展的视觉智能产业生态。

中国视谷烧得更旺些

谈到人工智能,高文院士介绍,从上世纪50年代开始,人工智能已经历了3个发展阶段,当下正处于人工智能第三次浪潮的上升期。

虽然处于上升期,但最近发展有点趋缓,很多企业包括视觉智能企业都遇到了各自的瓶颈。前几年,社会各界对人工智能的预期过热过高,有些拔苗助长,但其实还没有发展到那么高的水平。高文院士用手先划了条横线,之后又比划了一条竖线。现在可能也是消解泡沫的过程,是件好事。

相比基于符号逻辑的推理阶段,基于人工规则的专家系统阶段,高文院士认为处于大数据驱动的深度神经网络阶段的人工智能第三次浪潮已经有了很大的提升。

第三次浪潮是基于数据的,只要数据足够多、足够安全,那么它的智能程度自然比前两次会高很多。但到底最后有多少智能成份,我觉得可能没有人们预期的那么高。高文院士表示。

他也指出,基于深度神经网络的人工智能虽然产生的结果很好,但目前人工智能界最大的挑战之一是可解释性,比如很多参数,为什么一定是0.1而不是0.2,机器只有答案,无法解释。而人不一样,人的大脑可以把具体的原因、步骤解释出来。

所以,我们离真正的智能还有很远的距离,需要不断地寻求突破和深化。高文院士说,比如指纹识别,有人说这个技术已经很成熟了,甚至完全做透了。其实不然,它在很多特殊场景中还是无法识别,需要继续钻研下去。就像数字视网膜,从提出概念至今,该体系一直在不断完善,整个应用也在不断拓展,相信在不久的将来会越来越趋向于成熟。

他认为,人工智能未来的方向还是要和人、和应用场景结合。人工智能比较的应用比如人脸识别,随着数据量越来越大、神经网络越来越深、投入资金越来越多,技术上识别率已经越来越高,但应用场景的落地与产出却很有限。因此,人工智能必须要和生产制造结合起来,必须要和人的需求结合起来,那才是可持续的。

这次来杭,看到杭州正在热火朝天的打造中国视谷,我希望除了让企业继续发挥市场化竞争优势,地方政府也要适当地推一把。比如8月下旬将举办2021视觉智能院士产业论坛就非常好,把视觉智能产业的上下游聚在一起,让这把烧得更旺一些,这样就比较能成事了。

访谈中,高文院士言笑自如,以简单易懂的语言阐述了复杂的科技原理,让我们真切地感受到视觉智能就在我们身边。新的技术革命浪潮已滚滚而来,杭州打造视觉智能第一城更是大势所趋。在不久的将来,我们将共同见证中国视谷的伟大崛起!


访谈者| 浙商人工智能产业联盟秘书长、浙江省人工智能产业技术联盟副秘书长繆衡

撰文|杭州视觉智能产业集群融媒体中心 詹雪龙

视频制作|杭州视觉智能产业集群融媒体中心 沃童迈