登陆

刘伦 王辉:城市研讨中的计算机视觉使用发展与展望

admin 2019-08-05 184人围观 ,发现0个评论

近年来,核算机视觉与城市研讨的穿插催生了一系列立异性研讨,构成一个具有严重潜力的跨学科研讨范畴。本文经过对这一范畴前沿效果的整理指出,当时核算机视觉在城市研讨范畴的使用首要体现在城市环境认知点评、城市与修建文明辨认、建成环境与社会经济耦合剖析、城市相貌与城市规划点评四个方面。一起,核算机视觉在视觉认知研讨拓宽、城市文明核算模仿、城市规划技能立异等方面都展现出了较大的展开远景,但也存在着技能办法、研讨目标、价值取向等方面的约束与应战。

文/刘伦 王辉

刘伦 北京大学政府管理学院

王辉 清华大学修建学院

城市图画一向是记载城市展开变迁的重要信息载体,在当时的互联网与大数据时代,跟着图片共享网站、交际媒体、街景地图等线上渠道的蓬勃展开,可获取的图画数据正在以史无前例的速度添加。一起,来自人工智能范畴的核算机视觉技能经过40余年的展开取得了很多展开,使对海量城市图画的大规划、自动化判别与解析成为或许。近年来,核算机视觉与城市研讨的穿插催生了一系列立异性研讨,构成一个具有严重潜力的跨学科研讨范畴。

布景

(一)城市图画数据的呈现

刘伦 王辉:城市研讨中的计算机视觉使用发展与展望

城市图画是记载城市演化与展开的重要材料。近年来,伴跟着数字图画软硬件技能与设备的遍及,以及各类交际媒体和图片共享渠道的蓬勃展开,可获取的图画数刘伦 王辉:城市研讨中的计算机视觉使用发展与展望据正在以史无前例的速度添加。在线地图街景服务也以标准化、均匀散布、全掩盖以及定时更新的优势成为了城市图画的另一类重要来历。除了互联网街景数据之外,今世城市图画数据的其他来历还包含交际媒体,行车记载仪以及各类城市监控摄像头,乃至包含各类影视作品、视频材猜中的城市场景等。

与以往笼统的、平面化的城市数据比较,新时期以信息化与互联网为前言的图画数据更有利于城市三维空间的展现,内容也更为丰厚直观。借助于海量、互动及实时的特征,这些图画数据在城市研讨特别是城市特征相貌研讨、城市规划等触及片面点评与理性认知的研讨范畴具有共同优势。伴跟着相关数据的呈现以及核算机技能的一日千里,很多城市研讨者与规划师们开端注重针对图画数据的发掘与使用。

(二)核算机视觉技能的展开

跟着大数据时代城市图画的海刘伦 王辉:城市研讨中的计算机视觉使用发展与展望量增加,核算机视觉技能正被越来越多地使用于城市图画剖析,构成一个具有巨大潜力的跨学科研讨范畴。核算机视觉是经过数学算法回溯二维图画中的三维物体信息,并树立对图画的全体认知了解,以使机器具有与人类相似的视觉信息解译才能的一门科学。这一概念最早于1970时代提出,现已成为一门触及核算机科学、使用数学、统计学、认知科学等的综合性学科,也是当时人工智能研讨的热门范畴。

现在,核算机视觉相关技能已广泛使用于医学图画剖析、人脸辨认、无人自动驾驶、图画查找等范畴。除了客观信息的辨认提取,核算机视觉范畴开端越来越多地重视图画美学质量、内容风格、难忘程度等片面认知课题。在城市图画研讨方面,最新的研讨也更多地触及城市环境审美点评、人对城市环境的感知、城市和修建风格等课题,构成核算机视觉与城市研讨的穿插范畴。本文将针对当时国内外这一范畴的前沿展开做一总述,并对该范畴的远景与应战进行评论。

首要研讨方向

(一)城市环境认知点评

城市环境的客观形状怎么作用于人的片面认知是城市研讨的关键问题,而且对城市规划与规划实践具有重要的启示含义。但因为认知试验的操作复杂度、本钱等要素,城市环境认知研讨一向遭到样本数量的约束。现在,核算机视觉对海量城市图画的自动化解读才能,结合互联网众包等参加形式,在很大程度上拓宽了城市环境认知研讨的规划与或许性沙漠鱼。

奎尔恰等人选用核算机视觉相关办法发掘了城市环境中影响审美认知的视觉要素。为取得很多城市环境认知点评样本,研讨组开设了网站(www.urbangems.org)搜集大众对伦敦不同街区在美感、安静感、愉悦感三方面的认知点评,网站随机显现2张来自谷歌街景或“地舆图片”(Geograph)网站的城市图片,要求用户别离比较并选取更具美感、更使人安静和更使人愉悦的图片,研讨共搜集到3300余份比较成果。根据排序成果,研讨从颜色、图画肌理和视觉元素三个视点剖析了三种认知感触的影响要素。研讨发现,在颜色方面,存在14种颜色与美感、18种颜色与安静感、12种颜色与愉悦感有较强的相相关系;在图画肌理方面,横向肌理(刘伦 王辉:城市研讨中的计算机视觉使用发展与展望大多对应于人工构筑物)与负面感触相关性较强,而斜向和无方向肌理(大多对应于天然景象)与正面感触相关性较强;在核算机辨认出的悉数500余个视觉元素中,维多利亚风格修建部分、红砖墙、树木和树篱、住所窗户等与正面感触相关,廉价住所、桥梁、护栏、勾花铁网、广告牌等与负面感触相关(图1)。奎尔恰等人的另一项研讨重视了城市环境的可辨认性,经过专设网站(urbanopticon.org)展开。该网站沿用了斯坦利米尔格拉姆在1972年的“心思地图”认知试验,随机展现1张来自谷歌街景的伦敦相片,由用户在地图上标示他以为的图片拍照地址,经过全体的标示精确率点评城市不同区域的可辨认性,并生成伦敦街区可辨认性地图。因为这项研讨选用了互联网众包形式,在试验本钱大为下降的一起样本量大幅进步,网站在上线5个月内便搜集到来自2255名用户的辨认成果。

现在,麻省理工学院媒体试验室建议的“地址脉冲”(pulse.media.mit.edu)网站是经过众包办法搜集城市环境认知数据的最大渠道。该研讨渠道触及的认知点评更为丰厚,包含美感、宜居感、兴趣感、压抑感、安全感、殷实感6个维度,并已掩盖全世界56座城市。研讨相同经过两两比较的办法进行数据搜集,要求用户在随机展现的2张谷歌街景相片中挑选“看起来更安全”、“看起来更殷实”的图片。网站至今已搜集到近140万组比较成果,并核算了悉数样本城市在6个维度的点评排名以及各城市的内部差异指数。

根据“地址脉冲”网站搜集到的4109张街景相片的安全感打分(来自91个国家7872名用户的近21万次点评),奈克等使用机器学习办法开发了猜测安全感认知的Streetscore指数,算法的猜测分值与图片实在分值之间确实定性系数(r)可到达0.53。假如将图片依照必定分数线二分类为“安全的街景”和“不安全的街景”,则算法的分类精确率可到达93%。此外,奥多涅斯和伯格也使用来自“地址脉冲”的2920张相片的得分开发了模仿大众安全感、殷实感和共同感认知的猜测算法,精确率在75%~95%之间。他们进一步将算法使用于整座城市,将核算机对城市街景的点评分数与实在家庭收入和自杀率数据比较较,得到二者之间确实定性系数(r)约为0.50,也在必定程度上验证了算法的有用性。

(二)城市与修建文明辨认

城市与修建的展开与人们的观念与当地的文明密切相关,不一起代、不同区域的城市必定存在不同的相貌特征。核算机视觉技能的展开也使得城市与修建文明这一传统论题的发掘成为或许。线上城市图画数据往往具有地舆位置、风格、时代等“标签”信息,根据这些标签,核算机视觉技能可以经过各类判别办法挑选出具有辨认性的图画信息,然后对城市与修建文明进行解析。

多尔施等在《巴黎之所以为巴黎》中使用机器学习办法自动辨认出最可以体现巴黎城市特质的风格元素。这类元素并非来自于少量标志性修建或场所,而是存在于普通住所、大街等日常场景中,体现出城市间纤细之处的风格差异。研讨抓取了来自12个城市的约12万张谷歌街景相片,从一切相片中提取很多大小不等的正方形图块,然后选用判别聚类算法屡次循环,从几千万个图块中挑选出在巴黎街景中经常呈现且在其他城市街景中很少呈现的图块,作为用于体现巴黎城市特质的风格元素(图2)。终究得到的风格元素包含临街住所的阳台栏杆、住所落地窗与阳台的组合、阳台雕花、路灯、路牌、门廊等。经校验,核算机辨认出的城市风格元素与艺术史学家卢瓦耶在《十九世纪的巴黎:修建与城市》一书中剖析得到的特征元素大体一致。此外,研讨还使用前100名的风格元素对随机选取的街景相片是否拍照于巴黎进行判别,精确率可达83%,这也验证了核算机视觉技能使用的有用性。

与上述研讨相相似,有研讨以修建风格或时代等特点作为图片标签,经过核算机视觉技能对修建文明的散布与演化进行辨认。

(三)建成环境与社会经济耦合剖析

建成环境与城市社会经济展开之间的耦合联系也是城市研讨的一项要点课题。社会学、经济学等相关范畴的理论也或多或少地反映出对物质环境的重视。核算机视觉对建成环境的大规划核算与辨认才能也为剖析相关问题供给了新的途径。

奎尔恰等研讨者在对街区可辨认性进行大规划点评的基础上,进一步重视了可辨认性与社会经济特点的联系,发现低收入社区的建成环境可辨认性也往往更低。“地址脉冲”项目也发现建成环境的好坏与犯罪率的凹凸之间存在必定的相关性。奈克等人还探究了建成环境变迁与城市社会经济展开之间的相关。研讨首要对2007和2014年拍照于纽约、波士顿等5个美国首要城市的谷歌街景相片进行挑选、配对以及核算机打分,得到同一地址在不同年份的安全感得分(图3)。研讨发现,建成环境变迁与社区人口密度和受教育程度最为相关。此外,研讨还在必定程度上为长期以来存在的关于社区演化的“侵入刘伦 王辉:城市研讨中的计算机视觉使用发展与展望”、“临界”和“过滤”三个理论假说供给了支撑。

(四)城市相貌点评

因为时刻、人力等方面的约束,以往的城市相貌研讨很少可以完成对整个城市的全体、精密掩盖。将核算机视觉使用于这一范畴,则有或许完成对城市相貌与城市规划质量的全面、大规划、自动化点评。在我国城市建设进入存量阶段的布景下,这一办法对全面整理快速城市化所构成的城市相貌,然后在新的展开阶段有的放矢地展开城市更新与规划,具有重要的实际含义。

笔者从沿街修树立面质量、大街修建界面连续性这两项对城市相貌具有重要影响的变量下手,开发了可用于我国城市相貌大规划点评的深度学习算法。以北京五环内为研讨规划,研讨首要以200m距离抓取了来自百度地图的36万张街景相片,从中随机选取约3500张,依照根据我国城市相貌实际状况拟定的打分规矩进行立面质量与界面连续性的专家打分,选用前沿的AlexNet、GoogLeNet等深度学习算法,模型体现较传统算法进一步进步。研讨将算法使用于悉数相片,得到北京修树立面质量和界面连续性点评地图(图4)。针对相片与实在体会在视角、光线、暗影、动态等方面的差异或许构成误差的问题,研讨进一步以问卷调查办法在56个随机选取的地址搜集了752份路人现场打分,并与机器打分成果进行比对,发现在立面质量和界面连续性两方面的相联系数都挨近0.70,阐明本研讨所选用的算法根本可以反映城市环境中的实在体会。在后续研讨中,其他城市相貌相关变量如修建风格、立面原料、体量标准等,以及修建集体的调和度、多样性等,都可测验输入机器学习模型,然后完成对我国城市相貌的全面、量化与动态点评。

展望与约束

核算机视觉与海量城市图画数据在带来信息科技革新的一起也在为城市研讨供给新的或许。但也应注意到,这类技能办法因为理论偏重、展开水平等要素的限制,在城市研讨的使用中也面临着必定的约束性。

(一)远景与展望

1、视觉认知研讨拓宽

城市建成环境认知研讨是城市研讨的要点刘伦 王辉:城市研讨中的计算机视觉使用发展与展望与难点,核算机视觉技能、海量城市图画数据以及众包形式带来的样本量的大幅扩展,或许为这一范畴研讨带来进一步拓宽。具样本规划很多提高、视觉判别办法更为多元的趋势之下,针对现有城市环境进行更为全面与精确的视觉认知点评成为或许,这也必将为城市研讨特别是城市环境全体点评这一难题供给科学有用的研讨办法。

2、城市文明发掘与模仿

根据城市与修建特征辨认等研讨,核算机视觉将有助于以科学化、定量化办法知道当地城市与修建文明,并讨论当地文明的构成、传达与传承规则,对修建史和城市史研讨都有必定学习含义。在我国当时“千城一面”的实际布景下,这类研讨对深化发掘我国城市地域文明、有用重塑城市特征相貌,可供给适当有价值的启示。

3、城市规划技能立异

核算机视觉技能使城市景象的全体、大规划量化点评成为或许。跟着街景相片和其他城市图画在时刻和空间上的堆集,这项技能将有才能完成城市相貌的动态监控,以每月或每年更新的办法随时感知建成环境质量改变,为规划规划应对供给数据支撑。

4、其他

核算机视觉中的人脸辨认、车辆辨认技能等还可使用于人群活动研讨,用于解析不同地址的人流、车流数量散布,并辨认性别、年纪、表情、着装等更细化的人群特点,可用于对商业生机、公共空间使用状况等问题的剖析。跟着才智城市建设中越来越多的监控摄像设备布局,核算机视觉与才智城市的结合也被以为具有适当的研讨与使用潜力。

(二)约束与应战

1、技能办法的约束

尽管核算机视觉在某些场景下已完成了与人类视觉相媲美乃至超越人类的体现,但全体而言,这项技能依然有待提高。关于具有丰厚理论与经历系统的城市规划范畴,核算机视觉对城市图画的点评根据是否具有理论有用性,也是有待研讨的问题。

2、研讨目标的约束

尽管城市图画可以反映城市环境的丰厚信息,但仍与实在体会存在某些差异。根据城市图画的研讨成果的精确程度,需求进行必定的验证与校核。

3、价值判别的约束

由核算机视觉办法所得到的成果往往反映的是人们对现有修建和城市环境的观点,是一种均匀性的观念,而突破性、立异性、前瞻性的规划或许往往会被核算机模型给予负面的点评,过于倚重核算机点评或许会导致过火着重文明的延续性而非创造性。因而,这类办法在何种状况下适用、何种状况下不适用需求进一步剖析,其间有关价值判别的设定更是触及人文与科技、立异与回忆等问题的剖析,这既是现在核算机视觉办法或许存在的约束,更是未来值得跨学科深化发掘的前沿范畴。

本文原载于《城市规划》2019年第1期。北大政治学(微信号:PKURCCP)为便利阅览,省略悉数注释,并有删省和调整。修改:王俊;郭姣裕

请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP