通话记录揭示城市移民生存状态

文/周 炜

浙江绍兴出生的杨洋在北京生活了6年,在湖北武汉待过4年,有一些很要好的当地朋友,可总有些时候感到自己是异乡客。这

位浙江大学计算机科学与技术学院的老师对城市移民的话题产生了好奇:他们过得怎样?怎样帮助他们更好地融入新城市?他

和同事合作,用人工智能建立起了一项看似天马行空的关联:通话记录与城市移民生存状态。

用“纯净”的数据说话
像这样利用计算机技术解决社会学问题,在学术界属于一个崭新的领域:计算社会学。计算社会学是计算机科学与社会学的交

叉学科。与传统的社会学调查不同,计算社会学依靠“纯净”的数据说话。
杨洋和合作者用人工智能系统对5400万人的6.98亿条通话记录进行分析。这些数据是客观存在的,不带主观色彩;而且每条通

话记录绝不涉及通话人身份、通话内容等,不涉及个人隐私。“计算机首先将这些‘纯化’的数据转化为一个包含超过10亿条

边的网络,然后进行分析与挖掘。”杨洋说。
计算机对网络的密度、网络簇系数、通话记录的时长和时间分布等物理特征进行学习,建立了一套可以用通话记录映射行为模

式的数学模型。“我们想让计算机告诉我们,移民与本地人的行为模式有什么不一样。”杨洋说,“比如地理分布。我们的研

究显示,城市中心占比较高的是城市老移民,原住民更趋于在城市周边居住。”
“新移民在到达大都市后一个月内的行为模式变化非常剧烈,存在多种演化模式。有的先朝老移民模式发展,然后慢慢朝本地

人模式发展;也有的直接朝本地人模式发展。这两种情况都属于融入成功。”杨洋介绍,还存在一种情况,新移民既没有趋同

于老移民,也没有趋同于本地人。研究者将之判断为融入失败。
在此基础上,输入新移民两星期的通话记录,人工智能系统就能自动做出判断:这位新移民将融入成功还是融入失败。

社群越多越杂,越能融入
移民所处社群的结构越紧密,融入成功的概率是否也越高?与人们直觉相反的是,杨洋及其合作者的研究表明,松散的社群结

构反而有助于移民融入本地人。社群的紧密或松散,指的是一个社群中人与人之间关系的连接强度。紧密型社群中的个体之间

有很强的互动,而松散型社群则相反。
“这或许可以解释,如果留学生到了国外后还是和本国学生交流,因为缺乏安全感而不愿意离开关系紧密的熟悉的圈子,就不

能很好地融入当地生活。所以城市新移民一定要努力往外跨一步,想办法跟本地人玩在一起。”
杨洋说,人工智能虽然能创造性地得出很多关联,但是如何理解这些关联,他们还需要和社会学家讨论。

参谋城市规划
让杨洋感到开心的是,这项研究能够初步在城市规划、社会治理等方面提供参考性建议。“有用,是我们判断一项研究的标准

。”杨洋说。
通过通话记录推演行为模式后得出:本地人更愿意去电影院、歌剧院等文化娱乐场所,而移民更喜欢商场等购物场所。“这或

许可以为城市规划者提供参考:在进行城市功能建筑布局时,考虑文化娱乐设施与购物场所相邻,或许可以促进城市移民与本

地人的交融。”
课题组还尝试研究房价的影响,结果发现,住在高房价区域的城市移民融入成功率较低。“我们猜测,这反映了移民是否可以

及时找到自己负担得起租金的居住地非常重要。”
“我们的生活中有很多客观存在的大数据,‘你见,或者不见我,我就在那里,不悲不喜’。它们刻画着我们可见或不可见的

社会规律或生活模式。譬如,电话记录就是这样‘不悲不喜’的大数据。”课题组成员浙江大学计算机科学与技术学院吴飞教

授说。
课题组还在进行更有挑战的工作:“在一个城市的不同区域,城市建设或政策是否会影响融入成功的比例?大数据就像一座

矿山,我们希望能挖出一些金子,并且能够对社会产生直接的价值,造福百姓生活。”

转载请注明 文章来源:《科学画报》

〖 欲看更精彩文章、图片,请购买科学画报。每月月初出版发行,铜板纸彩色印刷,每本仅售8.00元 〗 

 
《科学画报》2018© 版权所有 沪ICP备05024827号