
编者按:
近年来,网络平台算法逐渐从幕后走到台前,走进,而无法知道算法具体的运作机制;就算知道了,也会因为技术复杂而难以理解。熊节教授解释道:“推荐算法的运作机制其实并不复杂,它只是商家(也就是平台)尽可能掌握用户尽可能多的信息,掌握的信息越充分越全面,就可以给用户推荐尽可能准确的信息。”
但是,平台掌握关于用户的信息是极其大量的,一般会给用户贴上几千个甚至几万个这样的数量级的标签,这就会造成所谓信息茧房的问题。熊节教授指出:“平台都知道我喜欢X,然后每个平台都想争夺我的浏览量,于是都给我推荐X相关的文章和视频。这就会给我造成一种印象,让我感觉好像所有人都在讨论X。这就是一种推荐算法造成的偏见。”
另一个例子是外卖骑手的派单算法,电影《逆行人生》对此有很好的展示。算法可以给骑手分配高效的路线,这本来是件好事。但平台同时又把骑手配送的实际数据输入回去,根据实际数据不断调高对骑手的要求,强迫骑手要跑得越来越快才能保持收入水平。这就形成了对骑手的压榨,而且也造成了骑手和顾客之间的紧张关系。
平台诱导用户提供信息
熊节教授表示,平台一般需要从用户那里收集哪些信息和数据?算法又是如何诱导用户提供这些信息的?
- 个人信息:姓名、性别、年龄、职业、收入、教育背景等。
- 设备信息:设备类型、操作系统、网络信息等。
- 行为信息:浏览记录、搜索记录、点赞记录、分享记录、购买记录等。

熊节教授指出,算法会通过各种方式诱导用户提供这些信息,比如:

- 强制授权:使用平台的服务需要用户授权平台收集个人信息。
- 默认勾选:用户在注册或使用平台时,平台会默认勾选收集个人信息的选项。
- 诱导性提问:平台会通过一些诱导性的问题,引导用户提供个人信息。
发表评论