负反馈调研介绍

Reading time ~1 minute

清北研究者对于正负反馈,在用户者做了用户调研,并做了总结《Beyond Explicit and Implicit: How Users Provide Feedback to Shape Personalized Recommendation Content》,从用户的视角来看隐式反馈问题:

摘要

随着个性化推荐算法在社交媒体平台中变得不可或缺,用户越来越意识到他们影响推荐内容的能力。然而,关于用户如何通过其行为和平台机制提供反馈以塑造推荐内容的研究仍然有限。我们对34位算法驱动的社交媒体平台(如小红书、抖音)的活跃用户进行了半结构化访谈。除了显式和隐式反馈外,本研究还引入了有意隐式反馈,强调了用户通过感知到的反馈机制有意采取的行动来优化推荐内容。此外,研究发现反馈行为的选择与特定目的相一致。显式反馈主要用于定制信息流,而无意的隐式反馈则更多地与内容消费相关。有意的隐式反馈则被用于多种目的,特别是在增加内容多样性和提高推荐相关性方面。这项工作强调了显式-隐式反馈二分法中的用户意图维度,并为设计更能响应用户需求的个性化推荐反馈提供了见解。

1 引言

Ariela 是中国的一名设计专业本科生,同时也是一位热衷于社交媒体的用户。她对小红书上的个性化信息流着迷,这些信息流充满了时尚潮流、旅行建议和护肤产品,这些内容不仅引导她的购买决策,还帮助她探索新的兴趣爱好(见图1a和图1b,小红书用户界面)。随着每一次互动,平台似乎越来越了解她,持续推送符合她偏好的内容。与此同时,Ariela 使用抖音(中国版的 TikTok)在休息时进行轻松娱乐(见图1c,抖音用户界面)。她喜欢在抖音上观看短小有趣的视频。当算法推荐她不感兴趣的内容时,她会快速滑过,微妙地引导平台向她推送更多关于猫咪或搞笑短剧的内容

然而,Ariela 很快意识到,两个平台上的信息流曾经是多样化的,现在却变得重复,仅仅反映了她过去的选择。为了摆脱这种模式,Ariela 故意在小红书上搜索新的风格和趋势,或点击某些帖子的“不感兴趣”按钮,打破平台的常规推荐。而在抖音上,她会快速跳过她通常喜欢的视频,希望告诉平台推送一些不同的内容。

正如 Ariela 一样,我们越来越多地消费由社交媒体平台上的个性化推荐算法策划的内容,例如小红书、抖音等。这些算法旨在通过每一次点击、浏览或互动捕捉用户偏好,为每个用户创建一个档案,推荐不仅相关而且引人入胜的内容,从而吸引用户持续使用。用户通过民间理论(即“个人为解释技术系统的结果、影响或后果而发展的直观、非正式的理论”)形成对这些算法的理解,这些理论影响了他们与算法的互动方式。随着个性化推荐算法逐渐渗透到用户的线上和线下活动中,人们开始担心平台“窥探”他们的偏好,或将他们推入同质化的“回音室”或“信息茧房”。作为回应,用户开发了各种策略来影响推荐给他们的内容,例如不点赞、点击“不感兴趣”、搜索某些话题,或忽略他们喜欢的内容。这些策略基于一个假设,即用户的行为将被平台捕捉为对算法的反馈,从而影响未来的推荐

在系统工程的背景下,反馈已被广泛研究以提高信息检索和推荐系统的性能。这些系统依赖于显式和隐式反馈,这是现有文献中一个成熟的两分法:

  • 显式反馈是指用户为表达偏好而提供的直接输入,例如指定关键词、评分或回答有关兴趣的问题
  • 隐式反馈是指用户与系统的各种互动,例如浏览、选择、保存或转发内容,系统从中间接推断用户偏好

由于这两个概念都需要用户行为或互动作为输入,我们认为在个性化推荐平台上,用户策略性地利用他们的行为来塑造推荐信息流,构成了对系统的一种反馈形式。

事实上,用户对算法系统的策略性使用已经在人机交互(HCI)社区中得到了探索。例如,学者们研究了用户对算法的抵抗以及用户自主性。尽管这些研究强调了用户的意图和影响推荐信息流的潜力,但很少有研究将用户的感知与系统反馈机制联系起来。研究这种联系可以改进个性化推荐中的反馈设计。为了填补这一空白,我们的研究从一个更广泛的问题开始:用户如何通过他们的行为和平台机制提供反馈,以塑造和控制个性化推荐平台上呈现给他们的内容?

我们对34位个性化推荐平台(如小红书和抖音)的活跃用户进行了半结构化访谈。我们发现,用户采用了多种反馈机制来影响他们接收到的内容。这些机制从显式反馈(如将内容标记为“不感兴趣”)到隐式反馈(如点击和点赞),系统从中间接推断用户偏好。我们发现,传统的显式-隐式两分法未能完全捕捉到用户有意识地利用先前被归类为隐式反馈的行为来塑造推荐信息流的主动性。为了解决这一问题,我们将隐式反馈类别进一步划分为有意隐式反馈无意隐式反馈

与传统的隐式反馈作为被动或自然互动的理解不同,有意隐式反馈是指用户有意识地执行的行为,期望系统将其解释为他们偏好的信号。例如,快速跳过不喜欢的帖子,或故意点击感兴趣的帖子以获取更多相关内容的行为,在我们的研究中频繁出现。这些行为在以往的研究中被归类为隐式反馈,但其本质是明显有意的。同时,与显式反馈不同,有意隐式反馈允许用户在不直接表达偏好的情况下引导推荐。通过将意图维度引入两分法,我们强调了用户通过显式和隐式反馈行为主动参与塑造信息流的能力。通过识别有意隐式反馈,平台可以更准确地捕捉用户意图,并为用户提供更大的信息流控制感。

此外,我们发现用户的反馈行为与其目的密切相关。显式反馈主要用于信息流定制目标,例如减少不适当的内容和提高推荐相关性,而有意隐式反馈则在增加内容多样性和提高推荐相关性方面发挥了关键作用。无意隐式反馈则最常与内容消费相关。这些发现强调了在个性化推荐中更好地设计隐式反馈,并使反馈机制与用户的具体目的保持一致的必要性。

本研究的贡献如下:

  • 首先,研究提供了实证证据,展示了用户如何利用不同的反馈机制来实现他们在使用个性化推荐平台时的目的。
  • 其次,研究引入了有意隐式反馈的概念,扩展了传统的显式和隐式反馈两分法。有意隐式反馈捕捉了用户通过其行为影响算法及未来推荐信息流的意图。
  • 第三,研究为个性化推荐平台提供了设计启示,以支持更透明和目的导向的反馈机制。

2 相关工作

2.1 用户对个性化推荐的感知

个性化推荐平台利用算法根据用户的偏好和行为(如订阅、点击、喜欢与不喜欢、停留时间等)为用户定制内容 [1, 74, 84]。此前,推荐系统已广泛应用于搜索引擎、新闻消费和电子商务网站 [54, 68, 71]。在推荐算法的驱动下,推荐系统捕捉并分析用户的互动行为(如点击、购买或显式评分),以构建代表用户偏好和行为的用户模型。基于这些模型,协同过滤等推荐算法通过分析用户或物品之间的相似性,生成与每个用户档案匹配的个性化推荐 [85]。近年来,社交媒体平台越来越多地集成个性化推荐算法 [27],通过推送与用户偏好高度一致的内容来延长用户的参与时间,同时促进用户的内容创作和社交互动 [39, 72, 82]。

因此,个性化推荐算法逐渐在塑造用户所看到和了解的内容中扮演编辑角色 [26]。它们重塑了社交媒体中的内容消费 [7]、内容创作 [8, 14] 和在线社交 [19]。像抖音和小红书这样的平台在中国国内用户和国际受众(分别称为 TikTok 和 RedNote)中获得了极大的欢迎。这类平台允许用户直接与内容互动,并严重依赖算法来捕捉这些互动,而不仅仅依赖于账户关注,以优化个性化的图片或视频信息流 [11, 32, 47]。

然而,由于底层算法的不透明性 [26, 65],用户对个性化推荐平台的运作方式了解非常有限 [21]。这种理解的缺乏常常导致用户发展出“民间理论” [7, 15, 20, 62],以解释系统如何定制推送给他们的内容。例如,Klug 等人发现,TikTok 用户通常认为视频参与度、发布时间和标签的积累是影响平台算法推荐的关键因素 [47]。这些民间理论并非静态的,而是随着用户遇到新的经验和信息而不断演变,帮助他们更好地与算法系统互动 [14]。这些民间理论直接影响用户如何感知和与算法互动,基于此,用户会采取行动来控制算法,以改善内容个性化 [29] 或增加他们在社交媒体平台上的可见性 [8, 9]。内容创作者还会分享和讨论他们与算法的互动经验,即“算法八卦”,以共同优化他们的内容推广策略 [4]。

总之,个性化推荐平台重塑了用户在线消费、创建和分享内容的方式。然而,用户往往不清楚他们的互动行为是如何被平台处理的。随着用户形成“民间理论”来理解底层机制,探索用户如何与这些个性化推荐平台互动并提供反馈以塑造他们的推荐信息流变得至关重要,这也引出了文献综述的下一部分。

2.2 用户与推荐算法的策略性互动

用户越来越意识到他们的互动行为可能会影响算法,并进一步塑造他们的在线体验,有时甚至会让他们感到个性化推荐算法在“窥探”他们的想法 [18, 47]。这种意识导致了一系列用户行为,旨在“教导”、抵抗和重新利用算法 [43],以及个性化内容审核 [37]。

其中一些行为是微妙的内容修改操作,例如“伏地魔式操作”(即不提及某些词语或名称)和“截图”(即在不增加网站流量的情况下使内容可见)以控制他们的在线存在 [82],或者使用“算法语言”(即在创建或分享在线内容时故意更改或替换词语)以绕过算法审核 [48]。此外,用户花费大量时间和精力使用各种策略来对抗不想要的推荐内容 [64, 69],例如不点赞、点击“不感兴趣”、搜索新关键词 [43]、忽略他们喜欢的内容 [10],以及通过屏蔽特定关键词来配置个性化内容审核工具 [36]。一些研究挑战了那些加剧不平等和不公正的算法推荐和内容审核系统 [3, 40, 41, 70]。例如,TikTok 用户通过修改他们的互动行为(如关注用户和分享他们的内容)来影响他们的推荐信息流,使其与个人身份保持一致,并影响其他用户的信息流,以抵抗对边缘化社会身份的压制 [40]。他们还通过与特定标签和点赞互动来策划理想的“为你推荐”信息流,以应对感知到的不平等 [78]。为了避免社交媒体中的错误审核,用户使用编码语言或在感知到平台不成比例地删除边缘化用户身份相关内容时停止使用平台 [57],有时他们会在被“影子封禁”后选择切换账户 [55]。用户驱动的算法审计也被用来揭示有害的算法行为 [16, 75]。

因此,算法不仅通过用户与平台的有机互动来塑造,还通过用户策略性地尝试影响推荐信息流来塑造 [49]。例如,Haupt 等人将这一策略过程建模为一个两阶段的噪声信号博弈,用户首先在初始“冷启动”阶段策略性地消费呈现给他们的内容,以影响未来的推荐信息流,然后系统根据这些互动优化其建议,最终达到用户偏好被清晰区分的均衡状态 [29]。Taylor 和 Choi 扩展了人机互动的研究,指出用户注意到个性化并认为算法对他们的身份有响应,这进一步塑造了他们在平台上的互动和结果 [81]。一些研究还将用户有目的的操纵行为称为“游戏化”算法 [28, 67, 77]。内容创作者可能通过利用关系和模拟影响力来“玩可见性游戏”,以获得商业利益 [13]。虽然游戏化可能激发创新并发现现有平台的新用途 [2],但行为的策略性适应也可能被算法误解并降低其准确性 [10]。

这些研究表明,用户有意识地利用各种行为来影响算法并塑造他们的推荐信息流,这些行为受到他们对算法运作方式的感知或“民间理论”的指导。然而,很少有研究将这些用户感知与平台的底层反馈机制联系起来。理解用户的感知如何与算法的预期响应一致或分歧,以及它们如何相互作用以塑造推荐信息流,可以为个性化推荐系统的反馈设计改进提供参考。

3 研究方法

为了回答研究问题,我们对34位使用过个性化推荐平台(如小红书、抖音、快手和哔哩哔哩短视频)的用户进行了半结构化访谈研究。我们采用了归纳和演绎相结合的方法来分析数据。本研究已获得雪城大学机构审查委员会的批准,并遵循所有作者所在机构的伦理准则进行。

3.1 参与者招募

我们的目标是使用过个性化推荐平台的活跃用户。我们通过社交媒体平台、在线论坛和个人网络分发了预筛选问卷。入选标准包括:

  • (1)年满18岁;
  • (2)至少有六个月使用个性化推荐平台的经验

我们要求参与者自我报告他们常用的个性化推荐平台。预筛选问卷帮助我们选择了一组多样化的参与者,确保在性别、年龄、教育背景和日常使用模式上的差异。此外,我们采用了滚雪球抽样法,要求初始参与者推荐符合研究标准的其他用户。这种方法有效地覆盖了不同参与程度的用户,从主要消费内容的“潜水者”到积极发布和互动内容的“重度用户”。

我们总共招募了34名参与者:

  • 大多数参与者年龄在18-25岁之间(𝑛 = 25),女性参与者较多(𝑛 = 19)
  • 参与者报告使用了多个个性化推荐平台。抖音(𝑛 = 29,占参与者的85%)和小红书(𝑛 = 24,占参与者的71%)是最常用的平台;其他使用的平台包括哔哩哔哩短视频(𝑛 = 10)、快手(𝑛 = 7)和TikTok(𝑛 = 1)。这些平台都提供个性化推荐内容,包括短视频、图片和文本。小红书和抖音的主要界面如图1所示。快手的界面(见附录A中的图2a和图2b)与小红书类似,哔哩哔哩短视频的界面(见附录A中的图2c)则与抖音相似。
  • 参与者最常使用的平台的使用时长从不到一年到超过四年不等

根据报告,这些平台的大多数用户是35岁以下的年轻一代 [23, 56, 80],而小红书的用户中超过70%是女性 [23]。我们的参与者样本在年龄和性别分布上与这些平台的总体用户人口统计数据一致。更多参与者信息见附录C中的表5。

3.2 访谈流程

我们从2022年12月至2023年4月进行了半结构化访谈。每次访谈持续40至60分钟。访谈通过面对面或视频会议平台进行,以适应参与者的时间安排和地理位置。所有访谈均以普通话进行。参与者获得了25元人民币的补偿。参与者被告知他们可以随时退出研究而不会受到任何惩罚。

访谈协议旨在探索参与者与个性化推荐平台的互动。首先,我们询问了参与者的平台使用情况,包括他们使用的平台、感兴趣的内容以及与内容和平台的互动(如浏览、发布、点赞和搜索)。然后,我们询问了他们对个性化推荐和平台算法的理解与态度,以及平台使用的感知影响。特别是,我们深入探讨了参与者如何应对算法,例如他们管理内容曝光和内容偏好以及避免不想要内容的策略。最后,我们询问了他们对个性化推荐平台设计的总体建议

在访谈开始前,参与者被告知研究的目标和流程。每次访谈均在参与者同意的情况下进行录音,并详细记录关键点。录音被逐字转录并匿名化以供分析。

3.3 数据分析

我们对访谈数据进行了编码本主题分析 [5, 6]。首先,我们进行了归纳编码,允许主题从数据中自然浮现。然后,我们通过整合现有文献中的反馈概念进行了演绎分析,以进一步完善和应用编码。最后,我们进行了编码共现分析 [60],以探索用户反馈行为与平台互动目的之间的关系。

数据分析在MAXQDA上进行,编码本在研究人员之间共享以供讨论。所有访谈均以普通话进行分析,以保留原始细微差别和意义。选定的引述随后被翻译成英文以在本文中呈现。

归纳编码阶段,研究人员首先通读所有转录文本以熟悉数据,然后各自独立对转录文本的不同部分进行开放式编码,通过不断比较和备忘录记录使主题浮现 [59]。在此过程中,研究人员定期讨论以比较他们的编码并完善开放式编码方案。他们将编码综合为类别,并编写了初始编码本。类别包括:用户行为、互动目的、感知与态度、民间理论以及与算法互动的挑战。

过渡到演绎阶段,我们将编码结果与现有文献进行比较。我们发现,用户与算法的互动方式可以解释为用户向推荐系统提供反馈。根据现有文献,推荐系统反馈通常分为显式反馈和隐式反馈 [34, 35, 42]。显式反馈需要用户在其正常行为之外提供额外输入,例如评分和回答有关兴趣的问题,而隐式反馈则从用户与系统的自然互动中无干扰地得出,例如浏览、选择和转发 [42]。

我们观察到,在我们的研究中,参与者有意识地利用隐式反馈机制(例如点击帖子)向个性化推荐提供反馈。尽管一些塑造推荐信息流的策略性行为已在先前文献中记录 [10],但很少有研究将用户的感知与系统反馈机制联系起来。

通过与文献比较,我们完善了编码本。

  • 首先,我们缩小了重点,专注于两个编码类别:互动目的和用户行为。我们参考了文献中显式反馈和隐式反馈的既定类别 [34],对用户与系统的互动进行分类。
  • 然后,我们发现,在隐式反馈行为中,用户有意识地主动塑造推荐信息流,这与隐式反馈的原始定义相矛盾。

因此,我们将隐式反馈分为有意隐式反馈无意隐式反馈,以区分用户在隐式反馈行为中是否存在意图。总体而言,我们将用户的反馈行为分为三类:

  • 显式反馈:用户直接输入以表达其偏好或兴趣。
  • 有意隐式反馈:用户有意识地执行以影响推荐内容的行为,他们知道这些行为可能会被平台解释为推断其兴趣。
  • 无意隐式反馈:用户与平台的自然互动,没有任何刻意影响推荐内容的意图。

为了进一步理解和解释反馈行为,我们为每个识别出的行为映射了三个关键属性:

  • 特征(即支持反馈行为的特定平台功能,如“点赞”按钮或搜索框)、
  • 极性 [31, 35](即“正面”或“负面”反馈)
  • 最小范围 [63](即反馈应用的最小级别:“片段”、“对象”或“类别”)

我们仔细分析了所有提到的平台,以确定每个行为对应的功能,并根据参与者转录文本和平台功能的解释分配极性和范围。

然后,两名研究人员根据完善的编码本完成了演绎编码。对于前八份转录文本,他们独立编码并一起审查编码,以解决任何差异并相应地完善编码指南。这一迭代过程有助于确保解释的一致性。然后,他们独立编码了剩余的转录文本,每人负责13份。在此过程中,两名研究人员继续分享总结备忘录,并在每周与研究团队的讨论中解决任何歧义。

我们确定了反馈行为类型与平台互动目的(即内容消费、定向信息搜索、内容创作与推广以及信息流定制)以及特定信息流定制子目的之间的潜在相关模式。为了探索它们的关系,我们使用了编码共现分析。具体来说,我们识别了用户行为代码和用户目的代码在同一访谈片段中同时出现的实例。为了避免重复,我们使用MAXQDA对每个行为-目的共现实例在每位参与者中仅计数一次。例如,如果某个行为-目的共现在单个参与者的访谈中被多次提及,则仅计为该参与者的一个共现实例。然后,我们在三种反馈类型(即显式反馈、有意隐式反馈和无意隐式反馈)中汇总了这些共现实例。我们还对子目的(即提高推荐相关性、增加内容多样性、减少不适当内容和保护隐私)与用户反馈行为之间的共现进行了分析。值得注意的是,我们仅在有意隐式反馈和显式反馈中对子目的进行了计数,因为参与者未指定与四个子目的对应的无意隐式反馈行为。

4 研究发现

我们的分析揭示了三种用户反馈类型以及这些反馈如何与用户的目的相匹配。

  • 我们首先介绍三种反馈类型:显式反馈、有意隐式反馈和无意隐式反馈。
  • 然后,我们总结了用户与算法互动的四个目的:内容消费、定向信息搜索、内容创作与推广以及信息流定制。
  • 最后,我们展示了目的与所采用反馈类型之间的关系。

我们发现,显式反馈主要用于信息流定制,而有意隐式反馈在信息流定制中尤为关键,特别是在增加内容多样性和提高推荐相关性方面。无意隐式反馈则最常与内容消费和定向信息搜索相关。我们利用访谈数据来解释用户采用不同反馈类型以实现其目的的潜在动机。

4.1 个性化推荐内容的用户反馈类型

我们识别了六种显式反馈行为、九种有意隐式反馈行为和13种无意隐式反馈行为。正如在方法部分提到的,有意隐式反馈和无意隐式反馈的区别在于用户的行为是否有意向平台提供反馈。例如,用户可能出于欣赏而点赞帖子或关注用户,或者他们可能这样做是为了向算法传达他们的偏好。鉴于无意隐式反馈是平台常见且自然的使用方式,并且在大量先前研究中已被作为“隐式反馈”进行研究 [34, 42],本节我们重点解释显式反馈和有意隐式反馈。表1展示了这些行为及其对应的功能、极性、作用范围以及报告这些行为的参与者数量。附录B中的表4展示了无意隐式反馈的行为,包括创建、收藏和分享帖子、评论和查看评论、浏览个人主页、购买等。

4.1.1 显式反馈

在我们的分析中,显式反馈行为主要发生在对象范围内,并且都得到了特定平台功能的支持。最常用的显式反馈是:标记帖子为“不感兴趣”,共有21名参与者报告了这一行为。

  • 参与者将其用作负面反馈,以告知算法他们不希望在未来看到类似内容:P06表示这是“表达不喜欢的最直接和简单的方式,只需额外一步即可主动干预算法”。
  • 参与者提供了使用“不感兴趣”功能的各种原因,例如对帖子内容缺乏兴趣、广告以及内容质量差。有时,表达不感兴趣更多是在细粒度和微妙的内容层面上。例如,用户可能总体上喜欢时尚内容,但他们的品味差异很大,因此并非所有与时尚相关的帖子都对他们有吸引力(P08)。
  • 一些参与者强调了使用此功能减少同质化内容以获取多样化和吸引人的信息流的重要性。P13指出:“在将许多类似推荐标记为‘不感兴趣’后,可能会出现更多小众内容,使你的信息流更加多样化,并鼓励你在平台上花费更多时间。”尽管这一功能被广泛使用,但一些参与者发现平台并未有效或立即响应此反馈。
  • P12提到效果并不令人满意,因为“它停止推荐密切相关的内容,但继续推荐一些相关的内容”,这导致她减少了使用频率。与此同时,P08和P12观察到,通常需要多次尝试后,算法才会显著减少类似内容。P12推测平台需要一致的反馈才能逐步调整:“这不是一次性解决方案……我认为平台通过略微减少频率来测试你是否注意到,然后进一步减少。你需要持续提供反馈或明确表示你真的不喜欢这些内容,然后它才会逐渐调整。”(P12)

其他负面显式反馈包括屏蔽、举报和禁用个性化功能,这些行为使用频率较低:

  • 屏蔽是为了防止与特定用户的进一步互动,从而有效地从参与者的信息流中移除他们的内容。
  • 举报是为了将内容标记给平台的审核团队,表明该内容违反了社区准则。参与者只有在遇到强烈负面反应时才会选择屏蔽或举报,例如当内容具有冒犯性和不适当性时。
  • 与屏蔽和举报不同,屏蔽和举报针对特定对象(帖子或用户),而禁用个性化功能则在类别范围内传达整体不满

三名参与者曾尝试在小红书中禁用“个性化选项”功能,原因可能是隐私问题或为了避免平台过度学习他们的偏好而导致上瘾。然而,他们最终重新启用了该功能,因为发现非个性化信息流的相关性和吸引力大大降低。正如P01在禁用和重新启用个性化功能后反思的那样:

“禁用个性化后,我的小红书使用量显著下降,因为内容不再吸引我,所以我重新启用了个性化功能。重新启用后,我的观点发生了变化。我意识到启用个性化的好处在于它通过提供有针对性的推荐节省了大量时间,尤其是在搜索特定内容时。”(P01)

虽然大多数显式反馈是负面的,但参与者提到了两种正面显式反馈机制

  • 一种是使用标签在发布帖子时增加可见性,或关注感兴趣的内容。在小红书上,非内容创作者的用户可以收藏特定标签以关注更新并接收带有这些标签的推荐内容。然而,P09认为标签功能“主要有利于内容创作者增加流量,而不是观众”。她希望平台能够通过提供新帖通知,使收藏标签在类别层面上更有用,尤其是在小众领域。
  • 另一种正面显式反馈是订阅感兴趣的主题,这涉及选择偏好的内容类别或主题。这与关注单个用户或频道不同,因为它向平台传达了用户的总体兴趣,而不是订阅特定用户生成的内容。尽管平台允许后续编辑,但参与者要么没有注意到此功能,要么觉得没有必要进行更改。

4.1.2 有意隐式反馈

大多数有意隐式反馈行为是正面的。这些行为没有直接平台功能提示用户,主要依赖于用户自发提供反馈的意图。

忽略(在小红书中)或快速滑过(在抖音中)帖子,是20名参与者观察到的最常见的有意隐式反馈。忽略帖子是指故意不点击小红书推荐信息流中的某些帖子。参与者会“主动跳过”(P01, P07)、“过滤掉”(P04)或“不关注”(P11)他们不感兴趣的帖子。参与者通常将此行为与其相反行为——有意点击(一种正面反馈行为,14名参与者报告)结合使用。在抖音中快速滑过帖子是指快速跳过视频而不与之互动。作为一种负面反馈形式,以避免不感兴趣或同质化内容,一些参与者更喜欢忽略或快速滑过内容,而不是标记为“不感兴趣”,因为这种方式更高效且微妙。例如,P25认为某些内容是“现实世界的缩影”,不应被标记,即使这些内容对她个人没有吸引力,它们代表了社会和现实的多样性。P07认为,如果许多人将内容标记为“不感兴趣”,它可能无法到达需要它的人手中,因此她选择简单地滑过内容。P25和P07都使用忽略或滑过内容来传达微妙的负面反馈,因为标记“不感兴趣”会导致内容立即消失。尽管这种反馈很微妙,但参与者发现它相当有效。例如,P27说:“滑过是我处理不感兴趣视频的最快方式,平台会从这种行为中学习。”

另一种参与者常用的有意隐式反馈是发起新搜索。这是一种主动获取更有针对性的推荐内容的方法。参与者认为,搜索特定主题会促使算法更新他们的档案并推送更多相关内容。一些参与者还利用搜索或点击不相关的搜索推荐来寻求多样化内容或逃离“信息茧房”(P22, P29, P34)。P12表示,这可以被视为负面反馈,表明推荐信息流过于局限。她会“尝试发起一个新的搜索来覆盖压倒性的内容”,以告知平台向她展示其他内容。

尽管许多参与者观察到搜索反馈后推荐信息流的明显变化,但有时算法的响应可能不如预期那样准确或即时。例如,P12搜索了考试中心,但收到了各种与考试相关的帖子,例如好运仪式,她并不相信这些内容,但却引发了焦虑。P11强调了算法未能捕捉到她兴趣转变的问题:

“我非常喜欢《排球少年!!》,并多次搜索它。频繁的搜索和主页上相关内容的重复点击导致算法推送了大量《排球少年!!》的周边商品。但后来我转向了另一部动漫,系统仍然在我的信息流中充斥着《排球少年!!》的内容。即使我搜索了新动漫,平台仍然没有意识到我的兴趣已经转移。”(P11)

4.2 个性化推荐平台的使用目的

我们将用户与算法互动的动机分为以下几类:内容消费、定向信息搜索、内容创作与推广以及信息流定制。理解这些目的为解释反馈提供了背景,并有助于更好地调整推荐信息流以满足用户需求。

4.2.1 内容消费

所有参与者都报告的一个常见目的是消费推荐内容。这包括在小红书中无目的地浏览“探索”页面,或在抖音、快手或哔哩哔哩短视频的“为你推荐”页面中与连续的视频流互动。有时,这成为参与者日常习惯的一部分。例如,P09将小红书的探索页面用作“图书馆”,以获取与书法或绘画相关的创意灵感。当用户遇到他们觉得有趣或有用的内容时,他们会自然地采取进一步行动,例如与朋友分享、收藏或下载以备后用。相反,用户对推荐内容的不满(如感知到的低相关性或高度同质化)会引发信息流定制的目的。

4.2.2 定向信息搜索

另一个目的是更直接地搜索信息,例如搜索护肤技巧、食谱或旅行建议。这通常涉及验证和交叉检查信息,并根据内容的感知质量和真实性采取进一步行动,例如跨平台搜索或咨询朋友。其他几位参与者强调了个性化推荐平台上信息的即时性和相关性,指出他们现在较少依赖搜索引擎进行“日常查询”(P12)。例如,P12使用它来搜索可用的考试中心并比较其条件,她指出“平台提供了及时且有用的信息,而百度(中国搜索引擎)的结果往往过时或更官方。”

4.2.3 内容创作与推广

一些参与者分享了他们在这些平台上发布内容的经历,指出帖子能否获得广泛传播通常取决于他们对算法的理解以及他们能否有效利用它。忠实的发布者会密切关注他们的帖子流量并推测其背后的机制。例如,P14提到她的帖子浏览量有时会让她感到焦虑。她将流量有限归因于缺乏评论。P18提到策略性地使用标签和制作吸引人的标题以提高帖子的可见性。通过内容创作和推广,参与者更多地了解了算法。他们不仅利用这些知识作为内容创作者增加帖子的可见性,还作为内容消费者策划自己的推荐信息流。例如,P12观察到使用特定标签提高了她帖子的可见性。然后,她通过搜索这些标签来获取更多相关内容。

4.2.4 信息流定制

当用户对个性化推荐信息流不满意时,信息流定制的需求就会出现,从而引发用户采取有意识的行动来塑造他们的内容。我们的分析确定了信息流定制的四个具体目标:提高推荐相关性、增加内容多样性、减少不适当内容和保护隐私。

提高推荐相关性是最常见的目标,23名参与者报告了这一目标,他们主动采取行动以增加信息流中更相关和感兴趣的内容,或减少不感兴趣或无关的内容。特别是,参与者注意到,虽然算法最初很好地捕捉了他们的偏好,但当这些兴趣发生变化时,算法难以快速适应。这种算法响应的延迟要求用户不断引导算法以保持信息流的相关性和吸引力。

增加内容多样性由18名参与者报告,他们试图摆脱同质化内容,并通过更广泛的主题丰富他们的信息流。许多参与者对看到重复内容感到厌倦或烦恼。P15提到她不想再打开抖音,说:“我现在甚至感到浏览疲劳,经常觉得自己没有接触到任何新想法。”一些参与者担心,推荐内容与他们的个人偏好过于一致可能会缩小他们的视野或加剧极化观点。例如,P12觉得平台“故意试图取悦你,并希望你知道它在取悦你,这并不聪明,可能会让你陷入信息茧房。”P28说:“我们过去是让手机跟随我们的思想,但现在我们的思想跟随手机,所以结果不可避免地变得越来越狭窄。”这些担忧促使他们主动增加内容多样性。

减少不适当内容由11名参与者报告,当他们遇到引发强烈负面反应的内容时,他们会采取行动。这一目标主要是为了过滤掉广告或不适当和冒犯性的内容,以维持更愉快的在线环境。

保护隐私是一个较少报告的信息流定制目标。尽管许多参与者对平台侵犯隐私的行为(例如监控平台内与朋友分享的帖子、跟踪其他社交媒体上的对话,甚至窃听线下对话)表示反感和担忧,但只有两名参与者提到采取行动保护隐私。

4.3 用户目的与反馈类型的差异

在对参与者使用个性化推荐平台的目的进行分类后,我们进一步分析了这些目的与反馈类型之间的关系。我们通过编码共现分析将反馈类型映射到相应的目的。结果显示,所使用的反馈类型与目的高度相关。具体而言,有意隐式反馈显式反馈主要用于信息流定制,其中有意隐式反馈更多用于增加内容多样性和提高推荐相关性,而显式反馈则用于提高推荐相关性和减少不适当内容。无意隐式反馈则最常与内容消费相关。

4.3.1 反馈类型与一般目的的对应关系

表2展示了三种反馈类型与四个一般目的的频率分布。每位参与者可能报告了多种反馈行为及其对应的目的,因此总出现次数(𝑛 = 198)大于参与者人数。无意隐式反馈在不同目的中出现了105次,其次是有意隐式反馈(58次)和显式反馈(35次)。

总体而言,有意隐式反馈(75.9%,58次中的44次)和显式反馈(88.6%,35次中的31次)主要用于信息流定制,而无意隐式反馈(60%,105次中的63次)则最常与内容消费相关。

内容消费方面,63次实例强调了与平台的自然互动,例如点赞、分享或收藏帖子以表达欣赏或供未来参考。参与者还可能浏览内容创作者的个人主页、查看搜索提示或搜索更多信息以深入了解感兴趣的内容。例如,P18经常展开评论区以查看抖音提供的“热门搜索”,以快速找到关于帖子的解释或相关内容。所有这些自然行为随后会被算法视为无意隐式反馈,以优化推荐信息流。尽管参与者执行这些行为时并未报告有意影响算法,但一些参与者注意到算法已经对他们的行为做出了响应。P18注意到,当她在某人的个人主页停留时,平台开始推荐相关内容。

信息流定制方面,有意隐式反馈出现了44次,例如忽略或快速滑过帖子、点击帖子查看或发起搜索以塑造推荐信息流。例如,P27提到,在定制信息流时,他会花更多时间观看关于滑雪(新兴趣)而不是羽毛球(已知兴趣)的视频。此外,显式反馈出现了31次,例如将内容标记为“不感兴趣”或屏蔽内容,以主动干预算法。

定向信息搜索内容创作与推广方面,最常见的反馈行为分别是搜索信息和创建帖子。尽管在这些情况下,搜索和发布行为并非专门用于定制信息流,但系统仍将其解释为反馈并相应调整推荐内容。P11指出,在发布关于她最喜欢的偶像的帖子后,平台开始在她的信息流中推荐更多相关和流行的内容,尽管她的帖子本身并未引起太多关注。两名参与者提到明确使用标签进行内容推广。例如,P05在小红书上使用“笔记灵感”标签来提高帖子的可见性。

这些发现表明,当用户的意图是定制信息流时,反馈类型与他们在内容创作或消费等活动中的反馈类型存在明显差异。虽然信息流定制主要依赖于有意隐式反馈和显式反馈,其他目的则更多与无意隐式反馈相关。

4.3.2 特定信息流定制目的驱动的反馈类型

如表3所示,对于旨在提高推荐相关性的用户,有意隐式反馈(18次)和显式反馈(14次)都被频繁使用。忽略或快速滑过帖子是最常用的有意隐式反馈,而标记为“不感兴趣”则是最常见的显式反馈。P27断言,滑过内容已经有效地表达了不感兴趣,无需显式标记。P11解释说,她在这些反馈方法之间的选择取决于上下文和厌恶程度。她只会在“极度厌恶”推荐内容时使用标记为“不感兴趣”的选项。

“我之前没有搜索过《流浪地球》,但它仍然推荐给我。这可能是因为《流浪地球》最近很受欢迎,所以系统试图看看我是否感兴趣。如果我不关注,它们可能会消失。因此,对于这些探索性推荐,除非我极度厌恶,否则我通常只是滑过它们以获取一些新内容。”(P11)

如表3所示,当参与者试图增加内容多样性时,29次实例中有24次使用了有意隐式反馈,只有5次选择了显式反馈。主要的隐式反馈行为是发起新搜索。参与者发现,搜索某些主题会增加推荐信息流中相关内容的重要性,因此他们策略性地搜索新主题。正如P06推测的那样:“系统可能会根据该搜索更新您的用户档案或数据,然后开始推送与您新兴趣相关的内容。”

相比之下,12次实例中有10次选择了显式反馈来减少不适当内容。显式反馈被认为更快速、更直接地解决不适当内容问题。当参与者发现内容质量低劣、充满广告或令人不安时,他们倾向于将其标记为“不感兴趣”(P09和P16)。在遇到冒犯性的人身攻击或强烈不同意创作者观点的情况下,用户更有可能举报或屏蔽内容。

只有两名参与者提到他们通过显式禁用个性化选项来保护隐私。P01担心平台的数据收集和用户画像行为,决定关闭个性化功能以防止小红书利用他的互动建立详细的用户档案。P14表示,她尝试禁用个性化功能以保护隐私,但不确定“这是否真的有效”。

这些结果强调了用户的信息流定制目标及其对算法的理解如何驱动他们对个性化推荐平台的反馈类型选择。总体而言,参与者更多地依赖有意隐式反馈来增加内容多样性,而显式反馈则更常用于减少不适当内容。旨在提高推荐相关性的参与者则混合使用了隐式和显式反馈。与此同时,关注隐私保护的参与者采取了更被动的方式,很少使用反馈机制,这与旨在增加内容多样性的参与者积极使用有意隐式反馈形成鲜明对比。

6 结论

我们通过对34名小红书和抖音等平台上的活跃用户进行半结构化访谈,探讨了用户如何利用多样化的反馈机制来影响推荐信息流以实现特定目的。我们将各种用户反馈行为分为三类:显式反馈、有意隐式反馈和无意隐式反馈。我们还发现,用户选择的反馈类型与其目的密切相关。显式反馈主要用于信息流定制目标,例如减少不适当内容和提高推荐相关性,而有意隐式反馈在增加内容多样性和提高推荐相关性方面发挥了关键作用。无意隐式反馈则最常与内容消费相关。

本研究将意图维度引入传统的显式-隐式反馈二分法,并建议个性化推荐平台应更好地支持透明的有意隐式反馈和目的导向的反馈设计。通过更准确地捕捉用户的意图并提供灵活的反馈机制,平台可以增强用户的控制感和满意度,同时优化推荐系统的性能。未来的研究可以进一步探索用户反馈行为与算法响应之间的动态关系,以及如何通过设计创新来平衡个性化推荐与用户隐私保护之间的关系。

#

https://arxiv.org/pdf/2502.09869

kuaishou MomentCross介绍

kuaishou直播团队在《Moment&Cross: Next-Generation Real-Time Cross-Domain CTR Prediction for Live-Streaming Recommendation at Kuaishou》提出了它们的直播推...… Continue reading

T2Diff介绍

Published on February 01, 2025

字节ADS介绍

Published on January 21, 2025