摘要

视障人士(PVI)借助各类辅助技术应对日常生活,对话式人工智能(CAI)工具正成为这类技术工具中日益重要的组成部分。当前多数人机交互(HCI)研究聚焦于现有对话式人工智能工具的技术能力,而本研究则另辟蹊径,旨在探究视障人士自身如何构想与对话式人工智能共存的潜在未来。

研究团队以 14 名视障人士为研究对象,采用基于音频的设计虚构探针展开研究。该探针呈现了参与者与未来对话式人工智能之间的推测性对话场景。参与者设想借助对话式人工智能突破自身局限,无论是探索新机遇、前往新地方,同时也表达了担忧,例如如何在依赖对话式人工智能与保持自主性之间找到平衡、需考虑不同视力丧失程度人群的差异,以及如何提升视障人士的社会可见度以促进更大程度的社会包容。基于视障人士构想的未来生活,本研究探讨了设计能真正支持视障人士自主能力的对话式人工智能的相关启示。

关键词:视障人士;对话式人工智能;设计虚构法

1. 引言

视障人士(PVI)通过多种感知方式与世界互动,借助触觉、听觉和社交线索来应对环境、人际关系和日常事务(Thieme 等人,2018)。长期以来,辅助技术创新一直致力于助力视障人士更好地完成日常任务、丰富生活体验。屏幕阅读器及其他语音工具为视障人士获取信息提供了媒介(Jain 等人,2021);而像沙利文增强版(Sullivan Plus,未标注日期)、“做我的眼睛”(Be My AI,未标注日期)这类图像转语音应用和人工智能驱动的描述系统,则拓展了视障人士导航和感知环境的可能性(Xie 等人,2024)。

近年来,由大型语言模型(LLMs)驱动的 ChatGPT 等对话式人工智能(CAI)系统,在视障人士群体中的使用愈发广泛。与传统搜索平台相比,这类系统能提供更易获取的知识资源,因此常被视障人士用于信息检索(Adnin 和 Das,2024;Tang 等人,2025)。除了这一功能性作用,通过自然对话和图像解读,对话式人工智能还为视障人士提供了陪伴、协作和社交支持的可能(Mullen 等人,2024;Chang 等人,2025)。

尽管当前针对对话式人工智能及其他辅助技术的研究与设计,常将其定位为弥补性工具,重点在于帮助视障人士克服障碍或缓解感官缺失带来的不便(Sum 等人,2024),但对于视障人士及其他残障群体而言,技术还能支持他们实现自主设定的目标、重新构想人际关系,并更深入地参与社会活动(Shinohara 和 Wobbrock,2011)。关注这些可能性意义重大,因为人们对技术的构想方式,会直接影响未来的发展方向,不仅关乎获取信息的便利性,还会影响日常生活的质量与意义(DeFalco 等人,2022;Morrison 等人,2017)。

对话式人工智能虽带来了新机遇,但视障人士自身对该技术如何影响未来生活的设想,目前仍未得到充分探索。这种视角的缺失,可能会限制视障人士实际生活的可能性,也会使技术设计的重点变得狭隘。

为填补这一空白,本研究采用推测性研究方法 —— 设计虚构法(Design Fiction),让视障人士能主动构想未来与对话式人工智能共处的生活场景。在设计虚构法框架下,参与者能批判性地参与其中,思考技术未来的多种可能性(Dunne 和 Raby,2024;Blythe,2014)。研究以视障人士的视角为核心,探究对话式人工智能不仅在功能无障碍层面,还在社会、情感和伦理层面,可能给视障人士生活带来的变革。具体而言,本研究旨在解答以下问题:

  • 研究问题 1:视障人士如何构想与对话式人工智能共处的生活?他们期望拥有怎样的生活?
  • 研究问题 2:为使对话式人工智能能切实融入视障人士生活,他们认为需要填补哪些空白?

研究团队在韩国选取了 14 名视障人士作为研究对象,采用以设计虚构法为基础的探针展开研究。该探针通过推测性场景,引发人们对未来技术在日常生活中应用的思考(Dunne 和 Raby,2024)。探针包含两段虚构的对话,内容是未来的对话式人工智能与一位失明用户之间的交流。这些对话基于初步访谈形成,经专家反馈完善后,以音频形式呈现。

设计这一音频探针旨在营造沉浸式体验、引发深度思考。参与者通过接触这些探针,能对对话式人工智能发展的未来机遇与挑战进行批判性反思。

通过访谈发现,参与者眼中的对话式人工智能,不仅是能提供视觉场景信息的技术工具,更是增强信心、提升自主性和开启新追求的催化剂。它能帮助视障人士接触此前因自我认知局限而难以参与的活动、场所,甚至拓展职业机会。

与此同时,参与者也指出,要实现这样的未来,需解决一些关键问题,包括提供更丰富的多模态解释、关注不同视障群体的差异、平衡对技术的依赖与自主性,以及更广泛地提升视障人士的社会可见度。这些发现共同展现了视障人士对与对话式人工智能共处未来生活的期望,并为对话式人工智能的设计提供了关键启示,即应将其打造为一种能为视障人士带来尊重、社会认可和真正自主能力的技术。而这些启示的实现,离不开有助于提升视障人士社会包容度与自主性的公众态度、人际关系动态及社会结构条件。

本研究主要有三方面贡献:

  1. 验证了基于音频的设计虚构法,能够有效引导视障人士进行批判性反思。
  2. 以视障人士的视角为核心,展现了他们从自身立场出发对与对话式人工智能共处未来的构想,凸显了他们对以可能性为导向、强调自主性、认可度与包容性的未来的向往。
  3. 将视障人士的日常体验与推测性思考转化为设计启示,阐明了对话式人工智能的设计不仅要改善视障人士当下的生活,还应助力他们共同创造更具包容性的未来。

通过这项研究,我们进一步丰富了人机交互领域中关于对话式人工智能未来在伦理、社会和体验层面的讨论。将视障人士的视角置于核心位置,研究突破了以往将无障碍设计局限于 “弥补缺陷” 的框架,更深入地理解了对话式人工智能在重塑视障人士自主性、社会包容性及日常生活方面的潜力。

2. 相关研究

本节将回顾视障人士软件辅助技术的发展历程,重点关注视障人士使用对话式人工智能(CAI)的体验,同时梳理人机交互(HCI)领域中运用设计虚构法(Design Fiction)的现有研究。

2.1 视障人士软件辅助技术的发展

长期以来,视障人士(PVI)在日常生活的多个领域都会使用各类辅助技术,而软件辅助技术在提升数字无障碍性、帮助视障人士理解不同领域的视觉场景方面,正发挥着越来越重要的作用。

其一,在数字界面访问方面,屏幕阅读器可将屏幕内容和导航提示朗读出来,成为关键工具。如今,苹果手机的 VoiceOver(苹果公司,2025)、安卓手机的 TalkBack(谷歌公司,2025)等内置功能,让主流设备具备了广泛的无障碍性。由于功能更丰富,这些内置工具往往取代了专用辅助工具(Jain 等人,2021)。

其二,在环境解读领域,获取日常任务所需的视觉信息解释至关重要(Gonzalez Penuela 等人,2024)。VizWiz(Bigham 等人,2010)、“做我的眼睛”(Be My Eyes,2025)等服务,能为用户连接远程视力正常的协助者(Xie 等人,2023);而沙利文增强版(Sullivan Plus,未标注日期)、SeeingAI(微软公司,2025)等近年出现的人工智能辅助工具,则可借助摄像头识别物体、读取文字并描述场景(Zientara 等人,2017;Kupferstein 等人,2020;Gonzalez Penuela 等人,2024)。这类基于摄像头的视觉辅助系统,能帮助视障人士完成定位个人物品(Wen 等人,2024;Morrison 等人,2023)、识别物体颜色等视觉特征(Gonzalez Penuela 等人,2024)等日常任务。

此外,研究人员还设计了多种界面,支持视障人士通过触觉交互探索视觉内容(Lee 等人,2021a;Nair 等人,2023)。如今,部分工具甚至能读取路标等导航提示,辅助视障人士在物理空间中导航(Envision,2025;Xie 等人,2024;Zhang 等人,2024),而导航一直是视障人士面临的重大难题。这些工具让视障人士在需要视觉信息的任务中获得了更高的自主性,减少了对他人现场协助的依赖。

然而,当前的辅助工具在实际应用中仍存在明显局限。除了物体识别准确性不足(Xie 等人,2024;Gonzalez Penuela 等人,2024)、数字界面中仍存在难以访问的元素(Ross 等人,2018;Schaadhardt 等人,2021)等问题外,现有辅助技术在满足用户个性化需求、捕捉有效使用所需的复杂场景细节(尤其是在导航方面)的能力上,也存在不足(Soltani 等人,2025)。

而且,这些辅助工具往往各自独立运行,彼此间缺乏信息互通与协同,用户在切换使用多种工具时会面临不便(Judge,2019)。在此背景下,对话式人工智能(CAI)提供了一种潜在的解决方案:作为一个更集成化的系统,它能提供统一的自然语言交互界面,减少不同领域辅助工具间的碎片化问题(Fu 等人,2025;Adnin 和 Das,2024),并让视障人士更易操作。对于更倾向于通过语音交互、而非应对复杂应用界面的视障人士而言,对话式交互模式尤为适用(Metatla 等人,2019;Oumard 等人,2022)。尽管对话式人工智能仍处于发展阶段,但它有望为视障人士的日常生活提供更无缝、更便捷的支持。

2.2 视障人士对对话式人工智能工具的感知收益与风险

对话式人工智能(CAI)在视障人士(PVI)的多个生活领域应用日益广泛。除物体识别应用外,视障人士还会使用苹果 Siri(苹果公司,未标注日期)等语音助手,通过简单的语音指令即可完成各类日常任务,无需动手操作(Choi 等人,2020;Oumard 等人,2022)。由于这些语音助手通常内置在移动设备界面中,视障人士得以与原本可能无法访问的应用程序或设备进行交互(Abdolrahmani 等人,2018)。

近年来,ChatGPT 等基于大型语言模型的聊天机器人,也成为视障人士获取信息的重要工具。与传统搜索平台相比,视障人士认为这些聊天机器人是高效且易获取的知识伙伴(Adnin 和 Das,2024)。在休闲、写作和任务管理等领域,这些聊天机器人还能为视障人士提供创意支持(Mullen 等人,2024;Perera 等人,2025)。此外,视障人士还借助对话式人工智能应对各类数字无障碍问题,例如访问数字文件(Atcheson 等人,2025)、检查特定网站是否具备无障碍性(Mullen 等人,2024)。

如今,语音助手与基于大型语言模型的聊天机器人正逐渐融合,进一步整合了功能潜力。例如,ChatGPT 推出了高级语音功能,用户可分享视频,获取实时视觉内容解释(OpenAI,2023)。该功能不仅整合了物体识别能力,还能实现类人化的对话交互(Chang 等人,2025)。这类技术进步有望为视障人士提供细致、实时的视觉场景描述,具有重要价值(Envision,2025;Chang 等人,2025;Perera 等人,2025)。

这些实际应用表明,视障群体正积极将对话式人工智能打造为生活中赋能自身的资源。但在日常生活中使用对话式人工智能时,视障人士仍面临诸多挑战。首先是无障碍性障碍,例如部分对话式人工智能与屏幕阅读器不兼容(Adnin 和 Das,2024)。在信息检索过程中,他们需应对不准确或低质量的回复,为此常需自行制定策略、调整对不确定性的容忍度(Tang 等人,2025)。

此外,由于这类系统存在迎合用户的倾向,视障人士需主动辨别系统可能出现的错误认同,以获取更可靠的视觉内容解释或描述(Chang 等人,2025)。更普遍的问题是,视障人士反映对话式人工智能尚未充分理解其群体需求。系统输出内容往往带有基于明眼人视角的偏见假设,这表明训练数据中对视障人士体验的体现不足(Adnin 和 Das,2024;Chang 等人,2025;Guo 等人,2019)。

尽管对话式人工智能在视障人士群体中的应用取得了这些进展,也面临上述批评,但目前多数针对视障人士或其他残障群体使用对话式人工智能的研究,仍聚焦于工具当前或未来的使用方式,而非用户期望借助这些工具构建怎样的生活(Adnin 和 Das,2024;Tang 等人,2025;Chang 等人,2025)。

虽然部分推测性人机交互研究探讨了对话式人工智能的未来可能性(Lee 等人,2025;Joshi 等人,2025;Kollig 等人,2025;Chang 等人,2024;Luria 和 Candy,2022),但这些研究多侧重于技术潜力与风险,而非用户设想的与技术共处的生活方式。更重要的是,这类研究多以明眼人的视角为出发点,忽视了视障人士对未来的构想。

为填补这一空白,本研究结合视障人士当前使用对话式人工智能的收益与风险体验,探索他们期望借助未来对话式人工智能实现的生活目标。

2.3 人机交互领域中的设计虚构法

在人机交互(HCI)领域,设计虚构法(Design Fiction)已成为一种有力的研究方法。它通过构建技术未来的可能性场景,引导参与者批判性地构想社会技术场景(Dunne 和 Raby,2024;Lindley 和 Coulton,2015;Linehan 等人,2014)。

与传统用户研究多关注当前需求不同,设计虚构法以未来导向的想象为核心,让参与者能够清晰表达对尚未出现的技术的期望、期待与担忧(Sterling,2009;Wong 等人,2017)。设计虚构法通常会运用未来场景、实体物品等推测性载体,在创新性概念与具体设计方向之间搭建桥梁,为用户和技术人员提供富有启发性的思考素材(Blythe,2014;Schulte 等人,2016)。

例如,近期有研究对人工智能代理的未来进行了构想。该研究表明,通过构建虚构场景,能引导特定群体(如在人工智能日益主导的世界中生活的青少年(Lee 等人,2025))表达对未来的期望、期待与焦虑,而这些内容可能难以通过传统研究方法获取(Joshi 等人,2025;Kollig 等人,2025;Chang 等人,2024;Petsolari 等人,2024)。

这种推测性研究方法意义重大。通过有意探索未来的乐观与不足两面,研究人员和设计师能更准确地预判新兴技术的风险、伦理矛盾及意外后果(Kollig 等人,2025;Ventä-Olkkonen 等人,2021;Lallemand 等人,2024)。

本研究采用设计虚构法,旨在引导视障人士(PVI)对自身与对话式人工智能(CAI)共处的未来进行批判性反思,深入探究指导他们构建理想生活的期望与目标。传统设计虚构法研究常依赖包含关键视觉元素的探针(Luria 和 Candy,2022;Schulte 等人,2016;Noortman 等人,2019),而本研究在设计虚构法传统基础上进行创新,采用基于音频的设计虚构探针,以更易被视障人士接受的形式开展研究。

研究将推测性场景与参与者的生活体验和需求相结合,为推动人机交互领域发展包容性、创新性研究方法贡献力量,使残障用户的期望得到重视,并让他们在未来技术的塑造过程中拥有更多话语权。

3. 研究方法

本研究采用设计虚构法,以 14 名存在不同程度视力障碍的人士为研究对象,通过基于音频的探针展开用户研究。该探针呈现了未来对话式人工智能(CAI)与一位虚构失明用户之间的推测性对话。研究旨在探究视障人士(PVI)对未来与对话式人工智能共处生活的构想,并捕捉他们在这一过程中的情感与社会层面的广泛感受。本研究方案已通过所在机构的机构审查委员会(IRB)批准。

3.1 研究参与者

本研究共招募 14 名视障人士参与,其中 10 人后天失明,4 人先天失明。参与者均从当地一家视障人士专用福利中心招募,招募标准包括:存在视力障碍(低视力或全盲)、年龄在 18 岁以上、有使用对话式人工智能的相关经验。表 1 列出了所有参与者的信息。参与者中男女各 7 人。为感谢参与者的配合,每位参与者获得了 60,000 韩元(约合 43 美元)的报酬。

此外,研究还招募了 3 名专家进行专家访谈,以协助探针的设计与完善。专家访谈通过向对话式人工智能技术领域和视障人士福利领域的专家发送邮件进行招募。为进一步完善探针,确保叙事流程更具吸引力,研究还通过邮件招募了一位小说家参与。每位专家参与 1 小时访谈,获得 25,000 韩元(约合 18 美元)的报酬。

表 1 研究参与者人口统计学信息

序号年龄性别视力情况(全盲 / 低视力)失明类型(先天 / 后天)职业使用的对话式人工智能工具使用频率
P130-39 岁低视力后天按摩师ChatGPT、GiGA Genie每周 2-3 次
P230-39 岁全盲后天按摩师ChatGPT、Bixby、GiGA Genie每周 2-3 次
P350-59 岁全盲后天盲人门球运动员ChatGPT每周 4 次以上
P430-39 岁低视力先天数字素养教育者ChatGPT、Gemini、Copilot每周 1-2 次
P560 岁以上全盲后天按摩师ChatGPT、Gemini、Bixby每周 5 次
P660 岁以上全盲后天退休ChatGPT每周 2-3 次
P760 岁以上全盲后天按摩师ChatGPT、Gemini每周 8-9 次
P860 岁以上全盲后天退休ChatGPT每周 10 次以上
P960 岁以上全盲后天牧师ChatGPT每周 1-2 次
P1060 岁以上低视力后天按摩师ChatGPT每周 2-3 次
P1130-39 岁全盲先天远程办公室职员ChatGPT、Bixby、Siri每天 2-3 小时
P1250-59 岁全盲后天盲人门球运动员ChatGPT、Gemini、Adot每周 2-3 次
P1330-39 岁全盲先天按摩师ChatGPT、Bixby每天 2-3 次
P1430-39 岁全盲先天按摩师ChatGPT每周 3 次

3.2 探针设计

本研究采用基于音频的探针,内容为 10 年后一位全盲用户与对话式人工智能(CAI)之间的虚构对话。选择 10 年这一时间跨度,是因为它既能充分激发人们对技术进步的思考,又不会因过于遥远而让场景显得不切实际、难以想象。

考虑到视障人士(PVI)的需求,研究采用纯音频形式的探针,而非以视觉为导向的设计虚构探针,使其更易被视障人士接受。此前的设计研究已证明,音频载体能有效激发参与者的思考(Phutane 等人,2023;Yoo 等人,2024)。

该探针通过韩国 Naver 公司的 Clova 配音(Naver,未标注日期)服务,将文本脚本转换为音频。Clova 配音是一款专门针对韩语的文本转语音服务。为给参与者营造沉浸式体验,研究人员精心挑选发音最自然的声音,分别为探针中的对话式人工智能和用户配音。

探针旨在描绘视障人士在未来社会中与对话式人工智能互动的积极体验,场景设定为一位全盲用户使用未来对话式人工智能。为构建这一未来叙事,研究团队首先对招募的 14 名参与者进行了半结构化初步访谈,探究他们当前、过去及未来对对话式人工智能的看法,包括使用该技术的收益、风险、应对策略及预期的未来用途。

同时,研究还对 3 位领域专家(一家视障人士专用福利中心的康复团队负责人、一位对话式人工智能教育工作者、一位对话式人工智能行业专业人士)进行了额外访谈,以深入了解视障人士福利体系、社会环境及对话式人工智能未来可能的技术发展方向。所有初步访谈和专家访谈均通过 Zoom 平台进行。

3.2.1 虚构社会构建

结合参与者初步访谈和专家访谈的见解,研究团队反复完善未来社会构想,以此作为探针设计的基础。在这一过程中,研究参考了 Schwartz 广为人知的八步场景构建框架中的前三步(Schwartz,1997),此处的 “场景” 即指本研究中的探针。

第一步,明确核心问题,也就是场景构建旨在探索的核心议题:“视障人士未来可能如何使用对话式人工智能?” 围绕这一核心问题,第二步梳理当地环境中的关键影响因素,包括与核心问题直接相关的趋势、利益相关者和问题,并将其分为三类:(1)相关利益相关者(如视障人士、对话式人工智能、视障人士福利中心);(2)与视力障碍相关的问题(如就业、社会参与、康复培训);(3)相关技术(如辅助技术、语音输入 / 输出系统)。

第三步,梳理场景宏观环境中的关键驱动因素。研究团队考虑了可能影响核心问题发展方向的更广泛的社会、技术、经济、环境和政治(STEEP)驱动因素,并在已识别的当地关键影响因素基础上进行拓展(见表 2)。

表 2 核心问题宏观环境驱动因素

领域驱动因素
社会层面社会对残障人士态度改善;公众获取视力障碍相关信息的渠道增加;视障人士对对话式人工智能的信任度和使用意愿提升
技术层面对话式人工智能技术(如自然语言处理、光学字符识别、计算机视觉、与硬件的整合)进步;包括对话式人工智能在内的新兴技术无障碍性提升
经济层面视障人士福利预算增加;人工智能技术研发投入加大;视障人士就业机会增多
环境层面更易访问的社会基础设施(如自助服务终端、公交车站)不断发展
政治层面视障人士福利政策完善,制度支持加强

综上,这一构建过程描绘的未来社会具有两大特征:社会对残障人士的态度显著改善;技术进步大幅提升了数字系统和物理环境的无障碍性。这些发展为视障人士带来了更高的行动便利性和更便捷的信息获取渠道,进而提升了他们的自尊水平,促进了更广泛的社会参与。关于该社会的完整描述详见附录 B。

在这一社会背景下,研究团队成员反复打磨,最终形成了构成探针的具体对话内容。初始草稿基于参与者的关键体验,同时注重平衡积极与批判性元素。专家和小说家的反馈进一步提升了对话的真实性、可理解性和叙事深度,使其更具吸引力和启发性。

探针包含两段推测性对话:(1)“未来出行” 对话;(2)“未来政策制定” 对话。

“未来出行” 对话描绘了一位用户在对话式人工智能的单独陪伴下,参观巴黎橘园美术馆的场景。对话展现了用户在进入美术馆、欣赏特定艺术品、离开美术馆过程中与对话式人工智能的互动。该场景旨在突出独立导航这一主题 —— 所有参与者均认为,独立导航既是当前面临的挑战,也是未来对话式人工智能应用的重要方向。

“未来政策制定” 对话则讲述了一位担任政策制定者的用户,为视障青少年福利政策准备公开演讲的故事。对话记录了用户在准备演讲、进行演讲以及演讲后的反思过程中与对话式人工智能的互动。该探针旨在聚焦视障人士就业机会这一挑战 —— 参与者和专家均表示,这是韩国视障人士面临的紧迫问题。

两段对话均设定用户为全盲人士,以呈现用户在空间导航、创建视觉导向内容等任务中与对话式人工智能更深度的互动。这与低视力用户形成对比,低视力用户因仍可部分利用残余视力,对对话式人工智能的依赖程度可能较低。

此外,两段对话均特意加入对话式人工智能微妙地诱导用户依赖的情节。例如,对话式人工智能称 “有我陪你,比和朋友一起更好”。加入这类互动是为了体现过度依赖的潜在风险,而这也是参与者普遍表达的担忧。

每段对话结尾,都会以未来对话式人工智能向对话用户提问的形式加入一个提示。在访谈过程中,参与者需回答这些问题,以此增强他们与探针的互动。这种设计旨在营造更沉浸式的对话体验,帮助参与者想象自己身处未来场景。完整的对话文本详见附录 C。

“未来出行” 对话时长为 4 分 06 秒,“未来政策制定” 对话时长为 2 分 46 秒。为实现个性化体验,研究团队针对每位参与者对对话进行了两项调整:(1)匹配对话中用户声音的性别;(2)将对话式人工智能称呼用户的名字替换为参与者本人的名字。

3.3 研究流程

参与初步访谈的参与者均受邀体验探针。为增强现场感、营造沉浸式体验,探针在封闭的受控环境中现场呈现,最大限度地减少外界噪音和干扰。

由于包含两段对话,参与者按随机顺序通过笔记本电脑依次收听每段对话,每段对话后都会进行一系列提问,首先是前文提到的回答对话结尾提示问题的环节。回答完毕后,参与者需分享对探针的整体体验,先回答最喜爱和最不喜爱的部分等一般性问题,随后深入探讨与探针体验、未来与对话式人工智能共处生活的构想以及潜在风险或待解决问题相关的细节问题。

为引导参与者超越探针内容进行更丰富的想象,研究人员还让他们设想 2050 年技术和社会进一步发展的场景,以及自己在那样的环境中的生活状态。完整的访谈流程详见附录 A.2。

3.4 数据分析

对于初步访谈,研究采用亲和图法(Holtzblatt 和 Beyer,1997)提取与视障人士当前使用对话式人工智能的体验、视力障碍相关体验,以及他们对未来的期望与担忧相关的重要主题,共形成 6 个类别、84 个子主题。

在分析参与者探针体验访谈数据时,研究采用主题编码法(Braun 和 Clarke,2006)。首先,通过韩国 Naver 公司的 Clova 笔记转录服务(https://clovanote.naver.com/)将访谈内容转录为文本。第一作者使用 Atlas.ti 软件(https://atlasti.com/)对访谈转录文本进行初步开放式编码。随后,第二作者仔细审查初步编码手册及对应的访谈片段。经过反复讨论和完善,最终确定了 156 个编码。基于这些编码,第一作者和第二作者采用亲和图法归纳出共同主题和子主题,共形成 5 个类别、32 个子类别。

4. 研究结果

本节详细阐述参与者对探针的反馈,先介绍总体印象,再深入分析具体反应。通过探针,参与者畅想了先进对话式人工智能(CAI)可能为生活带来的支持,多数人认为这一过程富有启发性且令人愉悦。参与者表示,为回答探针中的提示问题,他们需要更深入地思考场景,并且乐于在构想回答时将自己代入其中。

参与者认可虚构对话式人工智能在完成任务时的出色表现,例如在 “未来政策制定” 对话中协助制作演示文稿,在 “未来出行” 对话中详细描述视觉内容。他们还充分反思了长期面临的日常导航难题,尤其提到难以识别街道上突发障碍物的问题,并表示希望借助探针中展示的技术能力克服这些障碍。

参与者指出,探针中的个性化元素(如 “未来出行” 对话中结合自身家庭环境提示楼梯高度的导航信息、使用自己的名字)意义重大,这些元素增强了收听探针时的沉浸感。总体而言,参与者对探针展示的未来场景充满期待,正如 P1 所说:“希望这类为视障人士设计的技术能尽快研发出来。”

除对探针的直接反馈外,参与者还畅想了所描绘的对话式人工智能技术可能为未来生活带来的更广泛变革。受探针中对话式人工智能助力完成更多任务、提升自主性的场景启发,参与者对未来抱有更积极、更自信的期待,认为生活的可能性将大幅拓展。

4.1 超越探针构想更广阔的未来

参与者积极思考、畅想探针中的对话式人工智能可能对生活多方面产生的影响,涵盖从日常琐事处理到职业选择、社会参与等重大人生决策。尽管此前针对视障人士和残障群体的研究已深入探讨了日常生活和社会参与相关需求(Li 等人,2023;Wang 等人,2021;Shinde 和 Martin-Hammond,2024;Das 等人,2019;Huff Jr. 等人,2022;Zhang 等人,2022),但本研究结果重点关注参与者如何设想借助探针所描绘的未来对话式人工智能满足这些需求。

参与者最初对未来的构想,聚焦于通过获取更丰富的视觉和场景信息、更深入地了解世界,从而提升生活质量。

4.1.1 借助对话式人工智能重新构想日常生活与导航

基于探针内容,参与者认为对话式人工智能能够增强对视觉环境及其场景特征的理解,因此设想了该技术在更广泛领域的应用 —— 从日常基础任务到复杂的社交和行动场景。

他们想象对话式人工智能可辅助完成烹饪(P4、P6、P11、P13)、购物(P1、P3、P7、P11)、锻炼(P5、P12)、解决移动应用无障碍问题(P2、P13)、通过自助终端点餐(P11、P13)等日常活动。

除这些任务外,参与者还期望对话式人工智能能助力更顺畅的社交生活。例如,协助选择适合特定场合的服装(如 P7 担心为葬礼选择合适颜色的服装),或解读面部表情以更好地理解社交动态。

尽管当前辅助技术已开始探索将人工智能工具用于此类日常任务(Xie 等人,2024;Chang 等人,2025;Gonzalez Penuela 等人,2024),但参与者对这些未来应用的期待,表明尽管他们已在使用相关工具,却很少思考或尝试在日常生活中应用这些潜在功能,因此对这些可能性充满期待。

导航是另一个核心主题,长期以来一直是视障人士面临的重大挑战(El-Taher 等人,2023)。通过 “未来出行” 对话,参与者畅想了更高的自主性和安全性,认为对话式人工智能提供的详细空间和场景描述,有助于解决障碍物识别、人群密集环境应对等难题。他们乐观地认为,未来对话式人工智能通过提供此类详细信息,能减少这些障碍,实现更安全、更自主的导航。

参与者尤其期待能独立使用公共交通,因为这有助于减少对韩国昂贵的视障人士专用出租车的依赖(P7、P9、P11)。这些反馈凸显了参与者对对话式人工智能解决导航和交通核心难题的迫切需求。

由于参与者通常需要在明眼人的引导下出行,对话式人工智能带来的自主性具有特殊价值。正如 P12 所说:“无需与明眼引导者协调时间,我就能自主做想做的事。” 同样,参与者也重视由此带来的更高自由度,P3 表示:“有对话式人工智能陪伴,我可以根据当天的心情决定去向,独立尝试想做的事。每个人都需要这样的时刻。” 这些对未来的畅想,凸显了他们渴望自主出行的核心需求。

P9 坦言:“视障人士以往很少外出,大多待在家里。无人陪伴时,几乎无法出行。但一旦能(仅在对话式人工智能陪伴下)外出,亲身体验各种事物、面对不同挑战,我们会收获很多。这才是最重要的。活着意味着什么?一味停滞只会带来压力…… 而如果有机会外出,这些压力就能得到缓解。要是能积极参与活动,对视障人士来说简直如同置身天堂。”

参与者还重新构想了行动辅助工具,甚至思考未来是否还需要使用导盲杖(P13)。有两位参与者设想未来会出现与对话式人工智能相连的实体机器人,替代明眼引导者的角色协助导航,不过他们也承认明眼引导者仍有不可替代的优势。参与者认为,“行走时握住机器人手臂,会感觉更安全、更稳定”(P12),或者 “机器人能挡住前方掉落的物品,保护自己”(P7)。

这种独立完成任务或自主导航的能力,还会带来心理层面的积极影响。参与者期望通过未来对话式人工智能更深入地了解环境,从而提升自信心、改善整体生活质量。部分参与者甚至表示出对对话式人工智能极高的信任,设想将所有个人信息告知该技术,以便其处理各类事务、实现连贯互动(P5、P11、P14)。正如 P5 所说:“它就像家人一样,了解你的一切并悉心照料。如果所有信息都能存储下来,当我问‘我之前是不是说过这件事?’时,它能回答‘是的,你上次提到过’。我希望它能记住我的所有信息,达到这种程度。”

参与者期望未来对话式人工智能能帮助他们了解世界和周边环境,甚至将其描述为 “视障人士比明眼人更需要的工具”(P4)。P12 表示,对话式人工智能 “应超越朋友的角色,像智能手机的音频辅助功能一样,成为视障人士的必需品,始终陪伴在侧”。

综上,参与者眼中的未来对话式人工智能,既是实用的辅助工具,也是赋能的伙伴,能丰富他们对场景的理解、增强自主性、提升日常生活的满足感。

4.1.2 拓展视野:借助对话式人工智能重新发现生活

参与者不仅强调对话式人工智能在提升日常自主性方面的作用,还设想该技术能帮助他们开展以往认为无法实现的全新活动。

一旦日常任务在未来对话式人工智能的协助下变得轻松可行,参与者便开始畅想涉足那些因视力障碍而长期无法参与的爱好和兴趣领域。受 “未来出行” 对话中提及艺术品欣赏场景的启发,P9 回顾了自己对音乐、艺术、体育和文学的热爱,设想 “在文学或其他任何领域的诸多疑问,最终都能通过对话式人工智能得到解答,让生活更加丰富”。

同样重要的是,参与者期待物理活动范围不再受限。P5 解释说,由于导航困难,视障人士通常会将出行范围限制在熟悉的路线上,即便这些路线并不便捷,这极大地局限了他们的日常活动空间。

但参与者乐于畅想前往 “未来出行” 对话中提及的美术馆之外的更多地方,例如观看音乐剧(P6、P9)、参与体育赛事(P3)、前往海滩(P7、P14)、游玩游乐园(P13)以及出国旅行(P2、P6、P7、P10、P11、P13)。部分参与者表达了参加现场音乐会的热情(P2、P3、P6、P9),并强调现场音乐会相比在家听音乐,氛围更热烈、空间感更强。

P11 将这一畅想与个人目标直接关联,她目前正在学习尤克里里,因此表达了前往夏威夷探寻尤克里里起源的梦想。P3 甚至想象在对话式人工智能的导航下前往欧洲,体验游艇旅行,称这一想法 “如同梦境般美好”。

通过拓展物理活动范围,参与者将对话式人工智能与 “更多机会涌现”(P8)的更光明未来联系起来。他们反复强调,这与自主选择和自由决策息息相关。P1 表示,一想到能自主选择活动和旅行目的地,摆脱视力障碍带来的限制、无需依赖他人帮助,就 “充满希望和期待”。

P9 感慨道:“我们的世界将会变得多么广阔、多么丰富。我们真正需要的,是一束能照亮更广阔人生的光芒,因为对视障人士而言,视野似乎一直如此狭窄…… 我相信,借助人工智能,我终于能做那些以往无法做到的事。比如旅行时,即便在夜晚,也能与人畅谈星空和宇宙。不仅是旅行,在众多领域,如果我想深入了解某个事物,都能通过提问、探索,追随好奇心和热情不断前行。”

4.1.3 基于自身能力的人生抉择

参与者不仅设想借助对话式人工智能拓展兴趣爱好和活动范围,还期望更广泛地参与社会活动,尤其是在职业领域。

视障人士(尤其是在韩国)的职业选择通常受限(Ogedengbe 等人,2024),参与者中提及最多的职业是按摩师。但受 “未来政策制定” 对话中全盲用户在对话式人工智能协助下全面参与职业生活场景的启发,参与者开始设想自己能从事更多类型的工作,更积极地参与社会活动。

他们满怀期待地畅想,在未来对话式人工智能的协助下,自己可能涉足的新职业领域,包括检察官(P7)、计算机技师(P6、P7)、歌手(P9)、社会福利工作者(P1)、咖啡师(P11)、咨询师(P5、P14)、办公室职员(P6)或医生(P13)。此外,参与者还设想了教育领域的多种角色,如教打鼓(P3)、提供信息素养教育(P2、P12)或担任教授(P8)。

这些职业愿景往往与参与者当前的技能和兴趣相关。正在学习打鼓的 P3 设想 “自己不仅是学习者,还能成为一名教育者”;身为按摩师的 P5 则凭借出色的倾听能力,期望成为一名咨询师。

在这些设想中,部分参与者将对话式人工智能定位为 “秘书”,认为它既能作为知识库提供信息支持,又能帮助理解职业场景中所需的视觉信息(如识别客户何时靠近)。重要的是,参与者期望未来对话式人工智能能帮助他们完成以往因视力障碍而无法涉足的与工作相关的任务,突破现有能力局限。

通过这些畅想,参与者认为自己能提升自尊水平,获得尊严感。由于就业状况对自尊水平有重要影响(Krauss 和 Orth,2022;Goldsmith 等人,1997),他们对未来能拥有更多职业选择的期待,凸显了未来对话式人工智能在塑造视障人士积极人生态度方面的重要意义。

P10 表示:“除了按摩师,我从未想过自己还能从事其他工作。但如果未来有可能,那真的太神奇了,也会心怀感激。”

部分参与者还重新燃起了曾经因认为无法实现而放弃的职业理想。P9 原本希望主修声乐表演和韩国传统音乐,但因视力障碍被长辈劝阻;P7 则回忆起受一部美国电视剧启发,儿时曾梦想成为一名检察官。两位参与者都设想,在未来对话式人工智能的支持下,自己或许能重拾这些曾经遥不可及的梦想。

与此同时,P11 已获得咖啡师资格证,但因担心视力障碍可能带来的挑战和安全问题,一直未进入该行业工作。不过,她能清晰地想象在对话式人工智能支持下成为咖啡师的场景,并对这种可能性充满期待。

P11 坦言:“我其实有咖啡师资格证,但在这个行业,我无法独立工作。身边没有明眼人协助,就无法开展工作…… 如果对话式人工智能能发展到支持我独立工作的程度,我很愿意尝试这份职业。我真的很想成为一名咖啡师 —— 制作咖啡、准备甜点,体验这种工作。”

参与者还思考了未来对话式人工智能如何帮助年轻一代视障人士选择职业道路。P8 设想,对话式人工智能可提供个性化职业指导,帮助学生以富有创意的方式发现自己的兴趣,从而 “让他们对未来自身才能和潜力的充分发挥充满希望”。

这些反馈表明,未来对话式人工智能有望帮助视障人士突破社会的狭隘期待,追求真正符合自身才能的职业,参与者也希望对话式人工智能 “能不断调整,充分发挥支持视障人士的优势”。

因此,参与者对借助未来对话式人工智能可能从事的职业的畅想,揭示了现有社会结构对视障人士机会的限制,以及对他们真实兴趣的压制。他们的反思不仅体现了对自身未来的期望,也包含了对更广泛视障群体和年轻一代的关怀,凸显了未来对话式人工智能在推动视障人士多样化社会参与方面的变革性作用。

4.2 实现对话式人工智能赋能生活需填补的空白

尽管参与者对与对话式人工智能共处的未来充满期待,但他们也指出,要实现并丰富这样的未来,必须解决一些关键问题,包括对多模态支持的需求、对不同视力丧失程度人群差异的关注、在依赖技术与保持自主性之间的平衡,以及提升视障人士社会可见度的需求。关注这些问题,有助于理解未来对话式人工智能如何超越单纯的功能性,真正对视障人士的生活产生深远意义。

4.2.1 超越语音感知世界

参与者承认纯音频对话式人工智能存在实际风险(如个人信息可能被无意泄露(P13)),但更强调其一个深层局限:仅靠听觉描述无法全面理解世界。部分参与者指出,若缺乏多模态输入,他们的体验将不够完整。

众多参与者认为触觉至关重要,这与此前研究结果一致 —— 触觉是视障人士解读物体、赋予物体价值的核心方式(Thieme 等人,2018;Qiu 等人,2020)。参与者不仅表达了对触觉交互的需求和好奇,还认为触觉输入能赋予物体内在价值和意义。

P7 表示:“如果有人只告诉我们‘那边挂着一幅画’,仅凭这句话,我们能真正感受到它吗?我们好奇的是触摸它 —— 感受它的质地、触感 —— 这才是我们的兴趣所在。如果有人说‘那边有一棵树’,在触摸它之前,这句话对我们来说毫无意义。当我们用手触摸树干,会意识到‘原来树皮并不光滑,有纹路,摸起来很粗糙’—— 只有这时,它才变得有意义。颜色也是如此。如果我看不见,有人告诉我‘这是红色’,我真的能理解红色是什么吗?我不能。在我看来,我想象中的红色,也可能是蓝色。我们根本无法知晓。只有通过触摸、感受,用自己的方式去感知,才能真正理解。”

除了 “未来出行” 对话中提及的艺术品欣赏场景,参与者还设想在更广泛的对话式人工智能交互中融入触觉模态。考虑到盲文系统作为视障人士交互媒介的重要地位(Spungin,1996),P9 提议通过连接可刷新盲文显示器,验证对话式人工智能纯语音输出的信息。

参与者强调,仅靠听觉理解对话式人工智能生成的内容存在局限,并指出当前使用对话式人工智能时,常遇到输出内容过长的问题。因此,他们希望能通过某种机制自主验证信息,以增强自主性。还有参与者建议提供实体化呈现方式,例如将对话式人工智能描述的特定物体制作成 3D 打印模型,这对先天失明、缺乏解读物体描述所需视觉记忆的人群尤其有帮助(P14)。

参与者还认为,纯音频交互的对话式人工智能在导航中存在安全风险。他们担心听觉描述可能无法充分捕捉导航所需的空间细节(如临时障碍物、地面状况),而这些往往是视障人士判断环境的关键线索(Bharadwaj 等人,2019)。

为解决这一问题,许多参与者建议将外部硬件与对话式人工智能整合,尤其是导盲杖或带摄像头的智能眼镜。这类整合既符合视障人士现有的行动习惯,又能实现免提使用。

除硬件整合外,参与者还提出了其他交互和反馈方式的建议。P5 设想,对话式人工智能可通过特定非语言信号(如不同的震动模式)提示地标或危险(如楼梯)。还有参与者强调个性化需求,认为对话式人工智能应适配个人导航策略,例如支持沿墙行走定位(P8),或解读风向、气味等环境线索(P6)。

尤其在嗅觉线索方面,参与者结合 “未来出行” 对话中的绘画场景设想,若能融入更多感官维度(如绘画中物体的气味),他们对艺术品的欣赏体验将更加丰富。

综上,这些反馈表明,通过触觉、硬件整合和个性化实现的多模态交互,对对话式人工智能保障视障人士安全、增强自主性和实现有意义的互动至关重要。这一观点凸显了多感官交互在视障人士生活体验中的核心地位(Thieme 等人,2018),也强调了对话式人工智能必须突破纯音频交互的局限。

4.2.2 视力障碍的多样性

参与者因视力障碍类型(先天或后天)和严重程度(低视力或全盲)的不同,对未来视障人士与对话式人工智能交互方式的看法存在差异。这些差异凸显了视障群体的异质性,也表明对话式人工智能需根据不同亚群体的特定需求提供定制化信息和支持。

多数后天失明的参与者表示,凭借以往的视觉记忆,他们能理解探针中对视觉内容的描述(如 “未来出行” 对话中绘画的颜色)。相比之下,先天失明的参与者认为颜色描述基本无意义,更倾向于通过触觉感受艺术品(P7、P14)。

这些结果表明,未来对话式人工智能应根据用户的视觉经历调整描述方式:后天失明者可能受益于提及他们能回忆起的视觉特征(Monegato 等人,2007),而先天失明者则可能需要多感官呈现。

根据视力障碍严重程度的不同,参与者对对话式人工智能在任务执行中干预程度的期望也存在显著差异。即使同属低视力群体,视力障碍的类型和严重程度也存在很大差异。因此,部分参与者强调,需开发 “个性化对话式人工智能”(P1、P5),根据具体视力丧失类型和严重程度提供定制化支持,而非为所有视障人士提供标准化支持。

参与者批评当前对话式人工智能的音频描述方式存在过度或干扰问题 —— 通常会对视觉内容进行从头到尾的详尽解读,他们更希望能自主调整描述的详细程度。例如,P11 指出,低视力者可能不需要完整的叙述,只需对无法获取的内容补充描述即可。

除实际应用层面,参与者还强调,未来对话式人工智能应尊重低视力者充分利用自身残余视力的努力。低视力者在导航时,通常会 “努力运用自己的视力”(P12)作为主要策略,但与全盲者相比,他们因可能误判障碍物或存在视野不对称问题,发生意外的风险更高(P1、P6、P9)。

这些体验也与部分后天失明参与者的视力变化过程相关。例如,P1 回忆道:“刚开始,我告诉自己,我的视力还没完全丧失,不用导盲杖也能行。所以我抗拒了很久。” 这一例子表明,后天失明者往往难以承认和接受自身残疾(Binder 等人,2020),而这种心态会因他们试图最大限度利用残余视力,增加导航时的安全风险。

因此,参与者强调,未来对话式人工智能应关注低视力者如何运用残余视力,根据个人需求提供辅助,而非以全盲者为标准提供通用支持。

P8 表示:“低视力者因为还能看到一点,所以更努力地尝试去看…… 重要的不是阻碍这种努力,而是帮助他们充分利用现有视力做到最好,对话式人工智能应在这方面提供尊重和支持。”

4.2.3 在依赖与赋能之间平衡

参与者担忧,若未来对话式人工智能承担过多任务、替代用户自身能力(如 “未来出行” 和 “未来政策制定” 对话中所描绘的深度干预),可能会变得过于主导。许多参与者担心过度依赖会降低人的自主性(P5、P6、P9、P14),甚至导致人工智能控制人类(P4、P5、P7、P11)。

导航支持尤其引发焦虑,因为这需要将安全托付给外部系统。参与者预计,若未来对话式人工智能全面负责导航(如 “未来出行” 对话中展示的便捷性),可能会导致过度依赖。他们还将这种潜在依赖与当前对智能手机无障碍功能的依赖进行对比,P3 表示:“没有语音支持的应用程序,简直寸步难行。” 还有参与者将可能出现的对话式人工智能依赖比作智能手机 “成瘾”,担心持续的辅助会让人 “无法脱离”(P9)。

参与者还担忧导航过程中对话式人工智能意外出错的后果,尤其是在用户完全依赖其引导的情况下。这种担忧反映出他们对系统和自身使用能力的信任不足。

参与者怀疑未来对话式人工智能能否完美完成关键任务,认为即使是街道导航中的一个小失误,也可能造成致命后果(P2、P6、P12)。他们还对自己作为用户的可靠性提出质疑,回忆起在记忆方向、地面状况等线索时遇到的困难。

实际使用中的担忧还包括可能丢失对话式人工智能依赖的硬件,部分参与者更倾向于使用可附着式设备,以防丢失(P10)。

除技术局限外,部分参与者强调,保持对自身残疾的认知至关重要 —— 这既能维持自主性,又能避免自满。

P9 反思道:“如果我忽视自己的残疾,一味依赖对话式人工智能,认为‘它会为我做好一切’,万一系统出了问题怎么办?因此,我必须认清自己的身份。无论世界如何发展、技术如何进步,我都需要承认自己是残障人士。秉持这种认知,我才不会过度依赖,也不会陷入自满。这关乎保持自我认知和清醒思考。事实上,承认自己的残疾,是接纳真实自我的方式。而了解自身身份,我认为能让生活更美好。”

这一反思凸显了参与者对平衡技术支持与个人责任、身份认同的重视。对他们而言,承认自身残疾并非妥协,而是防止过度依赖、维护自主性和强化身份认同的保障。

这一观点具有实际意义:尽管对话式人工智能的辅助功能得到认可和重视,但视障人士在交互中保持积极主导的角色,仍至关重要。

4.2.4 重获社会可见度

如前几节所述,参与者设想未来对话式人工智能能帮助他们更好地了解世界、实现以往认为不可能的目标,从而增强自信心,更积极地拥抱技术与生活。但在乐观之余,部分参与者也强调,视力障碍带来的不便让他们深感局限:

P7 表示:“我们甚至无法经营一家小彩票店、修理手表或售卖邮票。有句话说‘身体值千金,眼睛占九百’。对我们而言,感觉自己几乎只是勉强活着。”

这类经历往往让参与者对未来感到悲观。由于觉得无法过上探针中描绘的生活,他们在设想其他未来可能性时犹豫不决。P1 几乎从未想过 “未来政策制定” 对话中所描绘的职业,因为在韩国视障人士就业机会有限的环境下,他 “从不敢有更高期望”。

这种消极心态不仅源于自我怀疑,还与社会中持续存在的偏见密切相关。P11 指出,即便未来对话式人工智能能如 “未来出行” 对话所示支持自主出行,她可能仍会遇到以往独自出行时听到的歧视言论,例如 “一个视障人士出来干什么?”。

这些社会态度和环境因素共同导致参与者在接纳赋能型或技术驱动型未来时犹豫不决。

对此,参与者强调,提升自身社会可见度是实现更大程度社会包容的关键途径。他们发现,视障人士往往局限在自身群体中,这限制了更广泛的社会参与和信息获取。交流机会的缺乏不仅加剧了社会孤立,正如部分参与者所指出的,还滋生了自我偏见 —— 倾向于低估自身潜力,或仅从狭隘的个人经历看待世界。

为解决这些障碍,参与者强调,与明眼人交流对于减少误解、建立相互理解(无论是对视障人士还是明眼人群体而言)至关重要。

P9 分享道:“通过与视障人士共处、亲身体验他们面临的挑战,我发现他们的生活范围往往十分狭窄,这很大程度上是因为许多人缺乏充分参与社会生活的机会…… 残障人士往往也背负着沉重的偏见,无论是对自己还是对他人。由于获取信息的渠道有限,他们常常会陷入‘自己所知即是全部’的局限…… 这就像在乡间小路上夜间行驶。开近光灯时,只能看到前方很短的距离;但切换到远光灯后,整条道路突然清晰地展现在眼前。知识的作用也是如此。了解得越多,视野就越开阔,能分享的也越多。缺乏知识,会限制对世界的认知。因此,我希望对话式人工智能能拓宽视障人士的视野,帮助打破刻板印象、开阔思路,为更丰富的交流创造空间。”

参与者还建议,对话式人工智能可帮助弥合当前不同群体间的隔阂:一方面为明眼人提供更多关于视障人士的准确信息,另一方面通过展示视障人士在公共空间中的自主行为(如独立导航),提升他们的社会可见度。

通过这种方式,参与者设想,视障人士可借助未来对话式人工智能重塑社会认知,推动构建更具包容性的社会。

5. 讨论

本研究采用基于音频的设计虚构探针,引导视障人士(PVI)反思他们期望与未来对话式人工智能(CAI)共处的生活场景。研究结果显示,参与者在设想借助先进对话式人工智能追求新机遇时,将自己描绘成更自信、更坚定、更具创造力的个体。

尽管参与者生动地描述了对话式人工智能如何能提升自主性、丰富日常生活乃至重塑长期目标,但他们的反思也揭示了影响技术实际应用的人际关系、社会结构和伦理层面的条件。

因此,研究结果不仅记录了个人期望,还强调了对话式人工智能应如何融入社会态度、基础设施和自主性相关问题的大背景。以下讨论将参与者对未来的畅想,与更广泛的理论和设计对话相结合,探讨对话式人工智能如何超越单纯的功能性辅助工具,成为一种能为视障人士带来尊严、可见度和真正自主性的关系型技术。

5.1 重新构想与对话式人工智能共处的未来:视障人士技术的人际关系与社会维度

与专为残障人士设计的传统辅助技术不同,对话式人工智能有望成为主流工具,供所有用户使用。这种双重属性为不同类型用户之间的共享实践创造了机会。例如,此前研究描述了对话式人工智能支持家庭协作(如协助明眼家庭成员完成烹饪等任务(Tang 等人,2025))或残障群体间互助(如视障人士共同导航城市环境(Bennett 等人,2018))的场景。这些例子表明,对话式人工智能有潜力支持相互依存的实践模式,而非强化 “独立” 与 “依赖” 的二元对立(Vincenzi 等人,2021)。

然而,研究结果也凸显,要理解视障人士使用对话式人工智能的未来,必须结合技术应用的更广泛社会背景。尽管参与者设想对话式人工智能能增强他们的自信心、自豪感和自主性,但他们也强调,若不关注影响技术使用的人际关系和社会结构条件,仅靠个人层面的收益是不够的。

他们的反思与残疾模型的观点一致,即残疾是社会定义和构建的结果,而非单纯由身体缺陷导致。

首先,参与者描述了在公共空间中遭遇歧视时的不适,这与 “人际关系残疾模型” 的观点相符 —— 该模型认为残疾源于人与人之间的关系和互动(Kafer,2013)。即便对话式人工智能支持自主导航或参与社会活动,参与者仍认为,社会反馈(如同情、回避或过度好奇)可能会削弱这些技术带来的益处。

他们的经历凸显了残疾是在日常互动中共同构建的:对话式人工智能作为辅助工具的有效性,不仅取决于视障人士如何使用它,还取决于他人对其使用行为的认知和反应。

参与者还反思了韩国视障人士面临的就业机会有限、社会参与受限等问题。这些担忧与 “社会残疾模型” 的观点一致 —— 该模型认为残疾源于社会结构和制度障碍,而非个人缺陷(Oliver,1990)。尽管参与者设想对话式人工智能能提升他们的工作能力和生产力,但他们强调,若就业体系、福利政策和文化规范不发生变革,对话式人工智能的价值将受到限制。

他们的反馈表明,即便新技术看似前景广阔,社会结构条件仍会影响实际可实现的未来。

综上,这些观点表明,对话式人工智能的发展必须与不断变化的社会结构和文化态度相结合,认可视障人士的生活具有人际关系属性,并依赖集体基础设施支撑。

在此背景下,对话式人工智能使用的可见性具有重要意义:当视障人士使用对话式人工智能的行为得到公众认可时,该技术有望成为一种包容性工具,促进社会认可与融合。

在公共场合使用辅助技术,若能展现视障人士的自主行为,可向更广泛的社会群体传递他们的能力和自主性(Lee 等人,2021b;Frank,1988;Profita 等人,2016),通过证明辅助技术能增强而非削弱自主性,重塑公众认知。

重要的是,这需要将对话式人工智能定位为支持自主性的工具,而非替代个人能力的手段。尽管残障人士以往可能因担心被视为依赖他人,而不愿在公共场合使用传统辅助设备(India 等人,2025),但主动使用对话式人工智能,反而能在社区中展现自主性和赋能状态。

在这样的环境中,参与者对使用对话式人工智能的积极预期有望实现,而这与他们在个人决策中行使选择权和控制权密切相关。这种自主性能增强他们的自主意识和自我效能感(Lee 等人,2021b;O’Brolcháin,2018),让他们相信自己有能力追求目标 —— 无论是重拾曾经放弃的理想,还是迎接新的挑战。

即便掌握新技术需要学习新任务,拥有这种效能感的用户也会更积极地推动技术的全面应用(Rodrigues 等人,2021)。因此,当视障人士、对话式人工智能与社会结构之间的关系,以认可和支持自主性为导向时,人工智能就能成为赋能视障人士参与社区生活的资源,超越单纯的替代功能,助力他们实现自己设想的未来。

5.2 在对话式人工智能设计中尊重自主性

尽管对话式人工智能常被视为推动社会包容性发展的重要力量,但近期研究仍强调,此类系统中仍存在偏见(Guo 等人,2019;Kotek 等人,2023;Shen 等人,2021;Goyal 等人,2024)。当前系统往往带有不符合视障人士(PVI)真实生活的偏见。

参与者指出,对话式人工智能的回应有时带有同情口吻(Adnin 和 Das,2024),或在解释视觉内容(尤其是物体识别)时基于明眼人的视角假设(Chang 等人,2025)。这些行为不仅让用户感到不适,还加剧了排斥感,表明系统基于对残疾的偏见假设运行(Adnin 和 Das,2024;Lee 等人,2021b)。

因此,此类系统的设计必须建立在对盲人和低视力(BLV)群体的深入理解之上。要让对话式人工智能切实支持视障人士,就不能以明眼人为中心进行开发。这些案例凸显了对话式人工智能对残障人士的认知方式至关重要 —— 系统设计中隐含的刻板印象会直接影响用户体验,甚至可能无意中损害用户尊严。

为解决这一问题,对话式人工智能的训练和设计必须以视障人士自身的视角为出发点,而非仅依赖明眼人设计师的理解。设计初期应让视障人士直接参与,确保系统能反映他们的视角、生活方式和目标。

同样重要的是,不能将视障群体的多样性简化为单一叙事。例如,低视力用户通常会努力充分利用残余视力,参与者强调,对话式人工智能应作为补充,而非取代这些努力。

对于视力逐渐丧失的人群,尤其需要关注他们在适应过程中面临的特殊挑战(Binder 等人,2020),包括康复不充分、易发生意外以及日常任务处理困难等。在这类场景中,设计需格外谨慎 —— 对话式人工智能应能理解用户某些行为的意图,尊重其自主性,并提供定制化支持,以增强而非取代用户能力(Wobbrock 等人,2011)。

研究结果还强调,保留批判性思考空间和自主性至关重要。参与者担心过度依赖对话式人工智能(尤其是在导航方面)可能会削弱他们长期以来形成的定位策略(如利用气味或风向判断方向)。在职业场景中,对对话式人工智能输出不加质疑的依赖,也可能降低用户自身的判断力。

为应对这些风险,对话式人工智能应融入 “积极摩擦” 设计(Chen 和 Schmidt,2024;Singh 等人,2025;Joshi 和 Vogel,2025),鼓励用户反思,同时明确用户才是最终决策者。

这类设计考量不仅能保障当下的自主性,还能确保对话式人工智能支持(而非替代)用户长期技能的培养和自信心的建立。

此外,参与者强调,选择技术辅助还是人工协助的权利至关重要。即便在设想先进系统时,许多参与者仍希望保留获得护理人员或同伴支持的选项,因为这些支持可能带来更丰富的情感互动。

这种偏好并非矛盾,而是自主性的体现 —— 视障人士需要自主决定何时使用技术辅助,何时人工协助更符合需求(FINE 和 GLENDINNING,2005;Lee 等人,2021b)。因此,对话式人工智能应具备能在自动辅助和人工支持之间无缝切换的机制。

归根结底,技术发展的目标不应是追求单纯的技术先进性,而是打造能让视障人士在社会中自由、自信、自主生活的系统。要让对话式人工智能成为尊重自主性的技术,就需超越单纯的技术修复,培养符合伦理的设计实践、参与式设计流程,并推动文化变革,认可视障人士并非被动接受帮助的群体,而是与对话式人工智能共同创造未来的积极参与者。

6. 研究局限与未来展望

本研究存在一些主要局限,这些局限也为未来研究指明了方向。

首先,研究参与者仅限于韩国的视障人士(PVI),且多数从当地一家视障人士专用福利中心招募。这导致参与者平均年龄偏高,因为韩国福利中心的主要服务对象多为老年人。他们对与对话式人工智能(CAI)共处未来生活的设想,也与当前韩国的社会结构、康复体系和文化背景密切相关。在辅助基础设施、社会态度和无障碍技术水平不同的其他地区,视障人士的观点可能存在显著差异。

其次,本研究采用的设计虚构法(Design Fiction)依赖以导航和就业为核心的探针。尽管这些探针成功激发了参与者的想象力,但不可避免地限制了所讨论未来的范围。尽管参与者常常超越探针内容进行畅想,但涵盖日常生活更多方面(如医疗保健、休闲或家庭关系)的更多样化场景,可能会让我们更全面地了解对话式人工智能未来的潜在作用和用途。

未来研究可基于这些局限,从多个方向展开。开展跨文化设计虚构研究是一个有前景的方向,通过比较不同国家视障人士对与对话式人工智能共处未来的设想,探索整合或对比这些愿景的可能性。

将未来场景的范围拓展到生活更多领域,也可能让我们更全面地了解对话式人工智能在塑造自主性、社会参与和幸福感方面的作用。此外,开展针对视障青少年的研究,设想他们与未来技术共处的生活,将有助于为下一代设计相关技术。

最后,与视障人士共同设计的方法(Lee 等人,2022;Metatla 等人,2019;Thompson 等人,2023)将是重要的拓展方向:研究人员和设计师不仅可以探索设想中的未来,还能结合视障人士在辅助技术使用方面的现有技能和经验,共同探索可行的发展路径(Lee 等人,2021b)。

这种参与式研究方式能确保对话式人工智能的未来发展以视障人士的实际经验为基础,为开发不仅能满足基本需求,还能切实拓展其能力的技术提供参考。

7. 结论

以往关于对话式人工智能(CAI)的研究多从明眼人视角出发,侧重技术能力或通用实用性,却忽视了视障人士(PVI)对与这类工具共处未来生活的设想。

为填补这一空白,本研究采用设计虚构法,探究视障人士对与对话式人工智能共处生活的构想,以及他们对相关风险或伦理问题的预期。通过基于音频的设计虚构探针,研究团队引导 14 名视障人士反思推测性场景。

研究结果显示,参与者不仅将对话式人工智能视为支持自主完成任务的工具,还将其视为追求新机遇、拓展生活可能性和重塑社会互动的催化剂。

同时,他们也指出了实现这些未来必须解决的关键问题,包括平衡依赖与自主性、关注视障群体的多样性,以及提升视障人士的社会可见度。

基于这些发现,研究强调,对话式人工智能的设计需尊重多样性、增强自主性,并在日常生活中直观地展现视障人士的能力。

研究认为,要充分发挥对话式人工智能的赋能潜力,其设计需转向推动更广泛的文化和社会结构变革,确保未来技术不仅能提升自主性,还能促进包容性、尊严感和社区参与。

原文来源:https://arxiv.org/html/2510.12268v1